当前位置:文档之家› 公司业务数据分析

公司业务数据分析

公司业务数据分析
公司业务数据分析

公司业务数据分析问题

摘要

本文是对公司一季度业务数据分析问题,根据题中所给出的数据,利用SPSS 软件进行相关性统计分析,分别对各业务中指标进行分析,得到各业务之间的关系。同时通过现有的数据和所建立的模型,给出今后发展提出建议。

针对问题一,在对业务量接近饱和问题,首先采用变异系数法求出各项指标的权重,利用灰色变权聚类法,建立白化权函数,确定聚类权、求出聚类系数,再通过比较聚类系数,得出各个业务属于哪个灰类。最后得到业务二和业务三的业务量接近饱和。

针对问题二,根据题中所给的数据,通过SPSS软件得到各指标与收入的相关性系数,其中指标5与收入的相关系数为1,知指标五为收入。在这基础上通过SPSS软件进行相关性统计分析得收入主要和业务一和业务四相关。

针对问题三,考虑各业务之间的相关性及业务相互促进要使得收入增加。首先利用变异系数法计算出各业务中各指标的权重,综合业务中各指标,再通过SPSS得到各业务之间的相关系数,知业务一与业务二、业务三、业务四相关性强,与业务五相关性弱;业务二与业务三、业务四、业务五相关性弱;业务三与业务四、业务五相关性弱;业务四与业务五呈负相关。相互促进情况见表六七。

针对问题四,根据现有的数据,先利用BP神经网络预测出了下一个月各业务的发展情况。为扩大公司的盈利空间以及服务规模,并分析当前的状态给出以后发展的建议:1、推陈出新,使客户选择开通更多业务。2、加强对各业务的宣传。季度分析报告见模型的求解。

关键词:业务指标灰色变权聚类法变异系数法 BP神经网络预测

一问题重述

某互联网公司推出一项服务,此项服务包括5个主要的业务,这5项业务共包含8个指标,某项业务可以含有1个或多个指标,在这8个指标中其中有一个指标是收入。客户可以根据自己的需要选择开通某些业务,各个业务之间没有强制绑定关系,但是某些业务之间通过相互宣传有一定的促进作用。附件中是本公司2012年第一季度的数据,包括各个业务的各个指标的数据:指标数据为0,说明该业务还没有这个指标;从0变为正数说明此项业务开始包含新的功能,新功能具有新的指标。附件中还包括此项服务带来的收入数据。

请你根据各个服务的指标数据和收入数据,完成如下问题:

1、其中某些业务的使用量接近饱和,请你建立模型计算哪些业务量接近饱和,

饱和的指标估计值是多少;

2、根据财务数据,你能判断出哪个指标是收入吗,请你说明收入主要和哪些业

务相关;

3、请你分析出各个业务之间的相关性,哪几个业务相互促进可以使得收入增加;

4、假如你是本服务的项目经理,根据现有的数据和你所建立的模型,给公司总

经理写一份季度分析报告,分析当前的状态以及以后发展的建议,如何扩大公司的盈利空间以及服务规模。

二问题分析

问题一:因某些业务的使用量接近饱和,要建立模型计算哪些业务量接近饱和,及饱和的指标估计值。对于饱和度的理解可认为,当业务中的指标趋于一个平缓的趋势时接近饱和,因为若该业务已接近饱和则对该业务的指标控制上不会有太大的变化,反之则应还会有一个较大的波动趋势。因此可先用变异系数法确定出每个业务中相应指标的权重。再采用灰色变权聚类分析求解,以饱和及不饱和作为两个灰类,聚类对象为五个业务,而影响业务的指标共有八个可作为聚类指标。建立白化权函数和彻度函数,再通过聚类权,即可得出各业务是否饱和,及其饱和的估计值。

问题二:根据题中所给的财务数据,为判断哪个指标是收入,从各指标之间的相关性出发,考虑各业务中相同指标与收入的相关性,及各业务中不同指标与收入的相关性,利用SPSS软件分别计算出各指标与收入的相关系数,若指标与收入的相关系数为1,则该指标为收入。为说明收入主要和哪些业务相关,考虑各业务与收入相关性,同时考虑收入指标、各业务中指标与总收入的相关性,从而确定收入与哪些业务相关。

问题三:要分析出各个业务之间的相关性,对各业务中有1个或多个指标,我们采用变异系数法求出各指标的权重,将业务中多个指标的权重综合成总指标来考虑,通过各业务中总指标之间的相关性来衡量各业务之间的相关性。要知道哪几个业务相互促进可以使得收入增加,通过Excel对收入进行分析,根据收入在某段时间的波动大小,对收入增加的时间段进行分析,考虑此阶段收入与各业务之间的相关性,从而确定哪些业务相互促进可以使得收入增加。

问题四:根据现有的数据和所建立的模型,分析当前的状态以及以后发展的建议,对如何扩大公司的盈利空间以及服务规模。首先采用BP神经网络系统法建立模型,预测出下一个月各业务中各指标的发展趋势,及其收入的发展情况,结合当前的状态,为以后发展提出了相关建议。

三符号说明

i V :第i 项指标的变异系数;

i σ:第i 项指标的标准差;

i X :第i 项指标的平均数;

i W :各指标的权重;

四 模型假设

1、假设题中所给的数据是真实的、可靠的;

2、假设该公司在今后的发展中不会有特殊情况导致公司倒闭。

五 建模前的准备

5.1 BP 神经网络的介绍:

BP 神经网络是一种多层前馈神经网络,主要特点是信号前向传递,误差反向传递。在前想传递中,输入信号从输入层京隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP 神经网络预测输出不断逼近期望输出。BP 神经网络的拓扑结构如图1所示。

图1 BP 神经网络层次图

图1中,12,,,n

x x x BP 神经网络的输入值,12,,,n

y y y 是BP 神经网络的预

测值,固定权

ij

ω和可调权

jk

ω为BP 神经网络权值。从图可以看出,BP 神经网络

可以看成一个非线性函数,网络输入值和预测值分别为该函数的自变量和因变量。当输入节点数为n ,输出节点数为m 时,BP 神经网络就表达了从n 个自变量到m 个因变量的函数映射关系。 BP 神经网络预测钱首先要训练网络,通过训练师网络具有联想记忆和预测能力。BP 神经网络的训练过程包括以下几个步骤。

步骤1:网络初始化。根据系统输入输出序列(,)x y 去顶网络输入层节点数n 、隐

含层节点数l ,输出层节点数m ,初始化输入层、隐含层和输出层神经元之间的连接权值,初始化隐含层阈值a ,输出层阈值b ,给定学习速率和神经元激励函数。

步骤2:隐含层输出计算。根据输入向量,输入层和隐含层见链接权值ij ω以及隐含层阈值a ,计算隐含层输出H 。

1()n

j ij i j i H f x a ω==-∑ 1,2,,j l =

公式中,为隐含层节点数;为隐含层激励函数,该函数有多种形式,我们取:

1

()1x

f x e -=+ 步骤3:输出层输出计算。根据隐含层输出H ,链接权值jk ω和阈值b ,计算BP 神经网络预测输出O

1l

k j jk k j O H b ω==-∑ 1,2,,k m =

步骤4:误差计算。根据网络预测输出O 和期望输出Y ,计算网络预测误差e 。

k k k O Y e -= m k ,,2,1 =

步骤5:权值更新。根据网络预测误差e 更新网络连接权值ij ω,jk ω。

∑=-+=m

k k jk j j jk jk e i x H H 1

)()1(ωηωω l j n i ,,2,1;,,2,1 ==

k j jk jk e H ηωω+= m k l j ,,2,1;,,2,1 ==

式中,为η学习速率。

步骤6:阈值更新。根据网络预测误差更新网络节点阈值b a ,。

∑=-+=m

k k jk j j j j e H H a a 1

)1(ωη l j ,,2,1 =

k k k e b b += m k ,,2,1 =

步骤7:判断算法迭代是否结束,若没有,返回步骤2。 1.输入层的确定

神经网络的输入层起缓冲存储器的作用,其向量的数目相当于所研究问题的

独立变量数目。根据影响收入的几个因素,选定了五个业务的共十三个指标作为输入层。

2.隐含层的确定

隐含层神经元代表网络输入与输出之间的非线性程度,对模型的训练速度和预报能力有着重要影响,节点数太少,网络不能很好的学习,精度也受影响。但神经元个数太多网络容易过拟合。所以没有统一的理论依据,本文中我们根据Kolmogorov 定理,节点数参考如下公式,确定隐含层神经元个数为5个

1l n <-

l a <

2log l n =

其中n 为输入层节点数;l 为隐含层节点数,m 为输出层节点数,a 输出层节点数为010 之间的常数。 3.输出层的确定

输出层神经元的个数取决于系统对网络功能的要求,本模型要实现对收入的预测,故输出变量为收入,即输出层神经元的个数为1。 4. 样本集的确定

为完成对机器对数据的学习,首先要为网络提供一组适当数量的可靠样本。影响收入的因素为五个业务,而业务由于指标有关,因此样本集即为指标数据及收入数据,详细见附表。 5. 数据处理

数据处理的目的是为神经网络的推理提供较为准确的参数。本文我们对数据做归一化处理。为避免由于输入变量单位不同、绝对值相差很大对神经网络模型的影响,需要对输入输出参数进行归一化处理。本模型的BP 网络采用premnmx 函数对其进行归一化,使得各节点的值在[-1,1]之间。 6.网络学习

BP 网络学习的目的就是要获得最终的权值矩阵。归一化后的数据即可作为可靠性样本进行训练,本文中使用train 函数进行训练,经过数次训练后得出训练图2(见附表)

六 模型的建立与求解

6.1问题一的建立和求解: 6.1.1模型一的建立:

首先,该问要求业务使用量的饱和度,对于饱和度的理解可认为,当业务中的指标趋于一个平缓的趋势时接近饱和,因为若该业务已接近饱和则对该业务的指标控制上不会有太大的变化,反之没饱和则应还会有一个较大的波动趋势。因此可采用灰色聚类分析,以饱和及不饱和作为两个灰类,聚类对象为五个业务,而影响每个业务有八个指标。

假设ij x 为第i 个对象的第j 类指标的权重。对于权重的确定,因饱和度用波动程度来衡量,则可采用变异系数法来确定。各项指标的变异系数公式如下:

(1,2)j

j V x n x

σ=

=

式中:j V 是第j 项指标的变异系数、也称为标准差系数;j σ是第j 项指标的标准差;j x 是第j 项指标的平均数。

各项指标的权重为:1

j

j n

j

j V W V

==

设有n 个聚类对象,m 个聚类指标,s 个不同灰类,根据第,(1,2)i i n = 对象关于,(1,2)j j n = 指标的样本值(1,2,1,2)ij x i n j n == 将第i 个对象归入第

(1,2)k k s = 个灰类之中,称为灰色聚类。

若白化权函数()k j f ?无第一转折点)1(k j x 和第二个转折点)2(k

j x ,

即如图2所示,则称()k j f ?为下限测度白化权函数,记为)]4(),3(,,[k

j k j k j x x f --。

图2 若白化权函数()k j f ?无第三转折点)3(k j x 和第四个转折点)4(k j x ,

即如图3所示,则称()k j f ?为上限测度白化权函数,记为],),2(),1([--k

j k j k j x x f 。

图3

通过上述分析,我们可以得到不同情况下的白化权函数。

)

k j x k j

x 4(k j x

(1)对于图1所示的下限测度白化权函数,有

0 [0,(4)]() 1 [0,(3)]

(4) [(3),(4)]

(4)(3)

k j k k j j k

j k k j j k k j

j x x f x x x x x x x x x x ?????

=∈??-?∈?-? (2)对于图2所示的上限测度白化权函数,有

0 (1)

(1)() [(1),(2)](2)(1)

1 (2)

k

j k

j k k k

j j j k k

j j k j x x x x f x x x x x x x x ?

对于图1和图2所示的j 指标k 子类白化权函数,令(2)k k j j x λ=; 我们称k

j

λ为j 指标k 子类临界值,称1

k

j k j

m

k j

j ληλ

==

∑为j 指标关于k 子类的权重。

现设ij x 为对象i 关于指标j 的标本,()k j f ?为j 指标k 子类白化权函数,

k j η为j 指标关于k 子类的权重,则称1

()m

k

k k i

j ij j j f x ση==?∑为对象i 属于k 灰类的灰色变权

聚类系数。 称1

2(,,,)s i i

i

i

σσσσ= =???

? ????∑∑∑===m j s

j ij s j m j m j ij j j ij j x f x f x f 111211)(,,)(,)(ηη

为对象i 的聚类系数向量。

现设}{max 1*

k i s

k k i σσ≤≤=,则称对象i 属于灰类k 。

6.1.2模型一的求解:

根据变异系数法,因每个业务中所含指标数不同,因此将所有的指标分别计算出其变异系数,再对变异系数进行权重的确定。通过matlab 计算得到各个业务各指标权重如表一:

步骤一:给出聚类白化值。

假设饱和及不饱和作为两个灰类,聚类对象为五个业务,而影响每个业务有八个指标,ij x 为第i 个对象的第j 类指标的权重。给出聚类白化矩阵ij A

0.0399

00000000.04910.0357000000000000.03910.04360.05130.054700.02790.18930.20230000.0224000.07460.1701000ij A ????????=????????

步骤二:确定白化函数 白化函数有四种基本形式: (1)、若该灰色类别内的元素反映越大、越好、越明确,则采用上限测度白化权函数;

(2)、若该灰色类别内的元素越小、越好、越明确,则采用下限测度白化权函数;

(3)、若该灰色类别内的元素取白化值的可能性围绕着某小区间内元素左右递减;则采用典型测度白化权函数;

(4)、若围绕的是一个点, 则变为适中测度白化权函数,即三角白化权函数。而在本模型中可用(1),(2)得出白化函数。

白化函数第一类,灰色类越小越好得出的下限彻度函数如下:

11[,,0.0399,0.0547]f --;21[,,0,0.0357]f --;31[,,0,0.0279]f -- 41[,,0.0746,0.1893]f --;51[,,0.1701,0.2023]f --;61[,,0,0.0391]f --71[,,0,0.0436]f --;81[,,0,0.0513]f --

其彻度函数对应的函数关系示例:

11[,,0.0399,0.0547]f --→11001

00.03990.05470.03990.0547

0.05470.0399

x f x x x ??≤?

=<≤??-<≤?

-?

其他函数表达式可以依次类推。

白化函数第二类,灰色类越小越好得出的上限彻度函数如下:

12[0,0.0547,,]f --;22[0,0.0357,,]f --;32[0,0.0279,,]f -- 42[0,0.1893,,]f --;52[0,0.0701,,]f --;62[0,0.0379,,]f -- 72[0,0.0436,,]f --;82[0,0.0513,,]f --

其彻度函数示例:

1

2[0,0.0547,,]f --→121000.05470.05470.0547

x x f x x ?≤??=<≤?

?>?? 其它函数可以此类推。

根据白化函数可得出k j λ其中k j λ为j 指标k 子类临界值如表二:

步骤三:聚类权的确定。 因1

k

j k j

m

k j

j ληλ

==

∑为j 指标关于k 子类的权重,可得聚类权的值如表三:

步骤四:求聚类系数k i σ

因1

()m

k

k k i

j ij j j f x ση==?∑则首先应计算出()k

j ij f x

11(0.0399)1f =,111238(0)(0)(0)0f f f ==== 21(0.0399)0.7249f =,222128(0)(0)(0)1f f f ====

110.0827η=,120.074η= 180.0513η=

111111111

1

11122881

()(0.0399)(0)0.0827m

j j j j f x f f f σηηηη==?=?+??=∑ 222222222

1

11122881

()(0.0399)(0)0.9754m

j j j j f x f f f σηηηη==?=?+??=∑ 则1

211

1max(,)0.9754σσσ==该结果说明第一个业务是属于第二个灰类即是不饱和的。依照此方法。依次可计算得:

12

222max(,)max(0.1568,0.1478)0.1568σσσ===,表明第二个业务是属于第

一个灰类的为饱和。

12333max(,)max(0.2779,0.2191)0.2779σσσ===,表明第三个业务是属于第一

个灰类的为饱和。

12444max(,)max(0.6481,0.7225)0.7225σσσ===,表明第四个业务是属于第二

个灰类的为不饱和。

12555max(,)max(0.5902,0.6770)0.6770σσσ===,表明第五个业务是属于第

二个灰类的为不饱和。

因此对于饱和指标的估计值只需}{max 1*

k i s

k k i σσ≤≤=其间的最大值是属于第一个

灰类即可认为达到饱和。

业务二饱和指标的估计值当2min(0.1568,0.1478)0.15σ>=时是属于第一个灰类的为饱和。

业务三饱和指标的估计值3min(0.2779,0.2191)0.22σ>=时是属于第一个灰类的为饱和。

6.2问题二的建立和求解: 6.2.1模型二的建立:

假设(15,18)ij x i j == 为第i 个业务第j 个指标的所有值,i y 为收入。要判断收入指标,即判断那的指标与收入的相关系数为1。

5,8,1

5,85,82,1

,1

()()

()()

i j ij ij k i j i j i j ij ij k i j i j x x y y r x x y y =========--=--∑

∑∑

判断当j 为何值时相关系数为1.若为1则该指标就是收入。

6.2.2模型二的求解:

根据题中所给的财务数据,通过各业务中相同指标与收入的关系及各业务中不同指标与收入的关系,首先将所有相同的指标加起来共8个指标。利用SPSS20做相关分析得到各指标与收入之间的相关性。结果如表四;

指标五就是入。

6.2.3模型三的建立:

要确定收入与哪些业务相关可对收入和业务做相关性分析,但业务中有的含有多个指标,不好分析,则先采用变异系数法将业务中的多个指标化为单个总指标。运用变异系数法,求出各业务中各指标的权重,再综合业务中各指标的权重, 其中各项指标的变异系数公式如下:

i

i i

V X σ=

(i=1, (8)

(式中:i V 是第i 项指标的变异系数、也称为标准差系数;i σ是第i 项指标的标准差;i x 是第i 项指标的平均数。)

各项指标的权重为:

8

1

i

i i

i V W V

==

∑ (i=1, (8)

6.2.4模型三的求解:

经过spss 做相关性分析得出收入与业务总指标的相关性如下表(表五)。

三也相关但相关度不大,而与业务五呈现负相关。

6.3问题三建立与求解:

对业务数据进行整理,根据SPSS 得到各业务之间的相关性如表六:

表六 各业务之间的相关性

业务二与业务三、业务四、业务五相关性都比较弱。

业务三业务四、业务五相关性弱。

业务四与与业务五呈负相关;

要判断收入的增加与那些业务相互促进有关首先通过matlab作出收入的折线图如下图(图四):

图四:收入趋势图

由上图可说明收入在2012年1月1日-2012年2月15日这阶段波动较小,在2012年2月16日-2012年2月26日与2012年3月17日-2012年3月31日这两段时期内收入波动较大,有明显的上升趋势。为此考虑这两时期各业务与收入的相关性,通过SPSS得到在这两时期内各业务与收入的相关性如表七、表八:

表七第一时间段各业务与收入的相关性

业务三和业务四相关性也相对比较大,故业务三和业务四相互促进可使得收入增加。

可能是与业务四增加了两个新的指标使得收入大幅增加。而业务之间没有相互促进因素。

以上综合可知业务三与业务四有相互促进作用。 6.4 问题四建立与求解: 6.4.1 模型四的建立:

要写季度分析报告,分析当前的状态以及以后发展的建议,则可先用神经网络预测出下个月的所有指标与收入。对由于预测出的收据应满足如下准则。

假设,ij ij V V '预测前后的第i 个业务第j 个指标的变异系数。p '为预测前后的收入

目标一:变异系数应尽量小5

8

'11min ij i j V ===∑∑

目标二:收入尽可能大

30

'

1 max

k

k

p

=

=∑

6.4.2模型四的求解

用bp神经网络预测出数据见附表(表九):

预测误差如下图(图五)显示神经网络预测误差不超过4个百分点

图五:预测误差

对预测的数据计算出前后数据的变异系数如下表:

上表显示预测后的数据完全符合预想。

当前分析:

根据现有的数据及前面三问,可分析出当前的状态为:业务二和业务三的业务量接近饱和;收入与业务四、五有关;通过相互宣传某些业务之间有促进作用,业务三和业务四相互促进可使得收入增加,业务二和业务三相互促进可使得收入增加。其中收入在前期波动较小,业务四增加指标后收入有明显的上升趋势。

今后的发展:

根据预测的数据得出各业务个指标的一个投资范围见下表(表:表十)由于业务二与业务三已近趋于饱和,则要想有更大的进展应增加新的业务。

表十:各指标范围

六模型评价

优点:

1、利用灰色聚类法,将聚类对象划分为不同灰类,通过聚类系数将聚类对象主观的化为饱和与不饱和两类。

2、采用SPSS软件,对于处理的数据,具有速度快、效率高、准确度高的优点。

3、在问题三中采用的变异系数法,可以直接比较各项指标取值的差异程度,得到相应的权重。

缺点:

1、模型中利用变异系数法求相应权重客观性强。

2、BP神经网络算法存在局部极小问题,使得算法陷入局部极值,并且算法

收敛速度慢。

七模型推广

此模型属于数据分析问题,就问题一中模型可用于水环境质量综合评价研究、绿色施工的评价及上市公司信用风险评价等等。就问题四中模型,可用于对疾病预测、对建筑工程投标报价等问题。

八参考文献

[1] 姜启源等,数学模型.高等教育出版社,2009年。

[2] 刁在筠等,运筹学.高等教育出版社,2007年。

[3]薛薇等,SPSS统计分析方法及应用.电子工业出版社,2009年。

[4] 陈汝栋等,数学模型与数学建模[M],国防工业出版社,2006年。

[5] 谢云苏,张志让.数学实验.北京:科学出版社,1999.

[6] 唐其环. 灰色聚类灰类白化函数确定方法的探讨[J].四川兵工学报, 1996, 17( 4) : 4- 7.

[7] 刘思峰, 党耀国, 方志耕, 等. 灰色系统理论及其应用(第3版) [M]. 北京: 科学出版社, 2004: 104- 105.

[8]周开利,康耀红.神经网络模型及matlab仿真程序设计.

附录:

附录一:神经网络预测代码

%收入预测

close all

clear

echo on

clc

%BP建模

%原始数据归一化

m_data=load('sr.txt');

%定义网络输入p和期望输出t

pause

clc

p1=m_data(:,1:13);%输入值

t1=m_data(:,14);%期望输出值

p=p1';t=t1';

[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t)

%设置网络隐单元的神经元数

%建立相应的BP网络

pause

clc

net=newff(minmax(pn),[30,1],{'tansig','purelin'},'traingdm'); inputWeights=net.IW{1,1};

inputbias=net.b{1};

layerWeights=net.IW{1,1};

layerbias=net.b{2};

pause

clc

% 训练网络

net.trainParam.show=50;

net.trainParam.lr=0.05;

net.trainParam.mc=0.9;

net.trainParam.epochs=200000;

net.trainParam.goal=1e-3;

pause

clc

%调用TRAINGDM算法训练BP网络

net=train(net,pn,tn);

%对BP网络进行仿真

A=sim(net,pn);

E=A-tn;

M=sse(E)

N=mse(E)

pause

clc

%% 作误差图

figure(1);

plot(A,':og');

hold on;

plot(tn,'-*');

legend('预测输出','实际输出');

title('BP网络预测输出','fontsize',12);

ylabel('函数输出','fontsize',12);

xlabel('样本','fontsize',12);

figure(2);

plot(E,'-*');

title('BP网络预测误差','fontsize',12);

ylabel('误差','fontsize',12);

xlabel('样本','fontsize',12);

figure(3);

plot((tn-A)./A,'-*');

title('神经网络预测误差百分比');

clc

echo off

%%预测

p2=load('sry.txt'); %sry.txt存放预测出的各指标的值,作为预测输入值p2=p2';

p2n=tramnmx(p2,minp,maxp);

a2n=sim(net,p2n);

a2=postmnmx(a2n,mint,maxt);%预测结果

echo off

pause

clc

a2’

%指标预测

close all

clear

echo on

clc

%BP建模

%原始数据归一化

m_data=load('srx.txt'); %srx.txt文本文档存储各业务的指标

%定义网络输入p和期望输出t

pause

clc

p1=m_data(1:90,:); %输入值

t1=m_data(91,:); %期望输出值

p=p1;t=t1;

[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t)

%建立相应的BP网络

pause

clc

net=newff(minmax(pn),[30,1],{'tansig','purelin'},'traingdm'); inputWeights=net.IW{1,1};

inputbias=net.b{1};

layerWeights=net.IW{1,1};

layerbias=net.b{2};

pause

clc

% 训练网络

net.trainParam.show=50;

net.trainParam.lr=0.05;

net.trainParam.mc=0.9;

net.trainParam.epochs=200000;

net.trainParam.goal=1e-3;

pause

clc

%调用TRAINGDM算法训练BP网络

net=train(net,pn,tn);

%对BP网络进行仿真

A=sim(net,pn);

E=A-tn;

M=sse(E)

N=mse(E)

pause

clc

%%各指标以后三十天的预测

p2=load('sry.txt'); %sry.txt存放预测出的各指标的值,作为预测输入值for i=1:30

p2n=tramnmx(p2,minp,maxp);

a2n=sim(net,p2n);

a2=postmnmx(a2n,mint,maxt)

for j=1:89

p2(j)=p2(j+1);

end

p2(90)=a2;

end

echo off

pause

clc

p2(61:90,:) %预测结果

附件二:变异系数的计算a=load('shu.txt');

n=size(a,2);

x=mean(a);

y=std(a);

for i=1:n

v(i)=y(i)/x(i); end

v

w=v/sum(v)

科研常用的实验数据分析与处理方法

科研常用的实验数据分析与处理方法 对于每个科研工作者而言,对实验数据进行处理是在开始论文写作之前十分常见的工作之一。但是,常见的数据分析方法有哪些呢?常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。 1、聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。 2、因子分析(Factor Analysis) 因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难。因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。

3、相关分析(Correlation Analysis) 相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系,例如,以X和Y 分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。 4、对应分析(Correspondence Analysis) 对应分析(Correspondence analysis)也称关联分析、R-Q 型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。 5、回归分析 研究一个随机变量Y对另一个(X)或一组(X1,X2,…,Xk)变量的相依关系的统计分析方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一

16种常用数据分析方法

一、描述统计描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策 树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W 检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数卩与已知的某一总体均数卩0 (常为理论值或标准值)有无差别; B 配对样本t 检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t 检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。 适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10 以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。 四、列联表分析用于分析离散变量或定型变量之间是否存在相关。对于二维表,可进行卡 方检验,对于三维表,可作Mentel-Hanszel 分层分析列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 五、相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量; 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以

经营数据分析报告

经营数据分析报告一、确定分析目标分析目标主要包括以下三个方面分析目的。分析范围。分析时间。如下图所示,分析目标除了主要包括三个方面外,还有备注一栏,这里备注的是计算周期问题。强调一点,我们做运营数据分析的时候通常都会拿更新前和更新后的数据进行比较,因此我们的设定的分析周期一般都会跟着游戏实际的更新情况走。二、分析综述分析综述主要包括两方面的内容1、上周本周充值数据对比充值总额充值人数服务器数服务器平均充值服务器平均充值人数针对上述内容进行差额对比以及增减率对比,如游戏有特殊要求,可以适当增加其它数据内容。2、上周本周更新内容对比主要陈列两周内分别更新的活动内容或一些重大调整。三、一周运营数据分析1、本周收入概况日均充值金额,环比上周日均充值金额用户值,环比上周值简述与上周或之前的充值情况的比较,如上升还是下降、影响充值的较大的因素。2、新用户概况新用户就是新进游戏的玩家,这里主要介绍这些新玩家的动态数据,一般以两个月为总时长进行陈列比较,具体周期数据仍以周为单位。新用户数据主要包括安装下载数、创建角色数、安装→角色转化率、付费人数、创建角色→付费转化率、值、次日留存、三日留存、七日留存等,可根据游戏实际情况进行添加。3、活跃用户概况活跃用户概况主要包括三部分内容日均在线人数,环比上周实时在线人数,提升下降百分比日均付费用户登陆人数,环比上周付费登陆数,提升

下降百分比日均活跃玩家数,环比日均活跃玩家数,提升下降百分比4、道具消费概况道具方面的消费概况主要包括产出活动类别道具分类单类道具消费元宝,消费占比,环比上周日均消费元宝,总消费元宝,环比上周下降上升简述活动效果较好较差的道具分类5、当前元宝库存当前元宝库存是指玩家充了元宝还没花出去的存量,以及游戏中额外获得的元宝存量。例如,我充了1000块,拿了1元宝,花了8,我造成的存量是2,当平台各服的元宝存量不断上涨,就代表消费点不够了,要不补新消费系统,要不上消费类的运营活动。6、重点商业活动付费玩家参与情况活动参与情况主要考虑以下几点付费群体类别,活跃付费玩家数付费玩家的参与比例付费玩家在活动中消费的元宝数付费玩家在活动中消费的元宝占周消费元宝总数的比例付费玩家的人均消费元宝数根据活动的这些付费玩家的相关数据,判断该活动产生的效益以及玩家的接受程度。如果数据不佳,则代表该活动不行,需深究其存在的问题,看看问题是出现在活动难度、活动的奖励不吸引、还是活动本身的可玩性太差。根据分析的原因在下次更新活动时判断是需要进行调整玩法设定还是替换成新活动。另外,同一时期可能会推出多个活动,在进行单个活动数据分析时,也要横向比较各个活动的效果,对于下次运营其它产品,有个经验借鉴。注付费玩家数活动期间登陆过游戏的玩家数;消费占比=活动道具总消费元宝当周总消费元宝四、游戏运营数据总分析在简单分析完一

数据分析软件和工具

以下是我在近三年做各类计量和统计分析过程中感受最深的东西,或能对大家有所帮助。当然,它不是ABC的教程,也不是细致的数据分析方法介绍,它只是“总结”和“体会”。由于我所学所做均甚杂,我也不是学统计、数学出身的,故本文没有主线,只有碎片,且文中内容仅为个人观点,许多论断没有数学证明,望统计、计量大牛轻拍。 于我个人而言,所用的数据分析软件包括EXCEL、SPSS、STATA、EVIEWS。在分析前期可以使用EXCEL进行数据清洗、数据结构调整、复杂的新变量计算(包括逻辑计算);在后期呈现美观的图表时,它的制图制表功能更是无可取代的利器;但需要说明的是,EXCEL毕竟只是办公软件,它的作用大多局限在对数据本身进行的操作,而非复杂的统计和计量分析,而且,当样本量达到“万”以上级别时,EXCEL的运行速度有时会让人抓狂。 SPSS是擅长于处理截面数据的傻瓜统计软件。首先,它是专业的统计软件,对“万”甚至“十万”样本量级别的数据集都能应付自如;其次,它是统计软件而非专业的计量软件,因此它的强项在于数据清洗、描述统计、假设检验(T、F、卡方、方差齐性、正态性、信效度等检验)、多元统计分析(因子、聚类、判别、偏相关等)和一些常用的计量分析(初、中级计量教科书里提到的计量分析基本都能实现),对于复杂的、前沿的计量分析无能为力;第三,SPSS主要用于分析截面数据,在时序和面板数据处理方面功能了了;最后,SPSS兼容菜单化和编程化操作,是名副其实的傻瓜软件。 STATA与EVIEWS都是我偏好的计量软件。前者完全编程化操作,后者兼容菜单化和编程化操作;虽然两款软件都能做简单的描述统计,但是较之 SPSS差了许多;STATA与EVIEWS都是计量软件,高级的计量分析能够在这两个软件里得到实现;STATA的扩展性较好,我们可以上网找自己需要的命令文件(.ado文件),不断扩展其应用,但EVIEWS 就只能等着软件升级了;另外,对于时序数据的处理,EVIEWS较强。 综上,各款软件有自己的强项和弱项,用什么软件取决于数据本身的属性及分析方法。EXCEL适用于处理小样本数据,SPSS、 STATA、EVIEWS可以处理较大的样本;EXCEL、SPSS适合做数据清洗、新变量计算等分析前准备性工作,而STATA、EVIEWS在这方面较差;制图制表用EXCEL;对截面数据进行统计分析用SPSS,简单的计量分析SPSS、STATA、EVIEWS可以实现,高级的计量分析用 STATA、EVIEWS,时序分析用EVIEWS。 关于因果性 做统计或计量,我认为最难也最头疼的就是进行因果性判断。假如你有A、B两个变量的数据,你怎么知道哪个变量是因(自变量),哪个变量是果(因变量)? 早期,人们通过观察原因和结果之间的表面联系进行因果推论,比如恒常会合、时间顺序。但是,人们渐渐认识到多次的共同出现和共同缺失可能是因果关系,也可能是由共同的原因或其他因素造成的。从归纳法的角度来说,如果在有A的情形下出现B,没有A的情形下就没有B,那么A很可能是B的原因,但也可能是其他未能预料到的因素在起作用,所以,在进行因果判断时应对大量的事例进行比较,以便提高判断的可靠性。 有两种解决因果问题的方案:统计的解决方案和科学的解决方案。统计的解决方案主要指运用统计和计量回归的方法对微观数据进行分析,比较受干预样本与未接受干预样本在效果指标(因变量)上的差异。需要强调的是,利用截面数据进行统计分析,不论是进行均值比较、频数分析,还是方差分析、相关分析,其结果只是干预与影响效果之间因果关系成立的必要条件而非充分条件。类似的,利用截面数据进行计量回归,所能得到的最多也只是变量间的数量关系;计量模型中哪个变量为因变量哪个变量为自变量,完全出于分析者根据其他考虑进行的预设,与计量分析结果没有关系。总之,回归并不意味着因果关系的成立,因果关系的判定或推断必须依据经过实践检验的相关理论。虽然利用截面数据进行因果判断显得勉强,但如果研究者掌握了时间序列数据,因果判断仍有可为,其

企业经营状况内容

一、企业生产经营的基本情况 (一)企业主营业务范围和附属其他业务,纳入年度会计决算报表合并范围内企业从事业务的行业分布情况;未纳入合并的应明确说明原因;企业人员、职工数量和专业素质的情况;报表编报口径说明。 (二)本年度生产经营情况,包括主要产品的产量、主营业务量、销售量(出口额、进口额)及同比增减量,在所处行业中的地位,如按销售额排列的名次;经营环境变化对企业生产销售(经营)的影响;营业范围的调整情况;新产品、新技术、新工艺开发及投入情况。 (三)开发、在建项目的预期进度及工程竣工决算情况。 (四)经营中出现的问题与困难,以及需要披露的其他业务情况与事项等。 二、利润实现、分配及企业亏损情况 (一)主营业务收入的同比增减额及主要影响因素,包括销售量、销售价格、销售结构变动和新产品销售,以及影响销售量的滞销产品种类、库存数量等。 (二)成本费用变动的主要因素,包括原材料费用、能源费用、工资性支出、借款利率调整对利润增减的影响。 (三)其他业务收入、支出的增减变化,若其收入占主营业务收入10%(含10%)以上的,则应按类别披露有关数据。

(四)同比影响其他收益的主要事项,包括投资收益,特别是长期投资损失的金额及原因;补贴收入各款项来源、金额、以及扣除补贴收入的利润情况;影响营业外收支的主要事项、金额。 (五)利润分配情况。 (六)利润表中的项目,如两个期间的数据变动幅度达30%(含30%)以上,且占报告期利润总额10%(含10%)以上的,应明确说明原因。 (七)会计政策变更的原因及其对利润总额的影响数额,会计估计变更对利润总额的影响数额。 (八)其他。 三、资金增减和周转情况 (一)各项资产所占比重,应收账款、其他应收款、存货、长期投资等变化是否正常,增减原因;长期投资占所有者权益的比率及同比增减情况、原因、购买和处臵子公司及其他营业单位的情况。 (二)资产损失情况,包括待处理财产损益主要内容及其处理情况,按账龄分析三年以上的应收账款和其他应收款未收回原因及坏账处理办法,长期积压商品物资、不良长期投资等产生的原因及影响。 (三)流动负债与长期负债的比重,长期借款、短期借款、应付账款、其他应付款同比增加金额及原因;企业尝还

常用的数理统计及数据处理方法

常用的数理统计及数据处理方法 水泥厂生产中的质量控制和分析都是以数据为基础的技术活动。如果没有数据的定量分析,就无法形成明确的质量概念。因此,必须通过对大量数据的整理和分析,才能发现事物的规律性和生产中存在的问题,进而作出正确的判断并提出解决的方法。 第一节数理统计的有关概念 一、个体、母体与子样 在统计分析中,构成研究对象的每一个最基本的单位称为个体。 研究对象的所有个体的集合即全部个体称为母体或总体,它可以无限大,也可以是有限的,如一道工序或一批产品、半成品、成品,可根据需要加以选择。 进行统计分析,通常是从母体中随机地选择一部分样品,称为子样(又称样本)。用它来代表母体进行观察、研究、检验、分析,取得数据后加以整理,得出结论。取样只要是随机和足够的数量,则所得结论能近似地反映母体的客观实际。抽取样本的过程被称作抽样;依据对样本的检测或观察结果去推断总体状况,就是所谓的统计推断,也叫判断。 例如,我们可将一个编号水泥看成是母体,每一包水泥看成是个体,通过随机取样(连续取样或从20个以上不同部位取样),所取出的12kg检验样品可称为子样,通过检验分析,即可判断该编号水泥(母体)的质量状况。 二、数据、计量值与计数值 1,数据 通过测试或调查母体所得的数字或符号记录,称为数据。在水泥生产中,无任对原材料、半成品、成品的检验,还是水泥的出厂销售,都要遇到很多报表和数据,特别是评定水泥质量好坏时,更要拿出检验数据来说明,所以可用与质量有关的数据来反映产品质量的特征。 根据数据本身的特征、测试对象和数据来源的不同,质量检验数据可分为计量值和计算值两类。 2,计量值 凡具有连续性或可以利用各种计量分析一起、量具测出的数据。如长度、质量、温度、化学成分、强度等,多属于计量值数据。计量值也可以是整数,也可以是小数,具有连续性。

从历年双十一数据看电子商务发展

从历年双十一数据看电子商务的发展 课程:电子商务 专业:会计 姓名:某某 学号:******

摘要:2016年双十一购物狂欢节结束,电商销售数据对比本文通过历年双十一电商销售的数据对比,从历年双十一购物狂欢节电商的销售额、消费群体、热门行业、物流运输等方面综合分析了电商所面临的问题及可行的解决办法,概括总结了未来电商的发展趋势。 关键词:双十一,电商,销售额,发展趋势 目录: 一.数据分析 1. 销售额与增长率分析 1.1问题 1.2分析 1.3解决 2.物流运输 2.1问题 2.2分析 2.3解决 二.问题分析 三.结论

参考文献

一.数据分析 表1 数据来源: 销售额——中国网 双十一销售额占社会消费品零售额比例——中商产业研究院物流订单量——CN人才网、国家邮政局 1.历年双十一销售额与增长率分析 图1-1

1.1 问题 从图1-1可以看出,2009年起至今,双十一电商的销售额都在呈增长趋势,2009年到2010年销售额增长率大幅度提升,2010年到2016年双十一电商销售额增长率逐渐放缓。 1.2 分析 2009年至今,随着电子技术的发展,由表1双十一销售额占社会消费品零售额比例可以看出,电商的接受度逐渐增强,人们的电商平台购买力逐渐增强。 2009年到2010年双十一电商购物狂欢节这个概念刚刚出现在人们眼前,由于人们的好奇心理等原因,销售额增长率大幅上升之后,出现转折点。 2010年到2016年,虽然销售额仍在增长,但增速放缓,说明电商平台购买力已逐渐饱和。人们虽然愈加依赖电商的消费方式,但是随着大家已经完全接受电商平台双十一促销的方式,双十一购物狂欢节的短期性、产品的时效性等特点,决定了人们的消费数额增长速度逐渐放缓,人们不会再盲从地大量消费,购买囤货,而是在双十一理性消费。 2.物流 图1-2

常用数据分析方法详细讲解

常用数据分析方法详解 目录 1、历史分析法 2、全店框架分析法 3、价格带分析法 4、三维分析法 5、增长率分析法 6、销售预测方法 1、历史分析法的概念及分类 历史分析法指将与分析期间相对应的历史同期或上期数据进行收集并对比,目的是通过数据的共性查找目前问题并确定将来变化的趋势。 *同期比较法:月度比较、季度比较、年度比较 *上期比较法:时段比较、日别对比、周间比较、 月度比较、季度比较、年度比较 历史分析法的指标 *指标名称: 销售数量、销售额、销售毛利、毛利率、贡献度、交叉比率、销售占比、客单价、客流量、经营品数动销率、无销售单品数、库存数量、库存金额、人效、坪效 *指标分类: 时间分类 ——时段、单日、周间、月度、季度、年度、任意 多个时段期间 性质分类 ——大类、中类、小类、单品 图例 2框架分析法 又叫全店诊断分析法 销量排序后,如出现50/50、40/60等情况,就是什么都能卖一点但什么都不 好卖的状况,这个时候就要对品类设置进行增加或删减,因为你的门店缺少 重点,缺少吸引顾客的东西。 如果达到10/90,也是品类出了问题。 如果是20/80或30/70、30/80,则需要改变的是商品的单品。 *单品ABC分析(PSI值的概念) 销售额权重(0.4)×单品销售额占类别比+销售数量权重(0.3) × 单品销售数量占类别比+毛利额权重(0.3)单品毛利额占类别比 *类别占比分析(大类、中类、小类) 类别销售额占比、类别毛利额占比、 类别库存数量占比、类别库存金额占比、

类别来客数占比、类别货架列占比 表格例 3价格带及销售二维分析法 首先对分析的商品按价格由低到高进行排序,然后 *指标类型:单品价格、销售额、销售数量、毛利额 *价格带曲线分布图 *价格带与销售对数图 价格带及销售数据表格 价格带分析法 4商品结构三维分析法 *一种分析商品结构是否健康、平衡的方法叫做三维分析图。在三维空间坐标上以X、Y、Z 三个坐标轴分别表示品类销售占有率、销售成长率及利润率,每个坐标又分为高、低两段,这样就得到了8种可能的位置。 *如果卖场大多数商品处于1、2、3、4的位置上,就可以认为商品结构已经达到最佳状态。以为任何一个商品的品类销售占比率、销售成长率及利润率随着其商品生命周期的变化都会有一个由低到高又转低的过程,不可能要求所有的商品同时达到最好的状态,即使达到也不可能持久。因此卖场要求的商品结构必然包括:目前虽不能获利但具有发展潜力以后将成为销售主力的新商品、目前已经达到高占有率、高成长率及高利润率的商品、目前虽保持较高利润率但成长率、占有率趋于下降的维持性商品,以及已经决定淘汰、逐步收缩的衰退型商品。 *指标值高低的分界可以用平均值或者计划值。 图例 5商品周期增长率分析法 就是将一段时期的销售增长率与时间增长率的比值来判断商品所处生命周期阶段的方法。不同比值下商品所处的生命周期阶段(表示) 如何利用商品生命周期理论指导营运(图示) 6销售预测方法[/hide] 1.jpg (67.5 KB) 1、历史分析法

16种常用的数据分析方法汇总

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;

C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。 A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。

重卡历年销售数据及主要企业历年销售数据

重卡销量年度项目合计123456789101112 销量(台)771,11854,42544,42282,59080,44775,01858,96347,52662,42862,42860,06970,89171,911 占比7.1% 5.8%10.7%10.4%9.7%7.6% 6.2%8.1%8.1%7.8%9.2%9.3% 销量(台)767,63062,94964,54099,16586,54675,71263,72050,61848,12654,43751,29654,15856,363 同比0%16%45%20%8%1%8%7%-23%-13%-15%-24%-22% 占比8.2%8.4%12.9%11.3%9.9%8.3% 6.6% 6.3%7.1% 6.7%7.1%7.3% 销量(台)549,98539,99027,55167,69958,70751,71250,27337,24734,20741,82945,20746,70248,861 同比-28%-36%-57%-32%-32%-32%-21%-26%-29%-23%-12%-14%-13% 占比7.3% 5.0%12.3%10.7%9.4%9.1% 6.8% 6.2%7.6%8.2%8.5%8.9% 销量(台)726,45536,87234,94272,77868,88464,83159,35749,72749,34152,93669,62291,84975,316 同比32%-8%27%8%17%25%18%34%44%27%54%97%54% 占比 5.1% 4.8%10.0%9.5%8.9%8.2% 6.8% 6.8%7.3%9.6%12.6%10.4% 销量(台)1,112,01783,01786,377114,636104,37497,70497,57690,21393,666101,11092,28984,75566,300 同比53%125%147%58%52%51%64%81%90%91%33%-8%-12% 占比7.5%7.8%10.3%9.4%8.8%8.8%8.1%8.4%9.1%8.3%7.6% 6.0% 销量(台)1,143,710109,60074,827138,946122,818113,579112,07474,65971,84276,00080,06589,30080,000 同比3%32%-13%21%18%16%15%-17%-23%-25%-13% 5.36%20.66% 占比9.6% 6.5%12.1%10.7%9.9%9.8% 6.5% 6.3% 6.6%7.0% 销量(台)1,173,99098,70278,017148,755118,757108,264103,69375,78373,26083,57191,347101,60292,239 同比3%-10%4%7%-3%-5%-7%2%2%10%14%14%15% 占比8.4% 6.6%12.7%10.1%9.2%8.8% 6.5% 6.2%7.1%7.8%8.7%7.9% 年度项目合计123456789101112 数据来源:中国卡车网统计范围:27家重卡企业重型货车产销量 天然气重卡销量 年度项目合计123456789101112 销量(台)16,0911********,0298391,8381,6748009721,2562,7413,522 当月占比0.1% 3.7% 5.0% 6.4% 5.2%11.4%10.4% 5.0% 6.0%7.8%17.0%21.9% 销量(台)36,5761,7461,4141,6363,3783,9657,5213,5752,2191,7351,9842,1845,219 同比127%10813%139%101%228%373%309%114%177%78%58%-20%48% 201820192012 2013 2013 2014201520162017

实证研究论文数据分析方法详解

修订日:2010.12.8实证论文数据分析方法详解 (周健敏整理) 名称变量类型在SPSS软件中的简称(自己设定的代号) 变革型领导自变量1 zbl1 交易型领导自变量2 zbl2 回避型领导自变量3 zbl3 认同和内部化调节变量 TJ 领导成员交换中介变量 ZJ 工作绩效因变量 YB 调节变量:如果自变量与因变量的关系是变量M的函数,称变量M为调节变量。也就是, 领 导风格(自变量)与工作绩效(因变量)的关系受到组织认同(调节变量)的影 响,或组织认同(调节变量)在领导风格(自变量)对工作绩效(因变量)影响 关系中起到调节作用。具体来说,对于组织认同高的员工,变革型领导对工作绩 效的影响力,要高于组织认同低的员工。 中介变量:如果自变量通过影响变量N 来实现对因变量的影响,则称N 为中介变量。也就 是,领导风格(自变量)对工作绩效(因变量)影响作用是通过领导成员交换(中 介变量)的中介而产生的。 研究思路及三个主要部分组成: (1)领导风格对于员工工作绩效的主效应(Main Effects)研究。 (2)组织认同对于不同领导风格与员工工作绩效之间关系的调节效应(Moderating Effects)研究。 (3)领导成员交换对于不同领导风格与员工工作绩效之间关系的中介效应(Mediator Effects)研究。

目录 1.《调查问卷表》中数据预先处理~~~~~~~~~~~~~~ 3 1.1 剔除无效问卷~~~~~~~~~~~~~~~~~~~~ 3 1.2 重新定义控制变量~~~~~~~~~~~~~~~~~~ 3 2. 把Excel数据导入到SPSS软件中的方法~~~~~~~~~~ 4 3. 确认所有的变量中有无“反向计分”项~~~~~~~~~~~4 3.1 无“反向计分”题~~~~~~~~~~~~~~~~~~ 5 3.2 有“反向计分”题~~~~~~~~~~~~~~~~~~ 5 4. 效度分析~~~~~~~~~~~~~~~~~~~~~~~~6 5. 信度分析~~~~~~~~~~~~~~~~~~~~~~~~8 6. 描述统计~~~~~~~~~~~~~~~~~~~~~~~~9 7. 各变量相关系数~~~~~~~~~~~~~~~~~~~~ 12 7.1 求均值~~~~~~~~~~~~~~~~~~~~~~~12 7.2 相关性~~~~~~~~~~~~~~~~~~~~~~~12 8. 回归分析~~~~~~~~~~~~~~~~~~~~~~~13 8.1 使用各均值来分别求Z值~~~~~~~~~~~~~~~13 8.2 自变量Z值与调节变量Z值的乘积~~~~~~~~~~~13 8.3 进行回归运算~~~~~~~~~~~~~~~~~~~~14 8.3.1 调节作用分析~~~~~~~~~~~~~~~~~~14 8.3.2 中介作用分析~~~~~~~~~~~~~~~~~~18 8.4 调节作用作图~~~~~~~~~~~~~~~~~~~~22

店长经营数据分析

店长经营数据分析 Document number:WTWYT-WYWY-BTGTT-YTTYU-2018GT

店长必学:店长必须要会的数据分析 店长定期进行科学的数据分析,是店长掌握门店经营方向的重要手段。在日常工作中还有一些数据需要总部、门店分析,但无论哪方面数据,分析只是一个开始,关键是能够找出门店存在的问题及可以挖掘的能力,指导如何开始下一步工作才是重要的。店长需要每周或者每月开会,做以上各种数据分析,总结过去,找出差距。 一、门店经营指标数据分析 1)销售指标分析:主要分析本月销售情况,本月销售指标完成情况,与去年同期对比情况,通过这组数据的分析可以知道同比销售趋势,实际销售与计划的差距。 2)毛利分析:主要分析本月毛利率、毛利率情况,与去年同期对比情况。通过这组数据的分析可以知道同比毛利率状况,以及是否在商品毛利方面存在不足。 3)营运可控费用分析:主要是本月各项费用明细分析,与去年同期对比情况,有无节约控制成本费用,这里的各项费用是指:员工成本、能耗、物料及办公用品费用,维修费用,房租,存货损耗,日常营运费用(电话费、交通费、卫生费、税收、工商费),通过这组数据的分析,可清楚地知道门店营运可控费用后的列支,是否有同比异常的费用发生,有无可以节约的费用空间。 4)评效:主要是本月评效情况,与去年同期对比“日均评效”是指“日均单位面积销售额”,即日均销售额/门店营业面积。 5)人均劳效:主要是本月人均劳效情况,与去年同期对比,“本月人均劳效”计算方法:本月销售额/本月工资人数

6)盘点损耗率分析:主要是门店盘点结果简要分析,通过分析,及时发现门店在进、销、存各个环节存在的问题。 7)门店商品库存分析:主要是本月平均商品库存、周转天数,与去年同期对比分析。通过这组数据分析,看门店库存是否出现异常,特别是否有库存积压现象。 二、商品经营数据分析 1)经营商品目录执行情况总结分析:主要是本店执行商品目录情况与经营业态主力商品情况及新品引进情况、淘汰商品是否进行及时请退,总部每月1号将最新目录主力商品货号、目录新引进商品货号、目录淘汰商品货号发至各门店,门店根据相关货号查询出经营情况,特别是热销商品、新品商品经营情况,以及淘汰产品有没有及时请退,通过这组数据,可以了解门店是否按照商品目录的调整进行了门店的商品结构调整。 2)商品动销率分析:主要是本月商品动销品种统计,动销率分析,与上月对比情况,商品动销率计算公式:动销品种/门店经营总品种数*100,滞销品种数:门店经营总品种数-动销品种数。通过此组数据及具体单品的分析,可以看出门店在商品经营中存在的问题及潜力。 3)商品品类分析:主要是本店本月各品类销售比重及与去年同期对比情况,门店本月各品种类毛利比重及与去年同期对比情况,门店需对本月所有品类销售与毛利情况,特别是所有销售下降及毛利下降的品类进行全面分析,并通过分析找出差距,同时提出改进方案。 4)本月商品引进分析:主要是引进商品产生销售、毛利分析,这时的引进商品需要门店日常对新引进商品建档,并跟踪分析引进商品的动销率、适销率、销售额以及毛利

某公司经营情况分析报告模版

2003年一季度经营情况分析报告

新奥燃气控股有限公司 2003年4月

前言 03年度一季度已经匆匆过去。继02年度成功的市场开拓之后,控股公司有28个成员企业投入运作,从而使新奥燃气的覆盖人口从02年度的685万人迅速地增大到935万人。市场的扩展也使控股公司的经营收入比去年同期增长71.27%,达到11745.25万元,首次实现了季度收入过亿元。民用户的市场发展量和安装量、工商户的发展量和安装量比去年同期也有较大幅度的提高。一季度,控股公司成功的完成了部分A类物资的招标采购,实现了物资采购的质的飞跃并有效的降低了物资采购的成本;针对公司规模的迅速扩张,成立控股公司的安全管理委员会和安全管理办公室,为实施有效的安全管理打下了基础;工程管理迅速的开展了对成员企业的技术指导和流程支持,有效的支撑了企业的场站建设和基建工程建设。 也应该看到,随着新公司的增加,市场容量的迅速增大,销售收入并未实现同比的增长。老公司市场容量的日益减少、新公司市场培育尚未完成,给控股公司业绩的迅速提升带来巨大的压力。同口径相比,虽然老公司的业绩比去年同期增长14%,但新公司的市场增量依旧给控股公司一季度完成情况的差距。一季度,控股公司销售收入仅完成季度计划的82.69%,完成年度计划的11.51%。总体经营情况依旧没有摆脱严峻的形势,这就要求控股公司努力探求迅速提升市场发展的有效途径,寻找降低成本、提升业绩的有效手段,给投资者以信心。

一、总体经营情况 一季度,控股公司共实现销售收入11745.25万元,虽比去年同期增长

71.27%,但仅完成年度计划的11.51%,年度计划完成比比去年同期下降2.59个百分点;实现回款12456.45万元,比去年同期增长78.5%,回款率为106.06%。 经营收入与回款状况见附表一:03年一季度经营情况。 在销售收入的排名中,廊坊燃气、淮安燃气和蚌埠燃气分别以2603.71万元、1948.69万元和1715.91万元位居前三位,新乡燃气以1247.64万元位居第四。 在生产情况中,民用户发展完成34679户,完成季度计划的96.02%,完成年度计划的14.45%,比去年同期增长132.15%;在与去年同期老公司的数据对比分析中,今年老公司完成发展18019户,比去年同期的17073户增长了5.54%,显示出老公司的市场发展情况基本稳定;去年下半年度及今年成立的新公司的市场发展尽管也完成了16660户,但未能显现出市场发展的强劲势头来。工商业户发展完成19992.63方/日,完成年度计划的15.38%,完成季度计划的160.27%,比去年同期增长336.29%。 一季度,民用户安装完成10758户,虽比去年同期增长94.43%,但仅完成季度计划的73.36%,完成年度计划的5.57%;在与去年同期老公司的数据对比分析中,今年老公司完成安装仅完成4671户,比去年同期的5669户降低了17.6%,依旧显示出老公司注重房地产开发商的发展,对老户的开发仍然缺乏有效措施;工商业户安装完成7964.66方/日,完成季度计划的94.81%,完成年度计划的4.42%,完成量虽比去年同期增长65.22%,但年度完成率比去年同期下降1.52个百分点;总体的安装形势依旧呈现低迷状态。 在财务状况中,可控费用支出2856.63万元,比季度计划超支13.79%,比去年同期比例增高了1.46个百分点; 详见一季度经营指标完成情况表。 燃气集团2003年第一季度其它业务指标完成情况

怎么从公司财务报表中分析一个公司经营状况

怎么从公司财务报表中分析一个公司经营状况 假如有两家公司在某一会计年度实现的利润总额正好相同,但这是否意味着它们具有相同的获利能力呢?答案是否定的,因为这两家公司的资产总额可能并不一样,甚至还可能相当悬殊。再如,某公司2000年度实现税后利润100万元。很显然,光有这样—个会计数据只能说明该公司在特定会计期间的盈利水平,对报表使用者来说还无法做出最有效的经济决策。但是,如果我们将该公司1999年度实现的税后利润60万元和1998年度实现的税后利润30万元加以比较,就可能得出该公司近几年的利润发展趋势,使财务报表使用者从中获得更有效的经济信息。如果我们再将该公司近三年的资产总额和销售收入等会计数据综合起来进行分析,就会有更多隐含在财务报表中的重要信息清晰地显示出来。可见,财务报表的作用是有一定局限性的,它仅能够反映一定期间内企业的盈利水平、财务状况及资金流动情况。报表使用者要想获取更多的对经济决策有用的信息,必须以财务报表和其它财务资料为依据,运用系统的分析方法来评价企业过去和现在的经营成果、财务状况及资金流动情况。据以预测企业未来的经营前景,从而制定未来的战略目标和作出最优的经济决策。 为了能够正确揭示各种会计数据之间存在着的重要关系,全面反映企业经营业绩和财务状况,可将财务报表分析技巧概括为以下四类:横向分析;纵向分析;趋势百分率分析;财务比率分析。 一、财务报表分析技巧之一:横向分析 横向分析的前提,就是采用前后期对比的方式编制比较会计报表,即将企业连续几年的会计报表数据并行排列在一起,设置“绝对金额增减”和“百分率增减”两栏,以揭示各个会计项目在比较期内所发生的绝对金额和百分率的增减变化情况。下面,以ABC公司为例进行分析(见下表)。 比较利润及利润分配表分析: ABC公司比较利润表及利润分配表金额单位:元 项目2001年度2002年度绝对增减额百分率增减额(%) 销售收入7655000 9864000 2209000 28.9

常用数据分析方法论

常用数据分析方法论 ——摘自《谁说菜鸟不会数据分析》 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几方面开展数据分析?各方面包含什么内容和指标? 数据分析方法论主要有以下几个作用: ●理顺分析思路,确保数据分析结构体系化 ●把问题分解成相关联的部分,并显示它们之间的关系 ●为后续数据分析的开展指引方向 ●确保分析结果的有效性及正确性 常用的数据分析理论模型 营销方面管理方面 4P 用户使用行为STP理论 SWOT …… PEST 5W2H 时间管理生命周期 逻辑树 金字塔SMART原则 …… PEST分析法 PEST分析理论主要用于行业分析 PEST分析法用于对宏观环境的分析。宏观环境又称一般环境,是指影响一切行业和企业的各种宏观力量。 对宏观环境因素作分析时,由于不同行业和企业有其自身特点和经营需要,分析的具体内容会有差异,但一般都应对政治、经济、技术、社会,这四大类影响企业的主要外部环境因素进行分析。

以下以中国互联网行业分析为例。此处仅为方法是用实力,并不代表互联网行业分析只需要作这几方面的分析,还可根据实际情况进一步调整和细化相关分析指标:

5W2H分析法 5W2H分析理论的用途广泛,可用于用户行为分析、业务问题专题分析等。 利用5W2H分析法列出对用户购买行为的分析:(这里的例子并不代表用户购买行为只有以下所示,要做到具体问题具体分析)

逻辑树分析法 逻辑树分析理论课用于业务问题专题分析 逻辑树又称问题树、演绎树或分解树等。逻辑树是分析问题最常使用的工具之一,它将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。 把一个已知问题当成树干,然后开始考虑这个问题和哪些相关问题有关。 (缺点:逻辑树分析法涉及的相关问题可能有遗漏。)

企业经营情况分析报告

企业经营情况分析报告 ——————有限公司经营分析报告 (xx年xx月) 一、XX季度收入情况分析 1、近期业务收入情况(月度数据) (以上数据仅为示例) (业务发展情况分析)5月由于xxx原因,业务量激增,到6月回复xx水平。 2、主营业务各业务类型收入情况 要求列出占主营业务收入或主营业务利润总额10%以上的各种业务类型及产品情况:(以下为示例) 单位:(人民币)万元 二、公司业务生产情况分析

各二级企业根据本企业经营生产特点,把生产能力情况、主要业务指标情况等相关经营状况用数据和文字描述。 1、业务能力情况:——广告展示面积 (以广告公司为例,数据仅为示例,不具实际意义) 2、主要指标情况(以股份公司为例)三大指标: 1)近期趋势 2)季度指标同比情况 3、客户情况主要客户拓展客户 三、业务新增长点或近期工作重点 1、下阶段新的利润增长点市场情况启动工作准备情况 2、工作重点 四、公司重要经营事项报告表 关于***有限公司经营情况的调查报告 被调查企业:**有限公司

被调查人:** 调查日期:xx年10月 调查人:** 报告人:** 一、企业概况 **公司前身是武鸣县乡镇企业——**县**淀粉厂,原建设单位为**,于1994年经**批准立项、**环评批复而建设淀粉生产线和酒精生产线,xx年8月**公司整体收购了该厂的全部资产。 **公司成立于xx年2月,注册资本人民币1000万元,地址位于**镇**村,是一家专业生产食用酒精和淀粉制品的企业。法定代表人: **,股东**占公司60%的股份,股东**占公司36%的股份,股东**占公司4%的股份。公司下设人力资源部、财务部、市场部、车间等内部管理机构,总经理**,现有职工**人,其中大中专学历以上占30%。 xx年公司被评为**市农业产业化重点龙头企业,xx年被评为安全生产标准化三级企业,xx年和xx年连续两年被评为纳税超百万元企

大数据的统计分析方法

统计分析方法有哪几种?下面天互数据将详细阐述,并介绍一些常用的统计分析软件。 一、指标对比分析法指标对比分析法 统计分析的八种方法一、指标对比分析法指标对比分析法,又称比较分析法,是统计分析中最常用的方法。是通过有关的指标对比来反映事物数量上差异和变化的方法,有比较才能鉴别。 指标分析对比分析方法可分为静态比较和动态比较分析。静态比较是同一时间条件下不同总体指标比较,如不同部门、不同地区、不同国家的比较,也叫横向比较;动态比较是同一总体条件不同时期指标数值的比较,也叫纵向比较。 二、分组分析法指标对比分析法 分组分析法指标对比分析法对比,但组成统计总体的各单位具有多种特征,这就使得在同一总体范围内的各单位之间产生了许多差别,统计分析不仅要对总体数量特征和数量关系进行分析,还要深入总体的内部进行分组分析。分组分析法就是根据统计分析的目的要求,把所研究的总体按照一个或者几个标志划分为若干个部分,加以整理,进行观察、分析,以揭示其内在的联系和规律性。 统计分组法的关键问题在于正确选择分组标值和划分各组界限。 三、时间数列及动态分析法 时间数列。是将同一指标在时间上变化和发展的一系列数值,按时间先后顺序排列,就形成时间数列,又称动态数列。它能反映社会经济现象的发展变动情况,通过时间数列的编制和分析,可以找出动态变化规律,为预测未来的发展趋势提供依据。时间数列可分为绝对数时间数列、相对数时间数列、平均数时间数列。 时间数列速度指标。根据绝对数时间数列可以计算的速度指标:有发展速度、增长速度、平均发展速度、平均增长速度。

动态分析法。在统计分析中,如果只有孤立的一个时期指标值,是很难作出判断的。如果编制了时间数列,就可以进行动态分析,反映其发展水平和速度的变化规律。 四、指数分析法 指数是指反映社会经济现象变动情况的相对数。有广义和狭义之分。根据指数所研究的范围不同可以有个体指数、类指数与总指数之分。 指数的作用:一是可以综合反映复杂的社会经济现象的总体数量变动的方向和程度;二是可以分析某种社会经济现象的总变动受各因素变动影响的程度,这是一种因素分析法。操作方法是:通过指数体系中的数量关系,假定其他因素不变,来观察某一因素的变动对总变动的影响。 用指数进行因素分析。因素分析就是将研究对象分解为各个因素,把研究对象的总体看成是各因素变动共同的结果,通过对各个因素的分析,对研究对象总变动中各项因素的影响程度进行测定。因素分析按其所研究的对象的统计指标不同可分为对总量指标的变动的因素分析,对平均指标变动的因素分析。 五、平衡分析法 平衡分析是研究社会经济现象数量变化对等关系的一种方法。它把对立统一的双方按其构成要素一一排列起来,给人以整体的概念,以便于全局来观察它们之间的平衡关系。平衡关系广泛存在于经济生活中,大至全国宏观经济运行,小至个人经济收支。平衡分析的作用:一是从数量对等关系上反映社会经济现象的平衡状况,分析各种比例关系相适应状况;二是揭示不平衡的因素和发展潜力;三是利用平衡关系可以从各项已知指标中推算未知的个别指标。 六、综合评价分析 社会经济分析现象往往是错综复杂的,社会经济运行状况是多种因素综合作用的结果,而且各个因素的变动方向和变动程度是不同的。如对宏观经济运行的评价,涉及生活、分配、流通、消费各个方面;对企业经济效益的评价,涉及人、财、物合理利用和市场销售状况。如果只用单一指标,就难以作出恰当的评价。 进行综合评价包括四个步骤:

相关主题
文本预览
相关文档 最新文档