当前位置:文档之家› 随机区组和被试内实验设计以及对应的方差分析

随机区组和被试内实验设计以及对应的方差分析

随机区组和被试内实验设计以及对应的方差分析
随机区组和被试内实验设计以及对应的方差分析

近来关于随机区组和被试内实验设计以及对应的方差分析的问题,多人追问不止。既自觉已思路清晰、天下无敌。特本着一半自己再梳理一下,一半友好互助的形式小写个群邮件,充个英勇,让大家也分享下。定是不足与不当多多,盼批评指正。

相信把这个东西认真看完,思路不清晰的童鞋马上也会思路清晰起来。

看似很复杂,实际上我尽全力做到深入浅出,因此,相信只要是地球人都可以看得懂。

一、随机区组的被试分配:

a1 a2

区组b1 b2 b1 b2

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

数据刻意简单化,不合理没有关系。

是个2*2随机区组设计,3个区组。

如何分配被试?首先,随机区组的每个区组的被试应该是有差异的,否则就不需要分区组了,直接完全随机就可以了。

因此随机区组的前提是:区组间异质,而区组内的被试尽可能同质。

被试有以下几个情况:

第一分配方式:假设该实验的被试总个数为24个,每个区组的被试为8个。他可以有两种分配方式

1、将每组中的任意每2个被试随机接受一种处理,2*4=8

2、8人同时接受所有的处理,1*8=8

需要注意的三个问题:

1、一般都用第一种情况,第二种不用,因为区组内的这8个人本来就是理论上的同质的,所以只要把他们分开,随机接受不同的处理就能说明问题,这样可以省时,省钱,还能避免每个人由于重复测量导致的额外变量的增加。

2、它强调了区组内的被试随机接受不同的实验处理,也因此叫随机区组。

3、它要求每个区组的被试单位应该是实验处理水平的整数倍。如8/4=2

第二种分配方式:假设该实验的被试一共是3个,就是说,一个被试为一个区组。那么每个区组的这个被试全部接受实验的4个不同水平的处理。这个时候就需要平衡实验的顺序,防止一个人不短的被实验而出现的顺序效应,如何平衡,一般用“ABBA”或所谓的“拉丁方”。

第三种分配方式:当一个大团体(如学校)为一个区组的时候,而大团体中又有小团体的时候(如学校中的班级),通常让一个小团体接受一种处理。例如:ABC分别是不同的三个学校,他们各自为一个区组,那么A学校是区组一,A学校就要抽四个班级出来,每个班级随机接受一种实验处理。

注意:传统的观点认为上述“第二种方式”----一个被试为一个区组的情况不叫区组,叫被试内设计,就是因为每个被试都接受了不同的实验处理,因此没有随机可言。其具体的方差分析和随机区组的方差分析也有所差别。表现在SS残差的是否细分。具体往下看。

二、随机区组的方差分析

还是那个例子:

a1 a2

b1 b2 b1 b2

区组处理1 处理2 处理3 处理4

11 4 7 10

22 5 8 11

33 6 9 12

假定研究某种药物对某种操作的影响

自变量A(药物)有两个水平,药物分别是0单元和2单元

自变量B(实验环境)有两个水平,环境1和环境2。

分别取三个不同层次的个体,分别是:少年、青年、老年。

数据刻意简单化,不合理没有关系。

是个2*2随机区组设计

区组的个数n=3

a因素的处理水P=2

b因素的处理水平q=2

所有的处理水平p*q=4

所有的被试单位=N =npq =3*2*2=12

为了本质化,特意把所有的无聊的SS后面的字母统统去掉,用汉字表达

平方和的分解:

SS总=SS处理间+SS区组+SS残差

1、SS总=整个实验的每个具体测量值和整个实验的总平均数差的平方再求和。

即:SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)

2、“SS处理间”是什么意思?

例子一共有4种处理,因此,SS处理间=4种处理中,n倍的“每一种处理的平均值与整个实验总平均值差的平方再求和”。

即:SS处理间=n*[∑(各种处理平均值-μ)^2](μ=总平均数)

3、“SS区组”是什么意思?

例子一共有3个区组,因此,SS区组=3个区组中,pq倍的“每一个区组的平均值与整个实验总平均值差的平方再求和”。

即:SS区组=pq*[∑(各区组平均值-μ)^2](μ=总平均数)

如何具体求SS总、SS处理间、SS区组?

1、求SS总:

因为SS总=∑(X-μ)^2(μ=总平均数,X=各原始测量值)

又因为整个实验的总平均数=6.5

因此SS总=∑(X-μ)^2=(1-6.5)^2+(2-6.5)^2+(3-6.5)^2+……+(12-6.5)^2 (μ=总平均数,X=各原始测量值)

2、求SS处理间:

因为SS处理间= n*[∑(各种处理平均值-μ)^2](μ=总平均数,X=各原始测量值)

又因为处理1的平均值是2;处理2的平均值是5;处理3是8,处理4的是11。

因此SS处理间= n*[∑(各种处理平均值-μ)^2]=3*[(2-6.5)^2+(5-6.5)^2+(8-6.5)^2+(11-6.5)^2]

3、求SS区组:

因为SS区组= pq*[∑(各区组平均值-μ)^2](μ=总平均数,X=各原始测量值)

又因为区组一的平均值是5.5,区组二的平均值是6.5,区组三的平均值是7.5。

因此SS区组= pq*[∑(各区组平均值-μ)^2]=4*[(5.5-6.5)^2+(6.5-6.5)^2+(7.5-6.5)^2]

4、求SS残差:

直接用SS残差= SS总-SS处理间-SS区组

但是实际中,计算一般不用先求对应的平均数,而是直接用原始数据。

根据数学转化,可以得出以下等式:(数学转换过程不需要管)

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq(μ=总平均数,X=各原始测量值)

2、SS处理间= n*[∑(各种处理平均值-μ)^2]=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/npq(X=各原始测量值)

3、SS区组= pq*[∑(各区组平均值-μ)^2]=∑[(各区组的总值^2)/pq]-[(∑X) ^2]/npq(X=各原始测量值)所以可以用原始数据这么计算:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、因为处理1的总水平=1+2+3=6;处理2的总水平=4+5+6=15;处理3的总水平=7+8+9=24;处理4的总水平=10+11+12=33

所以SS处理间=∑[(各种处理的总水平^2)/n]-[(∑X) ^2]/npq=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、因为区组1的总水平=1+4+7+10=22,区组2的总水平=2+5+8+11=26,区组3的总水平=3+6+9+12=30

所以SS区组=∑[(各区组的总水平^2)/pq]-[(∑X) ^2]/npq=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

通过上述的分析,我们可以得到SS总、SS处理间、SS区组,自然“SS残差”也就得出来了。

因此,这个时候就可以通过“SS区组/ df区组”来计算出“MS区组”,同时通过“SS残差/df残差”可以计算出“MS 残差”。

在这里插个问题:

“df总”指总自由度,它等于所有被试单位-1,即npq-1=3*2*2-1=11

df区组等于多少?它等于区组数-1,即n-1=3-1

df处理间等于多少?它等于处理水平-1,即pq-1=2*2-1=3

df残差自然就等于(n-1)(pq-1)

df总=df区组+df处理间+df残差

再回到问题:

将“MS区组”除以“MS残差”,就可以得到F值,再与对应的F(0.05)以及F(0.01)比较。

若F大于F(0.05),则说明在0.05的水平上,可以得到差异显著结论。

请注意,到底是什么差异是否显著?

在这里,计算的是MS区组/ MS残差,因此,它所描述的统计结论是:该实验的三个区组的水平是否差异。具体的说,某种药物对某种操作的影响在少年、成年、老年这三个区组上的结果是差异显著的。或者说不同年龄段的人不管药物水平和环境如何,结果都是差异显著的。

同样,我们也可以通过“SS处理间/ df处理间”来计算出“MS处理间”,将“MS处理间”除以“MS残差”,就可以得到F值,再与对应的F(0.05)以及F(0.01)比较。得出是否显著显著。

请您集中全身注意,惊险时刻!!!在这里,通过计算“MS处理间/MS残差”检验的是什么差异是否显著?

实验要检验的是在A因素上实验的结果是否差异显著、B因素上实验的结果是否差异显著、在AB因素交互作用下结果差异是否显著。而按照“MS处理间/MS残差”检验的时候只能检验出实验中4个处理水平是否差异显著。每个水平既有A因素,又有B因素。因此,在多因素实验设计的时候,必须对SS处理间进行平方和的再分解,分解出A、B以及AB交互的平方和:SSA、SSB以及SSAB之后,再利用SSA/dfA、SSB/dfB以及SSAB/dfAB求出对应的MSA、MSB以及MSAB才能具体检验。

如何分解?如何计算SSA、SSB以及SSAB以及对应的dfA、dfB以及dfAB?

先等等,到这里插个问题题:

如果我们把题目改成:

区组处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

比较一下,把两个AB因素去掉了,直接说成是一个自变量的4种处理,实质上的方差分析是一模一样的。

自变量(药物)有4个处理水平,药物分别是0单元、2单元、4单元、8单元(几个单元不管,只是区分水平)

分别取三个不同层次的个体,分别是:少年、青年、老年。

这就是个单因素随机区组设计

区组的个数n=3

处理水平k=4

所有的被试单位=N =nK=3*4=12

方差分析要分析出:区组差异是否显著,以及处理间差异是否显著。

同样:

SS总=SS区组+SS处理间+SS残差

如何计算?方法跟上面一模一样,只是这里的K等于原来的pq

因此字母换一下而已:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/nk=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、SS处理间=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/nk=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS区组=∑[(各区组的总值^2)/k]-[(∑X) ^2]/nk=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+ (12)

^2]/12

同时:

df总=nk-1=3*2*2-1=11

df区组=n-1=3-1

df处理间=k-1=2*2-1=3

df残差=(n-1)(k-1)

df总=df区组+df处理间+df残差

这个时候,用“MS区组/ MS残差”检验描述的统计结论还是:某种药物对某种操作的影响在少年、成年、老年这三个区组上的结果是差异显著的。

而用“MS处理间/MS残差”检验描述得统计结论自然变得“理所当然”:某种药物不同水平对某钟操作的影响是差异显著的。

因此,以上借两因素的随机区组实验的方差分析实际上讲的是单因素的随机区组方差分析。

灰常正经的:这就是单因素随机区组实验的方差分析!

这也说明方差分析的本质是一样的。

而实际的两因素的方差分析才进行到一半。

继续两因素的方差分析,以上已经计算出SS总、SS处理间、SS区组以及SS残差,和对应的自由度,同时完成了区组的检验,即MS区组/MS残差。而SS处理间还要进一步分解。

分解:SS处理间=SSA+SSB+SSAB

因此:SS总=SS区组+SS残差+SSA+SSB+SSAB

1、SSA=在A因素中,nq倍的“每一种水平对应的具体测量值和这个水平的平均值的差的平方再求和”。即:SSA=np*[∑(A因素各水平的平均值-A因素平均值)^2](A因素的平均值实际上就是总平均值)

因为A因素水平1的平均数是=(1+2+3+4+5+6)/6=3.5,

水平2的平均值=(7+8+9+10+11+12)/6=57=9.5,

总平均值=6.5

nq=6

因此SSA=6*(3.5-6.5)^2+(9.5-6.5)^2

也可以用数学方法转换成原始数据计算的公式:

SSA=∑[(A因素各种水平的总值^2)/nq]-[(∑X) ^2]/npq

因为A因素水平1的总值=1+2+3+4+5+6=21,A因素水平2的总值=7+8+9+10+11+12=57

因此SSA= [(21^2)/6+(57^2)/6]-[(1+2+3+……+12)^2]/12

2、SSB=在B因素中,np倍的“每一种处理水平对应的具体测量值和这个水平的平均值的差的平方再求和”。即:SSB=np*[∑(B因素各水平的平均值-B因素平均值)^2](B因素的平均值实际上也就是总平均值)

因为B因素水平1的平均数是=(1+2+3+7+8+9)/6=5,

水平2的平均值=(4+5+6+10+11+12)/6=8,

总平均值=6.5

nq=6

因此SSB=6*(5-6.5)^2+(8-6.5)^2

也可以用数学方法转换成原始数据计算的公式:

SSB=∑[(B因素各种水平的总值^2)/np]-[(∑X) ^2]/npq

因为B因素水平1的总值=1+2+3+7+8+9=30,B因素水平2的总值=4+5+6+10+11+12=48

因此SSB= [(30^2)/6+(48^2)/6]-[(1+2+3+……+12)^2]/12

3、求SSAB=SS处理间-SSA-SSB

同时:dfA=p-1

dfB=q-1

dfAB=(p-1)(q-1)

df处理间=dfA+dfB+dfAB

df总=df区组+df处理间+df残差=df区组+df残差+dfA+dfB+dfAB

因此SS总=SS区组+SS残差+SSA+SSB+SSAB中的任何值都求出来了,同时也知道了各自的自由度df,就可以求任意的均方(MS),通过和残差均方的对比,来构建F检验,从而判断各种因素或区组是否差异显著。

需要说明的是:AB的交互作用是非常重要的,如果检验AB的交互作用是不显著的,那么检验AB因素各自的主效应就很重要;如果AB的交互作用很显著,那么对AB因素各自主效应的检验的意义就不大。

此外,很多时候,在检验A因素和B因素的时候会发现一个问题,那就是,是否可以把AB因素各自的主效应再细分,例如,是否可以检验A因素在B1和B2哪个水平上更显著?或者B因素在A1和A2哪个水平上更显著?

1、如何检验A因素在B1和B2哪个水平上更显著?(仅限2*2设计时)

将SSA+SSAB=SSAB1+SSAB2

求SSAB1=(A1B1水平上的和的平方+ A2B1水平上的和的平方)/n-(A1B1水平上的和+A2B1水平上的和)^2/qn

=[(1+2+3)^2+(7+8+9)^2]/3-(1+2+3+7+8+9)^2/6

求SSAB2=(A1B2水平上的和的平方+ A2B2水平上的和的平方)/n-(A1B2水平上的和+A2B2水平上的和)^2/qn

=[(4+5+6)^2+(10+11+12)^2]/3-(4+5+6+10+11+12)^2/6

将求得的SSAB1、SSAB2分别求MSAB1和MSAB2,并分别除以MS残差。并检验结论。

2、如何检验B因素在A1和A2哪个水平上更显著?(仅限2*2设计时)

同理将SSB+SSA=SSA1B+SSA2B

求SSA1B=(A1B1水平上的和的平方+ A1B2水平上的和的平方)/n-(A1B1水平上的和+A1B2水平上的和)^2/pn

求SSA2B=(A2B1水平上的和的平方+ A2B2水平上的和的平方)/n-(A2B1水平上的和+A2B2水平上的和)^2/pn

同时:dfAB1=dfAB2=dfA1B=dfA2B=1

三、被试内设计方差分析

还是那个例子:

a1 a2

b1 b2 b1 b2

区组处理1 处理2 处理3 处理4

11 4 7 10

22 5 8 11

33 6 9 12

如果这个时候把“区组”俩字改成“被试”,意味着该实验有3名被试,每一名被试均接受4种不同的处理。

那么就成了一个被试内实验。

(一)单因素时

被试处理1 处理2 处理3 处理4

1 1 4 7 10

2 2 5 8 11

3 3 6 9 12

被试的个数n=3

自变量的水平K=4

所有的被试单位=N =nk =3*4=12

原来的平方和分析是:SS总=SS区组+SS处理间+SS残差

因此相应的也就改成:SS总=SS被试间+SS处理间+SS残差

(SS处理间+SS残差=SS被试内,这个没有任何意义,知道下就可以了)

进行对应的方差分析:(和原来一模一样,就把原来的区组统统改成被试间)

方差分析要分析出:被试间差异是否显著,以及处理间差异是否显著。

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/nk=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、SS处理间=∑[(各种处理的总值^2)/n]-[(∑X) ^2]/nk=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS区组=∑[(各个被试的侧量总值^2)/k]-[(∑X) ^2]/nk=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+ (12)

^2]/12

同时:

df总=nk-1=3*2*2-1=11

df被试间=n-1=3-1

df处理间=k-1=2*2-1=3

df残差=(n-1)(k-1)

df总=df被试间+df处理间+df残差

再算

MS被试间/ MS残差

MS处理间/MS残差

(二)两因素时

a1 a2

b1 b2 b1 b2

被试处理1 处理2 处理3 处理4

11 4 7 10

22 5 8 11

33 6 9 12

被试的个数n=3

a因素的处理水P=2

b因素的处理水平q=2

所有的处理水平p*q=4

所有的被试单位=N =npq =3*2*2=12

原来的平方和分析是:SS总=SS区组+SS残差+SSA+SSB+SSAB

因此相应的也就改成:SS总=SS被试间+SS残差+SSA+SSB+SSAB

其中,SS总、SS被试间、SSA、SSB、SSAB的计算方法和随机区组一模一样,就是把字改一下:

1、SS总=∑(X-μ)^2=∑X^2-[(∑X) ^2]/npq=1^2+2^2+3^2+……+12^2-[(1+2+3+……+12)^2]/12

2、SS处理间=∑[(各种处理的总水平^2)/n]-[(∑X) ^2]/npq=(6^2)/3+(15^2)/3+(24^2)/3+(33^2)/3-[(1+2+3+……+12)^2]/12

3、SS被试间=∑[(各被试间的总水平^2)/pq]-[(∑X) ^2]/npq=(22^2)/4+(26^2)/4+(30^2)/4-[(1+2+3+……+12)^2]/12

4、SS残差= SS总-SS处理间-SS被试间

5、SSA=∑[(A因素各种水平的总值^2)/nq]-[(∑X) ^2]/npq

= [(21^2)/6+(57^2)/6]-[(1+2+3+……+12)^2]/12

6、SSB=∑[(B因素各种水平的总值^2)/np]-[(∑X) ^2]/npq

= [(30^2)/6+(48^2)/6]-[(1+2+3+……+12)^2]/12

7、求SSAB=SS处理间-SSA-SSB

同时:

1、df总=npq-1=3*2*2-1=11

2、df被试间n-1=3-1

3、df处理间=pq-1=2*2-1=3

4、df残差=(n-1)(pq-1)

5、dfA=p-1

6、dfB=q-1

7、dfAB=(p-1)(q-1)

8、df总=df被试间+df处理间+df残差=df被试间+df残差+dfA+dfB+dfAB

注意:从这里开始,就不一样了~

传统的心理统计认为:在进行被试内设计的方差分析的时候,需要把SS残差细分,尽管张版统计认为一个被试可以当成一个区组,因此直接利用总的残差计算。但是貌似主流的观点还是将SS残差进行一个划分,因此,那就分吧~

SS残差=SSA*被试间+SSB*被试间+SSAB*被试间

因此在最后计算完MSA、MSB、以及MSAB之后,不能将他们分别直接除以SS残差。

而是要对应的除以:SSA*被试间、SSB*被试间、SSAB*被试间

即:F=MSA/ MSA*被试间

F=MSB/ MSB*被试间

F=MSAB/MAB*被试间

最后比较他们和F(0.05)以及F(0.01)的关系,进而作出结论。

据说这样细分的结果更科学、更合理、更敏感、更·#¥%……

那么如何算SSA*被试间、SSB*被试间、SSAB*被试间以及对应的自由度?

(灰常痛苦~)

1、SSA*被试间=∑[(A因素任意水平上每个被试两次处理结果的和^2)/q]-[(∑X) ^2]/npq-SSA-SS被试间=[(1+4)^2+(2+5)^2+(3+6)^2+…+(9+12)^2]/2-[(∑X) ^2]/npq-SSA-SS被试间

2、SSB*被试间=∑[(B因素任意水平上每个被试两次处理结果的和^2)/p]-[(∑X) ^2]/npq-SSB-SS被试间=[(1+7)^2+(2+8)^2+(3+9)^2+…+(6+12)^2]/2-[(∑X) ^2]/npq-SSB-SS被试间

3、SSAB*被试间=SS残差-SSA*被试间-SSB*被试间

同时:

dfA*被试间=(p-1)(n-1)

dfB*被试间=(q-1)(n-1)

dfAB*被试间=(p-1)(q-1)(n-1)

df残差= dfA*被试间+ dfB*被试间+ dfAB*被试间

df总=df被试间+ dfA*被试间+ dfB*被试间+ dfAB*被试间+dfA+dfB+dfAB

终于结束了。

多因素只考两因素的,去年考过混合的,实际上混合的计算比这个简单。单因素的又太简单。

所以个人认为今年考个区组或被试内的可能还是有的。

方差分析和试验设计

6方差分析与试验设计 在研究一个或多个分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中主要方法之一。检验多个总体均值是否相等的统计方法。 所要检验的对象称为因素。因素的不同表现称为水平。每个因子水平下得到的样本数据称为观测值。 随机误差:在同一行业(同一总体)下,样本的各观测值是不同的。抽样随机性造成。 系统误差:在不同一行业(不同一总体)下,样本的各观测值也是不同的。抽样随机性和行业本身造成的。 组内误差:衡量因素在同一行业(同一总体)下样本数据的误差。只包含随机误差。 组间误差:衡量因素在不同一行业(不同一总体)下样本数据的误差。包含随机误差、系统误差。 方差分析的三大假设: 每个总体服从正态分布; 每个总体的方差必须相同; 观测值是独立的; 单因素方差分析(F分布) 数据结构:表示第i个水平(总体)的第j个的观测值。(i列j行)分析步骤: 1提出假设。自变量对因变量没有显著影响 不完全相等自变量对因变量有显著影响 2构造检验的统计量 计算因素各水平的均值(各水平样本均值) 计算全部观测值的总均值(总体均值) 计算误差平方和: 总误差平方和SST:全部观测值与总平均值得误差平方和。 水平项误差平方和SSA:各组平均值与总平均值得误差平方和。组间平方和。 误差项平方和SSE:各样本数据与其组平均值误差的平方和。组内平方和。 SST=SSA+SSE

A B C D E F G 1 误差来源 平方和自由度均方F 值P 值 F 临界值2SS df MS 3组间(因素 来源)SSA k-1MSA MSA/MSE 4组内(误差)SSE n-k MSE 5 总和 SST n-1 计算统计量 各平方和除以它们对应的自由度,这一结果称为均方。 SST 的自由度为(n-1),其中n 为全部观测值的个数。 SSA 的自由度为(k-1),其中k 为因素水平的个数。(组数-1) SSE 的自由度为(n-k )。 SSA 的均方(组间均方)为 SSE 的均方(组内均方)为 3统计决策 在给定的显著性水平α下,查表得临界值 若,有显著影响; 若,无显著影响; 4方差分析表

方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1. C 2. B 3. A 4. B 5. C 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6. A 7. D 8. D 9. A 10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

正交试验设计及其方差分析

第三节正交试验设计及其方差分析 在工农业生产和科学实验中,为改革旧工艺,寻求最优生产条件等,经常要做许多试验,而影响这些试验结果的因素很多,我们把含有两个以上因素的试验称为多因素试验.前两节讨论的单因素试验和双因素试验均属于全面试验(即每一个因素的各种水平的相互搭配都要进行试验),多因素试验由于要考虑的因素较多,当每个因素的水平数较大时,若进行全面试验,则试验次数将会更大.因此,对于多因素试验,存在一个如何安排好试验的问题.正交试验设计是研究和处理多因素试验的一种科学方法,它利用一套现存规格化的表——正交表,来安排试验,通过少量的试验,获得满意的试验结果. 1.正交试验设计的基本方法 正交试验设计包含两个内容:(1)怎样安排试验方案;(2)如何分析试验结果.先介绍正交表. 正交表是预先编制好的一种表格.比如表9-17即为正交表L4(23),其中字母L表示正交,它的3个数字有3种不同的含义: (1) L4(23)表的结构:有4行、3列,表中出现2个反映水平的数码1,2. 列数 ↓ L4 (23) ↑↑ 行数水平数 (2)L4(23)表的用法:做4次试验,最多可安排2水平的因素3个. 最多能安排的因素数 ↓ L4 (23) ↑↑ 试验次数水平数 (3) L4(23)表的效率:3个2水平的因素.它的全面试验数为23=8次,使用正交表只需从8次试验中选出4次来做试验,效率是高的. L4 (23) ↑↑ 实际试验数理论上的试验数 正交表的特点: (1)表中任一列,不同数字出现的次数相同.如正交表L4(23)中,数字1,2在每列中均出现2次. (2)表中任两列,其横向形成的有序数对出现的次数相同.如表L4(23)中任意两列,数字1,2间的搭配是均衡的.

第10章 方差分析与试验设计

第10章 方差分析与试验设计 三、选择题 1.方差分析的主要目的是判断 ( )。 A. 各总体是否存在方差 B. 各样本数据之间是否有显著差异 C. 分类型自变量对数值型因变量的影响是否显著 D. 分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是 ( )。 A. 组间平方和除以组内平方和 B. 组间均方除以组内均方 C. 组间平方除以总平方和 D. 组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为 ( )。 A. 随机误差 B. 非随机误差 C. 系统误差 D. 非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为 ( )。 A. 组内误差 B. 组间误差 C. 组内平方 D. 组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 6.组内误差是衡量某一水平下样本数据之间的误差,它 ( )。 A. 只包括随机误差 B. 只包括系统误差 C. 既包括随机误差,也包括系统误差 D. 有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定 ( )。 A. 每个总体都服从正态分布 B. 各总体的方差相等 C. 观测值是独立的 D. 各总体的方差等于0 8.在方差分析中,所提出的原假设是210:μμ=H = ···=k μ,备择假设是( ) A. ≠≠H 211:μμ···k μ≠ B. >>H 211:μμ···k μ> C. <

试验设计与数据分析

试验设计与数据分析

1.方差分析在科学研究中有何意义?如何进行平方和与自由度的分解?如何进行F检验和多重比较? (1)方差分析的意义 方差分析,又称变量分析,其实质是关于观察值变异原因的数量分析,是科学研究的重要工具。方差分析得最大公用在于:a. 它能将引起变异的多种因素的各自作用一一剖析出来,做出量的估计,进而辨明哪些因素起主要作用,哪些因素起次要作用。 b. 它能充分利用资料提供的信息将试验中由于偶然因素造成的随机误差无偏地估计出来,从而大大提高了对实验结果分析的精确性,为统计假设的可靠性提供了科学的理论依据。 (2)平方和及自由度的分解 方差分析之所以能将试验数据的总变异分解成各种因素所引起的相应变异,是根据总平方和与总自由度的可分解性而实现的。 (3)F检验和多重比较 ① F检验的目的在于,推断处理间的差异是否存在,检验某项变异原因的效应方差是否为零。实际进行F检验时,是将由试验资料算得

的F 值与根据df 1=df t (分子均方的自由度)、df 2=df e (分母均方的自由度)查附表4(F 值表)所得的临界F 值(F 0.05(df1,df2)和F 0.01(df1,df2))相比较做出统计判断。若F< F 0.05(df1,df2),即P>0.05,不能否定H 0,可认为各处理间差异不显著;若F 0.05(df1,df2)≤F <F 0.01(df1,df2),即0.01

第六章--方差分析与正交试验设计讲解学习

第六章 方差分析与正交试验设计 在生产实践和科学研究中,经常要分析各种因素对试验指标是否有显著的影响。例如,工业生产中,需要研究各种不同的配料方案对生产出的产品的质量有无显著差异,从中筛选出较好的原料配方;农业生产中,为了提高农作物的产量,需要考察不同的种子、不同数量的肥料对农作物产量的影响,并从中确定最适宜该地区种植的农作物品种和施肥数量。 要解决诸如上述问题,一方面需要设计一个试验,使其充分反映各因素的作用,并力求试验次数尽可能少,以便节省各种资源和成本;另一方面就是要对试验结果数据进行合理的分析,以便确定各因素对试验指标的影响程度。 §6.1 单因素方差分析 仅考虑一个因素A 对试验指标有无显著影响,可以让A 取r 个水平:r A A A ,,,21 ,在水平i A 下进行i n 次试验,称为单因素试验,试验结果观测数据ij x 列于下表: 并设在水平i A 下的数据i in i i x x x ,,21来自总体),(~2 i i N X ,),,2,1(r i 。 检验如下假设: r H 210:, r H ,,,:211 不全相等 检验统计量为 ),1(~) /() 1/(r n r F r n S r S F e A 其中2 1 2 11)()(x x n x x S i r i i r i n j i A i ,称为组间差平方和。 211 )(i r i n j ij e x x S i ,称为组内差平方和。

这里 r i i n n 1 , i n j ij i i x n x 1 1 , r i n j ij i x n x 111。 对于给定的显著性水平)05.001.0(或 ,如果),1(r n r F F ,则拒绝0H ,即认为因素A 对试验指标有显著影响。 实际计算时,可事先对原始数据作如下处理: b a x x ij ij 再进行计算,不会影响F 值的大小。 例1 试分析三种不同的菌型对小白鼠的平均存活日数影响是否显著? 解:30,11,9,10,3321 n n n n r 16.6,27.7,22.7,4321 x x x x 43.70)()(21 2 11 x x n x x S i r i i r i n j i A i , 74.137)(211 i r i n j ij e x x S i 49.5)27,2(90.601.0 F F ,说明三种不同菌型的伤寒病菌对小白鼠的平均存活日数的影响高度显著。 §6.2 双因素方差分析 同时考察两个因素A 和B 对试验指标有无显著影响,可以让A 取r 个水平: r A A A ,,,21 ,让B 取s 个水平:s B B B ,,,21 ,在各种水平配合),(j i B A 下进行试验, 称为双因素试验。 一、无交互作用的双因素方差分析 在每一种水平配合),(j i B A 下作一次试验,称为无交互作用的双因素试验,试验结果观测数据ij x 列于下表:

利用SPSS_进行方差分析以及正交试验设计

实验设计与分析课程论文 题目利用SPSS 软件进行方差分析和正交试验设计 学院 专业 年级 学号 姓名 2012年6月29日

一、SPSS 简介 SPSS 是世界上最早的统计分析软件,1984年SPSS 总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+,开创了SPSS 微机系列产品的开发方向,极大地扩充了它的应用范围,并使其能很快地应用于自然科学、技术科学、社会科学的各个领域,世界上许多有影响的报刊杂志纷纷就SPSS 的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。 SPSS 的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic 回归、Probit 回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS 也有专门的绘图系统,可以根据数据绘制各种图形。SPSS 的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL 及DBF 数据文件,现已推广到多种各种操作系统的计算机上,它和SAS 、BMDP 并称为国际上最有影响的三大统计软件。 SPSS 输出结果虽然漂亮,但不能为WORD 等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这可以说是SPSS 软件的缺陷。 二、方差分析 例如 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。对照组为组一,锻炼组为组二,药物组为组三。 第一步:打开 SPSS 软件 表1 三组战士的第一秒用力肺活量(L) 对照组 锻炼组 药物组 合计 3.25 3.66 3.44 3.32 3.64 3.62 3.29 3.48 3.48 3.34 3.64 3.36 3.16 3.48 3.52 3.64 3.20 3.60 3.60 3.62 3.32 3.28 3.56 3.44 3.52 3.44 3.16 3.26 3.82 3.28

第10章__方差分析与试验设计

第10章方差分析与试验设计 三、选择题 1.C 2.B 3.A 4.B 5.C 1.方差分析的主要目的是判断()。 A.各总体是否存在方差 B.各样本数据之间是否有显著差异 C.分类型自变量对数值型因变量的影响是否显著 D.分类型因变量对数值型自变量的影响是否显著 2.在方差分析中,检验统计量F是()。 A.组间平方和除以组内平方和B.组间均方除以组内均方 C.组间平方除以总平方和D.组间均方除以总均方 3.在方差分析中,某一水平下样本数据之间的误差称为()。 A.随机误差B.非随机误差C.系统误差D.非系统误差 4.在方差分析中,衡量不同水平下样本数据之间的误差称为()。 A.组内误差B.组间误差C.组内平方D.组间平方 5.组间误差是衡量不同水平下各样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 6.A 7.D8.D9.A10.A 6.组内误差是衡量某一水平下样本数据之间的误差,它()。 A.只包括随机误差 B.只包括系统误差 C.既包括随机误差,也包括系统误差 D.有时包括随机误差,有时包括系统误差 7.在下面的假定中,哪一个不属于方差分析中的假定()。 A.每个总体都服从正态分布B.各总体的方差相等 C.观测值是独立的D.各总体的方差等于0 8.在方差分析中,所提出的原假设是0:=···= ,备择假设是() 12 k A.1:12···kB.1:12···k C. 1:···kD.1:1,2,···,k不全相等 12 9.单因素方差分析是指只涉及()。 A.一个分类型自变量B.一个数值型自变量 C.两个分类型自变量D.两个数值型因变量 10.双因素方差分析涉及()。 A.两个分类型自变量B.两个数值型自变量 C.两个分类型因变量D.两个数值型因变量 11.B12.C

实验设计与方差分析

试验设计与方差分析 SPSS操作 一、试验设计与方差分析的关系 试验设计并不是一种统计方法,而是一组统计方法的统称,其主要用途在于分析自变量x的值与因变量y值之间的关系。此外,还用于降低背景变量对理解x值与y值之间关系时的影响。 试验设计使用的最主要的统计工具是方差分析,因此,许多教材将试验设计与方差分析设计为同一部分,使用共同的概念和术语。 其实方差分析并不仅仅在试验设计领域使用,也可以用来分析观察数据。 二、基本术语 例:影响某温室水果产量的主要因素有三个:施肥量、浇水量、温度。如果想通过控制三个因素的量,找出一个最优组合来提高产量,就是实验设计与方差分析问题。相关的术语有: 自变量(因子、因素、输入变量、过程变量):可以控制的、影响因变量的变量。本例为施肥量、浇水量、温度。 因变量(反应变量、输出变量):我们所关心的、承载试验结果的变量。本例为产量。 背景变量(噪声、噪声变量、潜伏变量):能观察但不可控的因子或因素,影响较小、达不到自变量水平。本例可能有测量误差等。 水平(设置):自变量的不同等级。水平数通常不多,连续型变量需离散化取值。如本例:施肥设1000克、1100克、1200克三个量,

浇水量设200千克、220千克两个量,温度设18度、20度、22度三个量。 处理:各因子按设定水平的一个组合。如本例:施肥1000克、浇水200千克、温度18度为一个处理。 试验单元:试验载体的最小单位。如本例的一个温室或由一个温室分割形成的房间。 主效应与交互效应:两因子及以上试验时,各因子可能对因变量有影响,因子间的相互作用也可能对因变量有影响。于是就有了上述概念。有时,交互效应比主效应更重要。如本例:施肥固定在1000克,浇水固定在200千克,18度、20度、22度三个温度条件下产量的差异,可以理解为温度的主效应;而同一温度条件下,不同的施肥量、浇水量造成的产量差异,就是交互效应。 三、试验设计的三个基本原则 第一,随机化。即采取机会均等的措施,将各种条件完全随机地配置在试验单元上。目的是要尽量消除试验因素之外的其他因素的干扰(平衡处理,不是减少误差,而是避免某种未知因素与系统因素相混淆)。极其重要。 第二,重复(复制)。即基本试验的重复,将一个处理施于两个或两个以上试验单元。重复的目的主要在于估计误差。没有对误差的估计就无法做出试验结论。同时,重复也有助于更准确地估计因子的效应。 第三,区组化。一组同质齐性的试验单元称为区组。即对试验单

相关主题
文本预览
相关文档 最新文档