当前位置:文档之家› 第十章 方差分析与正交试验设计

第十章 方差分析与正交试验设计

第十章方差分析与正交试验设计

方差分析与试验设计是英国统计学家和遗传学家费希尔进行农业试验发展起来的通过试验获取数据并进行分析的统计方法。方差分析讨论的是生产和科学试验中有哪些因素对试验结果有显著作用,哪些因素没有显著作用。讨论的是一个因素对试验结果是否有影响称为一元方差分析,讨论的是多个因素对试验结果是否有影响称为多元方差分析.对于因素多于两个的方差分析,公式变得相当复杂,试验次数较多,我们介绍一个试验次数少的试验设计方案,正交试验设计。

10.1 一元方差分析

人们常常通过试验来考察了解各种因素对产品或成品的性能,成本、产量等的影响,我们把性能、成本、产量等统称为试验指标。有些指标可以直接用数量表示,称为定量指标;不能直接用数量表示的,称为定性指标,可按评定结果打出分数或评出等级,这时就能用数量表示了。在试验中,影响试验指标的原因称为因素。因素在试验中所处的各种状态称为因素的水平,某个因素在试验中需要考察它的几种状态,就称它为几水平的因素。

在生产实践和科学试验中,人们经常要研究这样的问题:如果改变生产条件是否会对产

品(指标)产生显著影响?如果改变试验条件是否会对试验结果(指标)产生显著影响?方差分析的作用就在于通过对试验数据的统计分析,从而推断试验数据间的差异是由于生产条件的改变还是由于随机误差的影响,并分析出最佳的试验条件。为此弄清楚方差分析处理问题的基本思想,下面举例说明。

例10.1.1 某灯泡厂用四种不同配料方案制成的灯丝生产四批灯泡,在每批

,其中下标i表示第i批灯泡中取若干个做寿命试验,它们的寿命分别记为x

ij

灯泡,第二个下标j表示第j次试验。具体数据如下

表10.1.1 四批灯泡的寿命试验表

响。

在这里灯泡的寿命就是指标,灯泡品种就是因子,四种不同品种的灯泡就是四个水平,因此这是一个单因子四水平试验。我们将每一种配料制成的灯泡,其寿命看成同一总体,而不同品种的灯泡就是不同总体,因而出现四个不同总体。每一种的灯泡寿命都有一个理论上的平均值,即分布的数学期望,不同品种的灯泡的寿命的数学期望可能有显著差异,也可能没有显著差异,试验的目的就是通过假设检验对这个问题给出一个推断。一般可假定母体的方差相同。由于其他试验条件相同,如果灯泡品种对灯泡寿命无显著性影响,我们可认为四个总体的概率分布相同,换句话说,灯泡品种对灯泡寿命是否有显著性影响,就是要检验四个总体的均值是否相等.按参数估计的假设检验方法可以逐个地进行检验,但这个方法显得繁而复杂.特别当水平数较多时,需要做许多假设和检验,计算量也相当大.如果能导出一个可以用来检验所有这些假设的统计量,那么解决这样的

问题就方便多了。方差分析就是解决这样的问题.

假设试验只考虑一个因素A ,它有I 个水平A 1,A 2,…,A I ,总共有N 次试

验,x ij 表示第i 水平第j 次试验,其数据如下表

表10.1.2 一元方差试验数据表

我们再作如下假设:I X X X ,,,21 为I 个子总体,且I X X X ,,,21 相互独立,),(~2σμi N X ,而i in i i x x x ,,,21 为i X 的样本。显然I 个水平对试验结果有无显著性影响,就是看I X X X ,,,21 是否为相同的总体,或它们的分布是否相同。由于它们都是正态总体,就只要看它们分布的参数是否相同,已知方差相同,这就只须判断数学期望是否相等。换句话说,只要在一定的显著性水平上检验统计假设

I H μμμ=== 210:

∑==i

n j ij i i X n X 11,∑∑===I i n j ij i X N X 111 分别表示第i 个子总体的样本均值(组平均值)和总体样本均值(总平均值)。总偏差平方和

∑∑==-=I i n j ij i

X X SST 112)(

它描述全部数据离散程度(总波动)的大小。容易证明

SSE SSA SST += (10.1.1) 其中 ∑=-=I I i i X X n SSA 12

)(,∑∑==-=I i n j i ij i X X SSE 11

2)( 反映的是各子总体样本均值(组平均值)的不同而引起的误差,是各组平均值与总体样本平均值的离差平方和,它表示因试验水平差异带来的误差大小,称为组间偏差平方和,也称为系统误差。SSE 反映的是每一个子总体的(组内)数据不同而引起的误差,是每个观测值与其组内平均值的离差平方和,它表示试验误差的大小,称为组内偏差平方和,也称为误差平方和。因此,通过SSA 的大小可以反映原假设0H 是否成立。若SSA 显著地大于SSE ,说明各子总体(水平)i X 之

间差异显著,那么0H 可能不成立。这种比较方差大小来判断原假设0H 是否成立的方法就是方差分析的由来。那么

SSE

SSA 的值大到什么程度可以否定0H 呢?在理论上已经证明

),1(~)/()1/(I N I F I N SSE I SSA F ----= (10.1.2) 统计量F 可以作为判断0H 是否成立的检验统计量。在给定显著水平α的情况下,当),1(I N I F F -->α时,则拒绝0H ,认为因素A 对试验的指标是显著的,否则接受0H 。在实际进行一元方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表

表10.1.3一元方差分析表

解 按题意,4=I 26,6

,8,5,74321=====N n n n n ,经计算可得下列方差分析表

表10.1.4 例10.1.1的方差分析表

对给定的05.0=α,查表得05.3)22,3(05.0=F ,因为)22,3(15.205.0F F <=,所以接受0H ,即这四种灯丝的配料方案生产的灯泡寿命之间无显著差异,换句话说,配料方案对灯泡寿命没有显著影响。

10.2 二元方差分析

10.2.1.无重复试验的方差分析

如果两个因子无交互作用,只需在各种组合水平下各作一次试验就可进行方差分析,称为无重复试验的方差分析。在上一小节中,我们假定对两个因子的每个水平组合都重复1次,则将既没有误差平方和,也没有自由度来刻画随机误差。

此时,因子效应的大小将失去比较的依据,从而也无法进行F 检验.因此,对双因子无重复试验数据,只有采用简化的模型,才能进行方差分析.由于是无重复试验,可将数据重新记为ij X ( J j I i ,,1,,,1 ==),它表示A 的第i 水平和B 的第j 水平的指标值。假设诸ij X 之间相互独立,且),(~2σμij ij N X ,则ij ij ij X εμ+=,其中ij ε之间相互独立,且),0(~2σεN ij 。类似上一小节的讨论,得到数学模型:

⎪⎪⎪⎩

⎪⎪⎪⎨⎧==+++=∑∑==I i J j j i ij ij ij j i ij N X 1120,0),,0(~βαεσεεβαμ相互独立且各 (10.2.1)在上述表达式中,μ表示总均值,i α表示A 因子的第i 水平对指标的单独效果,称为A 因子的主效应,j β表示B 因子的第j 水平对指标的单独效果,称为B 因子的主效应。A 因子的主效应水平是否显著,对此可以检验假设:

0:211====I H ααα (10.2.2) B 因子的主效应是否显著,则可以检验假设:

0:212====J H βββ (10.2.3) 总体样本均值、A 的第i 水平样本均值和B 的第j 水平的样本均值分别为

∑∑===I i J j ij X IJ X 11

1, ∑==J

j ij i X J X 11., ∑==I i ij j X I X 11. 可以证明

SSE SSE SSA SST ++= (10.2.4) 其中

总偏差平方和 ∑∑==-=I i J

j ij X X SST 112)(

A 因子偏差(主效应)平方和: ∑=-=I

i i X X J SSA 12)..(,

B 因子偏差(主效应)平方和:∑=-=J

j j X X I SSB 12).( , 随机误差平方和:∑∑==+--=I i J

j i j ij X X X X SSE 112)..(

总偏差平方和SST 的自由度(独立平方项的个数)为1-=IJ N ,A 因子偏差(主效应)平方和 SSA 的自由度为1-I ,B 因子偏差(主效应)平方和SSB 自由度为1-J ,误差平方和SSE 的自由度为)1)(1(--J I 。

还可以证明在1H 成立的条件下

)))1)(1(,1(~)

1)(1()1(------=J I I F J I SSE I SSA F A (10.2.5) 统计量A F 可以作为判断1H 是否成立的检验统计量。在给定显著水平α的情况下,当))1)(1(,1(--->J I I F F α时,则拒绝1H ,认为因子A 对试验的指标的影响是显著的,否则接受1H 。同理在2H 成立的条件下

))1)(1(,1(~)

1)(1()1(------=J I J F J I SSE J SSB F B (10.2.6) 统计量B F 可以作为判断2H 是否成立的检验统计量。在给定显著水平α的情况下,当))1)(1(,1(--->I I J F F B α时,则拒绝2H ,认为因子B 对试验的指标的影响是显著的,否则接受2H 。在实际进行方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表

表10.2.1 无重复试验的二元方差分析表

等的四个小区,四个品种的小麦,在每一地块内随机分种在四个小区上,每一小区小麦的播种量相同,测得收获量资料如下表(单位:斤/块)

表10.2.2 收获量资料表

现在考察地块和品种对小麦收获量有无显著影响,取05.0=α。

解 设有两个因子A 、B 分别表示品种和地块。显然因子A 有四水平A 1 、A 2 、A 3、A 4,因子B 有五水平B 1 、B 2 、B 3、B 4 、B 5。因此原问题转化为如下的数学问

题:

0:43211====ααααH

0:543212=====βββββH

直接计算可以得到下列方差分析表

表10.2.3 例10.2.1的方差分析表

对品种A ,有95.5)12,3(49.2005.0=>=F F A ,说明不同品种对小麦的收获量有显著的影响。对地块B ,有26.3)12,4(6.105.0=<=F F B 说明不同地块对小麦的收获量没有显著的影响。

10.2.2重复试验的方差分析

在许多实际问题中,往往不只出现单个因素的各个水平状态对实验指标的影响,而可能同时需考虑两个因子对实验指标的影响。这时的方差分析,不仅需要判断各因子对指标的影响是否显著,还要考虑因子各水平之间的相互组合对指标的交互作用。如果两个因子有交互作用,则要考虑每一种组合水平下各作多次试验才能进行方差分析。

例如.假定要比较一种新型复合肥料与传统肥料对小麦增产的效果.又假定所使用的试验地块的地质条件也不同(酸性、碱性或中性等).自然我们会考虑到:除了肥料的不同可能使小麦的单产产生差异之外,地的酸碱性不同也可能使小麦的单元产产生差异。在这种情况下,如果把一种肥料撒到一块地上,而把另一种肥料撒到另一块地上,那么即使这两块地上的小麦单产有显著的差异,也无法判断这种差异是由肥料的不同造成的,还是由地的酸碱性的不同造成的。对此,可以采取如下的作法:假定有三个试验地块,分别为酸性、碱性和中性。我们将每块地划分为K 2块小区,将它们随机地分成两组,每组K 块小区,其中一组小区施用传统肥料,另外一组施用新型复合肥料。这样作的结果是:每种肥料和地块的组合(共有6种组合)都进行了K 次试验.这样,数据的分组可以按肥料分组和按地块分组两种方式,等价地说,决定数据分组的因子有两个,即肥料(因子A)和地块(因子B)。因子A 有两个水下,因子B 有三个水平。在上述的试验方法下,两个因子的任一水平组合都做了相同次数的试验(K 次).这是一个完全平衡的双因子试验。

一般,我们假定在一个试验中要考虑两个因子A 与B ,分别有I 水平与J 水平,记A 因子的I 水平为I A A A ,,,21 ,B 因子的J 水平为J B B B ,,,21 。一个完

全平衡的试验,就是要对两个因子的每个不同的水平组合j i B A ⨯都做相K 次试验,其中K>l 。在水平组合j i B A ⨯下所得到的响应变量观测值

ijk X K k J j I i ,,1,,,1,,,1 ===

它表示A 的第i 水平B 的第j 水平上的第k 次实验的指标值。假设诸ijk X 之间相互独立,且),(~2σμij ijk N X ,则ijk ij ijk X εμ+=,其中ijk ε之间相互独立,且),0(~2σεN ijk 。在上面的模型中,两个因子不同水平的组合对响应变量的影响的差异表现在分布的均值ij μ的差异上。为了更清楚地看清ij μ的含义,我们做如下一些变换:

∑∑===I i J j ij IJ 111μμ, ∑==J j ij i J 1

1.μμ, ∑==I i ij j I 11.μμ μμα-=.i i ,μμβ-=j j .,μμμμγ+--=..i j ij ij

于是得到数学模型:

⎪⎪⎪⎩⎪⎪⎪⎨⎧====++++=∑∑∑∑====I

i J j I i J j ij ij j i ijk ijk ijk ij j i ijk N X 1

11120,0,0,0),,0(~γγβαεσεεγβαμ相互独立且各 (10.2.7) 在上述表达式中,μ表示总均值,i α表示A 因子的第i 水平对指标的单独效果,称为A 因子的主效应,j β表示B 因子的第j 水于对指标的单独效果,称为B 因子的主效应,ij γ表示A 因子的第i 水平和B 因子的第j 水平在主效应之外,对指标所产生的额外的联合效果,称为交互效应。

在双因子试验的模型中,我们所关心的是:

(1)因子的主效应是否显著。假如我们关心A 因子的主效应水平是否显著,对此可以检验假设:

0:211====I H ααα (10.2.8) 或者,假如我们所关心的是B 因子的主效应是否显著,则可以检验假设: 0:212====J H βββ (10.2.9)

(2)检验交互效应的效果是否显著。这时我们检验假设::

0:12113====IJ H γγγ (10.2.10)

双因子检验数据的方差分析主要解决上述三个假设的检验问题。上述假设的检验方法,与在单因子试验数据的方差分析中所采用的方法类似,就是将数据的总平方和分成若干项平方和,其中有的刻画因子的主效应,有的刻画因子的交互效应,有的刻画随机误差的效应,然后构造适当的F 统计量进行检验。令

∑∑∑====I i J j K k ijk X IJK X 1111, ∑==K

k ijk ij X K X 1

1., ∑==i J j ij i X J X 1

.1.., ∑==I i ij j X I X 1.1.. 分别表示总体样本均值(总平均值),A 的第i 水平与B 的第j 水平的样本均值,A 的第i 水平的样本均值(A 组平均值)和B 的第j 水平的样本均值(B 组平均值)。总偏差平方和

∑∑∑===-=I i J j ijk K

k X X SST 1121)(

它描述全部数据离散程度(总波动)的大小。容易证明

SSE SSAB SSB SSA SST +++= (10.2.11) 其中

A 因子偏差(主效应)平方和: ∑=-=I

i i X X JK SSA 12)..(,

B 因子偏差(主效应)平方和:∑=-=J

j j X X IK SSB 12)..( ,

交互效应偏差平方和:∑∑==+--=I i j i ij J

j X X X X K SSAB 121).....(, 随机误差平方和:∑∑∑===-=I i j j ij ijk K

k X X SSE 1121).(

与单因子方差分析中平方和的解释及自由度的计算类似,我们可以对上述的平方和给出解释,并计算自由度。总偏差平方和SST 刻画样本对于样本总均值X 的总离散程度,平方项共有IJK N =,满足一个约束条件: ∑∑∑====-I i j j ijk K

k X X 1110)(

因此,SST 的自由度(独立平方项的个数)为1-=IJK N 。A 因子偏差(主效应)平方和 SSA 可以解释为A 因子主效应的总体效果,平方和项为I ,满足一个约束条件:0)..(1=-∑=I

i i X X ,因此SSA 的自由度为1-I 。类似地,SSB 可以解释为

B 因子主效应的总体效果,自由度为1-J 。SSAB 代表交互效应的总效果,平方和项为IJ ,它们之间满足约束条件:

J j X X X X

I i j i ij ∑===+--1,,1,0).....( ,∑===+--J

j j i ij I i X X X X 1,,1,0).....( 这J I +个约束条件中只有1-+J I 个是独立的,因此SSAB 的自由度为)1)(1(--J I 。最后再来看误差平方和SSE ,它可以看成是随机误差的总度量,平方和项为IJK ,满足下列约束条件:

∑====-K k ij ijk J j I i X X

1,,1,,,1,0).(

因此SSE 的自由度为)1(-K IJ 。

因此,通过SSA 的大小可以反映原假设1H 是否成立。若SSA 显著地大于SSE ,A 因子水平之间差异显著,那么1H 可能不成立。这种比较方差大小来判断原假设1H 是否成立的方法就是方差分析的由来。那么

SSE

SSA 的值大到什么程度可以否定1H 呢?在理论上已经证明在1H 成立的条件下 )))1(,1(~)

1()1(----=K IJ I F K IJ SSE I SSA F A (10.2.12) 统计量A F 可以作为判断1H 是否成立的检验统计量。在给定显著水平α的情况下,当))1(,1(-->K IJ I F F α时,则拒绝1H 认为因子A 对试验的指标的影响是显著的,否则接受1H 。同理在2H 成立的条件下

)))1(,1(~)

1()1(----=K IJ J F K IJ SSE J SSB F B (10.2.13) 统计量B F 可以作为判断2H 是否成立的检验统计量。在给定显著水平α的情况下,当))1(,1(-->K IJ J F F B α时,则拒绝2H 认为因子B 对试验的指标的影响是显著的,否则接受2H 。同理在3H 成立的条件下

))1(,1(~)

1()1)(1(-----=K IJ J F K IJ SSE J I SSAB F AB (10.2.14) 统计量AB F 可以作为判断3H 是否成立的检验统计量。在给定显著水平α的情况下,当))1(,1)1((--->K IJ J I F F AB α时,则拒绝3H ,认为因子A 与B 对试验的指标的交互作用的影响是显著的,否则接受3H 。

在实际进行方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表

表10.2.4 有重复试验的二元方差分析表

区对每种松树随机地选取5株,测量它们的胸径,得到了如下的数据

表10.2.5 三种松树的胸径数据

解 这是一批等重复的两因子数据,记树种因子为A ,地区因子为B ,则A 因子有3水平,B 因子有4水平,总共有12个水平组合,每个组合有5个重复观测。假定树的胸径为度量

树的生长情况是否良好的数值指标,我们的目标是:由以上数据来判断不同树种及不同地区对松树的生长情况是否有影响(好或坏)?这时要考虑的影响有三种:树种的单独影响(A 因子主效应),地区的单独影响(B 因子主效应),以及不同树种和不同地区的结合所产生的交互影响(AB 因子的交互效应)。方差分析的结果如下表

表10.2.6 例3.2.2的方差分析表

从上面的分析结果,我们来对因子的主效应和交互效应的显著性进行检验。现取显著性水平05.0=α,查表得到F 的临界值:

19.3)48,2(05.0=F , 80.2)48,3(05.0=F , 29.2)48,6(05.0=F

因为 19.3)48,2(68.905.0=>=F F A , 80.2)48,3(90.005.0=<=F F B , 29.2)48,6(97.005.0=<=F F AB 。

所以,接受1H ,拒绝2H 与3H 。A 因子主效应是显著的,或者说松树的不同种类对树的胸径有显著影响。由于A 因子主效应是显著的,我们可以进一步考查A 因子不同水平的均值.注意到A 因子的第二水平为最大:23..55,而第三水平的均值为最小:17.65,可以认为树种2的生长情况优于树种3。能够得出这个结论,得益于观测的等重复性。B 因子主效应不显著,或者说不同地区对树的胸径没有显著影响.AB 因子的交互效应不显著,或者说不同地区对不同的树种的生长没有特别的影响。

10.3正交试验设计

10.3.1 方差分析法的推广和正交试验法的提出

上二节所研究的单因子、双因子试验的方差分析模型中所包含的统计思想和方法可以推广到多因子试验的场合。以3因子模型为例,设有3 因子对响应变量(指标)有影响,分别记为A 、B 、C ,它们的水平数分别为I 、J 、K 。它们对响应变量的影响可以分成如下三种:

(1)各因子的主效应,即单个因子的不同水平对响应变量产生的影响。

(2)一阶交互效应,即在扣除主效应的影响之后,任意两个因子的不同水平组合(AB 、AC 、BC)对响应变量产生的联合影响。

(3)二阶交互效应,即在扣除主效应和一阶交互效应的影响之后,三个因子的不同水平组合(ABC)对响应变量产生的联合影响。

与双因子的情况类似,如果在3个因子的每个水平组合上作相同次数试验K ,则当试验次数K 大于1(有重复)时,可以用全模型(包含全部上述3种效应的模型)进行方差分析,而当试验次数等于1(无重复)时,无法对二阶交互效应分析,而只能分析主效应和一阶交互效应。读者可以仿照上二节的作法,对这两种情况下3个因子方差分析的全部过程列出结果(模型、平方和分解、自由度、F 统计量,等等).以上的这些作法可以推广到4因子、5因子、乃至m 因子的情况.无

论有多少个因子,如果在所有因子的每个水平组合上都做至少一次试验,则试验是完全的。为便于进行方差分析,试验应该是等重复的。为能够分析最高阶(m-1)阶交互效应,试验应该是有重复的(重复数大于1)。

虽然我们在理论上可以将单因子、双因子方差分析的模型和方法推广到多因子方差分析的情况,但在实践中,做多个因子的完全试验会有实际的困难,因为完全试验所要求的试验次数太多乃至无法实现。例如,假定要考虑5个三水平因子,则完全试验(重复数为1)要求做243次试验;假如再加一个四水平因子,则完全试验(同样重复数为1)要作972次试验.如果要能够分析全部交互效应,同时还能够做平方和分解,则试验次数还需加倍!显然,如此多的试验次数在实际应用中几乎是无法实施的。如何解决这个困难呢?

在对一个因子试验所建立的线性模型中,独立参数(总均值、主效应、交互效应等)的个数k与试验次数n之间有下面的关系:当n>k时,有足够的自由度来估计参数,同时还有剩余自由度来估计误差的方差;当n=k时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差,当n

我们知道在生产经营管理活动中,经常要做许多试验。如果试验设计得好,就能用较少的试验次数取得较满意的结果,反之,如果试验设计得不好,虽经多次试验,也不—定能取得满意的结果。因此,如何合理地设计试验,是很值得研究的一个问题。在模型中只有主效应的前提下,统计学家发明了一类试验设计的方法,统称为“正交因子设计”,或简单地称为“正交设计”。它的主要内容是讨论如何合理地安排试验以及试验后的数据怎样作统计分析等。在这种试验设计中,可以安排许多因子,而试验次数远远小于完全试验所需的试验次数。

应用正交试验进行试验设计,就是在试验前借助于一种现成的规格化的表—正交表,科学地挑选试验条件,合理地分析试验结果。从而可以只用较少的试验次数,分清各因素对试验结果(指标)的影响,按其影响大小,找出主次关系并确定最佳搭配方案或最优工艺条件。

10.3.2正交表及直观分析法

正交表

正交表是统计学家和数学家构造的、供实际工作者安排正交试验用的表,是正交试验法中安排试验,并对数据进行直观分析和方差分析的重要工具。正交表实际上就是一个在给定试验次数和因子水平数之后,可以容纳最多因子个数的正

交试验表.正交表可以分为两大类:单—水平正交表和混合水平正交表。在单一水平正交表中,所有因子有相同水平,而在混合水平正交表中,因子有不同水平。

单一水平正交表表示为)(k n t L ,其中L 表示正交表,下标n 是正交表的行数,为试验次数,k 是正交表的列数,表示试验至多可以安排因素的个数,t 是表中不同数字的个数,为因子水平数。例如)2(78L 表示在8次试验中最多可安排7个两水平因子,其表如下:

表10.3.1 正交表)2(78L

效应,就可以选用一个能够容纳指定因子的而且试验次数最少的正交表来安排试验。由于是无交互效应模型,因此因子具体安排在表的哪一列是没有限制的。例如,假定有4个两水平因子,由于试验次数最少的两水平表为)2(34L ,最多只能安排3个两水平因子,因此需选用)2(78L ,4个因子可以安排在7列中的任意4列。为便于读者使用,本书将常用正交表列于附录。按照正交表安排好试验后,就可以作试验,得到试验数据后就可以进行直观分析和方差分析。在因子试验中,二水平的因子是遇到最多的,因此)2(k n L 正交表也是用得最多的。对二水平的因子,在正交表中通常用1和2分别表示两个水平。如果将表中所有元素2都改成﹣1,就得到一个所有元素都是l 和﹣l 的n 行k 列的矩阵X 。表中的每一列1和2的个数是相同的,任意两列中组合(1,1),(1,2),(2,1),(2,2)出现的次数相同,因此矩阵X 的每一列1和﹣1的个数是相同,任意两列中,组合(1,

1),(1,﹣1),(﹣1,1),(﹣l ,﹣1)出现次数相同,由此可见X 的列在“向量内积”的意义下是两两正交的。正交表具有下列特点:任意一列中数字重复的次数相同,对于任意两列数字间的搭配是均衡的。

正交试验法的直观分析一般步骤

下面通过实例说明下正交表的应用和直观分析的一般步骤

例10.3.1为了提高某化工产品的转化率,选择了三个有关因素,反应温度A ,反应时间B 和用碱量C ,各因素所选取的水平为

表10.3.2 三因素的水平选择表

次试验,如果用正交表来安排这项试验,只须做9次试验就够了。具体步骤如下:(1)例中要考察的因素和水平都已确定。对于一般问题是这样考虑:根据试验的目的,确定试验要考察的因素,如果对事物的变化规律了解不多,因素可以多取一些,如果对其规律已有相当了解,可以准确判断主要因素,这时因素可取少一些。每个因素的水平数可以相等,也可以不等。重要的因素或者特别希望详细了解的因素,水平可多取一些,其余情况水平可取少一些。

(2)选择适合试验的正交表。此例是三因素三水平试验,选用)

L比较

3(4

9

合适。究竞选用那种正交表,要根据因素和水平的多少以及试验费用的情况而定,一般地讲,要求试验精度高的可选试验次数多的正交表,试验费用较贵的,可选试验次数少的正交表。’

(3)因素A、B、C放在正交表的列上。如果有些因素的不同水平改变起来比较困难,应当优先考虑这些因素,把它们放在适当的列上,在这种列上不同水平的改变次数较少,固定一个水平后,要连续做几次试验才改变为另一水平。

(4)根据表可知,9次试验的方案是:第一号试验的工艺条件是80℃,90分,5%;第二号试验的工艺条件是80°C,120分,6%;第九号试验的工艺条件是90°C ,150分,6%。

(5)按试验方案表中载明的各次试验条件进行试验。例中,转化率是试验指标,按设计的方案进行试验,取得数据.将所得测得转化率的数据填入试验结果分析表的最右边一栏。

表10.3.3直观分析计算数据

其中ij k 表示第j 列中对应水平i 的试验指标数据之和,3ij

ij k k 。

试验结果的直观分析

(1)从正交试验结果分析表中挑出较好的方案:第九次试验的结果最好,其具体条件是233C B A ,这是正交试验中较好的方案。

(2)计算各因子在相应于同一水平下的试验指标之和及平均试验指标,计算各列的极差。

(3)确定因素重要性顺序依照各因素极差大小,排出重要性顺序,极差大的因素表示此因素重要。因素的重要性顺序是A 、B 、C 。

(4)确定最佳搭配方案或最优工艺条件,在不考虑交互作用时,只需根据该试验指标的要求(即该指标或是以最高者为优或是以最低者为优)将各因素的最优水平组合起来,再将最

优水平组合与试验中的较好方案进行对比试验,从而得到最佳搭配方案或最优工艺条件。例中我们取每个因素平均转化率最高的为优水平,因此,最优水平组合

223C B A ,即最优工艺条件为反映温度900C ,反映时间120分,用碱量6%。而

223C B A 不在所做的九次试验中,因此,可将这个条件与正交试验中较好的方案233C B A 比较,对 223C B A 再做试验的试验结果的转化率为74℅,从而得最优的工艺条件223C B A 。

10.3.3正交试验法的方差分析法

正交表的直观分析其优点是简单直观,计算量小,但它不能给出误差的估计,因此就不知道分析的精度,即不知道要到怎样的程度,一个因素才算是次要因素。至于怎样进行方差分析与单因子和双因子方差分析类似。下面举例说明: 例10.3.2考虑例10.3.1,我们建立如下数学模型。设i y 为第i 次试验中产品的转化率(%),并记l α为温度因子的第l 水平对产品的转化率的影响,l β为时间因子的第l 水平对产品的转化率的影响,l γ为用碱量因子的第l 水平对产品的转化率的影响,3,2,1=l 。根据表5.3.3我们容易写出这个模型如下:

⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎨⎧++++=++++=++++=++++=++++=++++=++++=++++=++++=9

233981238

7313761326

53225421243331322212

11111εγβαμεγβαμεγβαμεγβαμεγβαμεγβαμεγβαμεγβαμεγβαμY Y Y Y Y Y Y Y Y (10.3.1) 其中91,,εε 为独立、),0(2σN 分布的随机误差;μ为总均值,如同在全面试验的方差分析模型中的作法一样,我们假定模型中的参数满足下面的约束条件:

⎪⎩⎪⎨⎧=++=++=++000321

321321γγγβββααα (10.3.2) 容易证明在约束条件(5.3.2)下,min 9

12=∑=i i ε的最小二乘估计是

⎪⎪⎪

⎪⎩

⎪⎪⎪⎪⎨⎧++=++=++=++=++=++=++=++=++==∧∧∧∧∧∧∧∧∧∧

)(31),(31),(31)(31),(31),(31)(31),(31),(31*7*5*33*9*4*22*8*6*11*9*6*33*8*5*22*7*4*11*9*8*73*6*5*42*3*2*11y y y y y y y y y y y y y y y y y y y y y y y y y y y y

γγγβββαααμ (10.3.3) 其中y y y y y i i i i -==∑=*9

1

,91 。还可以证明这些估计是相应的参数的最小方差估计。得到参数估计之后,为了检验因子效应的显著性,与单因子和双因子方差分析类似进行方差分析:

SSE SSC SSB SSA SST +++= 其中总平方和为29

1)(∑=-=i i y y SST ,它的自由度为8。因子效应的平方和分别为

∑=∧

=31

2)(3i i SSA α (10.3.4)

∑=∧

=31

2)(3i i SSB β (10.3.5)

∑=∧

=312)(3i i SSC γ (10.3.6)

其自由度分别为2。残差平方和SSE 的自由度为2。根据上述结果我们可以构造F 统计量。在实际进行因子方差分析时,通常将有关的统计量连同分析结果列在一张标上,即如下的方差分析表

表10.3.4 模型的方差分析表

2

,7,52

,5,311

,2,950

321321321-==-=-==-==-=-===∧∧∧∧∧∧∧∧∧∧γγγβββαααμy 进而得到方差分析结果列于下表

表10.3.5 例10.3.2的方差分析表

取显著性水平05.0=α,查表得0.19)2,2(05.0=F ,又

0.19,0.19,0.19<<>C B A F F F ,故反映温度对产品转化率有显著影响,用碱量和反映时间对产品转化率没有影响。由参数估计知道得到最优的工艺条件为223C B A 。

比较例10.3.1和例10.3.2,我们知道当因子对试验结果的影响比随机误差的影响明显的大或明显的小,可以直接判断而不必进行方差分析。

10.3.4考虑交互作用的正交设计

在一些实际问题中,有时不仅因素的水平变化对指标有影响,而且有些因素间各水平的联合搭配对指标也产生影响,这种联合搭配作用称为交互作用。因此,一般应该考虑某些因子的一阶交互作用。例如,在农作物施肥试验中,在单位面积上施氮肥(N)6斤,能使该农作物增产30斤,施磷肥(P)4斤,能增产50斤。若同时施6斤氮肥和4斤磷肥,似乎应该增产30+50=80斤,但实际上增产了160斤,这说明氮肥和磷肥除了本身作用外,还有一种联合作用,这就是交互作用,记作N ×P 。在这里交互作用的大小为160-30-50=80斤。

一般地,在多因素试验中,一个因素A 对指标的影响与另一个因素B 取什么水平有关,这就是因素A 和因素B 有交互作用,记为A ×B 。使用正交表安排试验时,有时需要分析各因素之间的交互作用。在常用正交表中,有的表后面附有一张“两列间的交互作用”表,这是专门为分析交互作用而使用的表,现以)2(78L 的两列间的交互作用表为例,说明它的用法。

表10.3.6 )2(78L 的两列间的交互作用表

排“列号1”中,B 放在“横排2”中,查此表得到第一行与第二列交叉点元素是3,则正交表上第3列就是第1列与第2列的交互作用列。同理可得到第2列与第4列的交互作用列是第6列,其它任意两列的交互作用列可用类似方法查得。因此,当我们用)2(78L 来安排三因子A 、B 和C 有交互作用的正交试验时,如果因子A 放第一列,因子B 放在第二列,则A ×B 放在第三列。在试验时,我们把交互作用A ×B 单独作为一个因子来考虑,A ×B 所在的列不能再安排其它因子。如C 放在第4列,再查交互作用表,A ×C 和B ×C 应分别放在第5和第6列。这样设计出的表头如下:

表10.3.7

)2(78L 的表头

下面通过实例说明交互作用的正交设计。

例10.3.3 某试验小组,为了提高水稻的产量,选取了对产量有影响的三个因素,每个因素取2个水平进行试验,以便确定生产方案。并希望考察因素间的交互作用。 具体水平如下:

表10.3.8 因素与水平选择表

用)2(78L 安排8次试验,试验结果如下表

表10.3.9 试验数据及直观分析表

对于考虑交互作用的试验,只要我们将每个交互作用作为一个因子考虑,其分析计算的步骤完全类似无交互作用情况,不同的是如何确定最优水平问题。由表计算数据及直观分析知,因子B ×C 、A 和C 是重要的。显然A 取水平A 1,B ×C 的最优水平可以将B 和C 的不同水平组合的实验结果比较确定,计算如下:

表10.3.10 B ×C 的最优水平的选择

11111 现在进行方差分析。总偏差平方和的分解公式为:

SSE SSBC SSAC SSAB SSC SSB SSA SST ++++++= 其中总偏差平方和为28

1)(∑=-=i i y y SST 。第j 列因子(包括交互因子)效应的平

方和为

∑∑==⎪⎪⎭⎫ ⎝⎛-=j j r i r i ij ij j k n k n r SSJ 12121

正交试验设计教学案

正交试验设计 2 正交试验设计的基本程序(实例分析) 为提高山楂原料的利用率,研究酶法液化工艺制造山楂原汁,拟通过正交试验来寻找酶法液化的最佳工艺条件。 对本试验分析,影响山楂液化率的因素很多,如山楂品种、山楂果肉的破碎度、果肉加水量、原料pH 值、果胶酶种类、加酶量、酶解温度、酶解时间等等。经全面考虑,最后确定果肉加水量、加酶量、酶解温度和酶解时间为本试验的试验因素,分别记作A、B、C和D,进行四因素正交试验,各因素均取3个水平,因素水平表如下表所示。 试验因素 水平 加水量(mL/100g)A 加酶量(mL/100g)B 酶解温度(℃)C 酶解时间(h)D 110120 1.5 250435 2.5 390750 3.5 (3)选择合适的正交表正交表的选择原则是在能够安排下试验因素和交互作用的前提下,尽可能选用较小的正交表,以减少试验次数。试验因素的水平数=正交表中的水平数。因素个数(包括交互作用)小于等于正交表的列数。各因素及交互作用的自由度之和< 所选正交表的总自由度,以便估计试验误差。 若各因素及交互作用的自由度之和=所选正交表总自由度,则可采用有重复正交试验来估计试验误差。 正交表选择依据列数(正交表的列数c≥因素所占列数+交互作用所占列数+空列) 自由度(正交表的总自由度(a-1)≥因素自由度+交互作用自由度+误差自由度。) 此例有4个3水平因素。若仅考察4个因素对液化率的影响效果,不考察因素间的交互作用,故宜选用L9(34)正交表。若要考察交互作用,则应选用L27(313)。 (4)表头设计所谓表头设计,就是把试验因素和要考察的交互作用分别安排到正交表的各列中去的过程。在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按所选正交表的交互作用列表安排各因素与交互作用,以防止设计“混杂”。此例不考察交互作用,可将加水量(A)、加酶量(B)和酶解温度(C)、酶解时间(D)依次安排在L9(34)的第1、2、3、4列上,如下表所示。 (5)编制试验方案,按方案进行试验,记录试验结果。把正交表中安排各因素的列(不包含欲考察的交互作用列)中的每个水平数字换成该因素的实际水平值,便形成了正交试验方案。 试验号并非试验顺序,为了排除误差干扰,试验中可随机进行;安排试验方案时,部分因素的水平可采用随机安排。 2.2试验结果分析 3.1.1 不考察交互作用的结果分析

实验设计的方差分析与正交试验

实验设计的方差分析与正交试验 一、实验设计中的方差分析 方差分析(analysis of variance,ANOVA)是一种统计方法, 用于比较不同组之间的均值差异是否具有统计学上的显著性。 在实验设计中,方差分析主要被用来分析因变量(dependent variable)在不同水平的自变量(independent variable)中的变 化情况。通过比较不同组之间的方差,判断是否存在显著差异,并进一步分析差异的原因。 1. 单因素方差分析 单因素方差分析是最简单的方差分析方法,适用于只有一个自变量的实验设计。该方法通过比较不同组之间的方差来判断各组均值是否有差异。 步骤如下: (1)确定研究目的,选择合适的因变量和自变量。 (2)设计实验,确定各组的样本个数。 (3)进行实验,并收集数据。 (4)计算各组的平均值和总平均值。 (5)计算组内方差和组间方差。

(6)计算F值,通过计算F值来判断各组均值是否有显著差异。 2. 多因素方差分析 多因素方差分析是在单因素方差分析的基础上,增加了一个或多个自变量的情况下进行的。这种方法可以用来分析多个因素对因变量的影响,并判断各因素的主效应和交互效应。 步骤如下: (1)确定研究目的,选择合适的因变量和多个自变量。 (2)设计实验,确定各组的样本个数。 (3)进行实验,并收集数据。 (4)计算各组的平均值和总平均值。 (5)计算组内方差、组间方差和交互方差。 (6)计算F值,通过计算F值来判断各组均值是否有显著差异。 二、正交试验设计 正交试验设计是一种设计高效实验的方法,可以同时考虑多个

因素和各个因素之间的交互作用,并通过较少的试验次数得到较准确的结果。 1. 正交表的基本原理 正交表的设计是基于正交原理,即每个因素和其他所有因素的交互效应都是独立的。 通过正交表设计实验,可以确保各因素和交互作用在样本中能够均匀地出现,从而减少误差来源,提高实验结果的可靠性。 2. 正交试验设计的步骤 (1)确定要研究的因素和水平。 (2)选择合适的正交表。 (3)根据正交表的要求,设置实验组合。 (4)进行实验,收集数据。 (5)进行方差分析,分析各因素和交互作用的影响。 (6)进行多重比较,确定各水平的均值差异。 三、正交试验设计与方差分析的结合 在实验设计中,正交试验设计常常与方差分析相结合,通过方

正交试验设计步骤(教学参考)

正交试验设计步骤 1 在SPSS中手动录入数据。请注意写入空白列。 2 点击数据→正交设计→生成,出现“生成正交设计”对话框。按因素水平表进行赋值, 空白列的赋值为1“1”,2“2”,3“3”

3 点击“数据”→“正交设计”→“显示”, 空白列的D可不加到右边的“因子”框中。 4 测量数据填入表8中的“STATUS_”列的相应单元格中 5单击“分析”→“一般线性模型”→“单变量” 注意不要选“空白列” 6 单击“对比”→选择“简单”

7 单击“模型”→选择“设定”→将“A”、“B”、“C”选入右边的“模型”中→单击“构建项”中的“主效应”, 8 单击“选项”→将“因子与因子交互”中的“A”、“B”、“C”选入“显示均值”中→勾选“比较主效应”, 9 结果分析 (1)方差分析结果 主体间因子 值标签N

硬脂酸钠溶液浓度 1 40 3 2 50 3 3 60 3 硫酸铝溶液浓度 1 40 3 2 50 3 3 60 3 浸渍时间 1 5 3 2 15 3 3 20 3 主体间效应的检验 因变量:STATUS_ 源III 型平方 和df 均方 F Sig. 校正模型733.073a 6 122.179 35.690 .028 截距10588.410 1 10588.410 3093.012 .000 A 423.487 2 211.743 61.853 .016 B 305.060 2 152.530 44.556 .022 C 4.527 2 2.263 .661 .602 误差 6.847 2 3.423 总计11328.330 9 校正的总计739.920 8 a. R 方 = .991(调整 R 方 = .963) 根据正交试验方差分析可知,硬脂酸钠溶液浓度和硫酸铝溶液浓度对试验指标的影响非常显著,而处理时间对试验指标的影响不显著。影响程度的大小也有差异,A>B (2)单因素统计量分析 1. 硬脂酸钠溶液浓度 估计 因变量:STATUS_ 硬脂酸钠溶液浓度 均值标准误差 95% 置信区间下限上限 dimensio n140 25.600 1.068 21.004 30.196 50 34.933 1.068 30.337 39.530 60 42.367 1.068 37.770 46.963

第十章 方差分析与正交试验设计

第十章方差分析与正交试验设计 方差分析与试验设计是英国统计学家和遗传学家费希尔进行农业试验发展起来的通过试验获取数据并进行分析的统计方法。方差分析讨论的是生产和科学试验中有哪些因素对试验结果有显著作用,哪些因素没有显著作用。讨论的是一个因素对试验结果是否有影响称为一元方差分析,讨论的是多个因素对试验结果是否有影响称为多元方差分析.对于因素多于两个的方差分析,公式变得相当复杂,试验次数较多,我们介绍一个试验次数少的试验设计方案,正交试验设计。 10.1 一元方差分析 人们常常通过试验来考察了解各种因素对产品或成品的性能,成本、产量等的影响,我们把性能、成本、产量等统称为试验指标。有些指标可以直接用数量表示,称为定量指标;不能直接用数量表示的,称为定性指标,可按评定结果打出分数或评出等级,这时就能用数量表示了。在试验中,影响试验指标的原因称为因素。因素在试验中所处的各种状态称为因素的水平,某个因素在试验中需要考察它的几种状态,就称它为几水平的因素。 在生产实践和科学试验中,人们经常要研究这样的问题:如果改变生产条件是否会对产 品(指标)产生显著影响?如果改变试验条件是否会对试验结果(指标)产生显著影响?方差分析的作用就在于通过对试验数据的统计分析,从而推断试验数据间的差异是由于生产条件的改变还是由于随机误差的影响,并分析出最佳的试验条件。为此弄清楚方差分析处理问题的基本思想,下面举例说明。 例10.1.1 某灯泡厂用四种不同配料方案制成的灯丝生产四批灯泡,在每批 ,其中下标i表示第i批灯泡中取若干个做寿命试验,它们的寿命分别记为x ij 灯泡,第二个下标j表示第j次试验。具体数据如下 表10.1.1 四批灯泡的寿命试验表 响。 在这里灯泡的寿命就是指标,灯泡品种就是因子,四种不同品种的灯泡就是四个水平,因此这是一个单因子四水平试验。我们将每一种配料制成的灯泡,其寿命看成同一总体,而不同品种的灯泡就是不同总体,因而出现四个不同总体。每一种的灯泡寿命都有一个理论上的平均值,即分布的数学期望,不同品种的灯泡的寿命的数学期望可能有显著差异,也可能没有显著差异,试验的目的就是通过假设检验对这个问题给出一个推断。一般可假定母体的方差相同。由于其他试验条件相同,如果灯泡品种对灯泡寿命无显著性影响,我们可认为四个总体的概率分布相同,换句话说,灯泡品种对灯泡寿命是否有显著性影响,就是要检验四个总体的均值是否相等.按参数估计的假设检验方法可以逐个地进行检验,但这个方法显得繁而复杂.特别当水平数较多时,需要做许多假设和检验,计算量也相当大.如果能导出一个可以用来检验所有这些假设的统计量,那么解决这样的

正交实验设计法

正交实验设计法 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平: A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法:

(Ⅰ)取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,共有 33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A 变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。

正交试验设计

正交试验设计 对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。 1.1 正交试验设计的基本概念 正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。它是由试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验的,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。 例如,要考察增稠剂用量、pH值和杀菌温度对豆奶稳定性的影响。每个因素设置3个水平进行试验。 A因素是增稠剂用量,设A1、A2、A3 3个水平;B因素是pH值,设B1、B2、B3 3个水平;C因素为杀菌温度,设C1、C2、C3 3个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能组合有27种。 全面试验:可以分析各因素的效应,交互作用,也可选出最优水平组合。但全面试验包含的水平组合数较多,工作量大,在有些情况下无法完成。 若试验的主要目的是寻求最优水平组合,则可利用正交表来设计安排试验。 正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。 正因为正交试验是用部分试验来代替全面试验的,它不可能像全面试验那样对各因素效应、交互作用一一分析;当交互作用存在时,有可能出现交互作用的混杂。虽然正交试验设计有上述不足,但它能通过部分试验找到最优水平组合,因而很受实际工作者青睐。 如对于上述3因素3水平试验,若不考虑交互作用,可利用正交表L9(34)安排,试验方案仅包含9个水平组合,就能反映试验方案包含27个水平组合的全面试验的情况,找出最佳的生产条件。 1.2 正交试验设计的基本原理 在试验安排中,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格,如果网上的每个点都做试验,就是全面试验。如上例中,3个因素的选优区可以用一个立方体表示(图10-1),3个因素各取3个水平,把立方体划分成27个格点,反映在图10-1上就是立方体内的27个“.”。若27个网格点都试验,就是全面试验,其试验方案如表10-1所示。 3 因素3 水平的全面试验水平组合数为33=27, 4 因素3水平的全面试验水平组合数为34=81 ,5因素3水平的全面试验水平组合数为35=243,这在科学试验中是有可能做不到的。 正交设计就是从选优区全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验。图10-1中标有试验号的九个“(·)”,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即: (1)A1B1C1(2)A2B1C2(3)A3B1C3 (4)A1B2C2(5)A2B2C3(6)A3B2C1 (7)A1B3C3(8)A2B3C1 (9)A3B3C2 上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。对于A、B、C 3个因素来说,是在27个全面试验点中选择9个试验点,仅是全面试验的三分之一。 从图10-1中可以看到,9个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰是3个试验点;在立方体的每条线上也恰有一个试验点。 9个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。 1.3 正交表及其基本性质

正交试验设计中的方差分析

正交试验设计中的方差分析 正交试验设计是一种常用的实验设计方法,用于研究多个因素对试验结果的影响。在正交试验设计中,方差分析是一种常用的统计工具,用于量化各个因素对试验结果的影响程度,从而帮助我们做出科学的决策。本文将介绍正交试验设计中方差分析的基本概念、方法和应用。方差分析是通过将数据的变异分解成各个因素或误差的效应,从而量化各个因素对试验结果的影响程度。方差分析的主要目标是确定因素效应的大小和显著性,以便在实验中剔除不显著的因素,并对显著因素进行进一步研究。 在正交试验设计中,方差分析可以按照以下步骤进行: 确定试验目的:在进行方差分析前,需要明确试验的目的和研究问题。例如,研究三种因素对产品产量的影响,以便优化生产工艺。 设计正交试验:根据试验目的,选择合适的正交表,确定实验方案。正交表是正交试验设计的基础,它是一张包括所有可能组合的表格,可以列出实验中需要考虑的所有因素和水平。 收集实验数据:按照实验方案进行实验,并记录各个组合下的实验结果。

进行方差分析:利用统计软件进行方差分析,得出各个因素效应的估计值和显著性水平。 得出根据方差分析的结果,确定显著因素和非显著因素,从而得出优化方案或建议。 在正交试验设计中,方差分析的应用非常广泛。例如,在工业生产中,可以通过正交试验设计和方差分析来优化生产工艺,提高产品质量和产量。在医学研究中,可以用来研究多个药物剂量对疗效的影响,以便找到最佳治疗方案。正交试验设计和方差分析是解决多因素问题的有效工具。 正交试验设计中的方差分析是一种非常重要的统计工具,它可以帮助我们量化各个因素对试验结果的影响程度,从而找到优化方案或建议。通过方差分析的应用,我们可以更加科学地解决多因素问题,提高决策的准确性和效果。在实际应用中,需要结合实际情况和专业知识进行具体操作和解释,以充分发挥其作用和价值。 在进行科学实验或调查研究时,常常需要对不同的因素进行方差分析,以便确定哪些因素对实验结果有显著影响。为了简化分析过程和提高可靠性,可以借助正交试验方差分析程序进行分析。

正交试验结果的极差分析与方差分析

实验报告 实验三:正交试验结果的极差分析与方差分析 课程名称 考查学期 姓名 学号 专业 成绩 任课教师

实验三:正交试验结果的极差分析与方差分析 一、实验目标 熟练使用Excel和SPSS软件进行正交试验设计和结果分析 二、实验要求 按照1人/组的样式,所有成员都应该根据实验内容完成相应的任务。 三、仪器设备 笔记本电脑与数据分析软件Excel、SPSS。 四、实验内容 1. 正交试验数据的极差分析(Excel) 大枣的微波干燥工艺研究,试验因素选取A微波功率(W)、B干燥时间(min)、C载样量(kg/m2),以干燥大枣中总黄酮的含量为指标(越高越好),试选出最优工艺条件。 表3-1. 因素水平表 水平 试验因素 A (微波功率/W) B (干燥时间/min) C (载样量/kg/m2) 1150105 22501510 33502015 表3-2. 干燥大枣中的总黄酮含量 试验号微波功率 A 干燥时间 B 空列载样量 C 总黄酮含量1 (mg/g) 总黄酮含量2 (mg/g) 11111272.6 278.9 21222251.7 250.3

31333245.2 247.2 42123289.7 279.6 52231275.8 268.8 62312258.7 257.7 73132246.6 246.2 83213231.4 232.1 93321222.1 228.6 表3-3 干燥大枣中的总黄酮含量极差分析 试验号 列号重复试样 指标和1 2 3 4 1 2 A B C 1 1 1 1 1 272.6 278.9 551.5 2 1 2 2 2 251.7 250. 3 502 3 1 3 3 3 245.2 247.2 492.4 4 2 1 2 3 289.7 279.6 569.3 5 2 2 3 1 275.8 268.8 544.6 6 2 3 1 2 258. 7 257.7 516.4 7 3 1 3 2 246.6 246.2 492.8 8 3 2 1 3 231.4 232.1 463.5 9 3 3 2 1 222.1 228.6 450.7 K11545.9 1613.6 1531.4 1546.8 K21630.3 1510.1 1522.0 1511.2 K31407.0 1459.5 1529.8 1525.2 k1257.650 268.933 255.233 257.800 k2271.717 251.683 253.667 251.867 k3234.500 243.250 254.967 254.200 R 37.217 25.683 1.567 5.933 较优水平A2B1C1 因为指标越大越好,所以为因素A的2水平,即A2较好。其他各列的统计分析以此类推。各因素对指标影响的主次为:A>B>C,即微波功率>干燥时间>载样量。较优参数组合为A2B1C1,即微波功率取0.245kW、干燥时间10min、载样量取5kg/m2搭配起来,干燥效果最好。 2. 正交试验数据的方差分析(SPSS) 为探讨啤酒酵母的最适自溶条件,选择三因素三水平正交试验,试验指标为自溶液中蛋白质含量(%,越高越好),因素水平如表3-3,试验结果如3-4所示,

spss正交设计及其方差分析

正交设计及其方差分析 在日常试验中,对于只考察一个或两个因素的试验来说,由于控制的因素较少,试验设计和实施都比较的简单。但当一个试验出现超过三个因素时,试验就变得非常繁琐,全部实施起来也非常困难。当然,这些问题不只我们遇到了,统计学家们早已发现这一问题,并设计出简化试验的各种方法。本文要介绍的就是最为人所知的——正交试验法。正交试验正交试验的一般流程包括以下几个步骤:①确定研究因素;②选择指标水平;③制作成正交试验表格;④进行试验;⑤试验结果分析。 这里主要介绍第三步和第五步正交试验表格和试验结果分析。 1、正交表的设计与生成 1.1 打开spss软件,点击【数据】,选择【正交设计】,点【生成】。打开正交表设计对话框。如图1所示 图1

1.2将所有的实验因素编号及名称输入软件如图2所示 1.3 在各水平中输入【定义值】各因素水平数及对应的值,点击【继续】。将所有试验因素的水平均设定好。

1.4输出正交表如下图所示,按照正交表给出的水平组合进行相应实验。 2、方差分析 2.1按照下图整理并输入数据 2.2按照下图进行一般线性模型、单变量进行方差分析

2.3将实验指标产量输入【因变量】,实验因素选入【固定因子】 2.4 由于正交设计不是全部组合均进行实验,所以模型选择【设定】,并将因素通过【主效应】选入右边框内

2.5输出结果如下图所示 由于校正模型F值达到显著性水平,B因素主效应达到显著性水平,而A、C两个因素主效应不显著。因此B因素对实验结果其着主要影响。实验结果即采用B的最优水平即可。

备注:如果模型F值未达到显著性水平,说明实验较大可能存在交互作用,因此对主效应进行两两比较则失去意义。这是对水平组合进行两两比较,选出最优组合。而对水平组合的两两比较则需要重复的设定。其方法如下图所示

正交试验分析及分析方法

第九讲正交试验分析及分析方法 ORTHOGONAL DESIGN 基本知识: 一、正交试验设计的概念:正交设计是一种研究多因素试验中利用正交表仅挑选部分有代表性的水平组合构成试验方案设计方法。 二、正交试验设计的优点:节省处理数。在多因素、多水平的试验中,处理组合数相当多,正交设计的特点就是在较多的全部处理组合中,仅挑选部分有代表性的少数水平组合进行试验。通过部分试验了解全面试验情况,找到较优的水平组合。例如有4个因素3个水平的全部处理组合为34=81个,而采用正交表L9(34)只要挑选出有代表性的9个水平组合进行试验就可以了,节省了8/9的处理。再例如,有5个因素4个水平的试验,全部处理数为45=1024个,全部试验几乎不可能,若采用L16(45)正交表挑选水平组合,只要16个处理。所以因素、水平越多,正交试验设计的优点越明显。 三、适宜条件:多因素、多水平、只考察主效而较少考察互作(试验周期长、误差较大)的多处理试验。 四、分析方法:方差分析法和直观分析法两种。 五、注意:正交设计只是一种利用正交表在全部处理中挑选部分有代表性的水平组合构成试验方案设计的方法,该试验用那种设计方法排列处理和重复区组还要根据环境条件和试验条件而定。 第一节正交表的基本性质 一、正交表的通式 最简单的正交表为:L4(23)通式为L m(t k)或L m(t k,t k) L为正交表标记m为处理组合数t为因素的水平数k为最多可以安排的因素数或最多可以考察的效应数或正交表的列数。 表9.1 L3)正交表的表型构造 表头3列,为最多考察的效应数,水平栏为每个因素的水平(1,2),处理列为处理组合数4个。再例如L9(34)(表8-1)。其中L表示一张正交表,括号内的底数3表示因素的水平数,3的右上方指数4,表示最多可以安排因素的个数。L右下角的数字9表示试验的次数(水平组合数)。横表头的“1,2,3,4”是表示正交表4列号;纵表头的“1,2,…9”分别表示9行,也是9个处理的代号;表身中每一列的“1、2、3”分别表示因素的3个水平。 表9.2 L9(34)正交表

正交试验方差分析

正交试验方差分析 1. 引言 正交试验是一种基于统计学原理的实验设计方法,通过对多个变量进行组合,从而解决多因素对结果的影响。方差分析是一种常用的统计方法,用于比较不同组之间的差异。正交试验方差分析是将正交试验方法与方差分析相结合,用于分析多因素对结果的影响,并确定各因素的主要影响因子。 2. 正交试验的基本原理 正交试验是一种通过设计矩阵来确定各个变量组合的方法。其基本原理是将多个因素独立地进行变化,并通过正交设计矩阵来确定各个因素的取值组合。通过选择合适的正交设计矩阵,可以降低试验的次数,提高试验效率。 3. 正交试验方差分析的步骤 正交试验方差分析主要包括以下几个步骤: 3.1 确定试验因素 首先需要确定需要进行试验的因素。这些因素可以是产品的不同设计参数、工艺的不同操作条件等。 3.2 构建正交设计矩阵 根据确定的试验因素,构建正交设计矩阵。正交设计矩阵是一种特殊的矩阵,能够保证各个因素之间的相互独立性,从而减少试验次数,提高试验效率。 3.3 进行试验并记录结果 根据正交设计矩阵确定的因素取值组合,进行实际试验并记录试验结果。试验结果可以是产品的性能指标、工艺的生产效率等。 3.4 进行方差分析 根据试验结果,进行方差分析。方差分析是一种通过比较组间差异和组内差异来确定因素对结果的影响程度的方法。 3.5 确定主要影响因子 根据方差分析的结果,确定各个因素的主要影响因子。这些主要影响因子可以作为进一步优化产品设计或工艺操作的依据。

4. 正交试验方差分析的优势 正交试验方差分析具有以下几个优势: •减少试验次数,提高试验效率。 •可以同时考虑多个因素对结果的影响,更全面地评估产品或工艺的性能。 •通过方差分析确定主要影响因子,为进一步优化设计或操作提供指导。 5. 总结 正交试验方差分析是一种将正交试验方法与方差分析相结合的统计分析方法。 通过选择合适的正交设计矩阵,可以降低试验次数,提高试验效率。正交试验方差分析可以同时考虑多个因素对结果的影响,并通过方差分析确定主要影响因子,为进一步优化设计或操作提供指导。这种方法在产品设计和工艺优化中具有重要的应用价值。

(完整版)正交实验设计

正交实验设计 当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性水平组合进行试验。因此就出现了分式析因设计(fractional factorial designs),但是对于试验设计知识较少的实际工作者来说,选择适当的分式析因设计还是比较困难的。 正交试验设计(Orthogonal experimental design)是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分式析因设计的主要方法。是一种高效率、快速、经济的实验设计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(3)3正交表按排实验,只需作9次,按L18(3)7正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。 1.正交表 正交表是一整套规则的设计表格,用。L为正交表的代号,n为试验的次数, t为水平数,c为列数,也就是可能安排最多的因素个数。例如L9(34),(表11),它表示需作9次实验,最多可观察4个因素,每个因素均为3水平。一个正交表中也可以各列的水平数不相等,我们称它为混合型正交表,如L8(4×24) (表12),此表的5列中,有1列为4水平,4列为2水平。根据正交表的数据结构看出,正交表是一个n行c列的表,其中第j列由数码1,2,… S j组成,这些数码均各出现N/S次,例如表11中,第二列 的数码个数为3,S=3 ,即由1、2、3组成,各数码均出现次。

第十章正交试验设计

第十章正交试验设计 (I)本章教学内容与要求 (1)了解正交试验设计的基本思想,掌握正交表的基本结构和特点。 (2)掌握正交试验设计的基本步骤。 (3)掌握正交试验结果的直观分析法;理解和掌握正交试验结果的方差分析法。 (4)了解SPSS在正交试验结果分析中的应用。 (II)教学重点 正交试验设计的基本步骤,正交表的直观分析、方差分析。 (III)教学难点 正交表的选择和表头设计。 10.1 正交试验设计概述 10。1。1 正交试验设计方法的基本思想和优点 在实际工作中,常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模很大,往往因试验条件的限制而难以实施。正交试验设计法就是用正交表安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。我国60年代开始使用,70年代得到推广,因其优点突出,日益受到科学工作者的重视,在实践中获得了广泛的应用。下面,我们用具体例子来说明正交试验设计的思想及其特点。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80—90℃;B:90—150分钟;C:5—7% (提问:影响因素及其水平范围如何确定?) 试验设计方法: (1)试验目的:搞清楚因子A、B、C三种因素对产品转化率有什么影响,哪些因素是主要的,哪些因素是次要的,各种因素哪种水平比较好,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。 (2)确定因素的水平:在这里,对因子A、B、C,在其试验水平范围内分别选了三个水平来研究; A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 因子的水平可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 (3)试制定试验方案。这个三因子三水平的条件试验,通常有三种试验进行方法:

正交实验的设计方案

正交实验的设计方案 正交实验是一种用于确定影响因素对实验结果影响的统计方法。它可以帮助研究人员以少量实验设计来获取全面可靠的数据,从而进行合理的判断和决策。正交实验的设计方案是一项关键工作,本文将讨论如何进行正交实验的设计方案,并提供一个实际案例。 一、正交实验的基本原理 正交实验基于统计学的原理,通过一系列的实验来确定各个因素对结果的影响程度,并找出最优的组合方式。正交实验中,要考虑的因素被称为水平或处理水平,这些水平可以是定性的(如颜色、形状等),也可以是定量的(如温度、压力等)。关键是选择合适的水平组合,以获得准确、全面的数据。 二、正交实验的设计方法 1. 确定因素和水平:首先确定需要考虑的因素及其对应的水平。根据实际情况和研究目的,选择合适的因素和水平,保证实验结果的可靠性和可解释性。 2. 构建正交表:利用正交表是进行正交实验设计的核心步骤。正交表将各个水平组合按照一定的规律排列,确保每个水平在实验中均匀分布,并减少误差的影响。常用的正交表包括拉丁方、矩形方和正交平方等。 3. 进行实验:根据正交表的设计,进行实验。确保实验过程的准确性和可重复性,记录实验数据。

4. 分析实验数据:通过统计学方法对实验数据进行分析,评估各个 因素对结果的影响程度。常用的分析方法包括方差分析、回归分析和 卡方检验等。 5. 优化方案选择:根据实验结果,确定最优的因素组合和水平选择。同时,可以进一步优化实验方案,提高研究效果和实验效率。 三、实际案例 以某电子产品的设计为例,我们需要确定屏幕亮度、音量大小和屏 幕分辨率对用户体验的影响程度。我们选择了三个水平来表示这三个 因素,分别是:低、中、高。 通过正交实验的设计方案,我们利用正交表构建了以下实验方案:因素1:屏幕亮度(低、中、高) 因素2:音量大小(低、中、高) 因素3:屏幕分辨率(低、中、高) 在表中,每一行代表一个实验条件,我们总共需要进行9次实验。 实验数据如下: 实验结果屏幕亮度音量大小屏幕分辨率 实验1 低低低 实验2 低中中 实验3 低高高

正交试验设计(详细)

正交试验设计法 正交试验设计法的基本思想 正交表 正交表试验方案的设计 试验数据的直观分析 正交试验的方差分析 常用正交表 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法: (Ⅰ)取三因子所有水平之间的组合,即 AlBlC1,A1BlC2,A1B2C1,……,A3B3C3, 共有 33=27次

试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 图1 全面试验法取点.......... (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。 简单对比法的最大优点就是试验次数少,例如六因子五水平试验,在不重复时,只用5+(6-1)×(5-1)=5+5×4=25次试验就可以了。 考虑兼顾这两种试验方法的优点,从全面试 验的点中选择具有典型性、代表性的点,使 试验点在试验范围内分布得很均匀,能反映 全面情况。但我们又希望试验点尽量地少, 为此还要具体考虑一些问题。 如上例,对应于A有Al、A2、A3三个平面, 对应于B、C也各有三个平面,共九个平面。 则这九个平面上的试验点都应当一样多,即 对每个因子的每个水平都要同等看待。具体 来说,每个平面上都有三行、三列,要求在每行、每列上的点一样多。这样,作出如图2所示的设计,试验点用⊙表示。我们看到,在9个平面中每个平面上都

正交实验设计方法--非常有用

L9(34) 序号 1 2 3 4 1 1 1 1 1 2 1 2 2 2 3 1 3 3 3 4 2 1 2 3 5 2 2 3 1 6 2 3 1 2 7 3 1 3 2 8 3 2 1 3 9 3 3 2 1 回首页 正交试验设计法 正交试验设计法的基本思想 正交表 正交表试验方案的设计 试验数据的直观分析 正交试验的方差分析 常用正交表 1.正交试验设计法的基本思想 正交试验设计法,就是使用已经造好了的表格--正交表--来安排试验并进行数据分析的一种方法。它简单易行,计算表格化,使用者能够迅速掌握。下边通过一个例子来说明正交试验设计法的基本想法。 [例1]为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围: A:80-90℃ B:90-150分钟 C:5-7% 试验目的是搞清楚因子A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多少才能使转化率高。

试制定试验方案。 这里,对因子A,在试验范围内选了三个水平;因子B和C 也都取三个水平: A:Al=80℃,A2=85℃,A3=90℃ B:Bl=90分,B2=120分,B3=150分 C:Cl=5%,C2=6%,C3=7% 当然,在正交试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。 这个三因子三水平的条件试验,通常有两种试验进行方法: (Ⅰ)取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B2C1,……,A3B3C3,共有 33=27次 试验。用图表示就是图1 立方体的27个节点。这种试验法叫做全面试验法。 全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时。试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需56=15625次试验,这实际上是不可能实现的。如果应用正交实验法,只做25次试验就行了。而且在某种意义上讲,这25次试验代表了15625次试验。 图1 全面试验法取点.......... (Ⅱ)简单对比法,即变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之: ↗A1 B1C1 →A2 ↘A3 (好结果) 如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之: ↗B1 A3C1 →B2 (好结果) ↘B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之: ↗C1 A3B2→C2 (好结果) ↘C3 试验结果以C2最好。于是就认为最好的工艺条件是A3B2C2。 这种方法一般也有一定的效果,但缺点很多。首先这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。

正交试验设计及其统计分析

第三章正交试验设计及其统计分析 §3-1 正交试验设计 利用正交表解决多因素的试验问题:(1)参数和交互作用对指标影响的显著性;(2)参数较优化组合;(3)指标的预测。 一、正交表的特点 正交表代号La(bc)的含义:a—正交表行数,即试验点数; b—各因素水平数,c—正交表列数,每一列可安排一个因素。 L4(23)正交表 试验号列号 1 2 3 1 1 1 1 2 1 2 2 3 2 1 2 4 2 2 1 正交的含意:若将表中2换成-1,则任一列之和为0,任两列乘积的和为0。若将列看作向量,则两向量垂直相交,即正交。 从试验点的空间分布可知,L4(23)正交表为1/2实施。 (1)均衡搭配:即任一因素的任一水平与其它因素的每一水平相遇的次数均等。(2)综合可比:即任一因素的各水平出现的次数相等。 二、交互作用表(挂一张L8(27)正交表) 1、交互列的位置:要查交互列表。 2、混杂:若在交互两因素的交互列上,安排其它因素或其它因素的交互,则在此列将出现混杂现象。 3、如何对待混杂 ①若不想用较多的试验,则就可能有混杂,此时要用专业经验来判断。 ②若不研究规律,只找出参数较优组合,则可不考虑混杂。 三、试验方案设计 1、列因素水平表(挂豇豆脱水试验表) 因素水平A B C D 参数名称 (单位) 参数名称 (单位) 参数名称 (单位) 参数名称 (单位) 1 A1 B1 C1 D1 2 A2 B2 C2 D2 2、选正交表

原则:正交表的列数应≥要考察的因素和交互作用个数的最小正交表。 3、表头设计 即因素放在哪一列。其原则如下: ①若不考虑交互作用,则因素随机放各列,但若有余列时,因素最好不要放在其它因素的交互列上,一则避免混杂,二则可看出交互作用的大小。 ②若要考虑交互作用,则应先排要交互的因素,其它因素按不混杂的原则随机排列。 4、列出试验方案 将表中字码换成对应的水平值。每一行的因素水平组合即为一个试验点。(挂清选机试验方案) 四、试验 注意以下几点: (1)各因素的水平组合方案不能变。 (2)试验点的实施顺序是随机的,即可根据水平改变的难易来安排。 (3)严格控制试验条件,减少试验误差。 §3-2正交试验数据的直观分析法 一、单指标试验数据的极差分析 1、分析的内容 ①找出因素对指标影响的主次。 ②找出各因素的较优水平,即取哪个水平最好。 ③找出参数的较优组合:即各因素取何水平搭配起来最好,考虑了交互作用。 2、分析的步骤(挂豇豆脱水试验表) ①算出各因素同一水平的指标和m K 与均值 b a K k m m /= ,b m ~1= ②由各水平的均值算出极差 min max k k R -= ③找出各因素的较优水平:指标好的水平为较优水平,事先要知道指标是越高越好还是越近越好。 ④根据极差R 的大小确定因素的主次,即对指标影响的大小,R 越大影响越显著。 ⑤若考察交互作用时,要找出优搭配(水平搭配) ⑥找出因素水平的较优组合:即参数的较优组合(在试验中可能出现,也可能不出现)。 3、注意事项 ①若交互作用比其中某一因素的影响大时,应先从交互中找出因素主次和较优水平。 ②对于空列,反映了试验误差,若恰为某两因素的交互作用列,且该列极差很大,则该交互作用不能忽略。 [例题]豇豆脱水正交试验设计。以干制品中Vc 含量为指标,Vc 含量越高越好。研究3个因素,每因素取2水平。因素水平编码见下表。 豇豆脱水正交试验因素水平编码表 因素 水平 A B C 介质温度(℃) 介质速度(m/s ) 漂烫时间(min )

相关主题
文本预览
相关文档 最新文档