当前位置:文档之家› 方差分析及方差齐性检验的若干问答~

方差分析及方差齐性检验的若干问答~

方差分析及方差齐性检验的若干问答~
方差分析及方差齐性检验的若干问答~

在EXCEL中实现多总体方差的Bartlett齐性检验

在EXCEL中实现多总体方差的Bartlet t齐性检验 在体育教学和运动训练等的科学实验中,对影响体育教学成绩及运动竞赛的成绩的原因的探究,一直是当代体育科研中研究的主线。例如,在运动训练中,为更加有效地提高运动成绩,通常需要考察不同的运动强度、不同的运动量和不同的运动持续时间等因素对不同的专项运动成绩的影响,目的是为了找出适合不同专项的运动强度、运动量、运动持续时间的较佳组合。又如,我们从运动系体操专业的学生中随机抽取条件相似的20 名学生随机分成4组,每组5人,由 4 位教师施以不同的教学方法,教20 个具有相当难度的体操动作,并规定每个动作的计分标准,试教一学期后举行测试,测得各组得分,见下表。现假定每组的得分服从正态分布,则这 4 种教学方法的效果间是否有显著性差异的问题就是我们迫切需要了解的。 如果仅仅从上例每组的总分上看,显然四种不同的教法带来了四种不同的学生得分,分值上肯定有差异,但这种差异主要是由随机误差引起的,还是主要是由于教学方法的不同而引起的,即是否有显著性差异的统计结论,还须经统计检验后才能得出。若用两个样本间均数差异的显著性检验方法来处理本类问题的话,需要做6次检验。若这样的试验安排共有N组,则需要做N (N-1)/2 次两两比较,这一方面,显然太麻烦了,另一方面,

当设定两两比较时,犯第一类错误的概率 a =0.05,则N个独立 样本两两比较时,每次比较不犯第一类错误的概率为0.95N(N-1) /2,相应犯第一类错误的概率为1-0.95N(N-1) /2,远远大于 事先设定的0.05。因此,多个均数比较时不宜采用我们熟知的t 检验作两两比较,应采用一种新的统计处理方法来实现。 解决这一类问题的方法是方差分析。它最早由英国统计学家费舍( R.A.Fisher )在1923 年提出,最初用于生物学和农业试验方面,后于1946年由斯内德克(G.W.Snedecor)进一步加以完善。为纪念费舍的杰出贡献,又把它称为 F 检验。现在它在体育领域中也得到了广泛的应用。 方差分析是在总体服从正态分布且方差齐性的假设下展开的,在满足总体正态性但方差不齐时,此法不可用,而只能改用方差不齐时两均数差异的显著性检验的方法来进行两两均数间的比较。因此,这里很有必要来考虑方差的齐性检验的问题。本文主要介绍在EXCEL中如何来实现多总体方差的Bartlett 齐性检验的自动计算。 1 Bartlett 方差齐性检验的方法 Bartlett 法是一种可在各水平重复测定次数不等时用来检验方差齐性的方法,虽然,当各水平重复测定次数相等时,可用Cochran 提供的检验方法,但Bartlett 法同样适用。 2在EXCEL中进行Bartlett 方差齐性检验的方法 2.1工作表的安排 在用Bartlett 法进行方差齐性检验时,为使计算相对自动化,

方差齐性检验的原理

统计学搜索整理汇总——方差齐性检验的原理 LXK的结论:齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。 LXK注:方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平方根(s) F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差 ================= F检验为什么要求各比较组的方差齐性? ——之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。 简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。 ----------------- 在SPSS中,如果进行方差齐性检验呢?命令是什么? 方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。 One-Way ANOVA对话方块中,点击Options…(选项…)按扭, 勾Homogeneity-of-variance即可。它会产生Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值,若P值<于0.05,便拒绝方差整齐的假设。 顺带一提,Cochran和Bartlett检定对非正态性相当敏感, 若出现「拒绝方差整齐」的检测结果,或因这原因而做成。 --------------- 用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的? 答案 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝

方差齐性检验

一、方差齐性检验 1、 data abc; do a=1 to 4; do i=1 to 4; Input x @@; Output; end; end; t=_n_; /*自动生成序号变量t*/ cards; 19 23 21 13 21 24 27 20 20 18 19 15 22 25 27 22 ; Proc gplot data=a; /*绘图—按文件a作散点图*/ Plot x*t; /*纵坐标为x,横坐标为t*/ proc print a; proc anova; class a; model x=a; means a/hovtest; run; 2、 data d0; Input x @@; t=_n_; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; data d1; do a=1 to 4; do i=1 to 6; Input y @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc anova; class a; model y=a; means a/hovtest; proc print; var a y; run; data d0; Input y @@; t=_n_; do a=1 to 4; do i=1 to 6; Input x @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; proc anova; class a; model x=a; means a/hovtest; run;

方差齐性检验

LXK的结论:齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。 LXK注:方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平方根(s) F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差================= F检验为什么要求各比较组的方差齐性? ——之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。 简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。 ----------------- 在SPSS中,如果进行方差齐性检验呢?命令是什么? 方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。 One-Way ANOVA对话方块中,点击Options…(选项…)按扭, 勾Homogeneity-of-variance即可。它会产生 Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值, 若P值<于0.05,便拒绝方差整齐的假设。 顺带一提,Cochran和Bartlett检定对非正态性相当敏感, 若出现「拒绝方差整齐」的检测结果,或因这原因而做成。 --------------- 用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的? 答案 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我

为何需要正态分布和方差齐性的检验

为何需要正态分布和方差齐性的检验? 很多时候,我们都需要使用从单一样本中获取的样本信息利用统计推断的方法来估计总体的参数信息,这是一种非常有用的统计方法,但在执行相关推断之前,我们需要验证一些假定,任何一条假定若是不能满足,则得到的统计结论就是无效的。 通常数据的分析假设为:随机数据,独立的,正态分布,等方差,稳定,当然,测量系统的精确性和准确性也是要满足测量要求的。 什么是正态分布假定? 在再进行统计分析之前,需要识别出数据的分布,否则,错误的统计检验将带来一定的风险,许多统计方法在执行之前嘉定数据服从正态分布,比如,单/双样本-T检验,过程能力分析,I-MR和方差分析等。如果数据不满足正态分布,则需要使用非参数方法,利用中位数进行检验而不是均值,也可以使用BOX-COX转换或JOHNSON变换的方法把数据转换为正态分布。 但是需要知道许多统计工具虽然假定数据满足正态但实际上当样本量大于15或20的时候就不需要正态分布了,但是如果样本量小于15且数据不满足正态分布,P值得数据就是错误的,相关统计结论就需要特别注意了。 在Minitab中,有许多方法可以判断数据的分布是否满足正态,下面我们来了解两种比较常用的方法:正态检验和图形化汇总 Minitab的正态检验将生成概率图和执行单样本假设检验来判断数据的分布是否来自满足正态的分布总体,原假设是数据满足正态分布而备择假设是不满足 选择统计—基本统计量—正态检验 下面我们先看看数据的正态检验

图形中的数据点应该在直线的附近,如果有些数据点在尾巴上远离直线也可以接受,但前提条件是必须在置信区间内才可以。 图形中的数据点应该靠近你和分布直线且通过“粗笔检验”,用一只“粗笔”盖在拟合直线上,如果铅笔能盖住所有数据点,则数据满足正态分布 与之相连的Anderson-Darling检验统计量应该很小 P值应该大于选择的Alpha风险(通常取或) Anderson-Darling统计量用来衡量数据点远离拟合直线的程度,是每个数据点到直线距离的平方和,对于一组给定的数据分布来说,分布拟合的越好,该值就会越小。 Minitab描述性统计输出通过图形化汇总直观的展示数据分布和计算了Anderson-Darling数值和P 值,图形化汇总输出四张图形:带有正态拟合线的直方图,箱线图,均值和中位数的95%置信区间图。 接下来分析图形化汇总中的正态检验: 数据通过直方图展示出来,查看图形的分布行形状(对称还是有偏度),数据在图形中是如何延伸的,且需要查看是否存在异常数据 与之相关的Anderson-Darling统计量数值应该很小 P值应该大于选择的Alpha风险(通常取或) 对于一些流程来说,比如时间和循环周期的数据,数据永远不会满足正态分布的,不满足正态分布的数据对于一些统计方法是适用的,但需要明确数据需要满足一些特殊需求。 什么是等方差假定? 通常,方差是指数据的分布离散程度,统计分析中,比如方差分析(ANOVA)中,嘉定虽然不同的样本数据来自不同均值的抽样总体,它们应该有相同的方差,方差齐性是指不同样本的方差大体相同,如果方差非齐性会影响第一类风险且导致错误的结论,如果比较两个或两个以上样本均值,比如双样本T检验和ANOVA中,如果方差显著有差异将会掩盖掉均值的差异信息并导致错误的结论。 Minitab提供了几种可以执行等方差检验的方法,可以参考Minitab的帮助来决定基于不同的数据类型该选择哪种方法,当然,也可以通过使用Minitab协助来验证该假定(技巧:当使用协助,点

方差齐性检验

但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验。 ---------------- Levene方差齐性检验也称为Levene检验(Levene's Test).由H.Levene在1960年提出[1].M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展[2],使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差,也可以使用数据与中位数和调整均数(trimmed mean)的绝对差.这就使得Levene检验的用途更加广泛.Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立.国内常见的Bartlett多样本方差齐性检验主要用于正态分布的资料,对于非正态分布的数据,检验效果不理想.Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料,其检验效果比较理想. ---------------------------- 方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。该检验方法所计算的统计量服从分布。 用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。 …… 例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同? …… 本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为四总体方差不同或不全相同。 两个独立样本的方差齐性检验 例:某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21.男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致 解:1.提出假设 2.选择检验统计量并计算其值 3.统计决断查附表3, 得F(19,19)0.05=2.04 F=1.340.05,即男女生成绩的差异没有达到显著性差异. 两个相关样本的方差齐性检验 例子:教科书164页. 综合应用 例1:某省在高考后,为了分析男,女考生对语文学习上的差异,随机抽取了各20名男,女考生的语文成绩,并且计算得到男生平均成绩=54.6,标准差=16.9,女生的平均成绩=59.7,标准差=10.4,试分析男,女考生语文高考成绩是否有显著差异

t检验和方差分析的前提条件及应用误区

t检验和方差分析的前提条件及应用误区 用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。 若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t 分布作为其理论依据的检验方法。 值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。 t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。 医学论文中常见的统计方法误用 一、等级资料用卡方检验代替秩和检验

方差齐性检验-EmpowerStats

方差齐性检验 比较两组或多组样本方差是否相同。检验方法有三种:(1)传统的 Levene 检验,该检验使用各组均数;(2)稳健 Brown-Forsythe Levene 类型检验,该检验使用各组的中位数;(3)稳健 Levene 类型检验,该检验使用修剪后的各组中位数。 方差齐性检验是假设各组的总体方差相同,如果检验结果,p值很小(如<0.05)拒绝H0,接受H1,认为各组总体方差不等(不齐)。 方差趋势检验 当分组变量是有序变量(如文化程度分低、中、高),比较两组或多组样本方差是否随分组变量变化呈线性变化趋势。检验方法有三种:(1)传统的 Levene 检验,该检验使用各组均数;(2)稳健 Brown-Forsythe Levene 类型检验,该检验使用各组的中位数;(3)稳健Levene 类型检验,该检验使用修剪后的各组中位数。 方差趋势检验是假设各组的总体方差无线性变化趋势,如果检验结果,p值很小(如 <0.05)拒绝H0,接受H1,认为各组总体方差呈线性变化趋势。 该模块在完成方差齐性检验后,自动进行方差趋势检验,如果所用的分组变量不是有序变量,忽略方差趋势检验检验结果即可。 如比较几个变量的方差是否相同,选择变量名,不输入分组变量即可。 例1,DEMO数据比较不同文化程度第一秒肺活量的方差是否齐,输入界面: 输出结果: 分组变量: EDU.NEW

modified robust Brown-Forsythe Levene-type test based on the absolute deviations from the median ltrend test based on the modified Brown-Forsythe Levene-type procedure using the group medians (two-tailed with Pearson correlation coefficient)

方差齐性检验

第五节多个样本的方差齐性检验 方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett 法。该检验方法所计算的统计量服从分布。所用公式如下: (5.18) (5.19) 或,(5.20) (5.21)式中为第i组的样本含量;为第i组的样本方差;k为样本个数;C为校正数。 用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。 例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同? 1.建立检验假设和确定检验水准 H0:H1:各总体方差不同或不全相同=0.05

2.计算统计量值初步计算结果如表5.12。 表5.12四样本方差齐性检验的计算 分组 1 5.941529.705 1.781888.90939 2 2.370511.8500.86289 4.31445 30.5175 2.585-0.65971-3.29856 40.5816 3.486-0.54300-3.25803 合计—2147.626— 6.66725 =2.268 =17.19687 C=1+=1.090 =9.663 3.确定P值,作出统计推断结论。 本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为四总体方差不同或不全相同。

相关主题
文本预览
相关文档 最新文档