d c d b c a b a N
N bc ad ++++??? ??
--=2
22//χ
第四节 相关样本四格表的2
χ检验:1、()c
b c b +-=
2
2
χ
2、若()30<+c b 或()50<+c b 时, ()c
b c b +--=2
21
//χ
第十一章 相关分析 第一节 相关的意义
正相关:两个变量的变化方向一一致。负相关:两个变量 的变化方向相反。零相关:两上个变量值变化方向无一定规律。从密切程度来看,无论两个变量的变化方向是否一致,凡密切程度高的称为强相关,一笛膜的为中度相关,弱的为弱相关或低度相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。r
第二节 积差相关:当两个变量都是连续变量,而且两者之间呈线性关系时,表示这两个变量之间相关。使用条件是:1、两个变量都是由测量获得的连续性数据。2、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称。3、必须是成对数据,而且每对数据之间相互独立。4、两个变量之间呈线性关系。5、要排除共变因素的影响。6、样本容量30≥n 。
积差相关系数:两个变量标准分数乘积之和除以n 所得之商。n
y y y x x x r ∑????
??-???
?
?-=
σσ 相关系数的等距转换及其合并:相关系数不可以直接相加求和,因为它不具有等距的单位。1、将各相关系数r 转换成Zr 2、求Zr 的平均数()()∑∑--=
33n Z n Z r
r
相关系数显著性检验的步骤及方法: 一、0:0=ρH 条件下,
1、50≥n r 的抽样分布接近于正态分布 0:0=ρH ρ≠0H 2
11
r n r Z --= 50≤n 2
12r
n r t --=
2、 0:ρρ=o H 条件下 将r 转换成Z r ()3--=n Z Z Z r ρ 二、两个相对独立的样本相关系数差异的显著性检验3
1
312121-+
--=
n n Z Z Z r r
第三节 等级相关:指以等级次序或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列相关及肯德尔和谐系数。
斯皮尔曼等级相关:当两个变量值以次序或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。虽然X 变量可视为正态连续变量,但Y 变量是按某种标准评定的等级,故
(
)
1
612
2
--
=∑n n D r R
1、赋预等级。
2、计算两个变量每对所赋予的等级数之差D ,及差数的平方之和,即∑2D 检验方法:2
12r
n r t --=
肯德尔和谐系数:当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这向个变量之间的一致性程度(即相关)的量。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况:
()
n n K SS r R
w -=
3
212
1 ()∑∑
-=n R R SS R
2
2
2、有相同等级: ()
∑--=
T K n n K SS r R
w 3
212
1 ()∑-=12/3m m T
相关系数的显著性检验:()w r n K 12-=χ
第四节 质与量的相关:指一个变量为质,另一个变量为量,这两个变量之间的相关。主要包括二列相关、点二列相关、多系列相关。1、二列相关:当两个变量 都是正态连续变量,其中一个变量被人为地划分成二分变量。使用条件:1、两个变量都是连续变量,且总体呈正态分布,或接近正态分布,至少是单峰对称分布。2、两个变
量之间是线性关系。3、二分变量是人为划分的,其分界点应尽量靠近中值。4、样本容量应当大于80。 二列相关系数的计算:Y pq x x r t q p b σ-=
检验:n
pq
Y r
Z b 1=
2、点二列相关:当两个变量其中一个是正态连续变量,另一个是真正的二分名义变量,有时一个变量虽然并非真正的二分变量,而是双峰分布的变量。 点二列相关系数:pq x x r t
q
p pb σ-=
检验:2
12r
n r t --=
3、多系列相关:当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别(两类以上)的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关。
第五节 品质相关:两个变量都是按质划分成几种类别,数据一般是点计数据。根据两个变量的性质及所分类别的多少,分为四分相关,Φ相关及列联相关。 一、四分相关:当两个变量都是正态连续变量,且两者呈直线关系,但两者都被人
为地划分成二分变量。?????
?
?
+=bc ad
r t 1180cos 0
二、Φ相关:当两个变量都是二分变量,无论是真正的二分变量还是人为的二分变量,这两个变量之间的关系,可以用Φ相关来表示,比四分相关要广泛。
()()()()
d c d b c a b a bc
ab r ++++-=
φ
检验:22φχNr =
三、列联相关:当两个变量均被人为地分成两个以上类别,或其中一个变量被分成
两个以上类别。22χχ+=N c 先求出 ???
? ??-=∑102
c r n n f N χ 显著性检验:()()11--=c r df
第十二章 回归分析
相关表示两个变量之间的双向相互关系。回归表示一个变量随另一个变量 作不同程度变化的单向关系。由一个变量值估计、预测另一个变量值的准确性,随这两个变量之间的相关程度而变化。在存在相关的情况下,相关越高,由一个变量值预测另一个变量值越准确,误差越小。
第一节 一元线性回归指只有一个自变量的线性回归。
最小二乘方法求回归系数:在配制回归线时,回归系数(b )的确定原则是使散布图上各点距回归线上相应点的纵向距离平方和为最小,这种求b 的方法称为最小二乘方法。
求回归系数:由y 估计x :y
x xy r b σσ= 由x 估计y :x
y
yx
r
b σσ=
求截距:由x 估计y :x b y a yx yx -= 由y 估计x :y b x a xy xy -= 一元线性回归方程检验的方法:1、对回归方程进行方差分析。2、对两个变量的相关系数进行与总体零相关的显著性检验。3、对回归系数进行显著性检验。 检验步骤:1、提出假设:H 0:β=0 H 1:β≠0 2、计算检验统计量:2
12
r
n b t y x yx --=σσ由x 估计y
3、确定检验形式:
4、统计决断:
测定系数:∑
∑--=2
22
)()?(y y y y
r x 和y 两个变量相关系数和平方等于回归平方和在总平方
和中所占的比率。
第三节 一元线性回归议程的应用:回归方程主要是用来由自变量的值估计预测因变量的值。这里的估计预测包含两个方面,一方面是用样本的回归方程推算因变量的回归值y ;另一方面是根据样本的回归值y 估计预测因变量的真值y 。多元线性回
归是指有两个或两个以上自变量的线性回归。
1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<-μμσμσαα所以:即x x Z X Z X 7.09971==-=n s x n σ39.8161.787 .0*987.1807.0*987.1802/2 <<+<<-+<<-μμσμσαα即:x x t X t X 789.1208===n x σσ506.3171789.1*96.11712 1±=±=±-x z x σα
第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数
5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表
将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f
现代心理与教育统计学 复习资料 Revised as of 23 November 2020
1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。
统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f
第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f
(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。
第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。
第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:
第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数
现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185
小学音乐的创编是否有必要 1 问题的提出 音乐是儿童艺术活动的重要内容之一,它在想象力、创造力的培养上起着特殊的作用,因为音乐活动本身就需要丰富的想象及创造力,通过音乐不仅熏陶了幼儿的审美感,而且有助于幼儿创造力的开发和培养。而幼儿阶段是人的音乐智能和创造力发展的关键期。当代教育心理学的研究告诉我们,最有效地培养学生创造力的方式是要结合具体学科教学进行,在音乐课堂教学中正可以采用这样的方式锻炼学生的创造能力。虽然小学和教师都有一定意识,但是在实际教学中却因为各种原因没有有效的进行,忽视幼儿在活动过程中的情感体验,小学音乐创编很少进行,或者进行中只是形式化的按照教案依葫芦画瓢,教师没有扮演好自己的角色,也没有很好的调动幼儿的积极性和发散思维,不是正真意义上的音乐创编等等。 本研究将用问卷法,调查XXX市小学音乐创编环节教学的现状,期望能了解教师音乐创编的态度、能力,总结出XXX市音乐创编活动中存在的问题,通过调查和文献法总结教师音乐创编的策略,对音乐创编活动提出自己的建议。 2 研究意义 一、调查了解小学教师对音乐创编教学的目的和态度 二、调查教师经常采用的音乐创编方式总结幼儿创编兴趣和能力的年龄特点 三、调查了解音乐创编教学的小学支持及条件 四、调查现在音乐创编在实践中的不足 本研究的意义在于研究了解XXX市小学音乐创编环节教学现状,希望通过调查音乐创编教学存在的具体问题和不足,对改进音乐创编教学提供依据,通过总结小学音乐创编教学的策略,给予教师进行音乐创编教学的参考。 本研究主要采用的研究方法主要有文献法、问卷法。
用问卷法主要是调查广州市小学音乐创编环节教学的现状,期望能了解教师音乐创编的态度、能力,总结出广州市小学音乐创编活动中存在的问题,通过调查和文献法总结教师音乐创编的策略,对音乐创编活动提出自己的建议。 本研究采用SPSS11.5 for windows统计软件,将所得数据进行录入,整理及统计分析。本研究采用的统计方法有描述分析、t检验、相关分析、方差分析、回归分析。 3.4 研究对象及样本选择 本研究的目的在于调查广州市小学音乐创编环节教学的现状,因此,本研究的研究对象是在职的幼儿教师。本研究随机选取了五间小学进行问卷的发放,一共发出问卷150份,回收116 份,回收率为77.3%,其中有效问卷是113份,有效率为97.4% 。 3.研究方法与过程 本研究主要通过查阅文献资料了解关于幼儿音乐创编的相关研究,试图为本研究的开展找到理论的支撑点以及可借鉴的研究方法。在查阅大量文献的基础上,自编《小学音乐创编教学现状调查问卷》,并请有关专家对问卷进行评价,删除和修改语义模糊、表达不准确的题目,形成正式问卷。本问卷包括封闭式和开放式两种问题,以封闭式问题为主,问卷回收后,对数据进行了初步的分析,适当地剔除了个别题目,并对问卷进行修改,最后,在此基础上编成了最终问卷。 问卷的第一部分采用了Likert五点计分法,符合程度递增,依次是“完全不符合”、“基本符合”、“不表态”、“基本符合和完全符合”,五个选项分别赋予1、2、3、4、5分,数值越大表示符合的程度越高。如5代表题目的表述完全符合被试的实际情况。其中第3题,4题,14题为反向计分题。 本问卷分成以下部分构成:第一部分为被试基本资料的调查部分,用于了解幼儿教师所在的班级、幼儿教师的教龄和学历水平。 第二部分是问卷的主体部分,共有22道小题,主要有四个维度构成。第一个维度为教师素质,共有7道题目(2,6,8,10,11,15题),第二个维度为教师音乐创编的教学策略和方法(1,9,12,15,16,17,19题),第三个维度为幼
心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。
特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。
第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时
张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。
1. 解释相关系数时应注意什么? 相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。 相关系数的数值大小,表示两个变量关联的强弱。 相关系数即使是1,也不能推出因果关系的结论。 要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。 在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。 2. 假设两变量为线性关系,计算下列各种相关应用什么方法? (1)积差相关(2)斯皮尔曼等级相关(3)二列相关 (4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数) 3.如何区别点二列和二列相关? 主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关 4.品质相关有几种?各种品质相关的条件? 主要有四分相关、φ相关、列联表相关 四分相关:当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时, 求两个变量之间的相关。 Φ相关:当两变量是真正(自然)的二分变量时,求两变量之间的相关。 列联相关:当两个变量都是计数数据时,求它们的相关。 5. 用肯德尔和谐系数 6.将数据带入公式计算得: 解 7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数 8.解此题符合点二列相关的条件 85=男X 91=女X 8.3=X S 成绩与性别有关,即男女生的成绩存在显著差异 9.此题该用二列相关求解 2.88=奇X 8.87=偶X 8.3=X S )(() 819 .022 22=∑ ∑∑ ∑ ∑∑∑---=Y Y N X X N Y X XY N r ()()794.011413=++??? ?????-?-=∑ n n n R R n r y x R ()()972.011413 =++??? ?????-?-=∑ n n n R R n r y x R 789.04/1*8 .385 91=-=-=pq S X X r x q P pb
练习3 1.按照数据的获得方式,找出下列数据中与其它不同类的数据。( ) A.72克 B.65分 C.10米 D.3台 2.测量数据10.000的下实限是:( ) A.10.999 B.9.999 C.9.9995 D.10.0005 3.欲从某重点中学720名高一学生中随机抽取120名调查其视力情况。首先按原有视力记录,将他们的视力情况分为上、中、下三等,各等人数分别为108人、360人、252人。若用分层按比例抽样法,则中等视力水平的学生中应抽取:( ) A.18人 B.60人 C.42人 D. 72人 4.某班期末考试,语文平均成绩为82分,标准差为6.5分;数学平均成绩为75分,标准差为5.9分;外语平均成绩为66分,标准差为8分,问哪一科成绩的离散程度大?( ) A.语文 B.数学 C.外语 D.无法比较5.假如某班成绩服从正态分布,在按优、良、中、及格、不及格评定学生成绩时,良等成绩z分数应取值在哪个区间?( ) A.-0.6--0.6 B.-1--1 C.0.6--1.8 D.0.5--2.5 6.在正态分布中,标准差反映了:( ) A.随机变量的波动性 B.正态曲线的对称位置 C.随机变量的平均水平 D.正态曲线的陡峭程度 7.下列数据1,26,11,9,14,13,7,17,22,2的中位数是:( ) A.14 B.13 C.17 D.12 8. 某校1970年的教育经费是10万元,2002年的教育经费是121万元,问该校2010 年的教育经费是多少?( ) A.225.63万元 B.278.32万元 C.321.56万元 D.210.00万元 9. 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下: 男性拥护66人,反对106人;女性拥护28人,反对158人,那么性别与评价态度的相关系数为( )
《教育与心理统计学》试题一、 选择题:绪论 1、教育统计学是社会科学中的一门(B),是数理统计学、教育学、心理学交叉学科。 A、数据统计 B、应用统计 C、测量统计 D、推断统计 2、教育统计学是对教育领域各种现象(A)的取值从总体上的把握和认识。 B、质 C、物 D、数 A、量 3、教育统计学的内容包括(D)。 A、数理统计 B、生物统计 C、试验设计 D、描述统计与推断统计。 4、计算统计特征量数,属于(A) A、描述统计 B、推断统计 D、实验设计 C、多元分析 5、列表归类属于(A)。 A、描述统计 B、推断统计 D、实验设计 C、多元分析 6、预测某地的教育规模,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 7、检验普通班与实验班的成绩有无显著差异,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 8、通过抽查成绩来判断某校体育达标情况,属于(B)。 A、描述统计 B、推断统计 C、多元分析 D、实验设计。 9、预测某地教育规模,属于(B) A、描述统计 B、推断统计 C、教育统计 D、心理统计第一章常用的统计表与图 10、相对次数分布表与简单次数分布表各有不同的用途,如何使用它们?(C) A、单独使用 B、联合使用 C、既可单独使用又可联合使用 D、A,B,C,都不对 11、能很快地看出各组次数之间的相对大小及结构形态的图为(D)。 A、次数分布图 B、次数多边图 D、次数直方图 C、相对次数直方图 1 12、要求在横轴上最低组与最高组外各增加一个次数 f 为 0 的组的图为(A)。 A、次数多边图 B、次数分布图 D、相对次数直方图 C、次数直方图 13、适合于描述二元变量的观测数据的图为(B)。 A、线形图 B、散点图 C、圆形图 D、条形图 14、适合于描述离散性变量的统计事项的图为(D)。 B、圆形图 A、散点图 C、直方图 D、条形图 15、适合于描述具有百分比结构的分类数据的图为(A)。 A、圆形图 B、散点图 C、条形图 D、线形图用线段把相邻的点依次边接起来,边同横轴,构成一个闭合的多边 16、形,这是(B)。 A、条形图 B、次数多边图 C、次数直方图 D、线形图 17、有若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的、图形为(C)。 B、次数多边图 A、条形图 C、次数直方图 D、线形图 18、根据累积相对次数分布可绘制出(C)。 B、累积次数分布图 A、累积次数曲线图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积百分数分布可绘制出(D)。 19、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积次数分布可绘制出(B)。 20、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图 21、以起伏的折线来表示某种事物的发展变化及演变趋势的统计图是(B)。 B、线形图 A、散点图 C、条形图 D、直方图 22、用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系的图形为(A)。 A、散点图 B、线形图 C、条形图 D、直方图 23、用宽度相同的长条来表示各个统计事项之间的数量关系的图形是(C)。 A、散点图 B、线形图 C、条形图 D、直方图 24、适用于描述某种事物在时间序列上的变化趋势的图形(B)。 B、线形图 A、散点图 2 C、条形图 D、直方图第二章常用的统计参数 25、使用最普遍的一个集中量数是(A)。 A、算术平均数 B、中位数 C、加权平均数 D、众数 26、
一二章、绪论 现代统计学之父:皮尔逊 描述统计与推断统计 描述统计主要研究如何整理、描述数据的特征。 推断统计主要研究如何通过局部数据所提供的信息推论总体特征。 变量类型 定类变量:如,性别、学号、颜色类别、教学方法。 特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。 定序变量:程度、等级和水平。如,比赛名次、品质等级、喜爱程度 特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。 定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。 如温度、测验成绩、智商。 特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。 定距变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行计算。 降低偏差:利用随机抽样 降低变异性:用大一点的样本 三、描述统计 一、频数:某一事件在某一类别中出现的次数。 频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。 分布性质;集中(分散)程度,偏度和峰度不同。 偏态系数:数据的对称性 峰态系数:数据的峰度 二、集中量数: 包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。 组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。 算数平均数的性质(算法必须会):
统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN
第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。