当前位置:文档之家› 第五章统计估计和假设检验

第五章统计估计和假设检验

第五章统计估计和假设检验
第五章统计估计和假设检验

第五章统计估计和假设检验

第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。

统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。

假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;

另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。

第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。

极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。

例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:

P(A)= 其中:是这批产品的次品率。

若次品率=0.1,则P(A)=×0.1=0.0229 若次品率=0.4,则P(A)=×0.4=0.0003。现在事件A 既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。

由于0.02290.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。

把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x, )的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A =“一次观察中,所得一组样本的样本值为( )”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:同时发生的概率,也就是P(A)=,记为L()=L(), 于是有:

L()= L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为ln L()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。

在我们上述例子中,f(1, )=,f(0,)=1-,于是得到似然函数:

L()=令=0,舍去=1,得的最大似然估计值=0.067。

实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。

例5-2。从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。

解:构造似然函数为了求和,使ln的极大,令解上述方程得到:

所以得到和的极大似然估计量为:

二、估计量好坏的评选标准

前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。

例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。

表5-1 一组抽样样本的观察值样本值样本顺序均值 1 900 999 1011 970 2 995 1050 1105 1065 3 1010 941 890 947 4 950 910 1140 1000 为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?

评价点估计的结果通常有无偏性、有效性和一致性等标准。

1. 无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设为被估计参数,若有估计量( ),对一切n,有=,则称为的无偏估计量。

若-=b,则称b为估计量的偏差。若b≠0,则称为的有偏估计量。如果,则称为的渐近无偏估计量。

不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即,但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为=,则:

产生偏差的原因是总体方差的无偏估计应该是,但抽样时由于μ是未知的,因而用估计量来代替。根据最小平方原理,变量X距样本均值的离差平方和为最小,因此就小于,从而用代替μ计算的方差就低估了,为了得到的无偏估计,令这时,由于,就是的无偏估计了。

样本方差与之差称为偏差。但当n很大时,所以它是渐近无偏差估计。当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。

图5-1 估计的无偏性和有效性2. 有效性即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。

但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()1,则称比有效。

例如,对正态总体,利用样本均值及样本中位数M来估计总体的均值时,均为无偏估计,那末哪一个更有效呢?均值的抽样分布为,统计上可以证明中位数的分布为,由于。这就说明比有效,即用样本均值来估计总体的均值比用中位数来估计总体的均值效率高。换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。设用均值估计的样本为,中位数估计的样本为,设其估计效率相等,即方差相等,则,由此得到=1.57,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。

3. 一致性这就是要使统计量随样本容量n的增加,不断趋近于总体指标。在n→∞(有限总体n→N)时,估计值与总体参数完全

一致。一般地,点估计的一致性定义如下:设( )为未知参数的估计量,若依概率收敛于,则为的一致估计量。

现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式:

令当时

一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当样本容量很大时才起作用。另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。

第二节区间估计一、区间估计的概念和步骤点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。

在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683,落在总体均值范围内的概率是0.955,落在总体均值范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:

1. 如果所估计的区间越大,参数被包含在该区间内的概率就越大。

2. 如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。

一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置

信区间。分别为置信区间的下限和上限。称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。

常用的置信度有0.80,0.90,0.950.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。

图5-2 根据不同样本所得到的置信度为95.5%的置信区间需要指出的是,P()=不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间[],因此,上述概率可以理解为随机区间[]中包括参数的概率。

图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有

95.5%的置信度。

二、单个总体参数的区间估计(一)正态总体,方差已知,总体均值的区间估计根据第四章关于样本均值分布的结果,有~N(0,1) 在给定了估计置信度为时,我们有我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是这一置信区间的估计可以用图5-3来表示。

上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数。因此,总体均值的区间估计的公式就变为图5-3 置信度为的置信区间从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:

1. 计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本均值也必然服从正态分布。

2. 根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数。

3. 计算样本均方差,即抽样的标准误。

4. 最后把上述数据代入公式,得到区间估计的结果。

其实,这些步骤也同样适用于其他类型的区间估计问题。

(二)非正态总体,方差未知,大样本,总体均值的区间估计实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。这样样本均值仍服从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当时,我们可用样本标准差来代替总体标准差,直接把S代入上式中的就可以了。

(三)正态总体、方差未知,用小样本对总体均值的区间估计

在总体方差未知的情况下,如果抽取的样本就必须采用其他的估计办法。我们已知服从t分布,其自由度为n-1。因此我们就可以利用t分布来进行估计。此时与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体规模为N,样本大小为n,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数。

(四)总体比例的区间估计根据第四章关于样本比例分布的结果,我们有

若样本的比例为,同时规定估计的置信度为,则总体比例的区间估计的公式就是这里有一个问题,就是在确定总体比例的置信区间时要用到本身,而又恰恰是待估值。但由点估计理论我们知道,样本比例是总体比例P的无偏估计,于是在估计样本比例的方差时,直接用样本比例代替总体比例P。只要样本容量n足够大,并且满足和都大于5就可以保证结果是可靠的。最后,得到总体比例的置信区间为:当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数。

(五)正态总体方差的区间估计在第四章关于分布的结果中我们

介绍过,来自正态总体的一组样本的方差和总体方差之比服从于分布,即~于是对于给定的置信度,我们可以利用分布的特性,查表得到和,则有于是总体方差的区间估计为三、两个总体参数的区间估计(一)两总体均值之差的区间估计

1. 两个正态总体,方差已知,大样本从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。此时,

因此,。

由此可以得到,在置信度水平为的情况下,的置信区间为

2. 两正态总体,方差未知,但相等,大样本

两个样本都为大样本时,两样本均值之差也服从正态分布,由于假设两总体方差相等,但未知,需要根据样本方差进行估计。由于样本方差具有随机性,一般地,因此,合并推算总体方差

所以,两个样本均值之差的抽样分布的方差为

,于是,对两总体均值之差估计的置信区间为。

3. 两正态总体,方差未知但相等,小样本根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于小样本,相应的统计量不再服从正态分布而服从t分布。由于,则如大样本时一样,应将两个样本合并起来代替总体方差。即其自由度为,则两总体差的区间估计结果为。

(二)两总体比例之差的区间估计

根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。两个样本比例之差的方差为当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信度为时,两总体比例之差的置信区间为:

(三)两正态总体方差比的区间估计根据第四章所介绍的F分布的结果,来自于两个正态分布总体的总体方差和样本方差和,和所构成的统计量故对于给定的置信度水平,我们可以从F分布表查得

置信区间的临界值:

和从而于是最后我们得到的置信度为1-的置信区间为第三节样本容量的确定在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。

一、均值估计问题中,样本大小的决定在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题: 1. 要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,实际上也就是估计区间的大小, 2. 规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误差的可信度。 3. 要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。

设总体标准差为,样本均值的标准差为。估计的置信度为,于是可以相应地得到置信系数。于是对总体均值的估计可由下式得到:上式中的实际上就表示估计所允许的最大误差,我们用Δ表示,于是根据上式有

则由此只要规定了允许误差的大小Δ和总体的标准差σ,由置信度查表得到相应的,代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为的要求的最少样本数。

上述公式适用于重复抽样或无限总体不放回抽样时的情形。但对于有限总体不放回抽样的情形,公式变为如下的形式:

由此可求得满足上式要求的最小的整数为。

其中:Δ为允许最大误差,为有限总体的个体数,为置信度水平,为根据置信度水平查表得到的置信系数。

二、比例估计问题中,样本大小的决定关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样的三个问题: 1. 允许误差的大小,即规定估计值与实际值的最大偏离值。 2. 规定置信度,即估计所要求达到的可信度。 3. 对总体比例的事先估计值,即大致的或估计的总体比例是多少。与均值的估计问题完全平行地,我们可以得到以下的结果。对于重复抽样或无限总体不重复(放回)抽样时的情形为但对于有限总体不放回抽样的情形,公式变为如下的形式:

第四节假设检验一、假设检验的基本原理

假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总体均值的假设正确的可能性就愈小。

然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研究假设和判断假设是否正确的程度。

(一)假设检验中的假设

假设检验中通常把所要检验的假设称作原假设或零假设,记作。例如要检验总体均值μ=100这个假设是否正确,就表示为:μ=100。如果样本所提供的信息无法证明原假设成立,则我们就拒绝原假设。此时,我们只能接受另外备选的假设了,称之为备择假设,我们以表示备择假设。备择假设可以有三种形式,例如,在原假设:μ=100的条件下,备择假设可以是:

:μ100。这表示备择假设是总体的均值不等于100。或者是

:μ100。这表示备择假设是总体的均值大于100。或者是

:μ100。这表示备择假设是总体的均值小于100。

上述备择假设的选择与检验的要求是密切相关的。我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。

如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。在双侧检验时有左右两个拒绝区域。当原假设是::μ=100,备择假设是::μ100时就必须使用双侧检验。

若只有在样本的均值高于(或低于)假设的总体均值很显著时才拒绝原假设,这就称作单侧检验。单侧检验只有一个拒绝区域。若假设检验只有在样本均值高于假设的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验。此时,原假设实际上变为:μ100,备择假设为:μ100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为:μ100,备择假设为:μ100。由此可见,原假设和备择假设总是排他性的。

(二)检验的显著性水平假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。

我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平=5%,我们已知在概率密度曲线下包括在假设的均值两侧直线间的面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在95%的区域内,我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受

备择假设。

图5-4 假设检验的接受区域和拒绝区域不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。

在给定了检验的显著性水平后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。

对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误,我们在以后将对此进行讨论。

二、假设检验的步骤1. 提出原假设和备择假设。原假设和备择假设必须由题意来决定。在一般情况下总是把检验的目的作为备择假设,这样可以有充分的把握拒绝原假设。

2. 选择检验的显著性水平,从而确定检验的拒绝区域或临界点。表示在假设检验时当原假设为真而我们却拒绝了原假设,接受备择假设的错误概率。假设检验中还可能犯另一种错误,这将在下面讨论。

3. 确定样本的统计量和分布。样本统计量又称检验统计量。不同的统计量具有不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。

4. 计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值,如果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。如果统计

量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著,应该接受原假设。

三、几种常用的假设检验(一)

平均数的假设检验1. 双侧检验让我们研究下面的例子。

例5-4。某食品厂规定某种罐头每罐的标准重量是500克。多年的经验表明这个厂每罐重量的标准差是15克。今随机抽取了49个罐头,发现这些罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求?要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差别。因此可以列出要检验的假设为::μ=500 :μ500。

这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为由于置信度水平=0.05,=1.96。由此得到接受区域为[495.8,504.2]。但现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。我们无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求。

当总体方差未知,样本数量又小于等于30时,检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法,根据样本均值所处的位置作出判断。

2. 单侧检验再看下面的例子。

例5-5。某饮料厂规定某种纸罐包装饮料的容量不得少于500ml。今随机抽取了25个纸罐,发现这些罐头的平均重量是498 ml,标准差S=10。问在=0.05的显著性水平下能否认为这批纸罐的容重符合标准的要求?根据问题的要求可以列出要检验的假设为::μ500

:μ500 由于总体方差未知,样本容量又小于30,检验统计量服从t分布,其自由度为n-1。因此我们就必须利用t分布来进行检验。这又是一个单侧(左侧)检验问题。根据区间估计的结论可知原假设的

接受区域为根据置信度水平=0.05,查表得到。所以计算得到接受区域的临界点是496.6。现样本均值=*****.6。可见样本均值落在原假设的接受区域内。我们接受原假设,即认为这批纸罐的容重符合标准的要求。

例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10。问在=0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?这次要检验的假设为:

:μ500 :μ500 这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为根据置信度水平=0.05,查表得到。由此可以得到原假设的接受区域临界点是504.4。现样本均值=*****.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。

(二)比例的假设检验例5-7。某酒厂规定某种酒中含有的糖度应为12%,产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为11.3%。问在显著性水平=0.10的条件下,这批酒与合格产品对糖度的要求有无明显的差别?问题要检验的假设为::μ=0.12 :μ0.12 这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是由于=0.10,则=1.64。计算得到原假设的接受区域是[0.114,0.126]。由于样本比例0.1130.114,落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批酒与合格产品对糖度的要求有明显的差别。

对于比例问题也同样可以进行单侧的假设检验。方法也几乎与总体均值的单侧检验的情形相同。

此外,参照两个总体区间估计的情形,我们也可以对两个总体均值和比例差进行假设检验,所用的方法几乎是完全同样的。

四、假设检验中的两类错误假设检验是根据概率来进行判断的,因此有可能判断失误。在三种不同显著性水平下,例如=0.01,0.10,

或0.50时,进行假设检验所得到的结果就可能是完全不同的。对于同一组样本的均值的位置,在=0.01和0.10的显著性水平下可能是接受零假设的,而在=0.50的显著性水平下拒绝零假设。可见,采用高的显著性水平不大可能接受一个不正确的零假设,但却很可能拒绝掉正确的零假设。

在假设检验中,如果原假设正确而被拒绝时,就称为犯了第一类错误,这是弃真的错误,犯第一类错误的概率记作。相反,如果原假设错误而被接受时,称作犯了第二类错误,这是取伪的错误,犯第二类错误的概率记作。表5-3表示了两者之间的关系。这两种错误是互相替补的,这就是说,在样本容量一定的情况下,要减少第一类错误的概率就不得不增加发生第二类错误的概率,反过来也一样。实际上,为了减少第一类错误的概率就要增大接受区域,减少拒绝区域。但此时由于接受区域的增大,不正确的原假设也被接受的概率也随之增大,即增加了,如图5-4所示。要减少接受不正确的原假设的概率,就要减少的值,此时不正确的零假设被接受的概率减少了,但随着拒绝区域的增大,正确的零假设被拒绝的概率就上升,即增大了,如图5-4所示,表5-2 两类错误之间的关系接受接受为真正确弃真,第一类错误概率α 为假取伪,第二类错误概率β 正确图5-5 假设检验中的两类错误

由于两类错误之间的这种替补关系,在管理上决定检验第一类错误或第二类错误的显著性水平时就要具体考察同这两类错误相联系的费用和可能造成的损失。由此来决定究竟宁可发生第一类错误,而不愿发生第二类错误,还是宁可发生第二类错误,而不愿发生第一类错误。

练习题5-1 对某机器生产的滚动轴承随机抽取196个样本,测得直径的均值为0.826厘米,样本标准差0.042厘米,求这批轴承均值的95%与99%的置信区间。

5-2 某灯泡厂生产的灯泡的平均寿命是1120小时,现从一批新生产的灯泡中抽取8个样本,测得其平均寿命为1070小时,样本方

差=(),试检验灯泡的平均寿命有无变化(=0.05和=0.01)?5-3 设正态总体的方差为已知,问要抽取的样本容量n应为多大,才能使总体均值的置信度为0.95的置信区间的长不大于L。

5-4有人在估计总体均值时要求在置信度为99%的条件下保证样本平均数与总体均值之间的误差不超过标准差的25%。问应抽取多少样本?5-5为降低贷款风险,某银行内部规定要求平均每笔贷款数额不能超过120万元。随着经济发展,贷款规模有增大趋势。现从一个n=144的样本测得平均贷款额为128.1万元,S=45万元,用=0.01的显著水平检验贷款的平均规模是否明显超过120万元。

5-6 正常人的脉搏平均为72次/分,今对某种疾病患者10人测得其脉搏为54 63 65 77 70 64 69 72 62 71(次/分)设患者的脉搏次数服从正态分布,试在显著性水平=0.05下检验患者与正常人在脉搏上有无显著差异?5-7 从A市的16名学生测得其智商的平均值为107,样本标准差为10,而B市的16名学生测得智商的平均值为112,标准差为8,问在下这两组学生的智商有无显著差别?5-8 用简单随机重复抽样方法选取样本时,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()。(单选题)

A. 2倍

B.3倍

C.4倍

D.5倍5-9 某产品规定的标准寿命为1300小时,甲厂称其产品超过此规定。随机选取甲厂100件产品,测得均值为1345小时,已知标准差为300小时,计算得到样本均值大于等于1345的概率是0.067,则在:μ=1300,:μ1300的情况下,有()成立。(单选题)

A. 若=0.05,则接受

B. 若=0.05,则接受

C. 若=0.10,则接受

D. 若=0.10,则拒绝5-10下面关于假设检验的陈述正确的是()。(多选题)

A. 假设检验实质上是对原假设进行检验

B. 假设检验实质上是对备择假设进行检验

C. 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不能认为它绝对错误

D. 假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确

E. 当接

受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确5-11 某种新型建材单位面积的平均抗压力服从正态分布,均值为5000公斤,标准差为120公斤。公司每次对50块这种新型建材的样本进行检验以决定这批建材的平均抗压力是否小于5000公斤。公司规定样本均值如小于4970就算不合格,求这种规定下犯第一类错误的概率。

教育评价与测量(整理好)

教育评价与测量 简答题: 1、信息的描述包括哪几个要素? 答:⑴经过审核、整理及汇总的资料;⑵研究对象;⑶描述的技术和手段。 2、评价信息解释的特性是什么? 答:⑴可检验性;⑵不完全性;⑶有效性 3、定性分析的特点是什么? 答:⑴定性分析关注事物发展过程以及相互关系。⑵定性分析的对象是质的描述性资料。⑶定性分析无严格的分析程序,有较大的灵活性。⑷定性分析主要采用逻辑分析及哲学思辨方法。⑸定性分析容易受主观因素的影响并对背景具有敏感性。4、影响评价效度的因素是什么? 答:⑴评价指标和工具的科学性⑵评价实施的质量⑶效标特征⑷被评价者的特性和样本的代表性 5、评价信度鉴定的方法? 答:⑴评价指标的信度鉴定方法⑵评价工具的信度鉴定方法⑶评分者信度鉴定方法 6、影响信度的因素? 答:⑴被评价对象的情况⑵评价指标和评价工具⑶实施评价过程中的各种因素 7、设计双向细目表包括几个基本步骤? 答:⑴考核的内容抽样与考核认知水平的确定⑵题型和题量的确定⑶试题的平均难度和难度分布的确定⑷试题赋分与测验期望分的预估 8、学生思想品德评价的意义是什么? 答:⑴实施学生思想品德评价,是提高学生思想道德水平,促进向素质教育转轨的重要措施。⑵是促进德育管理科学化的重要手段⑶有利于激励先进,鞭策后进。 9、思想品德评价的方法 答:⑴操行评语法⑵等第法⑶评等评分测评法⑷操作加减评分法⑸加权综合测评法⑹模糊综合测评法⑺评等评分评语综合测评法

10、表现性评价的基本特点 答:⑴评价的问题情境具有开放性、真实性、综合性⑵评价的方案具有灵活性⑶评价主体具有多元性⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题 11、当前思想品德评价中存在的主要问题 答:⑴品德测评指标的设计问题⑵品德测评的量化问题⑶思想品德测评方法实践可行性的问题 12、课堂教学评价中教师自我反思的策略与途径 答:⑴在自我评价中反思⑵在他人评价中反思⑶在评价学生中反思⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题 13、课堂教学评价中教师自我反思的形式 答:⑴自我提问法⑵行动研究法⑶教学诊断法⑷交流对话法⑸案例研究法⑹观摩分析法⑺总结记录法 14、班主任工作过程评价的内容 答:⑴了解和研究学生⑵组织和培养班集体⑶班级日常管理及思想教育⑷协调各方面教育力量⑸制定班级工作计划和总结,搞好期末的鉴定和评优工作 15、班主任工作评价的方法 答:⑴定量积分评价法⑵定性讨论分析法⑶综合法 16、教育评价按评价功能分为哪几类? 答:一、诊断性评价二、形成性评价三、终结性评价。 17、教育评价的主要功能有哪些 答:一、导向功能二、鉴定功能三、改进功能四、调控功能五、服务功能 18、西方教育评价发展的原因有哪些? 答:一、社会经济和科学经济的发展是评价发展的根本原因二、教育评价理论和时间发展过程中的猫冬运动是西方教育评价发展的内在因素。三、政府对评价工作的重视并用法律手段保证他的顺利实施是外部动力。 19、简述二十年来我国教育评价发展的特点 答:1、起点高,发展快2、搞试点,重实践3、建制度将规范

教育统计与评价作业与答案

作业 1.第1 题对提出问题事先安排好答案,让对方从中选择的问卷类型是 A.限制式 B.开放式 C.半限制式 D.半开放式 您的答案:A 题目分数:2.0 此题得分:2.0 2.第2 题 在已知各个平均数的基础上再计算加权平均数的方法,称为 A.等级平均数 B.组距数列平均数 C .总平均数

D. 评分平均数C .总平均数

您的答案:C 题目分数:2.0 此题得分:2.0 3.第3 题 反映试题鉴别能力的指标是 A.区分度 B.信度 C.效度 D.难度 您的答案:A 题目分数:2.0 此题得分:2.0 4.第4 题 在不易简明扼要地表达答案的意思时,最好选用哪一种类型问卷 A.限制式 B. 开放式

C.半限制式 D.半开放式 您的答案:B 题目分数:2.0 此题得分:2.0 5.第5 题 难度系数为0.42 时,则试题的难易情况为: A.难 B.适中 C.易 D.无法区分 您的答案:B 题目分数:2.0 此题得分:2.0 6.第6 题欲分析某校教师和学生对某一改革方案持赞成或反对的态度是否一致的问题,应使用何种

检验方法? A.t 检验 B.u 检验 C.x 2检验 您的答案:B 题目分数:2.0 此题得分:2.0 7.第7 题 欲分析某校100 名教师对两个教学改革方案持赞成或反对的态度是否一致的问题,应使用何种检验方法? A.t 检验 B.u 检验 C.x 2 检验 您的答案:B 题目分数:2.0 此题得分:2.0

8.第19 题对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。这种方法称为 A.描述性统计 B.推断性统计 C.定量统计 D.相关统计 您的答案:A 题目分数:2.0 此题得分:2.0 9.第20 题 对两个不同对象的总体的差异评价称为 A.诊断评价 B.横向评价 C.安置评价 D.纵向评价 题目分数:2.0 您的答案:B

教育统计与测评综合测试3答案

1、什么是定量评估 定量评估是指依据统计数据,建立数学模型,并用数学模型计算出分析对象的各项指标及其数值来评估分析的一种方法。 2、什么是心理测验? 心理测验是根据一定的法则和心理学原理,使用一定的操作程序给人的认知、行为、情感的心理活动予以量化。心理测验是心理测量的工具,心理测量在心理咨询中能帮助当事人了解自己的情绪、行为模式和人格特点。 3、什么是抽样分布? 抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。 4、“教师自编测验在学生学业成就测评中占着重要的地位”,你认为这句话正确吗?为什么?正确。教师自编测验是学生学业成就测评的重要组成部分,具有很强的针对性。 5、你认为“信度的估计方法是根据测验的类型选择的”这句话正确吗?为什么? 正确。信度的估计方法包括重测信度、复本信度、内部一致性信度和评分者信度,更具不同的测验类型进行选择。 6、什么是条形图?条形图和次数直方图有何异同点? 排列在工作表的列或行中的数据可以绘制到条形图中。条形图显示各个项目之间的比较情况。描绘条形图的要素有3个:组数、组宽度、组限。 条形图用高度来表示频率,适用于结果有限且可数且数量较少时;直方图一般用面积来表示频率,适用于数量不可数时。 7、试论述常模参照测验与标准参照测验的差异。 常模参照测验是将被试与常模相比较,以评价被试在团体中的相对地位为目的 标准参照测验是将被试与以绝对标准相比较,以评价被试有无达到该标准为目的 常模是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表 常模是没有标准化的标准,两者皆为了比较做准备 8、试述简单随机抽样、分层抽样、等距抽样等四种抽样方法及适用条件。 如果每次抽取使总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。常常用于总体个数较少时。 分层抽样是先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。可以提高总体指标估计值的精确度。适用于层次分明的调查。等距抽样是将总体各单位按一定标志或次序排列成为图形或一览表式,然后按相等的距离或间隔抽取样本单位。适用于队列整齐,顺序齐全的抽查。 整群抽样又称聚类抽样。是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。适用于比较容易分类的群体进行。 9、《学记》中有记载:“比年入学,中年考校,一年视离经辨志,三年视敬业乐群,五年视博习亲师,七年视论学取友,谓之小成。九年知类通达,强立而不反,谓之大成。”请从教育评估体系的角度来对其进行分析与说明(如,评估内容、评估标准等)。 从评价内容上看,他第一年评价学生的基础知识,第三年评价学生的情商,人情往来能力。第五年评价学生掌握知识的程度以及学生的人情事理。第七年评价钻研知识的能力。 从评估标准上看,《学记》认为,读书之后,第一年考查学生是否具有点断经书句读的能力和是否明确自己的学习志向,第三年考查学生是否恭敬学业,是否与同学和睦相处。第五年考查学生是否学识广博、尊敬老师。第七年考查学生是否具有研究学问的本领和识辨选择朋友的能力。

教育统计与测评实践作品2教师专业发展评价指标体系作业教学文案

一、教师素质的构成 著名教育家陶行知先生曾对教师提出过“捧着一颗心来,不带把根草去”的要求,要求教师素养的培育走向“三心”即:“心态”要“正”,做一个简单的人;“心情”要“好”,做一个阳光的人;“心智”要“高”,做一个智慧的人。就教师心态而言,可分为:上位心态即社会心态,总的要求是“静”,要讲责任心,要扛得起放得下;中位心态:教育心态,总的要求是“纯”,要讲事业心,要纯化教育心态,催生教育激情,规范教育行为,提升教育思想,养成教育风格;下位心态即教学心态,要实在,要讲良心,淡化教学形式,注重教学实质。 教师的“心情”主要表现在三个层面,即教育工作前的动机与准备,及是否“在乎”教育,是否具有敬业态度把学生、课堂放在“心”上。教育工作中要求激情与投入,是否“在状态”,是否满怀情怀,教育情怀,用“心”来做教育。教育工作后的反省与改良,即是否一直保持“在找感觉”的情怀,是否有较高的自我效能感,此“心”未了。 教师的“心智”主要表现在三个层面:精深的专业智慧。要求教师具备精深的专业智慧即知识要“渊”,以专家的角色,以“知识份子”的身份,要求识记得多,理解得深,应用得广,分析得透,整合得新,评价得准;广博的文化素养。即教师知识要“博”,要求教师扮演学者的角色,以“文化人”的身份掌握学科文化、历史文化、地域文化、民族文化、时尚文化、信息文化。必备的教育素养。教师必备的教育智慧要“厚”,要求教师扮演教育家的角色,诠释“人民教师”的身份,具备备课智慧、说课智慧、讲课智慧、评课智慧、教研智慧、教管智慧。 教师素养一:高尚的人格素养,教育追求的是内在的教育魅力和外在的教育影响力。 教师素养二:教育追求内在满怀教育情怀,外化为教育激情。教育追求具备教育底气注重教育表达。 教师素养三:精深的专业素养。要求教师具备精深的专业智慧即知识要“渊”,以专家的角色,以“知识份子”的身份,要求识记得多,理解得深,应用得广,分析得透,整合得新,评价得准。 教师素养四:广博的文化素养。即教师知识要“博”,要求教师扮演学者的角色,以“文化人”的身份掌握学科文化、历史文化、地域文化、民族文化、时尚文化、信息文化。 教师素养五:必备的教育素养。教师必备的教育智慧要“厚”,要求教师扮演教育家的角色,诠释“人民教师”的身份,具备备课智慧、说课智慧、讲课智慧、评课智慧、教研智慧、教管智慧。 二、教师测评的类型 常见类型:(一)、按测评的目的分为:素质测评、过程测评、绩效测评;(二)、按测评的时机分为:诊断性测评、形成性测评、终结性测评。 三、教师测评的内容 测评的内容包括:前提素质主要是职业道德、知识结构、能力结构、身心素质;过程素质主要包括备课、上课、作业布置与批改、课外辅导、学业考评;教学绩效即教学效果;其他工作,如:班主任工作、继续教育培训、教育科研工作。 四、教师测评的指标体系 测评指标体系的构成:由评价指标、指标权重、评价标准构成。 (一)评价指标 1.拟定方法

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

教育统计学考试试题

1.(方差已知区间估计) 某中学二年级语文同一试卷测验分数历年来的标准差为10.6,现从今年测验中随机抽取10份考卷,算得平均分为72,求该校此次测验平均成绩的95%置信区间。 解 72,10.610,10.95X n σα===-= [] 112 2 :72 1.96 1.9665.43,78.57x x α αμμ μ - - ? ? ?-+=-?+????= 2(方差未知区间估计). 已知某校高二10名学生的物理测验分数为92、94、96、66、84、71、45、98、94、67,试求全年级平均分数的95%置信区间。 92949666847145989467 80.710 x +++++++++= = ()()1010222 21111310.999i i i i S x x x n x ==?? =-=-= ??? ∑∑ 17.632S = ( ( [] 112 2:1180.7 2.2622 2.262268.09,93.31x t n x t n ααμ- -? ? --+-?? ?=-?+??= 3. 3.(方差未知单样本t 检验) 某区中学计算机测验平均分数为70.3,该区甲校15名学生此次测验平均分数为67.2,标 准差为11.4,问甲校此次测验成绩与全区是否有显著性差异? 01:70.3 :70.3H H μμ=≠ 1.053x t = ==- ()()()0.97512 1114 2.1448t n t n α - -=-= 由于()0.9751.05314 2.1448t t =<=,接受0H ,甲校此次测验成绩与全区无显著性差异. 4(方差已知的单样本均值检验).某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 01:72.4 :72.4H H μμ=> 0.966x t == ()()10.95127 1.7033t n t α--==???

教育统计与测评综合测试12345

综合测试1 1.情境测试法 2、学生评估 学生评估是教师对学生的思想品德,学业成绩,身心素质,情感态度等的发展过程和状况进行价值判断的活动。一般描述学生的优点缺点,如何改进,并肯定学生的未来,让他们对自己有一定的信心。这样才能让他们前途无量。 3、项目的区分度 项目区分度,也叫鉴别力,是指测验项目对被试的心理特性的区分能力。 4、你认为“教育评价就是针对教育效果所作的评价”这种说确吗?为什么?不对。教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的方法系统地收集资料信息,对教育信息作价值分析和价值判断,并为教育决策提供依据的过程。 5、有人认为“随机误差是影响测验效度的唯一原因”,这种说确吗?为什么?不正确。影响测量效度的因素包括测验的构成,测验的实施过程,接受测验的被试,所选效标的性质,测量的信度,测量的长度。 6、计算再测信度时应注意哪些问题? (1)两次测验时间间隔要适当 (2)应提高被试的积极性 (3)适宜于人格测验与速度测验,不适合于智力等难度测验 7、简析算术平均数的运算性质 ①各单位变量值与其算术平均数离差之和等于零sigma(x-x拔)=0

②各单位变量值与其算术平均数离差平方之和为最小sigma(x-x拔)的平方=最小值 8、论述提高测量效度的方法。 1.精心编制测验量表,避免出现较大的系统误差 2.妥善组织测验,控制随机误差; 3.创设标准的应试情境,让每个被试都能发挥正常水平; 4.选好正确的效标,定好恰当的效标测量,正确地使用有关公式; 5.扩大样本的容量; 6.适当增加测验的长度。 9、省某县教委对全县部分教师开展教师评价活动,事先没有跟学校和教师打招呼,由教研员直接进入教师听课,并将评价结果记入教师档案。某校一位青年教师故意把教研员当作学生,当堂提问。教研员认为受到非礼,中途退出,学生哄堂大笑。教委要求学校处理这位青年教师,对对此事至今争论不休……。请具体分析这种推门听课式教师测评方法。 随堂听课评价法是有效教学测评的基本方法之一,随堂听课步骤:1.课前的充分准备,2.课中的仔细观察和翔实记录。3.课后客观评析,注意意见反馈。可以从师生及其交互活动和课堂教学要素两方面来进行评价。课堂上的教研员事先未做好充分的准备,同时没有认真听课,导致课堂出丑,推门听课,本身是教育部门检查教师工作的一种手段,但不能为了听课而听课,故意找毛病,推门听课应该是教育部门和老师学校的互动,大家共同进步。

教育统计和教育测量

教育统计和教育测量 市教育局教研室周凯 在教育、教学研究中,我们常常要进行评价。在评价过程中,定性是重要的,然而定量同样是必要的。为了使教育、教学研究深化和精确化,需要在占有科学数据的基础上,运用科学的手段和方法对数据进行处理,从而得出科学的结论。 教育、教学研究中的数据是由测量法产生的,对数据的搜集、整理和分析,对研究结果的解释,则需要通过统计法来实现。 一、教育统计 1、教育统计的意义 教育统计是运用数理统计的原理和方法研究教育问题。它的主要任务是研究如何整理和分析由教育调查、教育测量所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。 从应用角度来分,教育统计主要有三方面的容:描述统计、推断统计和实验统计。 下面简介描述和推断统计的一些容。 2、描述统计的意义及容 我们去看学生的成绩计分册,只看到一个个学生的分数(称原始数据),这些分数在未经整理之前是零乱的、不系统的,而且数据愈多,愈觉纷乱。因此,需要对统计资料进行绘图、制表、计算等初步的整理工作,以描述研究对象的统计特性。 描述统计就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。它的主要容有:统计表和统计图、集中量、差异量、相关系数等。 2.1统计表和统计图 统计表是用来表达统计指标与被说明事物之间数量关系的表格。 举例如下: 表1:某年级某学科某班学生考试成绩统计(本卷满分100分) 本表在统计学中称为频数分布表(落在各个小组的数据的个数叫做频数,表中各分数段的人数就是频数),每一分数段(即分数区间)都有上限和下限,比如区间90~75中,90称为上限,75称为下限,而75又是区间75~60的上限。统计时一般包含下限,而不包含上限,但满分100分这个上限例外。 从表1中可以得到如下信息:75~90这一分数段人数最多,有16人;60分(及格)以上有39人;60分以下有12人,其中30分以下4人,需要尽快补差等。 上表是将研究的对象按一个标志分类的,称为单向表。 将研究的对象按两个或两个以上标志分类的统计表,称为双向或多统计表。如,下 表就是将学生成绩按等第、班级、性别三个标志分类的。 表2:某年级学生操行评定表

现代教育统计与测评技术

《现代教育统计与测 评技术》考试试题 西南师范大学2006级研究生课程班昆明第八中学李扬

1、利用统计表和统计图描述所在学校两个班级学生的数学、语文、外语期末考试成绩 (统计表数据应包括平均分和标准差),判断两个班学生的外语和语文成绩是否具有相关性。 答:统计表和统计图如下图所示 班级:初二年级4班班级:初二年级3班 根据图表相关量计算,两个班的语文成绩相关量r=0.013 外语成绩相关量r=0.048,因此相关关系属于正相关,但是密切程度较小. 2、调查两个班某科期末考试成绩,利用统计表或统计图描述调查结果推断两个班的期 末成绩是否具有显著性差异。 答: 所以,CV=12.36/76.52=16.15%,6班的差异系数为CV=13.09/76.37=17.14%.得出结论,两个班政治考试成绩差异不是很显著,但是班级成绩两极分化情况比较严重。 3、某县初中毕业一次语文考试成绩服从正态分布,全县范围随机抽取试卷30份,成绩如下: 81、72、71、54、74、74、68、76、90、50、55、68、94、58、84、69、82、70、 69、74、83、90、75、44、56、68、78、84、72、64 估计全县总平均分在什么范围内。 答:根据区间估算法进行计算,设样本平均数置信度为95%,首先按照算术平均数法计算样本平均数 81+72+71+54+74+74+68+76+90+50+55+68+94+58+84+69+82+70+69+74+83+90+75

+44+56+68+78+84+72+64=2147 2147/30=71.57 样本平均数的标准差为11.91 所以,总体平均数的置信下限为:71.57-1.96×11.91/5.48=67.31 总体平均数的置信上限为 71.57+1.96×11.91/5.48=75.83 如果设置信度为99%,则总体平均数的置信下限为:71.57-5.61=65.96 总体平均数的置信上限为: 71.57+5.61=77.18 结论:全县总平均分在样本平均数置信度为95%时为67.31~75.83之间。当样本平均数置信度为99%时为65.96~77.18之间。 3、设对8名学生进行数学测验,为了考察这个测验的信度,1个月后对同一组学生用 原试卷再次测验,两次测验结果如下,试估计稳定性系数,并进行解释。 答:根据题目要求,计算可得:∑XY=1215 ∑X=93 ∑Y=100 ∑(X*X)=1123 ∑(Y*Y)=1328 N=8 所以经计算稳定性系数为0.9187,查表可知r(6)0.05=0.707而r A1A2=0.9187 结论:r(6)0.05=0.707<r A1A2=0.9187因此,两次测验结果信度系数比较高,即稳定性系数 比较高 5、简述测验效度的类型。 答:测验效度的类型一共有三种。 内容效度。即测验内容与预定要测的内容之间的一致性程度。 构想效度。既测验成绩能够解释心理学理论上的某种结构或特质的程度。主要用于心理测验效度的确定。 效标关联效度。即测验分数与作为效标的另一独立测验结果之间的一致性程度。一般是用本测验和效标测验去测同一组被试得到的两组分数的关系数表示。 6、有15名学生的数学成绩与第2题得分如图,计算该试题的区分度。

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 ^ 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

, 上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 56789 序号123' 4 7488827185 培训前677074~ 97 7687867895 培训后786778{ 98 【解】 (1)数据和变量说明 本文件有2个变量,9个数据 (2)操作方法 *

(3)结果报告 由上表可知,P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。 【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。

方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表 5-21 方案一喂养数据 序号! 1 23456789 饲料1" 饲料2/ 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: ; 表5-22方案二喂养数据 序号12345678· 9 1011甲队饲料1; 乙队饲料2\ 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)《 (2)数据和变量说明 答:9个数据,2个变量 (3)操作方法

教育统计与测量填空

1、教育统计学的内容主要包括:描述统计与推断统计 2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除 3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物 4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行 5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据 6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算 7、数据三个特点①数据的离散性②数据的变异性③数据的规律性 8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计 9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数 10、相对次数分布表主要能反映各组数据的百分比结构 11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少 12、次数分布图两种表达方式:次数直方图和次数多边图 13、次数分布曲线按形状有各种不同类型①单峰对称分布曲线。正态分布曲线也是这一类型曲线中的一种②非对称曲线即偏态分布。正偏态:次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,在一些考试中,若题目偏难,多数考分偏低时,可形成正偏态分布。而负偏态的次数分布偏向正好与正偏态相反 14、几种常用统计分析图:散点图、线形图、条形图和圆形图 15、圆形图有其独特的功能,特别适用于描述具有百分比结构的分类数据 16、集中量数有三个作用①向人们提供整个分布中多数数据的集结点位置②集中反映一批数据在整体上的数量大小③一批数据的典型代表值 17、集中量数有多个种类,最常用的是算术平均数、中位数和众数三种。其中算术平均数是使用最普通的一个集中量数。中数在下列情况中有较好的应用价值①数据分布中有个别异常值或极端值出现时,用平均数作分布的代表值倒不如用中数作分布的代表值来得客观合理②在次数分布的某端或两端的数据只有次数而没有确切数量时③在一些态度测验、价值观测验或一般的民意问卷测试中,通常向被调查对象提出一些事项,要求被调查对象对这些事项排序。那么,在这种资料的信息数据整理分析中可应用中数来概括各个事项的总体排序结果 18、常用的差异量数是平均差、标准差和方差等指标 19、差异系数又称为变异系数和变差系数,用符号CV表示。差异系数是一种反映相对离散程度的系数,即相对差异量数。它消去了单位,因而适合于不同性质数据的研究与比较。数据在次数分布中所处的地位可用百分等级来表示。百分等级也称百分位。用记号PR表示。百分等级反映的是某个观测分数以下数据个数占总个数的比例的百分数,在0到100之间取值。如百分等级PR=75,与其对应的这个百分位数,读作第75百分位数,记作P75 20、相关:统计学上用相关系数来定量描述两个变量之间的直线性相关的强度与方向。如相互关联着的两变量,一个增大另一个也随之增大,一个减小另一个也随之减小,变化方向一致是正相关。如相互关联着的两变量,一个增大另一个反而减小,变化方向相反是负相关。相关系数用r表示, r在-1和+1之间取值。相关系数r的绝对值大小,表示两个变量之间的相关强度;相关系数r的正负号,表示相关的方向,分别为正相关和负相关;相关系数r=0,称零线性相关,简称零相关;相关系数|r|=1时,表示两个变量是完全相关。当0.7≤|r|<1,称为高相关;当0.4≤|r|<0.7时,称为中等相关;当0.2≤|r|<0.4时,称为低相关;当|r|<0。2时,称极低相关或接近零相关 21、积差相关是应用最普遍、最基本的一种相关分析方法,尤其适合于对两个连续变量之间的相关情况进行定量分析 22、等级相关适用的几种情况①两列观测数据都是顺序变量数据,或一列是顺序变量数据,另一列是连续变量的数据。如对学生的绘画、体育测试成绩排名就属顺序变量数据②两个连续变量的观测数据,其中有一列或两列数据的获得主要依靠非测量方法进行粗略评估得到。如语文基础知识水平可测验加以测量但学生的课文朗读水平却只能根据若干准则由老师给

教育统计与测量练习题库及答案

n m 华中师范大学网络教育学院 《教育统计与测量》课程练习题库及答案 本科 一、 名词解释 1.教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学。 2.变量:是指可以定量并能取不同数值的事物的特征。 3. 算术平均数:所有观察值的总和除以总频数后所得之商。 4.频率:就是随机事件A 在n 次试验中出现了m (m ≤n )次,则m 与n 的比值就是频率, 用公式表示就是W(A)= 5.测验设计:是指测验编制者对测验形式、时限、题量、题目编排、测验指导手册等进行的设计工作。 6. 测验效度:就是测验实际上测到它打算要测的东西的程度。 7.描述统计:是研究如何将收集到的统计数据,用统计图表或者概括性统计量数反映其数量表现和数理关系的统计方法。 8.名称变量:又称类别变量,是指其数值只用于区分事物的不同类别,不表示事物大小关系的一种变量。顺序变量又称等级变量,是指其数值用于排列不同事物的等级顺序的变量。 9. 离散变量:又称间断变量,是指在一定区间内不能连续不断地取值的变量。 10.总体:是根据统计任务确定的同一类事物的全体。 11.教育测量学:就是根据一定的法则用数字对教育效果或过程加以确定。教育测量学是以现代教育学、心理学和统计学作为基础,运用各种测试方法和技术手段,对教育现状、教育效果、学业成就及其能力、品格、学术能力倾向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答,只要在题目限制的范围内,可在深度、广度,组织方式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割,即能连续不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。 16. 正相关:两个变量变化方向一致的相关。 17. 同质性χ2检验:在双向表的χ2检验中,如果是判断几次重复实验的结果是否相同,叫做同质性χ2检验。 18. 难度:就是被试完成项目作答任务时所遇到的困难程度。 19. 比率变量:等距变量又称间隔变量,是指其数值可以用于表明事物距离差异大小的变量。比率变量是指数值不仅能反映数字之间的间隔大小。还能说明数字之间比率关系的变量。 20. 样本:总体是根据统计任务确定的同一类事物的全体。个体是构成总体的每个基本单位。样本是从总体中抽取的作为观察对象的一部分个体。 21.频率:就是随机事件A 在n 次试验中出现了m (m ≤n )次,则m 与n 的比值就是频率,用公式表示就是W(A)= ,概率又称“机率”或“然率”,表示随机事件发生可能性大小的量。

教育统计与测评综合测试5答案

1、什么是集中量数? 描述所搜集到的资料里各分数之集中情形的最佳代表值,也是描述一个团体中心位置的一个数值。 2、什么是效标关联效度? 效标关联效度是指测验和一个独立的效度标准的一致性程度,测验和效标的一致性程度高,测验的效标关联效度就高;反之,效度就低。效标关联效度是用测验和效标之间的相关系数来表示的,所以,它是一种经验性效度。 3、什么是自陈量表法? 自陈量表法多以自我报告的形式出现,即对拟测量的个性特征编制若干测题(陈述句),被试者逐项给出书面答案,依据其答案来衡量评价某项个性特征,是心理测试中最常用的是一种自我评定问卷方法。 4、你认为“预测效度能同时取得效标测量值与测验实测值”这句话正确吗?为什么? 不正确。效标测量值与测验实测值在实际操作中会有一定的误差。 5、“检验一个因素K个水平之间的方差有无显著性差异是单向方差分析的目的”这句话正确吗?为什么? 正确。单向方差就是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响 6、为什么百分等级分数不是等单位量度? 一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。 等单位量度是用单位量度表示的一种方式。 7、如何用测验内部标准法来确定项目区分度? 项目区分度就是项目区别被试水平高低的能力的量度,它是测验性能的一个重要指标,说明的正是项目对测验目的来说的有效性程度。人们一般对测验项目作性能分析,常都采用这种较为方便的测验内部标准的方法,即去求取各个项目被试的题分与测验总分的相关。主要有两种方法:(1)利用点双列相关系数求取法(2)高低分组求的分率差的方法。 8、次数分布曲线按形状有哪几种类型? (1)钟型分布曲线。 (2)U形分布曲线。 (3)J形分布曲线。 9、教育评价是人对人的评价,不管是主评者还是被评者都会受个人经历、间色转换的影响,如主评者的本位心理、暗示心理等,被评价者的应付心理、迎合心理等。这些心理现象都会降低评价的客观性。结合生活工作实际,思考如何调控评价心理对评价的消极影响? 对于评价中出现的晕轮心理,就是要推进评价者以客观事实为评价依据,对事不对人,对任何成果的评价都按统一标准和尺度来判定,不依个人的好恶为出发点,不让主观印象干扰正常评价,不简单片面、以偏概全。 对于评价中出现的求全心理,就是要求评价者以平和的心态参与评价工作,在评价中控制好自己的情绪,处处以公认的评价标准为尺度来审视被评价的成果,用统一的标准进行价值判断,这样就不会得出偏高或偏低的评价结论。

教育统计与测量练习题库及答案

《教育统计与测量》课程练习题库及答案本科 一、名词解释 1.教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学。 2.变量:是指可以定量并能取不同数值的事物的特征。 3. 算术平均数:所有观察值的总和除以总频数后所得之商。 4.频率:就是随机事件A在n次试验中出现了m(m≤n)次,则m与n的比值就是频率,用公式表示就是 W(A)= 5.测验设计:是指测验编制者对测验形式、时限、题量、题目编排、测验指导手册等进行的设计工作。 6. 测验效度:就是测验实际上测到它打算要测的东西的程度。 7.描述统计:是研究如何将收集到的统计数据,用统计图表或者概括性统计量数反映其数量表现和数理关系的统计方法。 8.名称变量:又称类别变量,是指其数值只用于区分事物的不同类别,不表示事物大小关系的一种变量。顺序变量又称等级变量,是指其数值用于排列不同事物的等级顺序的变量。 9. 离散变量:又称间断变量,是指在一定区间内不能连续不断地取值的变量。 10.总体:是根据统计任务确定的同一类事物的全体。 11.教育测量学:就是根据一定的法则用数字对教育效果或过程加以确定。教育测量学是以现代教育学、心理学和统计学作为基础,运用各种测试方法和技术手段,对教育现状、教育效果、学业成就及其能力、品格、学术能力倾向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答,只要在题目限制的范围内,可在深度、广度,组织方 式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割,即能连续不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。 16. 正相关:两个变量变化方向一致的相关。 17. 同质性χ2检验:在双向表的χ2检验中,如果是判断几次重复实验的结果是否相同,叫做同质性χ2检验。 18. 难度:就是被试完成项目作答任务时所遇到的困难程度。 19. 比率变量:等距变量又称间隔变量,是指其数值可以用于表明事物距离差异大小的变量。比率变量 是指数值不仅能反映数字之间的间隔大小。还能说明数字之间比率关系的变量。

统计学第4章假设检验补充练习

第4章假设检验课堂补充练习 1、一项调查显示,每天每个家庭看电视的平均时间为7.25个小时,假定该调查中包括了200个家庭,且样本标准差为平均每天2.5个小时。据报道,10年前每天每个家庭看电视的平均时间是6.70个小时,取显著性水平α=0.01,这个调查是否提供了证据支持你认为“如今每个家庭每天收看电视的平均时间增加了”? 2、一个著名的医生声称有75%的女性所穿鞋子过小,一个研究组织对356名女性进行了研究,发现其中有313名妇女所穿鞋子的号码至少小一号。取α =0.01,检验如下的假设: 01:0.75;:0.75H P H P =≠ 对这个医生的论断你有什么看法? 3、一个视频录像设备(VCR )的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本标准差为2年。试构造一个假设检验,能够帮助判定电视机的使用寿命的标准差是否显著大于视频录象设备的使用寿命的标准差。”并在 α=0.05的显著性水平 下做出结论。

4、假设英语四级考试中学生成绩服从正态分布。现随机抽取25名学生的考试成绩,算得平均分为67分,标准差为10分。在显著性水平 01.0=α下,可否认为全体学生的平均考试成绩为72分? 5、某市统计局调查了30个集市上的鸡蛋价格,测得平均价格为6.50元/千克,已知以往的鸡蛋价格一般为 5.80元/千克。假定该市的鸡蛋售价服从正态分布)64.0,(μN ,假定方差不变,能否认为当前鸡蛋的平均价格高于以往?)01.0(=α。 6、 某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。 从过去的资料得知σ是0.6克,质检员每两小时抽取25包冲剂称重检验,并作出是否停工的决策。假定产品重量服从正态分布。 (1) 建立适当的原假设和备择假设; (2) 在05.0=α时,检验的拒绝域是什么? (3) 如果25.12=x 克,你将采取什么行动? (4) 如果 95.11=x 克,你将采取什么行动? 7、电视机显象管批量生产的质量标准是平均使用 寿命为1200小时,标准差为300小时。某电视机厂宣称其生产的显象管质量大大超过规定的标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命1245小时。能否说该厂的显象管质量显著地高于规定的标准? (1)给出原假设和备择假设;

《教育统计与测量》练习题库与答案

n m 华中师范大学网络教育学院 《教育统计与测量》课程练习题库及答案 本科 一、 名词解释 1.教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学。 2.变量:是指可以定量并能取不同数值的事物的特征。 3. 算术平均数:所有观察值的总和除以总频数后所得之商。 4.频率:就是随机事件A 在n 次试验中出现了m (m ≤n )次,则m 与n 的比值就是频率,用公式表示就是W(A)= 5.测验设计:是指测验编制者对测验形式、时限、题量、题目编排、测验指导手册等进行的设计工作。 6. 测验效度:就是测验实际上测到它打算要测的东西的程度。 7.描述统计:是研究如何将收集到的统计数据,用统计图表或者概括性统计量 数反映其数量表现和数理关系的统计方法。 8.名称变量:又称类别变量,是指其数值只用于区分事物的不同类别,不表示 事物大小关系的一种变量。顺序变量又称等级变量,是指其数值用于排列不 同事物的等级顺序的变量。 9. 离散变量:又称间断变量,是指在一定区间内不能连续不断地取值的变量。 10.总体:是根据统计任务确定的同一类事物的全体。 11.教育测量学:就是根据一定的法则用数字对教育效果或过程加以确定。教 育测量学是以现代教育学、心理学和统计学作为基础,运用各种测试方法和 技术手段,对教育现状、教育效果、学业成就及其能力、品格、学术能力倾

向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答,只要在题目限制的范围内, 可在深度、广度,组织方式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割,即能连续 不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。 16. 正相关:两个变量变化方向一致的相关。 17. 同质性χ2检验:在双向表的χ2检验中,如果是判断几次重复实验的结果是否相同,叫做同质性χ2检验。 18. 难度:就是被试完成项目作答任务时所遇到的困难程度。 19. 比率变量:等距变量又称间隔变量,是指其数值可以用于表明事物距离差 异大小的变量。比率变量是指数值不仅能反映数字之间的间隔大小。还能说明数字之间比率关系的变量。 20. 样本:总体是根据统计任务确定的同一类事物的全体。个体是构成总体的 每个基本单位。样本是从总体中抽取的作为观察对象的一部分个体。21.频率:就是随机事件A在n次试验中出现了m(m≤n)次,则m与n的比 值就是频率,用公式表示就是W(A)= ,概率又称“机率”或“然率”,表示随机事件发生可能性大小的量。 22. 负相关:两个变量变化方向相反的相关。 23. 独立性χ2检验:在双向表的χ2检验中,如果要判断两种分类特征之间是否有依从关系,叫做独立性χ2检验。 24.情境测验法:指的是把被试置于一种特定情境中以观察其行为反应,然后

相关主题
文本预览
相关文档 最新文档