当前位置:文档之家› 教育统计学重点

教育统计学重点

教育统计学重点
教育统计学重点

教育统计学是

教育科学的一门分支学科。它主要探讨如何应用数理统计的方法来研究教育,包括用一系列的数字来反映教育事业的发展状况,探讨教育的规律,制定教育方案,对教育进行科学管理,对教育效率进行检查等等。

作为一门学科,教育统计学属于应用统计学的范畴,是数理统计与概率论等数学学科在教育领域(包括实践领域与理论研究领域)中的应用。它是教育领域中各种数据资料,特别是量化数据资料的整理、分析,以及由此而进行推断与决策的有益的思维工具之一。教育统计学的研究内容,从不同角度分,可以分成不同的类别。从具体应用的角度来分,可以分成描述统计、推断统计和实验设计。

本门课程讲授的教育统计学包括两大部分,一部分是教育统计学的理论部分,教育统计的基本概念和原理,以及教育统计的原则、方法和手段,重难点除了统计学基本概念以外,还包括作为数据分析基础的一些统计知识,包括集中量和差异量特征及计算、正态分布的计算和应用、总体平均数的推断应用、方差的基本原理及检验应用,以及其他相关分析基本知识等。另一部分是SPSS软件操作部分。SPSS(SPSS Statistics)是一款数据分析软件,是三大综合性统计软件(SAS、BMDP、SPSS)之一,它集数据整理、分析功能于一身,SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS 统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。SPSS软件操作是教育统计学学习的重要内容,对于实际的教育教学现象和规律的探究有着实践的指导意义。

教育统计学是一门方法论科学,关于它的学习有一些方法和技巧。

首先,对于教育统计学中重要的相关概念、原理的范畴的理解和掌握,不能死记硬背,要通过理解在加强记忆,要抓住要点,能用自己的认识和语言表达出来。同时,要能联系实际或其它课程的知识,并将它们具体落实到每一个概念和范畴上去,因为这些概念和范畴都是从具体实践中抽象出来的,学习时也要能够返回到具体实践中去。其实,只要抓住各个概念和范畴的要点,结合实际例子来学习和记忆,就能够真正的理解和掌握它们。

其次,关于计算方法与公式的灵活运用,教育统计学中的方法问题很多,许多计算公式也需要记住并会运用。怎样才能将教育统计学中的计算方法和公式恰当运用到教育教学现象中去,除了需要具备一定的数学基础、记住计算公式以外,更为重要的是对教育教学现象涵义的理解,还是要联系实际情况进行理解和学习。

最后,关于SPSS统计软件的学习,最重要的还是联系实际,寻求一个适宜的实践案例,在上述教育统计学的理论知识和计算方法与公式学习的基础上,实现一个完整的数据分析的操作过程,实践操作之后,就能够深刻理解和掌握解软件的功能和使用方法。

另外关于考试和作业的问题。本门课程一般会有一次离线完成的平时作业,所占的分数比利为30%,要求手写,并使用“北师大作业封面”作为平时作业的封皮(详细填写个人信息),完成之后提交到所在的学习中心。届时可在“离线作业”中查看本课程作业的详细内容。

本门课程为开卷考试,考前一个月左右我们会在课程文件夹中发布考试指导,介绍考试范围和相关参考内容,届时同学们可以到课程文件夹中下载,借以参考,指导复习。

?第一章重点知识

本章难点是教育统计学的内容介绍。重点是作为学科基础的统计学中的几个基本概念。

一、教育统计学的内容

教育统计学分为三部分,即描述统计、推断统计和实验设计。严格地说,教育统计学只包括描述统计和推断统计两部分。

1.描述统计

对已获得的数据进行整理、概括,显现其分布特征的统计方法就叫做描述统计。具体来说,描述统计就是根据数据类型对数据进行分组,然后用统计图和(或)统计表的形式把分组结果表示出来;计算各种特征量(如平均数、中位数、方差、标准差、四分差、相关系数等),对实验数据的分布特征进行概括性地描述。

2.推断统计

由样本所提供的信息,根据概率理论进行分析,在一定可靠程度上,对总体分布特征进行估计、推测的统计方法就叫做推断统计。推断统计的内容包括总体参数估计和假设检验两部分。不同的数据类型采用不同的方法。在假设检验方面具体做法包括Z检验、t检验、F 检验和检验等。

二、统计学中的几个基本概念

1.随机变量

变量:实验结果的数值不是恒定不变的量称为变量,与它意义相反的量称为常量或恒常量。

定义:表示随机现象各种结果的变量称为随机变量。由于受随机因素的影响,结果呈随机变化,又有规律性的变量称为随机变量。

2.总体和样本

总体是我们所研究的具有某种共同特性的个体的总和。总体一般是有研究目的来确定的。总体中的每个单位称为个体。总体可以分为有限总体和无限总体。

样本是由从总体中抽取的一个部分个体组成的。样本中包含的个体数目称为样本的容量。按样本容量不同,样本有大样本和小样本之分。有时,大样本和小样本所用的统计方法会有很大的不同。

3.统计量和参数

样本上的数字特征是统计量。总体上的各种数字特征是参数。

?第二章重点知识

数据的初步整理,要理解、识记统计学的初期工作。数据的来源、种类及其分类是本章的重点,统计表、统计图在此基础上,成为本章的难点。

一、教育统计资料的来源通常有两种,经常性资料和专题性资料

经常性资料,主要指档案性资料。在学校中有关学生的档案资料有:学生的年龄、性别、民族、健康状况、所在班级、担任班干部的情况、每个学期各科的期末考试成绩、品行评定、奖励和处罚记录、考勤记录、参加各种竞赛的成绩、入学考试成绩等等。

专题性资料,主要通过对研究者非常感兴趣或急需通过研究解决的某一专门问题的调查或实验来搜集的。

二、数据的种类

数据是随机变量的观察值。

数据的种类不同会影响到统计方法的选择,所以了解数据的种类及特点非常重要。统计数据通常按两种方法进行分类:一种是按数据的来源不同,分为点计数据和度量数据;另一种是按随机变量的取值是否有连续性,分为间断型随机变量数据和连续型随机变量数据。

三、统计表的结构及编制要领

统计表一般由标题、表号、标目、线条、数字、表注等项构成。统计表编制的基本原则:表的结构要简单明了。表的层次要清楚,重点要突出,阅读流畅。一张表只能有一个中心,若统计数据所包含的信息非常丰富,难以在一张表格中清晰地表示出来,可以用若干张统计表来呈现。

四、统计表的种类和编制方法

统计表有简单表、分组表和复合表三种。只列出观察对象的名称、时间、地点或统计指标名称的统计表即为简单表;只按一个标志分组的统计表为分组表;按两个或两个以上标志分组的统计表为复合表。

五、频数分布表列法

某一个随机事件在n次观察或测量中出现的次数称为这个随机事件的频数。频数通常用英文中的小写字母f表示。把随机现象中所包含的各个随机事件出现的次数都呈现出来就构成了一个次数分布,这个次数分布就是频数分布。把频数分布用表格形式表示出来就是频数分布表。

频数分布表有以下几种形式:简单频数分布表,按数据类型不同又分为间断变量的频数分布表和连续变量的频数分布表两种。

间断变量的频数分布表的制作方法非常容易。首先,按随机事件的性质不同将数据分成若干类别;然后,计算各类的频数并用表格呈现出来。另外还有两种频数分布表,它们分别是累积频数和累积百分比分布表。若将频数转换成用累积频数表示,所产生新的频数分布表就叫做累积频数分布表。若将累积频数再转换成用累积百分比表示,则所得的新的频数分布表叫做累积百分比分布表。

六、统计图的结构及其绘制规则

统计图由标题、图号、标目、图形、图注等项构成。在教育研究中,常用的统计图分为间断变量的统计图和连续变量的统计图。

间断变量的统计图包括直条图和圆形图。

直条图是用直条的长短表示各统计项目数量的图形,常用于比较点计数据分组后各组的频数或百分比。其制作方法是以分组标志为横轴,频数为纵轴,用直条长短表示各组的频数。圆形图是用来表示数据经过分类以后各部分的构成比的

常用的连续变量的统计图有线形图和频数分布图两种。

若要表示两个变量之间的函数关系,一种事物随另一种事物的变化而变化,或某一事物的发展趋势,一般要绘制线形图。频数分布图,用来表示连续变量的频数发布情况,包括直方图

和多边图。直方图是用面积表示频数发布的统计图。多边图是以纵轴上的高度表示频数多少的统计图,常用于表示测量数据的频数分布。

第三章重点知识

第三章主要介绍一种最常用的统计量或最常计算的特征量,即集中量。集中量作为统计学的一个基础概念是一个非常重要的,同时其中的算术平均数在以后的学习中很重要,并且在实践中的使用比较常见。

本章的难点包括中位数、众数、加权平均数、几何平均数和调和平均数,重点包括集中量和算术平均数。

在真正领会集中量的基础上来学习算术平均数、中位数、众数、加权平均数、几何平均数和调和平均数。并且通过比较来学习。

一、算术平均数

算术平均数是一组数据的总和除以这组数据的个数所得的商。算术平均数常常简称为平均数或均数,一般用、等符号表示。有时也用大写的M(Mean)表示。它是各种统计量指标中最常用的一种。

算术平均数的计算方法,包括原始数据计算法,即根据定义公式计算,和频数分布表计算法。用频数分布表计算法计算算术平均数,其方法是:先用各组的组中值乘以该组的频数,求得各组数据的和。将各组数据的和加起来,就可以求得数据的总和;然后根据算术平均数的定义,将数据的总和除以总频数,就可以求得所有数据的算术平均数。

二、中位数

位数是将一列数据按一定顺序(从小到大或从大到小)排列后位于中央位置的那个数值。中位数一定会把整个数据分布分成上、下两半,每半的频数等于总频数的50%。中位数常用表示。中位数的计算方法也包括原始数据计算法和频数分布表计算法。

中位数是百分位数的一个特例,即第50百分位数。百分位数是将一列数据按一定顺序(从小到大或从大到小)排列后位于某个百分位置的数值。百分位数一般用表示。

三、众数

众数有两种定义方法。第一种叫做理论众数,是指频数分布曲线最高点的横坐标,要用积分法求得。第二种叫做粗略众数,指的是一组数据中出现频数最大的那个数,一般用观察法求得,或者用经验公式计算近似值。众数用表示。它也是一种集中量,用来代表一组数据的集中趋势。众数的求法可以用观察法,无论是分组的数据还是未分组的数据,都可以用观察法求众数。若数据没有经过整理,在一组原始数据中出现次数最多的那个数值就是众数。另外还有两种公式计算法,皮尔逊的经验法和金氏插补法。

四、算数平均数、中位数和众数的评价应用及关系

算术平均数的优点在于感应灵敏、严密确定、意义简单明了、适合代数运算、受抽样的影响较小,但是它易受两极端数值的影响,而且当一组数据中某个数值没写不清楚或不够准确,这时无法计算其算术平均数;不同质的数据不能直接相加求总和,然后再求平均数,而应该用中位数表示该组数据的集中量。

中位数的优点在于严密确定,概念简单明了、容易理解,计算简便,以及不受两极端数值的影响。但是感应不灵敏,不如平均数稳定可靠。

众数的有点在于概念简单明了,计算时不需要每个数据都加入,所以较少受两极端数值的影响。但是缺点在于极不稳定,反应不灵敏,不准确,不能做进一步的代数运算。

三者的关系在于当频数分布呈正态时,三者重合为一点;当频数分布为偏态时,三者在大小和所在位置上有一定规律。中位数基本上都居于平均数和众数之间。当频数分布为正偏态时,分布的峰会向左偏。当频数分布为负偏态时,分布的峰会向右偏。

五、加权平均数、几何平均数和调和平均数

加权平均数是不同比重数据的平均数。几何平均数是N个数值连乘积的N次方根。调和平均数是一组数据倒数的算术平均数的倒数。

?第四章重点知识

差异量是指表示一组数据变异程度、离散程度或离中趋势的统计量。第四章差异量的内容有利于以后的学习,要反映一组数据的全貌,就需要计算出该组数据的变异程度或称为离散程度、离中趋势。

常用的差异量指标有全距、四分位距、平均差、方差和标准差。重点是方差和标准差,难点包括平均差、方差、标准差和相对差异量。

一、平均差

所谓平均差,就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。通常用MD表示。

平均差有两种计算方法:原始数据计算法和聘书分布表计算法,分别对应有不同的公式。

二、方差和标准差

方差:方差也叫做变异数、均方,指的是离差平方的算术平均数。

标准差:标准差是指离差平方和平均后的方根,即方差的平方根。

方差和标准差也有两种计算方法,原始数据计算法和频数分布表计算法。

原始数据计算法,是指用定义公式计算方差和标准差要先求出平均数,再求离差的平方。

频数分布表计算法,是指频数分布表计算法的公式进行计算。

三、相对差异量

所谓差异系数是指标准差与其算术平均数的百分比。它是没有单位的相对数。

全距、四分位距、平均差及标准差都是带有与原观察值相同单位的名数,称为绝对差异量。这种差异量对两种单位不同,或单位相同而两个平均数相差较大的资料,都无法比较差异的大小,必须用相对差异量(即差异系数)进行比较。

相对差异量的具体应用:

1.比较不同单位资料的差异程度

2、比较单位相同而平均数相差数较大的两组资料的差异量程度

3、可判断平均数和标准差的值是否异常。

差异系数的应用条件:

从测验的理论来说,只有等比量表才使平均数等于零成为不可能。也就是说,用来测量的量尺,既具有等距的单位,又具有绝对零点,这时所测量出的数据的平均数才不可能等于零,这时才能计算差异系数。

?第五章重点知识

第五章概率及概率分布的重点包括概率的概念和正态分布的知识,难点是二项分布和正态分布,其中正态分布是以后学习的一个基础性知识。

一、概率的一般概念

(一)定义

概率的定义按求法不同分为两种,一种称为后验概率,另一种称为先验概率。

后验概率:

以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A概率的估计值,这样寻得的概率称为后验概率。

先验概率:

先验概率又称为古典概率,是最早提出的一种概率,不用通过试验,只需要用一个简单的公式就可以计算出来。不过,这个随机事件能不能用这个公式计算概率需满足两个条件:(1)试验的所有可能结果是有限的;(2)每一种可能结果出现的可能性(概率)相等。

(二)概率的性质

1、任何随机事件A的概率都是介于0与1之间的正数;

2、不可能事件的概率等于0;

3、必然事件的概率等于1。

(三)概率的加法和乘法

1、概率的加法

在一次试验中不可能同时出现的事件称为互不相容的事件。

两个互不相容事件和的概率,等于这两个事件概率之和。用公式表示为:

P(A+B)=P(A)+P(B)

2.概率的乘法

A事件出现的概率不影响B事件出现的概率,这两个事件为独立事件。

两个独立事件的概率,等于这两个事件概率的乘积。用公式表示为:

P(A·B)=P(A)·P(B)

二、二项分布函数

(一)定义

二项分布是一种离散型随机变量的概率分布;用n次方的二项展开式来表达在n次二项试验中成功事件出现不同次数(X=0,1,…,n)的概率分布叫做二项分布。

(二)二项分布图的特点:

(1)当p=q时,不管n有多大,二项分布呈对称形。当n很大时,二项分布接近于正态分布。当n趋近于无限大时,正态分布是二项分布的极限。

(2)当p不等于q时,且n相当小时,图形呈偏态。

(三)二项分布的应用

二项分布函数除了用来确定成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的偶然性和真实性的界限。

三、正态分布

(一)定义:

正态分布又叫做常态分布,是一种连续型随机变量的概率分布。

正态分布的特点是:

1.形态上很像古代的大钟,中间大两头小,左右最称,所以有人把它叫做钟形分布。如:人的许多生理和心理特征、学生的学习成绩分布。

2.与二项分布比较:

同:正态分布也是一个理论分布,有函数式;异:正态分布是连续分布,而二项分布是离散形的;函数式也不同。

(二)正态函数曲线的特点

(1)曲线在Z=0处为最高点。

(2)曲线以Z=0处为中心,双侧对称。

(3)曲线从最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。

(4)标准正态分布上的平均数为0,标准差为1。

(5)曲线从最高点向左右延伸时,在正负1个标准差之内,既向下又向内弯。

(6)曲线下方到基线的面积为1。

(三)正态曲线的面积与纵线

1.概念

正态曲线的面积:正态曲线与基线之间某一区域的面积,相当于能在该区间找到个体的概率,又叫累积概率。

2.标准正态曲线下面积的求法

(1)已知Z值求面积

如果是原始数据,要首先转化为标准分数,然后再由Z值查到面积,,具体做法有以下三种:

第一种情况:求Z=0至某一Z值之间的面积,可以直接查表。

第二种情况:求两个Z值之间的面积。

首先要找出这两个值到Z=0的面积找出来,然后看它们的符号相同还是相反。如果相同,就用大的面积减去小的面积所得差即为所求;如果符号相反,就把两个面积加起来,所得和即为所求面积。

第三种情况:求某一Z值以上或以下的面积。即左端或右端,上端或下端。

3.正态曲线的纵线

正态曲线的纵线高度Y是横轴上某一Z值的频率密度(即概率)。

(四)正态分布在测验计分方面的应用

1、用Z的公式将原始分数转换成标准分数

条件是原始分数的分布是正态的。

2、确定录用分数线

在选拔兴或竞赛性的考试中,录取或授奖的人数(或比赛)往往是事先确定的。这就是用标准分数的作用发挥。

3、确定等级评定的人数

因为人的许多属性为正态分布,因此在教育生活中,许多情况下,用正态分布来计算各等级的人数。

4、品质评定数量化

一般在教育中可以综合各个老师对某一个学生的评定。

奥鹏平台作业答疑:

同学你好,这个问题考察的是第一章绪论中关于什么是统计学和教学统计学的相关内容。要回答这个问题首先要清楚教育统计学的内容,严格地说教育统计学只包括描述统计和推断统计两部分。而对于量化统计学,原则上来说并没有量化统计学这样的说法,量化只是一种分析的方法。请参考以上提示,选择答案!

第六章重点知识一

在第六章中重点要掌握教育统计学的两个核心理论,即抽样分布和假设检验的基本原理。学会总体平均数的参数估计和显著性检验,以及假设检验。

————抽样分布和总体平均数的参数估计

一、抽样分布

(一)抽样分布的分类和概念

1、总体分布:总体内所有个体数值的频数分布。(基本随机变量的分布)

2、样本分布:样本内个体数值的频数分布。(基本随机变量的分布)

3、抽样分布:某一种统计量的概率分布。

(二)平均数抽样分布的几个定理

1、从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。

2、容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的方根。

3、从正态分布的总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态

分布。

4、虽然总体不是正态分布的,如果样本容量较大(大样本),反映总体μ和σ的样本平

均数的抽样分布,也接近于正态分布。

(三)抽样分布中的几个重要概念

1、标准误

在理解标准误之前,要先了解抽样误差的概念。

抽样误差:由每次抽样所得的数据计算出来的统计量与相应的总体参数之间的差异。

而抽样误差我们用抽样分布上的标准差来表示。因此,某种统计量在抽样分布上的标准差就称为该种统计量的标准误。

2、自由度

自由度指的是总体参数估计量中变量值独立自由变化的个数。通常用df表示。

用样本统计量去估计总体参数时才要计算自由度。估计量中随机变量的取值可以独立自由变化的数目是几自由度就是几。

(四)样本平均数与总体平均数离差统计量的形态

样本平均数与总体平均数离差统计量的形态一般分为两种,一种是当总体标准差已知时,按公式计算;另一种是当总体标准差σ未知时呈t分布。

另外还要了解t分布与标准正态分布的相似之处与区别。

二、总体平均数的参数估计

根据样本统计量去推断总体参数的两种基本形式:总体参数估计和假设检验。

(一)总体参数估计的基本原理

根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。

1、点估计

定义:用某一样本统计量的值去估计相应总体参数的值叫总体参数的点估计。

一个好的点估计量应该满足以下三个条件:无偏性、有效性和一致性。

2、区间估计

定义:以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

总体参数区间估计的条件:

1.要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;

2.要求出该种统计量的标准误;

3.要确定在多大的可靠度上对总体参数作估计,再通过查某种理论概率分布表,找出与

某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间上下限。

(二)总体平均数的区间估计的几种类型

1、σ已知条件下总体平均数的区间估计

当总体呈正态分布,总体σ已知,不管大样本(n>30),还是小样本(n≤30);总体虽不呈正态分布,但总体σ已知,大样本(n>30)时,在上述情况下,样本平均数都可以转换成标准记分。

2、σ未知条件下总体平均数的区间估计

当总体呈正态分布,总体σ未知,不管大样本,还是小样本时;总体虽不呈正态分布,总体σ又未知,样本容量较大(n>30)时,以上情况样本平均数与总体平均数的离差统计量呈t分布。不过,当样本较大时,t分布接近与正态分布,可以用正态分布近似处理。

第七章重点知识一

第七章平均数差异的显著性检验主要是介绍如何由两个样本平均数之差检验两个相应总体平均数之差的显著性,要求我们在学习过程中要识记并理解平均数差异显著性检验的基本原理,学会作相关、独立样本平均数差异的显著性检验。其中重点包括平均数差异显著性检验的基本原理,相关、独立样本平均数差异的显著性检验。难点包括方差不齐性独立样本平均数差异的显著性检验,以及方差齐性检验。

一、平均数差异显著性检验的基本原理

1、基本原理:

两个样本平均数差异的显著性检验也属于假设检验的范畴,和总体平均数的显著性检验的基本原理是相同的。

假设检验一般都要从提出零假设和备择假设开始。零假设用符号表示就是:Ho:μ1-μ2=0(或μ1=μ2);备择假设用符号表示就是:H1:μ1-μ2≠0(或μ1≠μ2)。然后,分析在零假设成立的情况下某个统计量的概率分布的形态。

分析在两个总体平均数之间没有差异的情况下,需要从这两个总体中各随机抽取一个样本所计算得一切可能的样本平均数的差会形成一个什么样的分布。从这样的两个总体中分别抽取一个样本,计算完两个样本平均数的差之后,把样本放回各自的总体,再分别抽取一个样本,计算第二次抽样的样本平均数之差然后放回各自的总体,再做第三次抽样。这种抽样可以一直进行下去。数理统计学的研究表明,假若μ1=μ2成立,那么两个样本平均数之差的概率分布就以0为中心的正态分布。

2、平均数之差的标准误:

要实际地判断样本平均数的差异是否落入了零假设的拒绝区域里,需要以该抽样分布的标准差,即平均数之差的标准误为依据。平均数之差的标准误就是样本平均数之差的抽样分布的标准差。

求平均数之差的标准误的步骤:

第一步:先求两列变量之差的平均数。

第二步:计算两列变量之差的离差。

第三步:计算两列变量之差的离差平方和。

第四步:计算两列变量之差的方差。

然后再根据公式求算。

二、相关样本平均数差异的显著性检验

1、相关样本的定义:

两个样本的个体之间存在着一一对应的关系,这两个样本称为相关样本。

符合以下两种情况的样本都属于相关样本:

(1)用同一个测验对同一组被试在实验前后各进行一次测验,所获得的两组测验结果。

(2)根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一个测验所获得的测验结果。

2、相关样本平均数差异的显著性检验的一般步骤:

(一)提出假设

(二)选择检验统计量并计算其值。要注意大样本和小样本的不同情况。

(三)确定检验形式。单侧检验或双侧检验

(四)统计决断。当进行t检验时,需根据自由度df=n-1查t值表找到临界值。当进行Z检验时,需查正态分布表找到临界值。

第七章重点知识二

三、独立样本平均数差异的显著性检验

1、独立样本的定义

两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系,这样的两个样本称为独立样本。

(1)独立大样本平均数差异的显著性检验

两个样本容量n1和n2都大于30的独立样本称为独立大样本。进行独立大样本平均数差异的显著性检验时有专门的标准误公式,需要掌握。

(2)独立小样本平均数差异的显著性检验

两个样本的容量均小于30,或者其中一个样本的容量小于30的独立样本称为独立小样本。

求方差齐性时独立小样本平均数差异的显著性检验,先用汇合方差公式,有了汇合方差,就可以用它来计算平均数差异的标准误。

(3)检验的步骤仍然是以下四步

1.提出假设

2.计算检验统计量的值

3.确定检验形式

4.统计决断

四、方差不齐性独立样本平均数差异的显著性检验

若总体方差不齐性,那么对两个独立样本平均数进行差异的显著性检验时,就需要用校正的t'作为检验统计量。t′值的计算有三种方法的计算公式。

计算得t′值之后,该值要与临界值对照以判断差异的显著性。与t检验不同,t′检验的临界值不能直接查表得,而要经过计算才能获得。需要掌握0.05显著性水平的临界值近似值的计算公式和0.01显著性水平的临界值近似值的计算公式。

五、方差齐性检验

1、定义

对两个总体的方差是否有显著性差异所进行的检验称为方差齐性检验。

2、F分布

从方差相同的两个正态总体中,各随机抽取一个样本,分别求出各自所属总体方差的估计值,并计算这两个总体方差估计值的比值,这个比值叫做F比值。

对两个总体方差进行差异的显著性检验,即方差齐性检验。

3、F分布的特点:

(1)F分布是一簇分布,随分子和分母的自由度不同而有不同的分布曲线(见P159)。

(2)F分布是正偏态的,即一簇正偏态的曲线(不过,随着分子和分母自由度的增大而逐渐趋于正态)。

(3)F比值都是正的。

(4)由于计算F比值时总把大的方差估计值作为分子,小的作为分母,所以F比值≥1。4、F检验的基本步骤:

第一步:提出假设

第二步:选择检验统计量并计算其值

第三步:一般情况下,经常应用的是右侧F检验。

第四步:统计决断

要掌握两个独立样本和两个相关样本的方差齐性检验

六、学习方法

因为检验两个样本平均数差异的显著性时涉及到两个总体,所以需要考虑的条件多一些,公式的变换也更多些,学习的时候,一定要根据具体情况选择恰当的统计量,用相应的公式来计算,并根据统计量分布的形态进行推断。

?第八章重点知识一

?一、方差分析的基本原理

(一)方差分析的目的

方差分析的目的就在于对多组平均数综合性地进行差异的显著性检验。

(二)方差分析的逻辑

通过对组间差异与组内差异比值的分析,来推断几个相应平均数差异的显著性,这就是方差分析的逻辑。

(三)以F检验来推断几个平均数差异的显著性

方差分析就是把组间差异和组内差异分离出来,然后比较二者的大小。组间方差和组内方差进行比较时要计算它们的比值,这个比值服从F分布,所以,方差分析就是要进行F 检验。

如果组间与组内方差相等或相近,F比值等于或接近1,就应该保留零假设,即认为各组平均数无显著性差异;如果F比值很大,超过了F抽样分布上对应于某个可靠度的临界值,则应该拒绝零假设,即认为组间与组内方差有显著性差异,由此可推断,各组平均数之间有显著性差异。

(四)四、方差分析中的几个概念

1、因素——即实验中的自变量。

只有一个自变量的实验称为单因素实验。有两个或两个以上自变量的实验称为多因素实验。

2、水平——指某一个因素的不同情况。水平有质的不同和量的差异两种情况。例如,所要

研究的因素为性别,这个因素就可以分为男和女两个不同的水平。另外,还可以根据数量高低来确定水平。例如,按IQ分数的高低把被试分成高智商、智商中等和低智商三个水平。

3、处理——指按单因素的各个“水平”条件或多因素的各个“水平”的组合条件进行的重复

实验。例如,要研究性别因素对智力发展的影响,可以从同龄学生中各抽取男女学生50名参加智力测验。性别因素所分成的两个水平(男和女)即两种处理。

二、完全随机设计的方差分析

(一)定义

完全随机设计是一种单因素实验设计,又叫做独立组实验设计。。其实验是这样安排被试的:从同一个总体中随机抽取一定数量的被试,再将他们随机地分入各实验组,在施以各种不同的实验处理以后,用方差分析法对这多个独立样本平均数做差异的显著性检验。

(二)需要掌握n相等和n不相等两种情况下的方差分析,以及运用样本统计量进行组间与组内方差的F检验。

?第八章重点知识二

?三、随机区组设计的方差分析

(一)定义

随机区组设计是这样安排被试的:先把某个总体中的被试按条件相同的原则分成若干个组(称为区组),即每个区组内的被试尽量保持同质,然后再将每个区组中的被试随机指派去接受各种不同的处理。对被试做这样的安排,是为了减少被试间的个别差异对结果产生影响。用方差分析法对多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。

(二)三种不同的处理方式

指派每一区组内被试接受各种不同的处理有以下三种方式:

1、一个被试作为一个区组,所有的被试都分别接受所有的处理。

2、每一区组内被试的人数是实验处理数K的整数倍,将每一区组内被试分成K等份,每一部分被试接受一种处理。

3、区组内以一个团体为一个基本单元。在被试的安排上也可以有两种方式,一种是从每个区组中只抽取一个团体,这个团体接受所有的处理;另一种是从每个区组中抽取的团体数是实验处理数的整数倍,将这些团体分成若干等份,每一部分被试接受一种实验处理。

(三)随即区间组设计的恰当性

检查随机区组设计恰当不恰当要看两方面:一方面要看是不是每一个区组都接受了所有的实验处理,接受每一个处理的人数或团体数相同;另一方面要看每一个实验处理在各个区组中重复的次数(人数或团体数)是否相同。

四、各个平均数差异的显著性检验

对多组平均数的逐对差异检验,以Newman-Keul提出的q检验法(或称N-K法)最为常用。这里需要掌握完全随机设计的q检验,包括各组n相等和各组n不相等的情况,以及随机区组设计的q检验。

五、多组方差的齐性检验

对于多组方差的齐性检验,目前研究者一般采用哈特莱(Hartley)所提出的最大F值检验法进行齐性检验。其检验统计量为:F max=S max的平方/S min的平方,其中,S max 和S min分别表示各种处理中最大和最小方差。这里也要注意掌握各组n和各组n不相等的情况。

六、多因素方差分析(了解)

(一)多因素方差分析的功能

多因素方差分析不仅可以检验各个因素(自变量)对因变量作用的显著性,而且还可以检验因素与因素间共同结合对因变量产生交互作用的显著性。

(二)双因素完全随机设计方差分析的基本方法

假设在某个实验中研究者设计了两个因素A和B,每个因素又各有两个水平,即a1、a2、b1和b2。若要对A因素、B因素以及这两个因素的交互作用对因变量所产生影响的显著性进行检验,应采取以下步骤:

第一步:提出假设

首先提出关于A因素的假设,然后,提出关于B因素的假设,最后,提出关于A、B 两个因素交互作用是否显著的假设。

H0:A、B两个因素交互作用不显著,H1:A、B两个因素交互作用显著.

第二步:计算各假设所要检验的统计量的值

对于A、B因素,都分别有各自专门的检验统计量的计算公式。对于A因素与B因素的交互作用,也可以按照专门的检验统计量的计算公式计算。

第三步:统计决断

根据分子和分母自由度及α=0.05和α=0.01两个显著性水平查附表3寻找F临界值。

然后,将实际计算出的F值与这两个临界值相比较,若实际计算出的F值小于临界值则保留零假设;如果实际计算出的F值大于临界值则应拒绝零假设。

第四步,列出方差分析表。

?第九章重点知识

一、总体比率的区间估计

(一)定义:

以比率的抽样分布为理论依据,按一定的概率要求估计总体比率的所在范围就叫做总体比率的区间估计。

(二)计算方法

1.正态近似法

当样本容量n比较大,np和nq中较小的那个数等于或大于5时,二项分布已经接近于正态分布,此时可以按照正态分布来估计总体比率0.95和0.99的置信区间(因这种方法比较简便),这种方法叫做正态近似法。

2.查表法

如果不满足正态近似法的应用条件,也就是说,n比较小,np或nq<5,二项分布不接近正态分布,就不能按照正态分布来确定总体比率0.95和0.99的置信区间,而应该按二项分布进行精确的概率计算来确定置信区间。

查表法非常简便,由于计算比较麻烦,计算工作一般交给计算机来完成。许多统计学著作在附表中都列出了计算结果,读者通过查表就可以确定总体的置信期间。

二、总体比率的假设检验

(一)定义:

总体比率的假设检验是检验样本比率与某个总体的比率之间差异是否显著。它比对总体比率进行区间估计时要多加一个条件,就是除了知道样本的比率外,还要知道某个总体的比率。

(二)计算方法

总体比率的假设检验同样也有正态近似法和查表法两种。

1.正态近似法

当p=q,无论nd的大小;或者虽然p≠q,但np和nq都≥5,这时p―pˊ的抽样分布接近正态分布,因此,可以对样本比率与总体比率的差异进行Z检验。其步骤与前面介绍过的假设检验的步骤是一样的。

2.查表法

当p≠q,np<5,这时p―pˊ的抽样分布不接近于正态分布,因此,不能对样本比率与总体比率的差异进行Z检验,而应该用查表法进行显著性检验。

三、总体比率差异的显著性检验

(一)定义:

总体比率差异的显著性检验是根据两个样本的比率来检验两个相应总体的比率是否存在显著性差异。

(二)方法

由于样本性质不同,其检验方法也不同。

1.两个独立样本比率差异的显著性检验

在进行显著性检验之前一般先要计算标准误。数理统计已经证明,当两个样本的容量都比较大,两个样本的最小频数都等于或大于5时,两个样本比率之差的抽样分布接近于正态分布,标准误计算可以通过专门的公式。如果总体比率未知,又假设这两个样本来自同一个总体,那么总体比率可以用两个样本比率的加权平均数作为估计量。最后通过专有公式,计算总体比率差异的检验统计量。

2.两个相关样本比率差异的显著性检验

如果两个样本的被试经过配对或用同一组被试在某种实验处理的前后接受某种调查或测试,那么所获得的两组数据就属于相关样本。对两个相关样本比率进行差异的显著性检验不能用独立样本的检验方法,而要采用一种新的方法。

?第十章重点知识

?一、χ2检验的特点

卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。即根据样本的频数分布来推断总体的分布。它属于自由分布的非参数检验。它可以处理一个因素分为多种类别,或多种因素各有多种类别的资料。所以,凡是可以应用比率进行检验的资料,都可以用卡方检验。

二、χ2值的计算

χ2检验统计量的基本形式有具体的公式。

χ2值有以下几个特点:

(1)χ2值具有可加性。

(2)χ2值永远是正值。因为实际频数与理论频数的差异被平方了,因此χ2值不会是负的。

(3)χ2值的大小随实际频数与理论频数之间差异的大小而变化。二者的差异越大,χ2值也越大,说明样本分布与某个假设的理论分布或经验分布的差异越大;二者的差异越小,χ2值也就越小,说明样本分布与某个假设的理论分布或经验分布越一致。

三、χ2分布的特点

χ2分布有以下几个特点:

(1)χ2分布呈正偏态,右侧无限延伸,但永不与基线相交。

(2)χ2分布为一簇分布,其形态随自由度的变化而变化。在这里自由度指实际频数与理论频数的差数中能够独立自由变化的个数。

四、单项表的卡方检验

(一)单项表的定义

把实得的点计数据按一种分类标准分类所编成的分类表就是单向表。

(二)单因素的χ2检验及其种类

对于单向表的数据所进行的χ2检验就是单向表的χ2检验,即单因素的χ2检验。

要掌握三种不同情况的单向表检验:按一定比率决定理论频数的χ2检验和均匀分布的χ2检验(无差假设的检验)以及频数分布正态性的χ2检验

五、双向表的卡方检验

(一)双项表的定义

把实得的点计数据按两种分类标准分类后所编制成的表就是双向表。

(二)双因素的χ2检验

对双向表的数据进行的χ2检验,就是双向表的χ2检验,即双因素的χ2检验。

在双向表的χ2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种检验称为独立性χ2检验。

在双向表χ2检验中,如果是判断几次重复实验的结果是否相同,这种χ2检验称为同质性检验。

双向表的独立性χ2检验和同质性χ2检验,只是检验的意义不同,而方法完全相同。对于同一组数据所进行的χ2检验,有时既可以理解为独立性χ2检验,又可以理解为同质性检验,两者无本质区别。

六、四格表的χ2检验

(一)独立样本四格表的χ2检验

独立样本四格表的χ2检验,就是最简单的双向表即222表的χ2检验。它既可以用缩减公式来计算χ2值,又可以用χ2检验的基本公式来计算χ2值,包括独立样本四格表χ2值的缩减公式和χ2值的校正计算公式,以及相关样本四格表的χ2检验中的大样本χ2值的缩减计算公式和χ2值的校正公式。

?第十一章重点知识一

?一、相关的意义

(一)相关的概念

两个变量之间不精确、不稳定的变化关系称为相关关系。它与事物之间普遍存在的另外两种关系即因果关系和共变关系是不同的。

(二)相关系数

用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。相关系数通常用r表示。(三)解释的步骤

首先,应注意相关系数的数值范围。相关系数的数值范围是从-1到+1,其中r=1表示两个变量为完全正相关,R=-1,表示两个变量为完全负相关。计算得的r值超出这个范围(例如,r=2.48),就表明计算有错误。

其次,分析相关系数的绝对值。相关系数的绝对值越接近于1,表明两个变量之间的关系越密切;越接近于0,就表明两个变量之间的关系越不密切。例如,r=-0.89的相关强度高于r=0.12。

第三,分析相关的方向。如果相关系数前符号为正,就表明两个变量之间的变化方向是一致的;如果符号为负,就表明两个变量之间的变化方向相反。例如,r=-0.89表明两个变量之间可能存在负相关,而r=0.12则表明两个变量之间可能有正相关。

第四,r值是一个比值,不能表示成百分比。r也不是等距的,所以,不能进行加、减、乘、除等代数运算。例如,对于r1=0.25和r2=0.50两个相关系数,不能说r1的相关程度是r2的一半,而只能说r1的相关程度不如r2。

二、积差相关

(一)积差相关的概念

当两列变量满足一定的条件,用专门的公式计算得的相关,称为积差相关。该公式是英国统计学家皮尔逊提出来的,所以又称为皮尔逊相关。

(二)积差相关的使用条件

积差相关公式的使用条件是:

1.两个变量都是由测量获得的连续性数据。

2.两个变量的总体都呈正态分布或接近于正态分布。

3.必须是成对的数据,而且每对数据之间是相互独立的。

4.两个变量之间呈线性关系。是否为线性关系可以根据两个变量的相关散布图来判断。

5.两个变量不是共变关系。在研究中一般需要靠经验和专业知识来判断并排除这种关系。

6.样本容量大于30,最好大于50。

(三)积差相关系数的计算方法

两个变量离差乘积之和除以n所得的商就是协方差,有专门的计算公式。有以下三种计算方法:1.根据定义公式来计算

2.用原始数据计算

3.用统计量计算

(四)相关系数的显著性检验

1.相关系数的抽样分布

2.相关系数显著性检验的基本原理

相关系数的显著性检验包括两方面内容:其一,检验两列变量之间是否有真正的相关;

其二,检验两个相关系数之间的差异是否显著。

3.相关系数显著性检验的步骤及方法

包括以下三种条件下的显著性检验:

(1)在H0:ρ=0条件下,相关系数的显著性检验

(2)在H0:ρ=ρ0条件下,相关系数的显著性检验

(3)两个独立样本相关系数差异的显著性检验

?第十一章重点知识二

三、等级相关(一)概念

等级相关是指以等级次序表示的两列或多列变量之间的相关。等级相关主要包括斯皮尔曼等级相关和肯德尔和谐系数两种。

(二)斯皮尔曼等级相关

1.斯皮尔曼等级相关的概念

当两列变量以等级次序表示时,用专门公式(详见第十一章第三节)计算得的相关,称为等级相关。又称为斯皮尔曼等级相关。

2.等级相关公式的使用条件

两列变量的值既可以是连续变量的数据,也可以用等级次序表示,并且不要求两个相应总体的分布呈正态分布,样本容量也不要求必须大于30。

3.等级相关系数的计算方法

在等级相关公式中,rR表示等级相关;D表示两个变量的每对等级之差;n表示样本容量。

(三)肯德尔和谐系数

1.肯德尔和谐系数的概念

当多个变量值以等级次序表示,用肯德尔提出的统计量或相关公式计算这几个变量之间的一致性程度,这个统计量称为肯德尔和谐系数。

2.计算方法

肯德尔和谐系数常用于计算多位评定者对同一组事物所评等级的一致性。当每一位评定者对一组事物所评结果没有相同等级时,应采取下列公式计算评定的一致性,包括无相同等级的情况和有相同等级的情况。

四、质与量的相关

(一)概念

质与量的相关指的是当两列变量中一列是按性质不同分类的变量,而另一列是连续变量时,用rb、rpb等公式计算得的相关。

(二)种类

质与量的相关主要包括二列相关、点二列相关、多系列相关三种。

1.二列相关(1)二列相关的概念

当两列变量都是正态连续性变量,其中一列变量被人为地划分为两类,变成二分变量,用专门的公式或计算得的相关称为二列相关。

2.二列相关公式的使用条件(1)两个变量都是连续变量,而且总体呈正态分布或接近于正态分布,至少呈单峰对称分布。

(2)两个变量之间是线性关系。

(3)二分变量本来是连续变量,不过被人为地分为两类,变成了二分变量,其分界点应比较靠近中值。

(4)样本容量应当大于80。

2.点二列相关(1)点二列相关的概念

当两列变量中一个是正态连续变量,而另一个是真正的二分名义变量,用专门的计算公式计算得的相关,称为点二列相关。

(2)二列相关公式的使用条件

计算点二列相关系数,要求两列变量中一列是正态连续变量,另一列是真正的二分变量。

所谓真正的二分变量指的是该变量的两个类别是截然不同的。

3.多系列相关

(1)多系列相关的概念当两列变量都是正态连续变量,其中一个被研究者按性质不同人为地分成多个类别(两类以上),变成了正态名义变量,用来表示正态连续变量与正态连续性变量之间相关的统计量,,称为点二列相关。

(2)多系列相关系数的计算方法

多系列相关系数用专门的公式(详见详见第十一章第四节)计算。

五、品质相关

(一)概念

若两列变量的值都是按性质不同划分成几种类别,那么表示这两列变量之间的相关称为品质相关。

(二)种类

1.四分相关

(1)概念及公式的使用条件

当两列变量都是正态连续变量,而且呈直线关系,只是两列变量都被人为地变成二分变量,表示这两列变量之间的相关称为四分相关。

(2)四分相关的计算方法

计算两列变量之间的四分相关,最常用的方法是皮尔逊提出的余弦π法,有专门的计算公式。

2.?相关(1)概念及公式的使用条件

当两列变量都是二分变量,不论是真正的二分变量,还是人为的二分变量,都可以用专门的计算公式来计算相关系数。用这个公式计算得的相关系数称为?相关。

(2)?相关系数的计算方法

也有专门的计算公式3.列联相关

(1)概念及公式的使用条件

当两列变量中的一列变量或两列变量被分成三个或三个以上类别,用来表示两列变量之间的相关,称为列联相关。

(2)列联相关系数的计算方法

首先,要用列联表呈现数据;然后用公式C计算列联相关系数。

统计学答案第八章

三、选择题 1 某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。某天测得25根纤维的纤度的均值x=1.39,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为α=0.05,则下列正确的假设形式是()。 A.H0:μ=1.40,H1:μ≠1.40 B. H0:μ≤1.40,H1:μ>1.40 C. H0:μ<1.40,H1:μ≥1.40 D. H0:μ≥1.40,H1:μ<1.40 2 某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。 A. H0:π≤0.2,H1:π>0.2 B. H0:π=0.2,H1:π≠0.2 C. H0:π≥0.3,H1:π<0.3 D. H0:π≥0.3,H1:π<0.3 3 一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3 2磅,则其原假设和备择假设是()。 A. H0:μ≤8,H1:μ>8 B. H0:μ≥8,H1:μ<8 C. H0:μ≤7,H1:μ>7 D. H0:μ≥7,H1:μ<7 4 在假设检验中,不拒绝原假设意味着()。 A.原假设肯定是正确的 B.原假设肯定是错误的 C.没有证据证明原假设是正确的 D.没有证据证明原假设是错误的 5 在假设检验中,原假设和备择假设()。 A.都有可能成立 B.都有可能不成立 C.只有一个成立而且必有一个成立 D.原假设一定成立,备择假设不一定成立 6 在假设检验中,第一类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时拒绝原假设 C.当备择假设正确时拒绝备择假设 D.当备择假设不正确时未拒绝备择假设 7 在假设检验中,第二类错误是指()。 A.当原假设正确时拒绝原假设 B.当原假设错误时未拒绝原假设 C.当备择假设正确时未拒绝备择假设 D.当备择假设不正确时拒绝备择假设 8 指出下列假设检验哪一个属于右侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0 :μ>μ0, H1:μ≤μ0 9 指出下列假设检验哪一个属于左侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0 , H1:μ<μ0 C. H0:μ≤μ0, H1:μ>μ0 D. H0:μ>μ0, H1:μ≤μ0 10 指出下列假设检验哪一个属于双侧检验()。 A. H0:μ=μ0, H1:μ≠μ0 B. H0:μ≥μ0, H1:μ<μ0

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲 教材:《教育统计学》 第一章绪论 第一节什么是统计学和心理统计学 一、什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学分为两大类。一类是数理统计学。它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。它是数学的一个分支。另一类是应用统计学。它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。应用统计学是与研究对象密切结合的各科专门统计学。 二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。 1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。 2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。 3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。 以上三部分内容,不是截然分开,而是相互联系的。 第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。 二、总体和样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当总体所包含的个数有限时,这一总体称为有限总体。而总体所包含的个数无限时,则称为无限总体。样本中包含的个体数目称为样本的容量,一般用n来表示。一般来说,样本中个体数目大于30称为大样本,等于或小于30称为小样本。在对数据进行处理时,大样本和小样本所用的统计方法不一定相同。 三、统计量和参数

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

【精品】2019年大学专业课程★★教育统计学考试试题

【精品】2019年大学专业课程★★ 1.(方差已知区间估计) 某中学二年级语文同一试卷测验分数历年来的标准差为10.6,现从今年测验中随机抽取10份考卷,算得平均分为72,求该校此次测验平均成绩的95%置信区间。 解 72,10.610,10.95X n σα===-= [] 112 2 :72 1.96 1.9665.43,78.57x x α αμμ μ - - ? ?? -+=-?+????= 2(方差未知区间估计). 已知某校高二10名学生的物理测验分数为92、94、96、66、84、71、45、98、94、67,试求全年级平均分数的95%置信区间。 92949666847145989467 80.710 x +++++++++= = ()()1010222 21111310.999i i i i S x x x n x ==?? =-=-= ??? ∑∑ 17.632S = ( ( [] 112 2:1180.7 2.2622 2.262268.09,93.31x t n x t n ααμ--? ? --+-?? ?=-?+??= 3. 3.(方差未知单样本t 检验) 某区中学计算机测验平均分数为70.3,该区甲校15名学生此次测验平均分数为67.2,标 准差为11.4,问甲校此次测验成绩与全区是否有显著性差异? 01:70.3:70.3H H μμ=≠ 1.053x t = ==- ()()()0.97512 1114 2.1448t n t n α- -=-= 由于()0.9751.05314 2.1448t t =<=,接受0H ,甲校此次测验成绩与全区无显著性差异. 4(方差已知的单样本均值检验).某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 01:72.4:72.4H H μμ=> 0.966x t == =

东师教育统计学18春在线作业1

(单选题) 1: 要检验多组计数数据间的差异,适宜的统计检验方法是: A: t检验 B: Z检验 C: 秩和检验 D: 卡方检验 正确答案: (单选题) 2: 某学校3位领导对本校的10名教师进行评定,为考察这三位领导对这10位教师的评定意见是否一致,应采用: A: 斯皮尔曼等级相关 B: 积差相关 C: 肯德尔和谐系数 D: - 正确答案: (单选题) 3: A: - B: - C: - D: - 正确答案: (单选题) 4: A: - B: - C: - D: - 正确答案: (单选题) 5: A: - B: - C: - D: - 正确答案: (单选题) 6: A: - B: - C: - D: - 正确答案: (单选题) 7: 下列统计图,可表示离散变量数量关系的是: A: 直条图 B: 线形图 C: 多边图 D: 直方图 正确答案: (单选题) 8: A: - B: - C: - D: - 正确答案: (单选题) 9: A: - B: - C: -

D: - 正确答案: (单选题) 10: 某县组织六名督学对该县的七所中学进行督导评估,想考察这六名督学评估结果的一致性,则采用: A: 积差相关 B: 斯皮尔曼等级相关 C: 肯德尔和谐系数 D: 点二列相关 正确答案: (单选题) 11: 进行方差分析时,对所用数据的非必备条件是: A: 组内平均数相等 B: 总体呈正态分布 C: 变异可加 D: 各组方差齐性 正确答案: (单选题) 12: A: - B: - C: - D: - 正确答案: (单选题) 13: 某班学生身高和体重的平均数分别为152厘米和43.8千克,标准差分别为20.5厘米和7.8千克,该班学生的身高和体重哪个离散程度大一些? A: 体重 B: 身高 C: 一样 D: 无法比较 正确答案: (单选题) 14: 数据3、7、2、6、8、9、4的中位数是 A: 7 B: 5 C: 4 D: 6 正确答案: (单选题) 15: A: - B: - C: - D: - 正确答案: (多选题) 1: 下列现象中,存在相关关系的是: A: 学生的学习成绩与其家庭环境之间 B: 学生的学习成绩与其体重之间 C: 学生的学习成绩与教师的教学方法 D: 学生的学习成绩与教师的教学态度之间 E: 学生的学习成绩与其努力程度之间 正确答案: (多选题) 2: A: - B: - C: - D: - E: -

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

广东省2011年07月高等教育自学考试 00974《统计学原理》试题及答案

2011年7月高等教育自学考试 统计学原理试卷 (课程代码00974) 一、单项选择题(本大题共15小题,每小题1分,共15分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.统计的基本方法包括 A.调查法、汇总发、预测法B.调查法、整理法、分析法 C.大量观观察法、综合分析法、归纳推断法D.时间数列法、统计指数法、回归分析法 2.对统计数据建立某种物理的度量单位的亮度层次是 A.定类尺度B.定序尺度 C.定距尺度D.定比尺度 3.调查单位是 A.调查对象的全部单位B.负责向上报告调查内容的单位 C.调查项目和指标的承担者D.基层企事业单位 4.对连续变量分组,最大值所在组下限为1000,又知其相邻组的组中值为750,则最大值所在组的组中值为 A.1100 B.1200 C.1250 D.1500 5.某商场2006年彩电销量为10000台,年末库存100台,这两个绝对指标是 A.时期指标B.时点指标 C.前者是时点指标,后者是时期指标D.前者是时期指标,后者是时点指标 6.下列属于比较相对指标的是 A.我国人口密度为135人/平方公里B.某年我国钢产量为日本的80% C.2006年我国GDP比上年增长9% D.2006你我国城镇职工平均工资为12000元 7.在抽样调查中,抽取样本单位必须遵循 A.可比性原则B.同质性原则 C.准确性原则D.随机性原则 8.样本容量与抽样误差的关系是 A.样本容量越大,抽样误差越大B.样本容量越大,抽样误差越小 C.样本容量越小,抽样误差越小D.两者没有关系 9.对500名大学生抽取15%的比例进行不重置抽样调查,其中优等生为20%,概率为95.45%(t=2),则优等生比重的抽样极限误差为 A.4.26% B.4.61% C.8.52% D.9.32% 10.当一个变量变化幅度与另一个变量的变化幅度基本上是同等比例时,这表明两个变量之间存在着 A.函数关系B.复相关关系 C.线性相关关系D.非线性相关关系

统计学第八章题目

一.单项选择题 1、用于测定两个变量之间密切程度的方法是( D )。 A、定性判断 B、相关表 C、相关图 D、相关系数 2、产品产量和单位成本的相关系数是—0.95,单位成本和利润率的相关系数是0.90,产量和利润的相关系数是0.08,因此( C)。 A、产量和利润的相关程度最高 B、单位成本和利润率的相关程度最高 C、产量和单位成本的相关程度最高 D、无法判断哪对变量的相关程度最高 3、相关系数的取值范围是( D )。 A、0≤r≤1 B、-1≤r≤0 C、r>0 D、-1≤r≤1 4、变量x和y之间的负相关是指(C )。 A、x值增大时y值也随之增大 B、x值减少时y值也随之减少 C、x值增大时y值随之减少,或x值减少时y值随之增大 D、y的取值几乎不受x取值的影响 5、两个变量之间的相关关系称为( B )。 A、复相关 B、单相关 C、曲线相关 D、直线相关 6、、正方形的边长和周长的相关系数为( A )。 A、1 B、-1 C、0 D、无法计算 7、在一元线性回归方程中,回归系数b的含义是( B )。

A 、当x=0时,y 的平均值 B 、当x 变动一个单位时,y 的平均变动数额 C 、当x 变动一个单位时,y 增加的总数额 D 、当y 变动一个单位时,x 的平均变动数额 8、常用的求解一元线性回归方程的方法是( B )。 A 、相关系数法 B 、最小平方法 C 、误差绝对值最小法 D 、误差和最小法 9、下列回归方程和相关系数的对应式中,错误的是( C ) A 、89.0,5.2170?-=-=r x y B 、94.0,8.35?-=--=r x y C 、78.0,5.036?-=+=r x y D 、98.0,9.25?=+-=r x y 10、已知变量x 和y 线性相关,x 和y 的协方差为-60,x 的方差为 64,y 的方差为去100,则二者的相关系数的值为( B )。 A 、0.75 B 、-0.75 C 、0.1 D 、-0.1 11、已知变量x 和y 高度线性相关,x 和y 的协方差为-60,x 的方 差为64,y 的方差为去100,则建立的y 依x 回归方程中的回归系 数b 的值为( B )。 A 、0.94 B 、-0.94 C 、0.6 D 、-0.6 12、若相关系数为正值,则回归系数的值( B )。 A 、为负 B 、为正 C 、视a 的符号而定 D 、不能确定 13、回归估计标准误差是说明( C )的指标。 A 、平均数代表性 B 、现象之间相关程度

教育统计学大纲

高纲1428 江苏省高等教育自学考试大纲 28063 教育统计学 南京师范大学编江苏省高等教育自学考试委员会办公室

Ⅰ课程的性质与设置目的 《教育统计学》是研究如何整理、分析在包括教育实验、教育调查等教育研究中所获取的数字资料,并且根据样本观察推断未知总体状况,进而把握教育发展客观规律的一门学科。教育统计学是一门应用统计学,统计学方法是教育科学研究的重要工具。《教育统计学》是高等师范院校教育专业的核心专业课程,也是江苏省高等教育自学考试小学教育专业本科段的必考科目之一。 学习《教育统计学》,首先是教育科学研究的需要。作为科研型的小学教育工作者,需要经常阅读国内外的教育研究报告和文献资料,而在这些报告或文献中,许多都是采用统计学方法来表述或解释其研究成果的。此外,我们自己的调查、实验等教育科学研究的成果也需要用统计学的方法来概括和说明。不仅如此,其实一项好的教育调查、教育实验从研究设计开始,就离不开统计学方法的支持。总之,缺乏教育统计学的知识和应用能力,不仅妨碍我们的学术交流,也严重地影响教育研究科学水平的提高。 学习《教育统计学》,同时也是科学训练的需要。统计学所运用的由个别到一般、由局部到总体的推理和思考问题的方法,是科学研究中常用的基本方法。因此通过教育统计学的学习,不仅可以掌握一些处理教育科学研究资料的技术手段,而且有助于我们科研意识的养成、科学思维的锻炼。 Ⅱ课程内容与考核目标 (考核知识点、考核要求) 第一章教育统计学的基本思想与内容 【学习目的和要求】 通过本章内容的学习,应该了解三对六种思维方式,即经验主义与理性主义的思维方式、归纳主义与演绎主义的思维方式、从局部到整体与从整体到部分的思维方式,以及教育统计学的思维方式;掌握总体、个体与样本,以及总体参数与样本统计量等基本概念;掌握样本的容量、样本的选取、抽样的类型以及常用的抽样方法;了解教育统计学的基本思想。 【学习内容】 第一节教育统计学的思维方式 一、思维方式及其基本类型 二、教育统计学的思维方式 第二节教育统计学的基本术语与符号 一、总体、样本与个体 二、总体参数与样本统计量 三、抽样方法简介 第三节教育统计学的基本思想 第四节教育统计学的基本内容 【考核知识点】 1.经验主义与理性主义

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

教育统计学的内容主要包括

教育统计学的内容主要包括

1、教育统计学的内容主要包括:描述统计与推断统计 2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除 3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物 4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行 5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据 6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算 7、数据三个特点①数据的离散性②数据的变异性③数据的规律性 8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计 9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数 10、相对次数分布表主要能反映各组数据的百分比结构 11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

教育统计学考试试题

1.(方差已知区间估计) 某中学二年级语文同一试卷测验分数历年来的标准差为10.6,现从今年测验中随机抽取10份考卷,算得平均分为72,求该校此次测验平均成绩的95%置信区间。 解 72,10.610,10.95X n σα===-= [] 112 2 :72 1.96 1.9665.43,78.57x x α αμμ μ - - ? ? ?-+=-?+????= 2(方差未知区间估计). 已知某校高二10名学生的物理测验分数为92、94、96、66、84、71、45、98、94、67,试求全年级平均分数的95%置信区间。 92949666847145989467 80.710 x +++++++++= = ()()1010222 21111310.999i i i i S x x x n x ==?? =-=-= ??? ∑∑ 17.632S = ( ( [] 112 2:1180.7 2.2622 2.262268.09,93.31x t n x t n ααμ- -? ? --+-?? ?=-?+??= 3. 3.(方差未知单样本t 检验) 某区中学计算机测验平均分数为70.3,该区甲校15名学生此次测验平均分数为67.2,标 准差为11.4,问甲校此次测验成绩与全区是否有显著性差异? 01:70.3 :70.3H H μμ=≠ 1.053t = ==- ()()()0.97512 1114 2.1448t n t n α- -=-= 由于()0.9751.05314 2.1448t t =<=,接受0H ,甲校此次测验成绩与全区无显著性差异. 4(方差已知的单样本均值检验).某区某年高考化学平均分数为72.4,标准差为12.6,该区实验学校28名学生此次考试平均分数为74.7,问实验学校此次考试成绩是否高于全区平均水平? 01:72.4 :72.4H H μμ=> 0.966x t == = ()()10.95127 1.7033t n t α--==???

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

相关主题
文本预览
相关文档 最新文档