当前位置:文档之家› 教育统计学

教育统计学

教育统计学
教育统计学

教育统计学

?教育统计与测量教育科学一门分支学科。它是将统计与测量学原理和方法应用于教育实践和研究领域而形成的一门应用性教育学科。属于工具性学科,具有基础性地

位。

第一节什么是教育学

?一、什么是教育统计学

教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。它的主要任务

是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,

进行科学推断,揭示教育现象所蕴含的客观规律。

?例:我们可以通过调查把握近五年来某地区小学教师学历达标的比例、逐年变化的情况。通过调查我们也可以了解学校各种设施逐年改善的情况,了解学生的升学率、辍学率等等。

?教育统计学与教育调查、教育试验的关系:

教育调查与教育试验会提出具体的研究任务,解决具体的问题。而教育统计学

主要是对数据进行分析和处理。如果统计学不与一定的调查和试验联系起来,研究者就不

知自己在干什么,说明什么问题。反过来,调查和试验不与统计联系起来,则它们会是杂

乱无章的,这样教育的规律就显示不出来。

?二、教育统计学的内容

从具体应用的角度来分,可以分成:

1.描述统计。就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。

2.推断统计。根据样本提供的信息,运用概率理论进行分析论证,在一定可靠程度上,对总

体分布特征进行估计、推测,这种统计方法称为推断统计。其内容包括总体参数估计和假

设检验两部分。

第二节学习教育统计学的意义

?首先,统计学是教育科学研究的工具。如教育者对随机因素的处理。

?其次,是提高专业素养、专业水平的需要。如可以帮助你阅读大量统计说明的资料,否则就不能理解别人的研究。

?再次,提高教育实际工作的效率和科学性。可以帮助了解现有的教育管理,从而在此基础上制定新的计划,提高教育实际工作的效率和科学性。同时,还可不断发现

问题,提出调整的方法和方案,因而能够提高工作效率。

最后,是科学训练的需要。可以学会科学研究所需的推理和逻辑的能力训练。

第三节统计学中的几个基本概念

一、随机变量

试验结果数值不是恒定不变的量,我们把它称为变量。和它相反的量叫做常量,即数值保

持恒定的量。表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。

一般用X、Y、Z表示。

?具有以下三个特性的现象,称为随机现象。

第一,一次试验有多种可能结果,其所有可能结果是已知的。

第二,试验之前不能预料哪一种结果会出现。

第三,在相同的条件下可以重复试验。

随机现象的每一个结果叫做一个随机事件。

二、总体和样本

总体是我们所研究的具有某种共同特征的个体的总和。

比如我们要了解全国初中生的英语水平,只有具有“全国的”“初中生”“英语”这些共同特征个体才构成一个总体。总体中的每个单位称为个体。

?总体和样本的分类:

?总体可以分为两种,一种为有限总体,另一种叫做无限总体。当总体所包含的个体数目有限时,这一总体称为有限总体。而总体所包含的个体数目无限时,则称为无

限总体。

?样本种包含的个体数目称为样本的容量,一般用n表示。样本中个体数目大于30称为大样本,等于或小于30称为小样本。

?总体和样本的关系:具有相对性,即在一定的条件下可以相互转换。比如我们想研究目前南阳师院在校大学生的外语水平,那么目前在校大学生就可以构成一个整

体。如果现在想研究全国大学生的外语水平,那么南阳师院在校大学生就是全国范

围内的一个样本。在这种情况下,总体就变成样本。

?总体,样本,与研究的目的相联系。

?三、统计量和参数

?样本上的数字特征是统计量。也就是说,根据教育调查或试验获得的数据所计算出来的能够描述这组数据各种特征的数量是统计量。

?总体上的各种数字特征是参数。也即反映总体上各种特征的数量是参数。

第二章数据的初步整理

第一节数据的来源、种类及其分类

一、教育统计资料的来源

1.经常性资料(档案性资料):如学生、家长和老师的资料等。

2.专题性资料:主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题,通过调查

或实验的方法来搜集的。

二、数据的种类

数据就是随机变量的观察值。

1.按来源分:点计数据和度量数据。点计数据指计算个数的数据。它具有独立的分类单数,

如人口数、学校数、男女数等,一般都取整数形式。

度量数据是指用一定的工具或一定的标准测量所获得的数据。如身高、体重、成绩分数。

按测量数据是否等距和有绝对零,又可分三种水平:

①有相等单位又有绝对零的数据称为比率变量数据,如身高、体重、反应时。

②有相等单位但无绝对零的数据,称为等距变量数据,如温度、各种能力分数、智商等。

③既无相等单位也无绝对零的数据称为顺序变量数据,如等级评定、品质评定、能力等级

等。

计数数据常用百分比率的检验方法,χ2检验等,比率或等距变量常用T检验及方差分析,顺序变量常用等级相关、等级差异数分析等。

2.按随机变量取值是否具有连续性,分为间断型随机变量的数据和连续型随机变量。

取值个数有限的数据,称为间断型随机变量的数据。这种数据的单位是独立的,两个单位

之间不能再划分成细小的单位,一般用整数表示。许多调查得来的数据属此类。

取值个数无限的数据,称为连续型随机变量的数据。它们可能的取值范围能连续充满某一

个区间。数据的单位之间可以在划分成无限多个细小的单位。数据可以用小数表示。

第二节统计表

1.标题:表的名称。上方,简明扼要。

2.表号:表的序号。左方,时间顺序。

3.标目:表中对统计数据分类的项目。

4.线条:四条基本线条;不宜多。

5.数字:小数数位要一致,对齐;尽量不留空格;无数字可画横杠,可用省略号或问号表示。

6.表注:补充说明表的来源;字号不要大于表中的其它文字。简单明了、重点突出。

二、统计表的种类

1.简单表:只列出观察对象的名称、地点、时序或统计指标名称的统计表。

2.复合表:按两个或两个以上标志分组的统计表。

三、频数分布表列法

频数:某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。一般用f表示。频数分布:各种随机事件在n次试验种出现的次数分布称为频数分布,即把随机事件出现

的次数都呈现出来。

频数分布表:把频数分布用表格的形式表示出来就是频数分布表。

频数分布表分类:

1.简单频数分布表(1)间断变量的频数分布表

(2)连续变量的频数分布表

第一步:求全距

R=最大值—最小值=128—81=47

第二步:决定组数和组距

k:一般分为10~15组。

i:一般定为1、2、3、5、10。

本例k=10,i=R/k=47/105

第三步:决定组限,即决定各组的上下限。

组中值=(上限+下限)/2

第四步:登记频数

2.累积频数和累积百分比分布表:累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。累积百分比就是把频数用百分比变成相对频数。用表格把这两种频数表示出

来就是累积频数分布表和累积百分比分布表。

(1)累积频数分布表制作

A.先制作频数分布表

B.从最低一组的频数开始登记,

思考题:

将下列30名学生的英语分数编制成组距为5的简单频数,累积频数(上限以下)

分布表,并绘制简单频数直方图。

76 71 66 63 88 83 77 72 68 64 70 76 81 79 73 71 66 61 55 65 74 86 78 82 74 84 67 72 76 74

第三节统计图

统计图是用来表达统计指标与被说明的事物之间数量关系的图形。它是整理数据的一种方

法。在运用统计图时,一般附有统计表。

一、统计图的结构及其绘制规则

1.标题。简明扼要,切合内容,必要时注明时间地点。字体在图中为最大;一般在图下方。

2.图号。

3.标目。对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。

4.图形。图形线在图中为最粗,要清晰,图形的高与宽之比3:5为宜,以美观为准。

5.图注。文字简明扼要,字体要小,写在图题的下方。

二、表示间断变量的统计图

1.直条图:用直条的长短表示统计事项数量的图形为直条图。常用来表示点计数据。

制作直条图的方法

(1)条宽应一致。只是高度不同,从而控制高度来表示大小。

(2)各直条之间要有一定的间隔。因为它表示的是间断变量;但间隔不要太宽、或太窄,

一般是一个到半个直条宽度之间。

(3)各直条的安排要有一定的顺序。如时间前后、数字大小、等级次序等。

(4)为了直观,直条的附近不要写数字。如需特别说明,可以安排一些图例。

直条图的分类:单式直条图和复式直条图

直条图还可分为横条图和纵条图。常见的为纵条图。

2.圆形图。是用来表示间断性资料构成比的图形。

三、表示连续变量的统计图

1.频数分布图(1)直方图用面积表示频数分布,用各组上下限上的

矩形面积表示各组频数。

直方图的制作:以组距为底边,以分组区间的上下限为底边二端点,以次数为高画矩形,各直条距形间不留空隙。

直方图与直条图的异同

同:都是用矩形来表示数据;

异:直条图表示间断变量,而直方图来表示连续变量;直条图各直条之间有间距,直方图

各直条之间没有间隔;直条图是以直条的长短高低来表示数量关系,而直方图是以面积来

表示频数分布。

多边图:多边图是以纵轴上的高度表示频数的多少的图形。

制图方法大体与直方图相同,其不同之处在于:以各组中点为横坐标,以各组的频数为纵

坐标描点,然后把每相邻的两点用直线连接起来,即成多边图。

若两组数据总频数不相同时,其纵轴应当以频数百分比表示。

(3)累积频数与累积百分比图

制作方法与多边图制作方法很相像,其区别在于:描点时应以各组的上限为横坐标,以各组的累积频数或累积百分比为纵坐标,然后描处标点,然后形成一个曲线。

第三章集中量

?二、算术平均数的计算方法

?第二节加权平均数、几何平均数、调和平均数

一、加权平均数:是不同比重数据(或平均数)的平均数。

?例:某门课程期中考试成绩与期末考试成绩的权数分别为3和7。已知某个考生期中考了92分,期末考了85分。若不考虑其他因素,问该生在这门课上的成绩是多

少?

?

?二、几何平均数。当一个数列的后一个数据以前一个数据为基础成比率(即等比级数)增长时,要用几何平均数求其平均增长率(即等比级数中的比率)。常用作速

率的集中量。

例如:某大学连续四年的毕业人数为:980、1100、1200、1300,问毕业生平均增长率是多少?

?三、调和平均数:是一组数据倒数的算术平均数的倒数,亦称倒数平均数。用公式表示为:

?

第三节中位数

一、中位数的概念

?二、中位数的计算方法

?三、百分位数的概念及其计算方法

1.概念:百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位

置的数

2.计算方法

第三节众数

对众数有理论众数及粗略众数两种定义方法。理论众数是指与频数分布曲线最高点相对应

的横坐标上的一点(积分)。粗略众数是指一组数据中频数出现最多的那个数。

?二、众数的求法

1.观察法。先把数据列出来,然后找出现频数最大的数,即为众数。

例如:有人想了解大学二年级一个半学生的年龄大概是多少。就可以把学生的年龄抄下来。

发现18岁有3个人,19岁8人,20岁4人,21岁2人,还有22岁1人。这时就可知这个班的年龄众数是19岁。

?三、算术平均数、中位数和众数的评价及关系

(一)评价与应用

1.算术平均数:最常用,优点也最多。

优点:

(1)感应灵敏

(2)严密确定

(3)简明易懂,计算简便

(4)适合代数运算

(5)受抽样变动的影响较小

?(二)三者的关系

当频数分布呈正态时,

第四章差异量

?第一节方差和标准差

一、方差和标准差的概念

方差也叫变异数(均方),是指离差平方的算术平均数。

? 2.频数分布表计算法:

?2.百分位距:百分位距是指两个百分位数之差。

例:某研究者对100名小学生进行智商测试,数据经过整理,结果如下,现要计算这100名学生智商的百分位距:

第三节相对差异量

一、概念带有与原观察值相同单位的名数,称为绝对差异量。

如前面所学的全距、四分位距、平均差及标准差等。这些差异量对两种单位不同,或单位

相同而两个平均数相差较大的资料,都无法比较差异的大小。如比较身高和体重的离散程

度。这时就需要用相对差异量(即差异系数)进行比较。

?小结:差异量和集中量的比较

联系:都是一组数据的特征量,区别:从不同角度来反映数据的特征。

1.集中量如果在数轴上表示,它是一个点,而差异量则可表示为一段距离。

2.这段距离越宽,说明数据的离散程度越大,数据的集中量代表性越差;反之,数据则比较

整齐,分布范围比较窄,数据的集中量代表性越好。

第六章抽样分布与总体平均数的推断

第一节抽样分布

? 1.总体分布:总体内所有个体数值的频数分布。

?例如:我们想研究去年全市中考语文的考试情况,把去年全市参加中考的所有考生的语文分数拿来制作一个频数分数,这个分布就是总体分布。

?二、平均数抽样分布的几个定理

? 1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。

?平均数抽样分布的形态及特征

?形态上:如果是大样本,不管总体是正态分布的还是非正态分布的,平均数的抽样分布都是正态分布或接近正态分布;如果是小样本,那么只有总体呈正态分布时,平

均数的抽样分布才是正态分布的。

?特征上:一切可能样本平均数的分布以总体平均数为中心,其取值围绕总体平均数在上下波动,平均数抽样分布的平均数等于总体平均数。而抽样分布的标准差与总体

标准差成正比,与样本容量成反比。

?标准误

?抽样误差我们用抽样分布上的标准差来表示。因此,某种统计量在抽样分布上的标准差称为该种统计量的标准误。

精品文档

?e= -μ

?三、样本平均数与总体平均数离差统计量的形态

从正态总体中,随机抽容量N的一切可能样本的平均数,是以总体平均数为中心呈正态分布的。

? 1.当总体标准差已知时

? 2.当总体标准差σ未知时

?t分布与正态分布的区别之处

?t分布的形态随自由度(df=n-1)变化呈一簇分布形态(即自由度不同的t分布形态也不同)。自由度越小,分布范围越广。

第二节总体平均数的参数估计

?根据样本对总体参数的推断有两种:总体参数估计和假设检验。

?一、总体参数估计的基本原理

?根据样本统计量对相应总体参数所作的估计叫总体参数估计。总体参数估计分为点估计和区间估计。

? 1.点估计

?用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。

?例如,有人通过抽样,对大学生做了一个调查。当研究者问“你认为谁对你影响最大?”,经统计,这个样本中有36.6%的认为父亲对自己的影响最大。

? 2.区间估计

?二、σ已知条件下总体平均数的区间估计

? 1.当总体σ已知,总体呈正态分布,大样本(n>30)或小样本(n≤30)时。不管大小样本,抽样分布都是正态的。

? 2.当总体σ已知,总体虽不呈正态分布,大样本(n>30)时,样本平均数的分布近似正态。

?已知某年某区高考数学成绩的方差为100,从该地区随机抽20名考生的数学成绩为:

65、68、38、56、72、75、47、58、70、63、67、64、60、69、61、66、55、76、

68、62,试求该地区这一年高考数学平均分95%和99%的置信区间。

?总体平均数99%置信区间为:

?三、σ未知条件下总体平均数的区间估计

? 1.σ未知条件下总体平均数区间估计的基本原理

?(1)当总体σ未知,总体呈正态分布。无论大小样本,样本平均数与总均的离差是不能转成标准正态分布的。可按T分布做推断。

?(2)当总体σ未知,总体虽不呈正态分布,大样本容量较大(n>30)时,样本平均数可以转换成t值。

?

第三节假设检验的基本原理

?以总体平均数的假设检验为例:当对某一个总体平均数(μ)进行假设检验时,首先从这个总体中随机抽取一个样本,计算出样本平均数的值。然后,假定样本所属

总体的平均数(μ)等于某个假设总体的平均数(μ0),那么,这个样本就来自这个假设总体,样本统计量的值是这个假设总体平均数值的一个随机样本值,样本平

均数与总体平均数之间的差异是由抽样误差造成的。

?从假设总体中抽取的一切可能样本统计量的值应当以假设的总体平均数为中心形成一个正态分布。这个分布可以分成两个区域。

?如果这个样本统计量的值落在了这个抽样分布中出现概率比较大的区域里,这时只好保留零假设,即研究者不得不承认这个样本来自这个假设的总体,或者这个样本

所属总体与假设总体没有真正的差异。如果这个样本统计量的值落在了抽样分布中

出现概率极小的区域里,根据小概率事件在一次随机抽样中几乎不可能发生的原

理,不得不承认样本统计量与假设总体的平均数存在着本质的差异。

?二、小概率事件

?三、显著性水平

?统计学中把这种拒绝零假设的概率称为显著性水平,表示为:

?检验的形式:

?双侧检验只强调差异不强调方向的检验为双侧检验。所提出的假设检验的问题是是否一样、相同、有差异等等。

?单侧检验既检验差异又考虑差异的方向的检验为单侧检验。具体来说,又分为左侧检验和右侧检验。

?四、统计推断的两类错误及其控制

?对于总体参数的假设检验,有可能犯两种类型的错误:α错误和β错误。

?假设有一个样本平均数值落到抽样分布的零假设的保留区间,这时认为样本平均数与总体的差异是由抽样误差造成的,没有真正差异,或者说差异不显著,差异没有

达到显著性水平,这时就不能拒绝零假设。如果样本平均数落到了零假设的保留区

间以外,小概率事件发生了,则有相当大的把握拒绝零假设,即认为样本平均数与

总体平均数的差异不是由抽样误差造成的,而是有真正的差异,或显著的差异。

第四节总体平均数的显著性检验

?显著性检验的一般步骤:

?(1)提出假设

?(2)选择检验统计量并计算其值

?(3)确定检验形式

?(4)统计决断

一、σ已知条件下总体平均数的显著性检验例子:某小学历届毕业生汉语拼音测验平均分

66分,标准差11.7。现以同样的试题测验应届毕业生,并从中随机抽取18份试卷,算得平均分为69分,问该校应届与历届毕业汉语拼音测验成绩是否一样?

?解:(1)提出假设

?(2)选择统计量并计算其值

?(3)确定检验形式

?双侧检验

?(4)统计决断

?查Z值表,

二、σ未知条件下总体平均数的假设检验

?通常要做t检验。同时还要看样本的大小,小样本一定要做t检验,大样本通常还可以转换成Z检验作近似处理。

?3、确定检验形式

?双侧检验

?4、统计决断因为当df=20-1时,查附表 2

第七章平均数差异的显著性检验

数理统计学的研究表明,假若

第二节相关样本平均数差异的显著性检验

例1:有人做了一项分散识字教学法与集中识字教学法的比较实验。根据研究的需要,将学

生配成了10对,再把每对学生中的一个随机地指派到实验组,另一个指派到对照组。两组

学生分别接受用不同的教学法进行的教学。经过一段时间的学习之后,两组学生接受统一

的测试,结果如表7.1所示。现在问,两种识字教学法是否有显著性差异?

例:某小学在新生入学时对28名儿童进行了韦氏智力测验,结果平均智商=99,标准差=14,一年后再对这些被试施测,结果平均智商=101,标准差=15,已知两次测验结果的相关系数

r=0.72,问能否说随着年龄的增长与一年的教育,儿童智商有了显著提高?

第三节独立大样本平均数差异的显著性检验

定义:两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系,这样的两个样

本称为独立样本。

假设某小学从某学期刚开学就在中、高年级各班利用每周班会时间进行思想品德教育,学

期结束时从中、高年级各抽取两个班进行道德行为测试,结果如下表所示,问高年级思想

品德教育的效果是否优于中年级?

第四节方差齐性检验

定义:对两个总体的方差是否有显著性所进行的检验称为方差齐性(相等)检验。

F分布的特点是:

1.F分布是一簇分布,随分子和分母的自由度不同而有不同的分布曲线。

2.F分布是正偏态的,即一簇正偏态的曲线(不过,随着分子和分母自由度的增大而逐渐趋

于正态)。

3.F比值都是正的。

4.由于计算F比值时总把大的方差估计值作为分子,小的作为分母,所以F比值≥1。

两个独立样本的方差齐性检验

例:某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,

从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21。男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致?

第八章方差分析

下表是A、B、C三种实验处理的数据,其中k=3表示有三种实验处理;n=5表示每种实验处理中有5个实验数据;表示某一种实验处理的平均数;表示总平均数。

三组平均数之间存在差异,每一组内的5个数据彼此也有差异,这两部分的差异合起来即

为实验结果总的差异。或者说,每一数据与总平均数的差异等于它与本组平均数之差加上

小组平均数与总平均数的差异。

第二节完全随机设计的方差分析

为了检验某一个因素多种不同水平间的差异的显著性,将从同一个总体中随机抽取的被试,

再随机地分入各实验组,施以各种不同的实验处理以后,用方差分析法对这多个独立样本

平均数差异的显著性进行检验,称为完全随机设计的方差分析。又叫做独立组实验设计。

例如,为了提高初三学生的物理成绩,物理教师设计了A、B、C、D四种计算机辅助教学软件,为了检查四种软件的教学效果,从某校初三学生中随机抽取了24名学生,分成四组,然后随机指派一组学生去使用一种教学软件。学期结束时进行统一考试,成绩如下。问四

种教学软件产生的助学效果有无不同?

第三步:统计决断

根据分子和分母自由度查F值表,得

例2:为了研究作业量对小学五年级学生学习成绩的影响,从某小学五年级各班中随机抽取A、B、C三个平行班来做实验(假定该校五年级有三个以上的平行班,各班的平均学习成

绩、智力水平及各种教学条件都基本相等),研究者让A班教师每天布置10道作业题,B 每天布置3道作业题,C班每天都不布置作业。学期结束时三个班进行统一的数学考试,这三个班学生的成绩如下,问作业量不同是否影响了数学成绩?

第二节随机区组设计的方差分析

用方差分析法对多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方

差分析。

每一区组内被试的人数分配有以下三种方式:

(3)区组内以一个团体为一个基本单元。在被试的安排上也有两种方式,一种是从每个区

组中只抽取一个团体,这个团体接受所有的处理;另一种是从每个区组中抽取的团体数是

实验处理数的整数倍,将这些团体分成若干等份,每一部分被试接受一种实验处理。

例如,将某市的学校分成五个区组:全国重点、市重点、区重点、一般学校和较差的学校,

从这五个区组中分别抽取4所学校,实验中安排了A、B、C、D四种处理,这样每个区组各

有一所学校接受一种处理。

第九章卡方检验

第一节χ2及其分布

一、卡方检验的特点

卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所

作的假设检验。即根据样本的频数分布来推断总体的分布。它属于非参数检验。

参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的

方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假

定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差

未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数

检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

χ2值有以下几个特点:

(1)χ2值具有可加性。

(2)χ2值永远是正值。

(3)χ2值的大小随实际频数与理论频数差的大小而变化。

三、χ2分布的特点:

(1)χ2分布呈正偏态,右侧无限延伸,但永不与基线相交。

(2)χ2分布随自由度的变化而形成一簇分布形态。

自由度越小,χ2分布偏斜度越大;自由度越大,χ2分布形态越趋于对称。

第二节单向表的卡方检验

把实得的点计数据按一种分类标准编制成表就是单向表。对于单向表的数据所进行的卡方检验就是单向表的卡方检验,即单因素的卡方检验。

第十章相关分析

第一节相关的意义

从变化方向来看:

正相关:两个变量值的变化方向一致。一个变量值随着另一个变量值的变大而变大,随另一个变量值变小而变小。

负相关:两个变量值的变化方向相反。一个变量值随另一个变量值的变大而变小,随着另一个变量值变小而变大。

零相关:两个变量值的变化方向无一定规律。一个变量值不随着另一个变量值的变大而变大或随着另一个变量值的变大而变小,这个变量值可能大也可能小,出现这两种情况的概率大致相等。

从密切程度来看:

强相关(接近1)

中度相关(居中)

弱相关(很弱,甚至为0)

积差相关公式的使用条件:

1.两个变量都是由测量获得的连续性数据。

2.两个变量的总体都呈正态分布或接近于正态分布。

3.必须是成对的数据,而且每对数据间是相互独立的。

4.两个变量之间呈线性关系。

5.样本容量大于30,最好大于50。

二、积差相关的计算

2.用原始数据计算

第三节等级相关

等级相关是指以等级次序表示的两列或多列变量之间的相关。

等级相关主要包括斯皮尔曼等级相关和肯德尔和谐系数两种。

一、斯皮尔曼等级相关

(一)斯皮尔曼等级相关的概念

当两列变量以等级次序表示时,用公式

(二)等级相关公式的使用条件

两列变量的值既可以是连续变量的数据,也可以用等级次序表示,并且不要求两个相应总体的分布呈正态分布,样本容量也不要求必须大于30。

例如,10名高三学生学习潜在能力测验(X)与自学能力测验成绩(Y)如下表所示,问两者相关情况如何?

解:(1)赋予等级

(2)计算D与D2

(3)将有关数据代入等级相关公式

第四节质与量的相关

质与量的相关指的是当两列变量中一列是按性质不同分类的变量,而另一列是连续变量时,

一、二列相关

2.二列相关公式的使用条件

(1)两个变量都是连续变量,而且总体呈正态分布或接近于正态分布,至少呈单峰对称分

布。

(2)两个变量之间是线性关系。

(3)二分变量本来是连续变量,不过被人为地分为两类,变成了二分变量,其分界点应比

较靠近中值。

(4)样本容量应当大于80。

二、点二列相关

1.点二列相关的概念

当两列变量中一个是正态连续变量,而另一个是真正的二分名义变量(不连续),用公式2.点二列相关公式的使用条件

计算点二列相关系数,要求两列变量中一列是正态连续变量,另一列是真正的二分变量。

所谓真正的二分变量指的是该变量的两个类别是截然不同的。

第六讲

概率及其二项分布

一、概率的定义

后验概率(或统计概率)

随机事件的频率

先验概率(古典概率)

古典概率模型要求满足两个条件:

⑴试验的所有可能结果是有限的;

⑵每一种可能结果出现的可能性相等。

二.概率的公理系统

1.任何随机事件A的概率都是在0与1之间的正数,即

0 ≤P(A)≤1

2.不可能事件的概率等于零,即P(A)= 0

3.必然事件的概率等于1,即P(A)= 1

三.概率的加法定理和乘法定理

概率的加法定理

若事件A发生,则事件B就一定不发生,这样的两个事件为互不相容事件。

两互不相容事件和的概率,等于这两个事件概率之和,即

概率的乘法定理

若事件A发生不影响事件B是否发生,这样的两个事件为互相独立事件。

两个互相独立事件积的概率,等于这两个事件概率的乘积,即

例1:某一学生从5个试题中任意抽取一题,进行口试。如果抽到每一题的概率为

1/5,则抽到试题1或试题2的概率是多少?如果前一个学生把抽过的试题还回

后,后一个学生再抽,则4个学生都抽到试题1的概率是多少?

计算

抽到第一题或第二题的概率应为抽到第一题的概率和抽到第二题的概率之和,即

例2:从30个白球和20个黑球共50个球中随机抽取两次(放回抽样),问抽出一个黑球和一个白球的概率是多少?

抽出一个白球的概率为3/5,抽出一个黑球的概率为2/5。

抽出一个黑球和一个白球的情况应包括先抽出一个黑球、后抽出一个白球和先抽出

一个白球、后抽出一个黑球两种情况。因此:

四、概率分布类型

概率分布(probability distribution)是指对随机变量取不同值时的概率的描述,一

般用概率分布函数进行描述。

依不同的标准,对概率分布可作不同的分类。

1、离散型分布与连续型分布

依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与

教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。

2、经验分布与理论分布

依分布函数的来源,可将概率分布分为经验分布与理论分布。

经验分布(empirical distribution)是指根据观察或实验所获得的数据而编制的次数

分布或相对频率分布。

理论分布(theoretical distribution)是按某种数学模型计算出的概率分布。

3、基本随机变量分布与抽样分布

依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布

(sampling distribution)。

基本随机变量分布是随机变量各种不同取值情况的概率分布,抽样分布是从同一总

体内抽取的不同样本的统计量的概率分布。

五.二项分布

二项分布(bionimal distribution)是一种具有广泛用途的离散型随机变量的概率分

布,它是由贝努里创始的,因此又称为贝努里分布。

1.二项试验

满足以下条件的试验称为二项试验:

一次试验只有两种可能的结果,即成功和失败;

各次试验相互独立,即各次试验之间互不影响;

各次试验中成功的概率相等,失败的概率也相等。

2.二项分布函数

二项分布是一种离散型随机变量的概率分布。

用n 次方的二项展开式来表达在n 次二项试验中成功事件出现的不同次数(X=0,1…)的概率分布,叫做二项分布函数。

二项展开式的通式(即二项分布函数):

(6.7)

二项展开式的要点:

项数:二项展开式中共有n+1项。

方次:p的方次,从n→0为降幂;q的方次从0→n为升幂。每项p与q方次之和

等于n。

系数:各项系数是成功事件次数的组合数。

例3:

从男生占2/5的学校中随机抽取6个学生,问正好抽到4个男生的概率是多少?最多抽到

2个男生的概率是多少?

最多抽到2个男生的概率,等于1个也没有抽到、抽到1个和抽到两个男生的概率之和,

3.二项分布图

以成功事件出现的次数为横坐标,以成功事件出现不同次数的概率为纵坐标,绘制

直方图或多边图,即为二项分布图。

二项分布是离散型分布,其概率直方图是跃阶式。

二项分布的性质

从概率直方图可以看到,二项分布有如下性质:

①.当p=q时,图形是对称的。

②.当p≠q时,直方图呈偏态。p>q与p<q时的偏斜方向相反。

4.二项分布的平均数和标准差

如果二项分布满足p>q且nq≥5(或者p<q且np≥5时,二项分布接近于正态

分布。可用下面的方法计算二项分布的平均数和标准差。

二项分布的平均数为

5.二项分布的应用

二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判

断试验结果的机遇性与真实性的界限。

例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他

是真会而不是猜测呢?

这种问题需要用累积概率来算。当做对8题或8题以上时,累积概率为0.989,也就是说,猜对9题或10题的概率不足0.05。

表6-1 一个学生做10个正误题做对不同题数的概率分布

例题:一个教师对8个学生的作业成绩进行猜测,如果教师猜对的可能性为1/3,问:

⑴.平均能猜对几个学生的成绩?

⑵.假如规定猜对95%,才算这个教师有一定的评判能力,那么这个教师至少要猜

对几个学生?

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲 教材:《教育统计学》 第一章绪论 第一节什么是统计学和心理统计学 一、什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学分为两大类。一类是数理统计学。它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。它是数学的一个分支。另一类是应用统计学。它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。应用统计学是与研究对象密切结合的各科专门统计学。 二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。 1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。 2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。 3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。 以上三部分内容,不是截然分开,而是相互联系的。 第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。 二、总体和样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当总体所包含的个数有限时,这一总体称为有限总体。而总体所包含的个数无限时,则称为无限总体。样本中包含的个体数目称为样本的容量,一般用n来表示。一般来说,样本中个体数目大于30称为大样本,等于或小于30称为小样本。在对数据进行处理时,大样本和小样本所用的统计方法不一定相同。 三、统计量和参数

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

东师教育统计学18春在线作业1

(单选题) 1: 要检验多组计数数据间的差异,适宜的统计检验方法是: A: t检验 B: Z检验 C: 秩和检验 D: 卡方检验 正确答案: (单选题) 2: 某学校3位领导对本校的10名教师进行评定,为考察这三位领导对这10位教师的评定意见是否一致,应采用: A: 斯皮尔曼等级相关 B: 积差相关 C: 肯德尔和谐系数 D: - 正确答案: (单选题) 3: A: - B: - C: - D: - 正确答案: (单选题) 4: A: - B: - C: - D: - 正确答案: (单选题) 5: A: - B: - C: - D: - 正确答案: (单选题) 6: A: - B: - C: - D: - 正确答案: (单选题) 7: 下列统计图,可表示离散变量数量关系的是: A: 直条图 B: 线形图 C: 多边图 D: 直方图 正确答案: (单选题) 8: A: - B: - C: - D: - 正确答案: (单选题) 9: A: - B: - C: -

D: - 正确答案: (单选题) 10: 某县组织六名督学对该县的七所中学进行督导评估,想考察这六名督学评估结果的一致性,则采用: A: 积差相关 B: 斯皮尔曼等级相关 C: 肯德尔和谐系数 D: 点二列相关 正确答案: (单选题) 11: 进行方差分析时,对所用数据的非必备条件是: A: 组内平均数相等 B: 总体呈正态分布 C: 变异可加 D: 各组方差齐性 正确答案: (单选题) 12: A: - B: - C: - D: - 正确答案: (单选题) 13: 某班学生身高和体重的平均数分别为152厘米和43.8千克,标准差分别为20.5厘米和7.8千克,该班学生的身高和体重哪个离散程度大一些? A: 体重 B: 身高 C: 一样 D: 无法比较 正确答案: (单选题) 14: 数据3、7、2、6、8、9、4的中位数是 A: 7 B: 5 C: 4 D: 6 正确答案: (单选题) 15: A: - B: - C: - D: - 正确答案: (多选题) 1: 下列现象中,存在相关关系的是: A: 学生的学习成绩与其家庭环境之间 B: 学生的学习成绩与其体重之间 C: 学生的学习成绩与教师的教学方法 D: 学生的学习成绩与教师的教学态度之间 E: 学生的学习成绩与其努力程度之间 正确答案: (多选题) 2: A: - B: - C: - D: - E: -

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

教育统计学大纲

高纲1428 江苏省高等教育自学考试大纲 28063 教育统计学 南京师范大学编江苏省高等教育自学考试委员会办公室

Ⅰ课程的性质与设置目的 《教育统计学》是研究如何整理、分析在包括教育实验、教育调查等教育研究中所获取的数字资料,并且根据样本观察推断未知总体状况,进而把握教育发展客观规律的一门学科。教育统计学是一门应用统计学,统计学方法是教育科学研究的重要工具。《教育统计学》是高等师范院校教育专业的核心专业课程,也是江苏省高等教育自学考试小学教育专业本科段的必考科目之一。 学习《教育统计学》,首先是教育科学研究的需要。作为科研型的小学教育工作者,需要经常阅读国内外的教育研究报告和文献资料,而在这些报告或文献中,许多都是采用统计学方法来表述或解释其研究成果的。此外,我们自己的调查、实验等教育科学研究的成果也需要用统计学的方法来概括和说明。不仅如此,其实一项好的教育调查、教育实验从研究设计开始,就离不开统计学方法的支持。总之,缺乏教育统计学的知识和应用能力,不仅妨碍我们的学术交流,也严重地影响教育研究科学水平的提高。 学习《教育统计学》,同时也是科学训练的需要。统计学所运用的由个别到一般、由局部到总体的推理和思考问题的方法,是科学研究中常用的基本方法。因此通过教育统计学的学习,不仅可以掌握一些处理教育科学研究资料的技术手段,而且有助于我们科研意识的养成、科学思维的锻炼。 Ⅱ课程内容与考核目标 (考核知识点、考核要求) 第一章教育统计学的基本思想与内容 【学习目的和要求】 通过本章内容的学习,应该了解三对六种思维方式,即经验主义与理性主义的思维方式、归纳主义与演绎主义的思维方式、从局部到整体与从整体到部分的思维方式,以及教育统计学的思维方式;掌握总体、个体与样本,以及总体参数与样本统计量等基本概念;掌握样本的容量、样本的选取、抽样的类型以及常用的抽样方法;了解教育统计学的基本思想。 【学习内容】 第一节教育统计学的思维方式 一、思维方式及其基本类型 二、教育统计学的思维方式 第二节教育统计学的基本术语与符号 一、总体、样本与个体 二、总体参数与样本统计量 三、抽样方法简介 第三节教育统计学的基本思想 第四节教育统计学的基本内容 【考核知识点】 1.经验主义与理性主义

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学第三版 复习重点

统计学复习重点 1、理解描述统计学与推断统计学(p5-6) 2、熟悉定量数据与定性数据的图表描述,常用图表 3、理解教材p51思考题T1、T2、T3、T5、T7、T10 4、熟练掌握加权算术平均数、标准差、标准差系数的计算方法(参考教材 p55T11、T13) 5、理解样本均值、样本比例的抽样分布及中心极限定理 6、理解点估计的三个评价标准,区间估计的有关概念(置信度、估计精度、区 间宽度等) 7、熟练掌握总体均值、总体比例的区间估计方法、样本容量的计算方法(参考 p129例题4.2、p131例题4.4、p142例题4.12、例题4.13) 8、理解样本容量与置信水平、总体方差、允许误差间的关系 9、理解假设检验的原理、步骤及两类错误、p值 10、熟练掌握总体均值、总体比例的假设检验方法(参考教材p159例题5.4、5.5、 5.6、5.8) 11、理解方差分析的相关概念、原理及基本步骤 12、熟练掌握单因素方差分析方法,理解单因素方差分析表的内在联系(参考教材p194表6.5、6.6、p210T3) 13、熟练掌握一元线性、多元线性回归分析方法及相关概念、重点熟悉Excel回归分析输出表的内在联系(参考教材p227表7.4、p241表7.6、p249T4) 14、熟练掌握时间序列的速度分析(参考教材p287习题1、2、3) 15、理解时间序列的组成因素及两类模型 16、熟悉选择拟合时间序列趋势模型的分析方法、常用模型(如指数曲线模型) 17、理解加权综合指数(拉氏指数和帕氏指数)、理解指数体系中的恒等式 18、熟练掌握总量指标的两因素分析方法(参考教材p306例题9.4) 19、理解CPI指数及其经济意义,CPI指数与购买力指数的关系 20、理解构建综合评价指数的基本问题(p312)

教育统计学的内容主要包括

教育统计学的内容主要包括

1、教育统计学的内容主要包括:描述统计与推断统计 2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度、可比可加。比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除 3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物 4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行 5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据 6、顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点。因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算 7、数据三个特点①数据的离散性②数据的变异性③数据的规律性 8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计 9、编制简单次数分布步骤①求全距②定组数③定组距④写组限⑤求组中值⑥归类划记⑦登记次数 10、相对次数分布表主要能反映各组数据的百分比结构 11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

2017年秋教育统计学答案(20200627082742)

综合作业20170802 1. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个元素都有相同的机会(概率)被抽中, 这样的抽样方式称为( )(本题6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 2. (单选题)从含有N 个元素的总体中抽取n 个元素作为样 本,使得总体中的每一个样本量为 n 的样本都有相同的机会(概 率)被抽中,这样的抽样方式称为( )(本题6.0分) A 、简单随机抽样 3 B 、整群抽样 B c 、系统抽样(等距抽样) D 、分层抽样(类型抽样) B 、

学生答案:A 标准答案:D 解析: 得分:0 3. (单选题)从总体中抽取一个元素后,把这个元素放回到总 体中再抽取第二个元素,直至抽取n 个元素为止,这样的抽样方 法称为()(本题6.0分) 重复抽样 不重复抽样 整群抽样 分层抽样(类型抽样) 学生答案:A 标准答案:A 解析: 得分:6 4. (单选题)一个元素被抽中后不再放回总体, 然后再从所剩 下的元素中抽取第二个元素, 直至抽取n 个元素为止,这样的抽 样方法称为()(本题6.0分) B 、

3 A 、重复抽样 3 B 、不重复抽样 3 c 、整群抽样 d D 、 分层抽样(类型抽样) 学生答案:B 标准答案:B 解析: 得分:6 5. (单选题)在抽样之前先将总体的元素划分为若干类,然后 为()(本题 6.0分) 简单随机抽样 整群抽样 系统抽样(等距抽样) 分层抽样(类型抽样) 学生答案:D 标准答案:D 解析: 得分:6 从各类中抽取一定数量的元素组成一个样本, 这样的抽样方式称 B 、

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

教育统计学答案

(0282)《教育统计学》复习思考题答案 一、填空题 1. 统计学是研究统计原理和方法的科学。 2.我们所研究的具有某种共同特性的个体总和称为总体。 3.一般情况下,大样本是指样本容量超过30 的样本。 4.表示总体的数字特征的特征量称为参数。 5.要了解一组数据的集中趋势,需计算该组数据的集中量。 6. “65、69、72、87、89”这组数据的算术平均数是76.4 。 7. “78、69、53、77、54”这组数据的中位数是69 。 8. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是145厘米。 9. 要了解一组数据的差异程度,需计算该组数据的差异量。 10.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是40分。 11.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是5.88% 。 12.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。 13.两个变量之间不精确、不稳定的变化关系称为相关关系。 14.要描述两个变量之间变化方向及密切程度,需要计算相关系数。 15. 若两个变量之间存在正相关,则它们的相关系数是正数。 16.若两个变量之间的相关系数是负数,则它们之间存在负相关。 17.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。 18.品质相关的分析方法包括四分相关、Φ相关和列联相关。 20. 某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是2/5。 21.某一种统计量的概率分布称为抽样分布。 22.平均数差异显著性检验中需要判断两个样本是相关样本还是独立样本。 23. 单纯随机抽样能保证抽样的随机性和独立性。 24. χ2检验的数据资料是点计数据。 25. 单向表是把实测的点计数据按一种分类标准编制而得的表。 26. 单向表χ2检验是对单向表的数据进行χ2检验,即单因素的χ2检验。 27. 双向表是把实测的点计数据按两种分类标准编制而得的表。 28. 双向表χ2检验是对双向表的数据进行的χ2检验,即双因素的χ2检验。 29.假设检验的方法包括参数检验和非参数检验。 30.符号秩次检验属于非参数检验。 31.标准正态曲线在Z=0处为最高点。 32.直条图是表示间断变量的统计图。 33.直方图是表示连续变量的统计图。 34.教育统计资料的来源主要是经常性资料和专题性资料。 35.教育调查从范围来看,可分为全面调查和非全面调查。 36.对数据进行统计分类的标志按照形式可分为性质类别和数量类别。 二、简述题 1.简述教育统计学的研究对象和内容。 教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工

《教育统计学》名词解释重点

第一章绪论 1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。 2,教育统计学分为描述统计、推断统计和实验设计三类。 (1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计 算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐 系数、多系列相关系数)反映一致性程度。 (2)推断统计包括总体参数估计和假设检验两部分。 3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。 随机事件:随机现象的每一种结果。 随机变量:把能表示随机现象各种结果的变量称之 4,总体:是我们研究的具有某种共同特性的个体的总和。 样本数目大于30称为大样本,小于等于30称为小样本。 第二章数据的初步整理 1,教统资料来源有经常性资料和专题性资料。 专题性资料包括(1)教育调查。按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。(2)教育实验。分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合) 2,数据的分类。按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。 3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。 4,用累计频数表示的频数分布表称为累计频数分布表。 第三章集中量 1,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 2,加权平均数:是不同比重数据(或平均数)的平均数。 几何平均数:是n个数值连乘积的n次方根。 调和平均数:是一组数据倒算的算术平均数的倒数,亦称倒数平均数。 第四章差异量 1,差异量是指表示一组数据变异程度或离散程度的量。差异量越大,表示数据分布越广,越不整齐;相反,表示分布越集中,变动范围越小。 2,全距是一组数据中最大值与最小值之差,又称极差,用R表示。 四分位距是指用依一定顺序排列的一组数据中间部分50%个频数距离的一半作为差异量指标。四分位距就是第三个四分位数(第75百分位数)与第一个四分位数(第25半分位数)差的一半。 百分位距是指两个百分位数之差。常用的有两种:一为第90与第10百分位数之差;一为第93与第7百分位数之差。 3,标准差越大,表明离散程度越大,即数据越参差不齐,分布范围越广。

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

《统计学原理》作业参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1 5、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C)。 A、等于78% B、大于84% c、在此76%与84%之间D、小于76% 6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A)。 A、甲厂比乙厂大 B、乙厂比甲厂大 C、两个工厂一样大 D、无法确定

相关主题
文本预览
相关文档 最新文档