当前位置:文档之家› 教育统计学-笔记公式

教育统计学-笔记公式

教育统计学-笔记公式
教育统计学-笔记公式

教育统计学王孝玲

第一章绪论

教育统计学是运用数理统计的原理和方法研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验等途径所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。

统计学和教育统计学的内容:从具体应用角度来分,可以分成:描述统计、推断和实验设计三部分。

描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法。通过教育调查和教育实验获得了大量的数据,用归组、编表、绘图等统计方法对这进行归纳、整理,以直观形象的形式反映其分布特征;通过计算各种特征量,来反映它们分布上的数字特征。

推断统计:根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测。

描述统计是推断统计的基础,推断统计是通过样本信息估计、推测总体,从已知情况估计、推测未知情况。

学习统计学和教育统计的学的意义:一、统计学为科学研究提供了一种科学方法,统计推理的方法是归纳法。二、教育统计学是教育科研定量分析的重要工具。三、广大教育工作者学习教育统计学的具体意义:1、可以顺利地阅读运用统计方法进行定量分析的科研报告。2、可以提高教育工作的科学性和效率。3、为学习教育测量及教育评价打下基础。

随机现象:1、一次试验有多种可能结果,其所有可能结果是已知的;2、试验之前不能预料哪一种可能结果会出现;3、在相同的条件下可以重复试验。

随机现象的每一种结果叫做一个随机事件。

总体:研究的具有某种共同特性的个体的总和。总体中的每个单位称为个体。样本

是从总体中抽取的作为观察对象的一部分个体。

样本上的数字特征是统计量。总体上的各种数字特征是参数。在进行统计推断时,就是根据样本统计量来推断总体相应的参数。

第二章数据的初步整理

教育统计资料的来源:经常性资料、专题性资料(教育调查、教育实验)

数据的种类:按来源分:点计数据和度量数据,按随机变量取值情况分:间断型(取值个数有限的数据,一般为整数)和连续型随机变量(取值个数无限的不可数的数据可用小数表示)。

数据的统计分类:按照研究对象的本质特征,根据分析研究的目的、任务,以及统计分析时所用统计方法的可能性,将所获得的数据进行分组归类。分类标志按形式划分:性质类别和数量类别。

统计表:一般由标题、表号、标目、线条、数字、表注构成。分复合表、简单表、分组表。某一个随机事件在n次试验中出现的次数称为随机事件的频数。

简单频数分布表:求全距、决定组数和组距、决定组限、登记频数。

统计图:表示间断变量的统计图:直条图、圆形图。表示连续变量的统计图:线形图、频数分布图(直方图、多边图、累积频数和累积百分比多边图)

第三章集中量:是代表一组数据典型水平或集中趋势的量。

算术平均数:算术平均数是所有观察值的总和除以总频数所得之商,它是统计学中最易理解最常应用的一种集中量指标。特性:观察值的总和等于算术平均数的n倍,各观察值与其算术平均数之差的总和等于0,若一组观察值是由两部分或几部分组成,这组观察值的算术平均数可以由组成部分的算术平均数而求得。优缺点:1、反应灵敏。2、严密确定3、简明易懂,计算简单4、适合代数运算5、只知一组观察值的总和及总频数就可以求出算术平均数。6、用加权法可以求出几个平均数的总平均数。7、用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,

它是总体平均数的最好估计值。8、在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

缺点是:易受两极端数值的影响。一组数据中某个数值大小模糊不清或不够确切时,就无法计算。它所适用 的条件:一组数据中每个数据都比较准确可靠;无两极端数值影响;而且还要通过它计算其他统计量。

中位数是位于依一定大小顺序的一组数据中央位置的数值。各有一半数的一级数据的数据个数一分为二的数值。是百分位数的一种。

百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。

中位数的应用及其优缺点:不适合代数计算,与算术平均数相比抽样偏差相对较大。很少受两极端数值的影响,由数据的个数所决定,反应不灵敏,适用于:1、一组数据有特大或特小两极端数值时2、一组数据中有个别数据不确切、不清楚时。3、资料属于等级性质时。

第三节 众数 皮尔逊经验法:X M M d 230-≈。

众数的应用及其优缺点:随频数分布表上的组距变化而变化,极不准确、极不稳定。不适合代数计算,受抽样变动较大,较少受两极端数值的影响,反应不灵敏。使用条件:1、当需要快速而又粗略地找出一组数据的代表值时2、当需要利用 算术平均数、中位数、众数三者关系来粗略地判断频数分布的形态时3、利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。

当一个频数分布出现两个频数最多一组时,可以通过合并组距的方法视其资料的同质性。若合并后仍有两个集中点,则表明这组数据是由两种性质不同资料混合在一起。

算术平均数、中位数、众数三者关系:当频数分布呈正态时,三者合为一点:0M M X d

==;

当频数分布呈正偏态时,0M M X d >>,负偏态时:0M M X d

<<

加权平均数 几何平均数 调和平均数

加权平均数是不同比重数据或平均的平均数。

几何平均数:n 个数值连乘积的n 次方根。当一个数列的后一个数据是以前一个数据为基础成比率增长时,要用它求其平均增长率,常用作速率的集中量,在教育方面,求增加率、进步率等。求法是n 个数据连乘积的n 次方根。n n g X X X X 21=

调和平均数:是一组数据倒数的算术平均数的倒数。主要是用来求学习速度。

???

?

??++=

n

H X X X n X 11111

21

第四章 差异量

表示一组数据变异程度或离散程度的量叫差异量。差异量大大,表示数据分布越广,越不整齐、差异量越小,表示数据分布得越集中,变动范围越小,(全距、四分位距、百分位距、平均差、方差、标准差、)绝对差异量,(差异系数。)相对差异量 全距是一组数据中最大值与最小值之差。

四分位距是用依一定顺序排列的一组数据中间部位50%个频数距离的一半作为差异量指标。2

1

3

Q Q

QD -= 四分位距的应用及其优缺点:简明易懂,计算简便,较少受两

极端数值的影响,比全距可靠的多。但它忽略了左右共50%数据的差异,不适合代数运算。当一组数据中用中位数表示集中量时,就要用四分位距表示差异量。 第二节 平均差 每一个数据与该组数据的中位数或算术平均数离差的绝对值的算术平均数。n

Md X MD ∑-=

第三节 方差和标准差 方差是指离差平方的算术平均数,一组数据中每个数据与该组平均数之差,平方之求其和,再除以数据的个数。()n

X X X

∑-=

2

2

σ标准差即方差的平方根2

2

???

? ?

?-=

∑∑n X

n

X

X

σ

优点:反应灵敏,随任何一个数据的变化而变化,严密

确定,一组数据的方差及标准差有确定的值,计算简单,适合代数运算,可以将几个方差和标准差综合成一个总的方差和标准差,用样本数据推断总体差异量时,方差和标准差是最好的估计量。在避免两极端数值影响方面超过全距,在考虑到全部

离差方面,优于四分位距,在避免绝对值方面优于平均差。缺点是不太容易理解,易受两极端的影响,有个别数值糊涂不清时无法计算。最直接的用途是描述一组数据的离散程度。

第四节 相对差异量 对两种单位不同或单位相同而两个平均数相差较大的资料进行差异大小的比较。%

100?=X

CV X

σ

偏态量及峰态量:X

M X SK σ0

-=

=()X

Md X SK σ-=3,0=SK 时,分布呈对称形, 0>SK 正偏

态 0

X

n

X X a 3

3

3

σ

∑-=

峰态量 ()

X

n

X X a

4

4

4

σ

∑-=

0=a 时呈正态

峰, 0>a 高狭峰 0

第五章 概率及概率分布

以随机事件在大重复试验中出现的稳定频率值作为随机事件概率的估计值,这样寻得的概率称为后验概率。

先验概率是在特定条件下直接计算出来的,是随机事件的真实概率,不是由频率估计出来的。

概率的性质:任何随机事件的概率都是在0与1之间10≤≤P 不可能事件的概率等于0,必然事件的概率等于1 第二节 二项分布

凡满足以下条件的试验称为二项试验: 一次试验只有两种可能结果,即成功和失败,各次试验相互独立,即各次试验之间互不影响。各次试验中成功的概率相等,各次试验中失败的概率也相等。二项分布是一种离散型随机变量的概率分布。 二项分布函数:()X n X X n X X

n X

q p X n X n q p C P

---=

=!

!!

二项分布的平均数和标准差:当二项分

布接近正态分布时,在n 次二项试验中成功事件出现次数的平均数为np =μ标准差为npq =

σ,二项分布的应用:除了用来求成功事件恰好出现

X 次的概率之外,在教

育中主要用来判断试验结果的机遇性与真实性的界限。

正态分布是一种连续型随机变量概率分布。正态曲线的函数:()2

2

22σμπσ-=X e

N Y

正态曲线的特点:曲线在Z =0(0M M

X d

==)处为最高点。曲线以

Z =0处为中心

双侧对称。曲线最高点向左右缓慢下降,并无限伸延,但永不与基线相交。标准正态分布上的平均数为0标准差为1,基线上Z 从-3至+3,6个标准差距离间几乎包含了全部(99.73%)面积,曲线从最高点向左右延伸时,在正负1个标准差之内既向下又向内弯,正负1个标准差开始,既向下又向外弯。

正态曲线在测验记分方面的应用:1、将原始分数转换成标准分数。标准分数的优点:各科标准分数的单位是绝对等价的;标准分数的数值大小和正负,可以反映某一考分在团体中所处的位置;确定录取分数线;确定等级人数;品质评定数量化。

第六章 抽样分布及总体平均数推断

平均数抽样分布的几个定理:1、从总体中随机抽出容量为n 的一切可能样本的平均数之平均数等于总体平均数2、容量为n 的平均数在抽样分布上的标准差,等于总体标准差除以n 的平方根。n

X

σ

σ

=

3、从服从正态分布的总体中,随机抽取的容量

为n 的一切可能样本平均数的分布也呈正态分布。4、虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布也接近于正态分布。当总体标准差为已知时,平均数抽样分布的标准差与样本容量n 的平方根成反比,即样本容量越大,平均数抽样分布的标准差越小,当样本容量n 确定时,平均数抽样分布标准差与总体标准差成正比,即总体数值离差程度越大,平均数抽样分布的标准差越大。抽样分布是统计推断的理论依据。某种统计量在抽样分布上的标准差称为该种统计量的标准误。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大,所以标准误是统计推断可靠性的指标。

样本平均数与总体平均数离差统计量的形态:

n

X X Z X

σ

μ

σμ

-=

-=

t 分布与正态分布的相似之处:t 分布基线上的t 值从-∞-+∞;从平均数等于0处,

左侧t 值为正;曲线以平均数处为最高向两侧逐渐下降,尾部无限伸延,永不与基线相接,呈单峰对称形。区别之处在于:t 分布形态随自由度的变化呈一簇分布形态,

t 分布的峰镲尖峭,尾长而翘得高,在基线上分布的范围广,自由度越小,分布范围

越广。当自由度逐渐增大时,t 分布逐渐接近正态分布。当自由度趋于无限大时,t 分布与正态分布重合。

第二节 总体平均数的估计 根据样本信息对总体参数的有两种不同形式:总体参数估计和假设检验。

总体参数估计的基本原理:根据样本统计量对相应总体参数所作的估计叫总体参数

估计,分为点估计(无偏性、有效性、一致性)和区间估计。当用某一样本统计量的值来估计相应总体参数的值叫点估计。以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围。

区间估计:95.096.196.1=??? ?

?

+<<-n X n X p σμσ ()()95.01105.005.0=??

? ??

-+<<--n t X n t X p X df X df σμσ 第三节 假设检验的基本原理 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出气绝或保留的决断,称为假设检验。 零假设是关于当前样本所属的总体与假设总体无区别的假设。

备择假设是与零假设相反的假设,是研究者根据样本信息期待证实的假设,是根据样本信息否定了零假设时,应当采取的假设。统计推理采用的是反证法。 小概率事件:样本统计量的值(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平。显著性水平:统计学中把拒绝零假设的概率。显著性水平越高,越不容易拒绝零假设,推断的可能性就越大。

统计决断的两类错误及其控制:第一类错误:假设真实而被拒绝,第二类错误:假设属伪而被保留。第一类错误的控制通过选择适当的显著性水平加以主动控制。后果非常严重的用较高的显著性水平,0.01 0.005,当拒绝一个属真的假设其后果不是严重的,选用较低的显著性水平 0.05 0.1。控制第二类错误的概率的方法:利用已知的实际总体参数值与假设参数值之间大小关系,合理安排拒绝区域的位置。2、使样本容量增大。 总体平均数的显著性检验

μ:0H >

μ:1

H

右侧检验

n

X Z σ

μ

-=

1

--=

n X t X

σμ

第七章 平均数差异的显著性检验 本章是根据两个样本平均数之差检验两个相应总体平均数之差的显著性。根据两个样本统计量的差异检验两个相应总体参数差异的显著性,统计学上称为差异显著性检验。

相关样本平均数差异的显著性检验:两个样本内个体之间存在着一一对应关系,这

两个样本称为相关样本,分为两种情况:配对组和对照组。小样本

1

222

122212

12

1212

1--+-=

-+-=

n r X X n

S rS S S X X t σσσσ大样本:用Z 检验,公式同上。

独立样本平均数差异的显著性检验:大样本:2

2

21

2

12

1n n X X Z σσ+

-=

独立小样本:2

12

1

212

222

112

12n n n n n n n n X X t +?-++-=

σσ

独立小样本方差不齐性时差异显著性检验:

1

1

22

2

12

1

2

12

2

212

121-+

--=

+-=

'n n X X n S

n S X X t σσ

()2

2

2121

05

.022

2

05.0)(12121)()05.0(n S n S t n S t n S t df df +?+????? ??='

方差齐性检验:对两个总体的方差是否有显著性差异所进行的检验。 两个独立样本的方差齐性检验:2

2

2

1

:σσ

=H

2

2

2

1

1:σσ≠H

()()

11222

21

2

1

1222

1--==

n n n n S S F σσ 两个相关样本的方差齐性检验:

()

2

142

2

22

12

221---=

n r t σσσσ

第八章 方差分析

基本原理:方差分析的目的:平均数差异的显著性检验,是对两个平均数的比较,在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。方差分析的功能就在于对多组平均数差异的显著性进行检验

方差分析中的几个概念:实验中的自变量称为因素。只有一个自变量的实验称为单因素实验。有两个或两个以上自变量的实验称为多因素实验。某一个因素的不同情况称为因素的水平,包括量差或质别两类情况,按各个水平条件进行的重复实验称为各种处理。假如要研究两种教材及三种教学法对学生学习成绩的影响,该实验是双因素的实验。一个因素是教材,它有两种水平,另一个因素是教学方法,它有三种水平。这个实验称为2*3的实验设计,共有6种处理,若一个实验为2*2*2设计,则表示该实验有三个因素,每个因素有两种水平,共有8种处理。 用方差分析法检验某一因素对因变量的作用,称为单因素方差分析。

完全随机设计的方差分析:为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。 1、n 相等的情况: 组间平方和:()()∑∑∑∑-

=nK

X n X SS b 2

2

组内平方和:()∑∑∑

∑-=n

X X SS W 2

2

总平方和:()∑∑∑∑-=nK

X X SS t

2

2

组间自由度:1-=K df b

组内自由度:K n n df w -++= (21)

总自由度:()

1-=n K df

t

W

W

W b

b

b df SS MS df SS MS =

=

W b

MS MS F = W

W

b b df SS df SS F

=

二、n 不相等 组间平方和:()()∑∑∑∑

∑-

=n

X n

X SS

b

2

2

组内平方和:()∑∑∑

∑-=n

X X SS W 2

2

总平方和: ()∑∑∑∑∑-

=n

X X

SS

t

2

2

K n n df W -++=...21 1...21-+=n n df t 1-=K df b

用n X S σ进行组间与组内方差的F 检验

∑∑=

n

X n X t ()()()t K K t t b X X n X X n X X n SS -+-+-= (2)

222

11 K

x x x W n n n SS σσσ++= (2)

2

1

221

K W n n n df +++=...21 1-=K df b

W

W

b b

df SS df SS F =

对多组平均数每对之间的差异进行多重比较的方法,q 检验法最为常用。 1、各组n 相等:

n

MS X X q W

2

1-=

2、各组n 不相等:?

??? ??+-=

21

21112

n n MS X X q W

第三节 随机区组的设计的方差分析

在检验某一因素多种不同水平(即不同实验处理)之间差异的显著性时,为了减少被试间个别差异对结果的影响,把从同一个总体中抽取的被试按条件相同的原则分成各个组(称区组),使每个区组内的被试尽量保持同质。在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析。

每一区组内被试的人数分配有以下三种方式:

1、一个被试作为一个区组,所有的被试都要分别接受各种实验处理。

2、每一区组内的被试的人数是实验处理数的整数倍数。

3、区组内不是以个别被试为基本单元,而是以一个团体为一个基本单元。 完全随机区组设计的方差分析

计算平方和:组内平方和解成区组平方和及误差平方和e r W SS SS SS += 总平方和可分解成组间平方和、区组平方和及误差平方和:

()∑∑∑∑-

=++=nK

X X SSe SSr SSb SSt 2

2

组间平方和:()()nK

X n X SS b 2

2

∑∑∑

∑-=

区组平方和:()()nK

R K R SS r 2

2

∑∑∑∑-

=

计算方差: 组间方差:b b

b df SS MS =

区组方差:r

r

r df SS MS = 误差方差:e

e

e d

f SS MS = 计算F 值:b

b

MS MS F =

区组差异显著性检验: 计算检验统计量的F 值:e

r

MS MS F =

第五节 多组方差的齐性检验

哈特莱提出的最大F 值检验法进行齐性检验。min

2max

2S S F =

()

1

2

2--=

∑∑n X X S

提出假设:C B A H σσσ===0

1H :至少有两个总体方差不相等

当各组n 不相等时可用容量最大一组n 计算自由度。

第九章 总体比率的推断

总体平均数、方差的统计推断都是对由测量而获得的、正态连续变量的数据所进行的统计推断。对点计数据的统计推断应采用总体比率的推断方法或2χ检验。 比率的抽样分布是二项分布。二项概率分布是进行总体比率统计推断的理论依据。总体比率标准误的估计量为n

pq

S P =

第二节 总体比率的区间估计

n pq

p p Z '-=

99.05.258.2=??

?

???+<'<-n pq p p n pq p p

第三节 总体比率的假设检验 一个样本总体比率假设检验:n

q p p p Z '''

-=

p '总体比率 q '=p '-1 p 为样本比率

两个独立样本比率差异的显著性检验:

()()

()2121221122112

1n n n n q n q n p n p n p p Z +++-=

=2

1212

1n n n n p p c c -

两个相关样本比率差异的显著性检验:c

b c

b Z +-= 第十章 2χ检验

2χ及其分布 2χ检验的特点:

对样本的频数分布所来自的总体分布是否服从某种理念分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。它与测量数据的假设检验的不同在于:1、测量数据的假设检验,其数据属于连续变量,而2χ检验的数据属于点计而来的间断变量。2、测量数据所来自的总体要求呈正态分布,而2χ检验的数据所来自的总体分布是未知的。3、测量数据的假设检验

是对总体参数或几个总体参数之差所进行的假设检验;2χ检验在多数情况下不是对总体参数的检验,而是对总体分布的假设检验。2χ检验属于自由分布的非参数检验。 比率和比率之差的假设检验,是对二项分布数据的假设检验。处理的是一个因素分成两个类别,或是两个因素,第个因素都分为两个类别的资料 ,它最多只能同时比较两组比率的差异。而2χ检验可以同时处理一个因素分为多种类别,或多种因素各有多种类别的资料。所以,凡是可以应用 比率进行检验的资料,都可以应用2χ检验。

一、2χ检验统计量:()∑

-=t

t f f f 2

02

χ

2χ特点:1、具有可加性。2、2χ值永远是正值。3、2χ值大小 随实际频数与理论频数差的大小而变化。 单向表的2χ检验 一个自由度的2χ检验: 1、各组5≥t f 的情况:()∑

-=t

t f f f 2

02

χ

2、某组5≤t f 的情况:()∑

--=t

t f f f 202

5.0//χ双向表的2χ检验:把实得的点计数据按

两种分类标准编制成的表就是双向表。在双向表2χ检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种2χ检验称为独立性2χ检验。在双向表2χ检验中,如果是判断几次重复实验的结果是否相同,这种2χ检验称为同质性检验。

第三节 四格表的2χ检验:1、()()()()()

d c d b c a b a N

bc ad ++++-=2

当1=df ,30

d c d b c a b a N

N bc ad ++++??? ??

--=2

22//χ

第四节 相关样本四格表的2

χ检验:1、()c

b c b +-=

2

2

χ

2、若()30<+c b 或()50<+c b 时, ()c

b c b +--=2

21

//χ

第十一章 相关分析 第一节 相关的意义

正相关:两个变量的变化方向一一致。负相关:两个变量 的变化方向相反。零相关:两上个变量值变化方向无一定规律。从密切程度来看,无论两个变量的变化方向是否一致,凡密切程度高的称为强相关,一笛膜的为中度相关,弱的为弱相关或低度相关。用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。r

第二节 积差相关:当两个变量都是连续变量,而且两者之间呈线性关系时,表示这两个变量之间相关。使用条件是:1、两个变量都是由测量获得的连续性数据。2、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称。3、必须是成对数据,而且每对数据之间相互独立。4、两个变量之间呈线性关系。5、要排除共变因素的影响。6、样本容量30≥n 。

积差相关系数:两个变量标准分数乘积之和除以n 所得之商。n

y y y x x x r ∑????

??-???

?

?-=

σσ 相关系数的等距转换及其合并:相关系数不可以直接相加求和,因为它不具有等距的单位。1、将各相关系数r 转换成Zr 2、求Zr 的平均数()()∑∑--=

33n Z n Z r

r

相关系数显著性检验的步骤及方法: 一、0:0=ρH 条件下,

1、50≥n r 的抽样分布接近于正态分布 0:0=ρH ρ≠0H 2

11

r n r Z --= 50≤n 2

12r

n r t --=

2、 0:ρρ=o H 条件下 将r 转换成Z r ()3--=n Z Z Z r ρ 二、两个相对独立的样本相关系数差异的显著性检验3

1

312121-+

--=

n n Z Z Z r r

第三节 等级相关:指以等级次序或以等级次序表示的变量之间的相关。主要包括斯皮尔曼二列相关及肯德尔和谐系数。

斯皮尔曼等级相关:当两个变量值以次序或以等级次序表示时,两个相应总体并不一定呈正态分布,样本容量也不一定大于30,表示这两变量之间的相关称为等级相关。虽然X 变量可视为正态连续变量,但Y 变量是按某种标准评定的等级,故

(

)

1

612

2

--

=∑n n D r R

1、赋预等级。

2、计算两个变量每对所赋予的等级数之差D ,及差数的平方之和,即∑2D 检验方法:2

12r

n r t --=

肯德尔和谐系数:当多个(两个以上)变量值以等级次序排列或以等级次序表示,描述这向个变量之间的一致性程度(即相关)的量。它常用来表示几个评定者对同一组学生学习成绩等级评定的一致性程度,或同一个评定者对同一组学生的学习成绩用等级先后评定多次之间的一致性程度。 无相同等级的情况:

()

n n K SS r R

w -=

3

212

1 ()∑∑

-=n R R SS R

2

2

2、有相同等级: ()

∑--=

T K n n K SS r R

w 3

212

1 ()∑-=12/3m m T

相关系数的显著性检验:()w r n K 12-=χ

第四节 质与量的相关:指一个变量为质,另一个变量为量,这两个变量之间的相关。主要包括二列相关、点二列相关、多系列相关。1、二列相关:当两个变量 都是正态连续变量,其中一个变量被人为地划分成二分变量。使用条件:1、两个变量都是连续变量,且总体呈正态分布,或接近正态分布,至少是单峰对称分布。2、两个变

量之间是线性关系。3、二分变量是人为划分的,其分界点应尽量靠近中值。4、样本容量应当大于80。 二列相关系数的计算:Y pq x x r t q p b σ-=

检验:n

pq

Y r

Z b 1=

2、点二列相关:当两个变量其中一个是正态连续变量,另一个是真正的二分名义变量,有时一个变量虽然并非真正的二分变量,而是双峰分布的变量。 点二列相关系数:pq x x r t

q

p pb σ-=

检验:2

12r

n r t --=

3、多系列相关:当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别(两类以上)的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关。

第五节 品质相关:两个变量都是按质划分成几种类别,数据一般是点计数据。根据两个变量的性质及所分类别的多少,分为四分相关,Φ相关及列联相关。 一、四分相关:当两个变量都是正态连续变量,且两者呈直线关系,但两者都被人

为地划分成二分变量。?????

?

?

+=bc ad

r t 1180cos 0

二、Φ相关:当两个变量都是二分变量,无论是真正的二分变量还是人为的二分变量,这两个变量之间的关系,可以用Φ相关来表示,比四分相关要广泛。

()()()()

d c d b c a b a bc

ab r ++++-=

φ

检验:22φχNr =

三、列联相关:当两个变量均被人为地分成两个以上类别,或其中一个变量被分成

两个以上类别。22χχ+=N c 先求出 ???

? ??-=∑102

c r n n f N χ 显著性检验:()()11--=c r df

第十二章 回归分析

相关表示两个变量之间的双向相互关系。回归表示一个变量随另一个变量 作不同程度变化的单向关系。由一个变量值估计、预测另一个变量值的准确性,随这两个变量之间的相关程度而变化。在存在相关的情况下,相关越高,由一个变量值预测另一个变量值越准确,误差越小。

第一节 一元线性回归指只有一个自变量的线性回归。

最小二乘方法求回归系数:在配制回归线时,回归系数(b )的确定原则是使散布图上各点距回归线上相应点的纵向距离平方和为最小,这种求b 的方法称为最小二乘方法。

求回归系数:由y 估计x :y

x xy r b σσ= 由x 估计y :x

y

yx

r

b σσ=

求截距:由x 估计y :x b y a yx yx -= 由y 估计x :y b x a xy xy -= 一元线性回归方程检验的方法:1、对回归方程进行方差分析。2、对两个变量的相关系数进行与总体零相关的显著性检验。3、对回归系数进行显著性检验。 检验步骤:1、提出假设:H 0:β=0 H 1:β≠0 2、计算检验统计量:2

12

r

n b t y x yx --=σσ由x 估计y

3、确定检验形式:

4、统计决断:

测定系数:∑

∑--=2

22

)()?(y y y y

r x 和y 两个变量相关系数和平方等于回归平方和在总平方

和中所占的比率。

第三节 一元线性回归议程的应用:回归方程主要是用来由自变量的值估计预测因变量的值。这里的估计预测包含两个方面,一方面是用样本的回归方程推算因变量的回归值y ;另一方面是根据样本的回归值y 估计预测因变量的真值y 。多元线性回

归是指有两个或两个以上自变量的线性回归。

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

小学音乐的创编是否有必要 1 问题的提出 音乐是儿童艺术活动的重要内容之一,它在想象力、创造力的培养上起着特殊的作用,因为音乐活动本身就需要丰富的想象及创造力,通过音乐不仅熏陶了幼儿的审美感,而且有助于幼儿创造力的开发和培养。而幼儿阶段是人的音乐智能和创造力发展的关键期。当代教育心理学的研究告诉我们,最有效地培养学生创造力的方式是要结合具体学科教学进行,在音乐课堂教学中正可以采用这样的方式锻炼学生的创造能力。虽然小学和教师都有一定意识,但是在实际教学中却因为各种原因没有有效的进行,忽视幼儿在活动过程中的情感体验,小学音乐创编很少进行,或者进行中只是形式化的按照教案依葫芦画瓢,教师没有扮演好自己的角色,也没有很好的调动幼儿的积极性和发散思维,不是正真意义上的音乐创编等等。 本研究将用问卷法,调查XXX市小学音乐创编环节教学的现状,期望能了解教师音乐创编的态度、能力,总结出XXX市音乐创编活动中存在的问题,通过调查和文献法总结教师音乐创编的策略,对音乐创编活动提出自己的建议。 2 研究意义 一、调查了解小学教师对音乐创编教学的目的和态度 二、调查教师经常采用的音乐创编方式总结幼儿创编兴趣和能力的年龄特点 三、调查了解音乐创编教学的小学支持及条件 四、调查现在音乐创编在实践中的不足 本研究的意义在于研究了解XXX市小学音乐创编环节教学现状,希望通过调查音乐创编教学存在的具体问题和不足,对改进音乐创编教学提供依据,通过总结小学音乐创编教学的策略,给予教师进行音乐创编教学的参考。 本研究主要采用的研究方法主要有文献法、问卷法。

用问卷法主要是调查广州市小学音乐创编环节教学的现状,期望能了解教师音乐创编的态度、能力,总结出广州市小学音乐创编活动中存在的问题,通过调查和文献法总结教师音乐创编的策略,对音乐创编活动提出自己的建议。 本研究采用SPSS11.5 for windows统计软件,将所得数据进行录入,整理及统计分析。本研究采用的统计方法有描述分析、t检验、相关分析、方差分析、回归分析。 3.4 研究对象及样本选择 本研究的目的在于调查广州市小学音乐创编环节教学的现状,因此,本研究的研究对象是在职的幼儿教师。本研究随机选取了五间小学进行问卷的发放,一共发出问卷150份,回收116 份,回收率为77.3%,其中有效问卷是113份,有效率为97.4% 。 3.研究方法与过程 本研究主要通过查阅文献资料了解关于幼儿音乐创编的相关研究,试图为本研究的开展找到理论的支撑点以及可借鉴的研究方法。在查阅大量文献的基础上,自编《小学音乐创编教学现状调查问卷》,并请有关专家对问卷进行评价,删除和修改语义模糊、表达不准确的题目,形成正式问卷。本问卷包括封闭式和开放式两种问题,以封闭式问题为主,问卷回收后,对数据进行了初步的分析,适当地剔除了个别题目,并对问卷进行修改,最后,在此基础上编成了最终问卷。 问卷的第一部分采用了Likert五点计分法,符合程度递增,依次是“完全不符合”、“基本符合”、“不表态”、“基本符合和完全符合”,五个选项分别赋予1、2、3、4、5分,数值越大表示符合的程度越高。如5代表题目的表述完全符合被试的实际情况。其中第3题,4题,14题为反向计分题。 本问卷分成以下部分构成:第一部分为被试基本资料的调查部分,用于了解幼儿教师所在的班级、幼儿教师的教龄和学历水平。 第二部分是问卷的主体部分,共有22道小题,主要有四个维度构成。第一个维度为教师素质,共有7道题目(2,6,8,10,11,15题),第二个维度为教师音乐创编的教学策略和方法(1,9,12,15,16,17,19题),第三个维度为幼

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量. (2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。(7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。(8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值. 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系.它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现.虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具. ③广大心理与教育工作者学习心理与教育统计学的具体意义. a.可经顺利阅读国内外先进的研究成果。

1. 解释相关系数时应注意什么? 相关系数的值表示两个变量之间的关联程度,但只说明其大概的趋势,不存在精确的数值关系。 相关系数的数值大小,表示两个变量关联的强弱。 相关系数即使是1,也不能推出因果关系的结论。 要能区分虚假相关,不能仅依据相关系数的大小确定变量的相关。 在纯理论研究中,即使有很小的相关,如果在统计上有显著性,也能说明心理规律。 2. 假设两变量为线性关系,计算下列各种相关应用什么方法? (1)积差相关(2)斯皮尔曼等级相关(3)二列相关 (4)多列相关(5)点二列相关(6)等级相关(斯皮尔曼或肯德尔和谐系数) 3.如何区别点二列和二列相关? 主要看是人为的划分还是自然划分,而为为二列相关,自然为点二列相关 4.品质相关有几种?各种品质相关的条件? 主要有四分相关、φ相关、列联表相关 四分相关:当两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型时, 求两个变量之间的相关。 Φ相关:当两变量是真正(自然)的二分变量时,求两变量之间的相关。 列联相关:当两个变量都是计数数据时,求它们的相关。 5. 用肯德尔和谐系数 6.将数据带入公式计算得: 解 7.此题的数据为非正态的等距数据,故用斯皮尔曼等级相关求相关系数 8.解此题符合点二列相关的条件 85=男X 91=女X 8.3=X S 成绩与性别有关,即男女生的成绩存在显著差异 9.此题该用二列相关求解 2.88=奇X 8.87=偶X 8.3=X S )(() 819 .022 22=∑ ∑∑ ∑ ∑∑∑---=Y Y N X X N Y X XY N r ()()794.011413=++??? ?????-?-=∑ n n n R R n r y x R ()()972.011413 =++??? ?????-?-=∑ n n n R R n r y x R 789.04/1*8 .385 91=-=-=pq S X X r x q P pb

练习3 1.按照数据的获得方式,找出下列数据中与其它不同类的数据。( ) A.72克 B.65分 C.10米 D.3台 2.测量数据10.000的下实限是:( ) A.10.999 B.9.999 C.9.9995 D.10.0005 3.欲从某重点中学720名高一学生中随机抽取120名调查其视力情况。首先按原有视力记录,将他们的视力情况分为上、中、下三等,各等人数分别为108人、360人、252人。若用分层按比例抽样法,则中等视力水平的学生中应抽取:( ) A.18人 B.60人 C.42人 D. 72人 4.某班期末考试,语文平均成绩为82分,标准差为6.5分;数学平均成绩为75分,标准差为5.9分;外语平均成绩为66分,标准差为8分,问哪一科成绩的离散程度大?( ) A.语文 B.数学 C.外语 D.无法比较5.假如某班成绩服从正态分布,在按优、良、中、及格、不及格评定学生成绩时,良等成绩z分数应取值在哪个区间?( ) A.-0.6--0.6 B.-1--1 C.0.6--1.8 D.0.5--2.5 6.在正态分布中,标准差反映了:( ) A.随机变量的波动性 B.正态曲线的对称位置 C.随机变量的平均水平 D.正态曲线的陡峭程度 7.下列数据1,26,11,9,14,13,7,17,22,2的中位数是:( ) A.14 B.13 C.17 D.12 8. 某校1970年的教育经费是10万元,2002年的教育经费是121万元,问该校2010 年的教育经费是多少?( ) A.225.63万元 B.278.32万元 C.321.56万元 D.210.00万元 9. 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下: 男性拥护66人,反对106人;女性拥护28人,反对158人,那么性别与评价态度的相关系数为( )

《教育与心理统计学》试题一、 选择题:绪论 1、教育统计学是社会科学中的一门(B),是数理统计学、教育学、心理学交叉学科。 A、数据统计 B、应用统计 C、测量统计 D、推断统计 2、教育统计学是对教育领域各种现象(A)的取值从总体上的把握和认识。 B、质 C、物 D、数 A、量 3、教育统计学的内容包括(D)。 A、数理统计 B、生物统计 C、试验设计 D、描述统计与推断统计。 4、计算统计特征量数,属于(A) A、描述统计 B、推断统计 D、实验设计 C、多元分析 5、列表归类属于(A)。 A、描述统计 B、推断统计 D、实验设计 C、多元分析 6、预测某地的教育规模,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 7、检验普通班与实验班的成绩有无显著差异,属于(B)。 B、推断统计 A、描述统计 C、多元分析 D、实验设计 8、通过抽查成绩来判断某校体育达标情况,属于(B)。 A、描述统计 B、推断统计 C、多元分析 D、实验设计。 9、预测某地教育规模,属于(B) A、描述统计 B、推断统计 C、教育统计 D、心理统计第一章常用的统计表与图 10、相对次数分布表与简单次数分布表各有不同的用途,如何使用它们?(C) A、单独使用 B、联合使用 C、既可单独使用又可联合使用 D、A,B,C,都不对 11、能很快地看出各组次数之间的相对大小及结构形态的图为(D)。 A、次数分布图 B、次数多边图 D、次数直方图 C、相对次数直方图 1 12、要求在横轴上最低组与最高组外各增加一个次数 f 为 0 的组的图为(A)。 A、次数多边图 B、次数分布图 D、相对次数直方图 C、次数直方图 13、适合于描述二元变量的观测数据的图为(B)。 A、线形图 B、散点图 C、圆形图 D、条形图 14、适合于描述离散性变量的统计事项的图为(D)。 B、圆形图 A、散点图 C、直方图 D、条形图 15、适合于描述具有百分比结构的分类数据的图为(A)。 A、圆形图 B、散点图 C、条形图 D、线形图用线段把相邻的点依次边接起来,边同横轴,构成一个闭合的多边 16、形,这是(B)。 A、条形图 B、次数多边图 C、次数直方图 D、线形图 17、有若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的、图形为(C)。 B、次数多边图 A、条形图 C、次数直方图 D、线形图 18、根据累积相对次数分布可绘制出(C)。 B、累积次数分布图 A、累积次数曲线图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积百分数分布可绘制出(D)。 19、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图根据累积次数分布可绘制出(B)。 20、 A、累积次数曲线图 B、累积次数分布图 C、累积相对次数曲线图 D、累积百分数曲线图 21、以起伏的折线来表示某种事物的发展变化及演变趋势的统计图是(B)。 B、线形图 A、散点图 C、条形图 D、直方图 22、用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系的图形为(A)。 A、散点图 B、线形图 C、条形图 D、直方图 23、用宽度相同的长条来表示各个统计事项之间的数量关系的图形是(C)。 A、散点图 B、线形图 C、条形图 D、直方图 24、适用于描述某种事物在时间序列上的变化趋势的图形(B)。 B、线形图 A、散点图 2 C、条形图 D、直方图第二章常用的统计参数 25、使用最普遍的一个集中量数是(A)。 A、算术平均数 B、中位数 C、加权平均数 D、众数 26、

一二章、绪论 现代统计学之父:皮尔逊 描述统计与推断统计 描述统计主要研究如何整理、描述数据的特征。 推断统计主要研究如何通过局部数据所提供的信息推论总体特征。 变量类型 定类变量:如,性别、学号、颜色类别、教学方法。 特征:没有绝对零点,没有测量单位。变量值之间有“相等”和“不等”的关系,但没有大小之分,不能比较大小,更不能进行加、减、乘、除四则运算。 定序变量:程度、等级和水平。如,比赛名次、品质等级、喜爱程度 特征:既无零点、又无测量单位。变量的值之间具有“等于”或“不等于”关系、序关系(优于、先于、劣于、后于等),四则运算没有意义。 定比变量:除了可以说出名称和排出大小,还能算出差异大小量的变量。 如温度、测验成绩、智商。 特征:有相等的测量单位,无绝对零点。考试成绩为零不表示没有一点知识。可进行加减运算,乘除运算则无意义。 定距变量:如身高、重量、学生人数。既有测量单位,又有绝对零点,可进行计算。 降低偏差:利用随机抽样 降低变异性:用大一点的样本 三、描述统计 一、频数:某一事件在某一类别中出现的次数。 频数分布类型:正态,正(负)偏态,正(反)J 形,U 形分布。 分布性质;集中(分散)程度,偏度和峰度不同。 偏态系数:数据的对称性 峰态系数:数据的峰度 二、集中量数: 包括算术平均数M 、中位数d M 、众数0M (用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便)、加权平均数W M 、几何平均数g M 、调和平均数H M 。 组数据中有少数数据偏大或偏小,数据的分布呈偏态时,应用几何平均数。 算数平均数的性质(算法必须会):

统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。

相关主题
文本预览
相关文档 最新文档