当前位置:文档之家› 统计复习纲要

统计复习纲要

统计复习纲要
统计复习纲要

第一章心理与教育统计学基础知识

1、数据类型

称名数据

计数数据离散型数据

顺序数据

等距数据

测量数据连续型数据

比率数据

2、变量、随机变量、观测值

变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。

用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。

随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。3、总体、个体和样本

需要研究的同质对象的全体,称为总体。

每一个具体研究对象,称为一个个体。

从总体中抽出的用以推测总体的部分对象的集合称为样本。

样本中包含的个体数,称为样本的容量n。

一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

5、统计误差

误差是测得值与真值之间的差值。

测得值=真值+误差

统计误差归纳起来可分为两类:测量误差与抽样误差。

由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。

由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差

第二章统计图表

一、数据的整理

在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。

二、次数分布表

(一)简单次(频)数分布表

(二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表

(三)累加次数分布表 (四)双列次数分布表

双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。

所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图

使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。

简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图

次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。

绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表

条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。

圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。

散点图是用相同大小圆点的多少或梳密表示统计资料量大小以及变化趋势的图。

第三章 集中量数

集中量数用来表现数据资料的典型水平或集中趋势。

常用的集中量包括算术平均数、加权平均数、中位数和众数等等。 一、算术平均数

算术平均数一般简称为平均数(average )或均数、均值(mean )。 一般用M,或者用 表示。 算术平均数是最常用的集中量 (一)算术平均数的计算公式

%100 N f X

(二)算术平均数的意义

算术平均数是应用最普遍的一种集中量。它是“真值”(true score )的最佳估计值。

真值是反映某种现象的真实水平的分数。由于测量过程中的各种偶然因素的影响,真值往往很难得到。

在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。

(三)算术平均数的优缺点

优点:反应灵敏、有公式严密确定、简明易懂、适合代数运算

缺点:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。 (四)计算和应用算术平均数的原则

同质性原则:算术平均数只能用于表示同类数据的集中趋势。

平均数与个体数值相结合的原则:在解释个体特征时,既要看平均数,也要结合个体的数据。

平均数与标准差、方差相结合原则:描述一组数据时既要分析其集中趋势,也要分析离散程度。 二、中位数

中位数(median )又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。一般用Md 或Mdn 表示 (一)中位数的计算方法 1、原始数据计算法

一组数据中无重复数值的情况 首先将一组数据按顺序排列

; 2、次数分布表计算法

公式中:Lb 为中位数所在组的精确下限

fb 为中位数所在组下限以下的累积频数 n 为数据总和

fMd 为中位数所在组的频数 i 为组距

(二)中位数的特点及应用

中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数也比较容易。中位数不受两端极端数据的影响,但反应不灵敏,也不适合进一步代数运算的要求。一般用于下列情况:

1、一组数据中有极端数据时;

2、一组数据中有个别数据不确切、不清楚时;

i

n

i n X n n X X X X ∑=∑=+++=1211 X n X ∑=1个数为第则为奇数若21,+n Md n 2,1

22++=

n n X X Md n 则为偶数若Md b b f i f n L Md ??? ??-+=2

3、资料属于等级性质时。 三.众数

众数(mode )用Mo 表示,有两种定义:

理论众数是指与频数分布曲线最高点相对应的横坐标上的一点; 粗略众数是一组数据中出现次数最多的那个数。

众数也是一种集中量,也可用来表示一组数据的集中趋势。 众数的计算方法(观察法寻找粗略众数 ) 未分组数据中出现次数最多的数即为众数。

次数分布表中,频数最多那一组数据的组中值,即为众数。 四、算术平均数、中位数、众数三者的关系

在正态分布中: 在正偏态分布中: 在负偏态分布中: 五、其它集中量数 (一)加权平均数

加权平均数是不同比重数据(或平均数)的平均数,一般用 表示。其计算公式有两种:

(二)几何平均数

几何平均数是n 个数值连乘积的n 次方根,用

或 表示。计算公式为:

当数据的分布呈偏态时,可用几何平均数表示该组数据的集中趋势。 几何平均数的变式 两边取对数,得

注意:几何平均数计算的是平均的变化情况,如果要计算平均增长率,需要从几何平均数中减去基数1。

几何平均数的应用:

1.直接应用基本公式计算几何平均数

有少数极端数据,数据呈偏态分布;心理物理学中的等距与等比量表实验中.(例[3-8]P72)

2.应用几何平均数的变式计算

按一定比例变化的一列数据,一般用来求平均变化率如平均增长率. 例[3-9][3-10][3-11]P73 (三)调和平均数

调和平均数,用符号MH 表示.也叫倒数平均数.公式为: 调和平均数的应用 学习速度方面的问题.调和平均数在描述速度方面的集中趋势时,优于其他

O M Md X ==O M Md X >>O M Md X <

i w n X n X ∑?∑=g M g X n n g X X X M ????=2111

1123

12---=????=n n n n n g X X X X X X X X M ()1lg lg 1

1lg X X n M n g --=

∑=

i

H

X

N

M

集中量

在有关研究学习速度的实验设计中,反应指标一般常取两种形式;

1、工作量固定,记录各被试完成相同工作所用的时间.例[3-13][3-14]P76

2、学习时间一定,记录一定时间内各被试完成的工作量,例[3-15]

第四章 差异量数

? 描述数据离散程度的统计量称为差异量。差异量越大,表明数据越分散、不集中;差异量越小,表明数据越集中,变动范围越小。

? 一组数据的离散程度,常常通过数据的离中趋势特点进行分析。 一、全距、四分位距和百分位距 (一)全距 R (range )

全距是一组数据中的最大值与该组数据中最小值之差,又称极差。 R =Xmax -Xmin

(二)百分位差(百分位距)

百分位差是指两个百分位数之差。 常用的百分位距有两种:

用几个百分位距能较好地反映一组数据的差异程度。

对于任何一组观察值,只要任意指定一个位置,就可以求出这个位置的数应该是多少;----百分位数

相反,如果给出一个数,也可以求出它应该在哪个位置.---百分等级 百分位数--频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。

百分等级分数--频数分布中低于特定原始分数的频数百分比。 (三)四分位距

四分位距是第一个四分位数与第三个四分位数之差的一半,计算公式为

(四)平均差

平均差是指一组数据中,每一个数据与该组数据的平均数离差的绝对值的算术平均数,通常用AD 或MD 表示。

原始数据计算公式

(五)方差和标准差

方差(又称为变异数、均方)。是表示一组数据离散程度的统计指标。一般样本的方差用 表示,总体的方差用 表示。 标准差是方差的算术平方根。一般样本的标准差用 S 表示,总体的标准差

用 表示。

标准差和方差是描述数据离散程度的最常用的差异量。 1、样本方差及标准差定义公式

2、总体方差及标准差的定义公式 2

13Q Q Q -=n X

X AD -∑=()n

X X S 22-∑=

()n X

X S 2

-∑=()X 22

μσ-∑=()X 2

μσ-∑=

2S 2

σσ

是总体σ的无偏估计

3、原始数据的方差与标准差计算

4、总标准差的合成

方差具有可加性的特点。当已知几个小组数据的方差或标准差时,可以计算几个小组联合在一起的总的方差或标准差。

需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。

计算公式

公式中: 为总方差

, 为总标准差 Si 为各小组标准差

ni 为各小组数据个数

5、方差和标准差的性质

方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。 标准差是一组数据方差的算术平方根,它不可以进行代数计算,但有以下特性:

如果 则 如果 则 6、方差和标准差的意义

方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。

标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。

应用方差和标准差表示一组数据的离散程度,须注意必须是同一类数据(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。 7、标准差的应用/——差异系数

差异系数是指标准差与其算术平均数的百分比,它是没有单位的相对数。常以CV 表示,其计算公式为 :

差异系数的作用: 比较不同单位资料的差异程度

比较单位相同而平均数相差较大的两组资料的差异程度 可判断特殊差异情况

()

12

--∑=

n X X S 222

?

?

? ??∑-∑=n X n X S 2

2??? ??∑-∑=n X n X S ()i

i T i i i T

n X X n S n S ∑-∑+?∑=222()

i i T i i i T n X X n S n S ∑-∑+?∑=222T S T S i T i X X d -=C X Y +=X Y S S =X C Y ?=X

Y S C S ?=%

100?=X

S CV

8、标准差的应用——标准分数

又称基分数或Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。

离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。

标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

(1)标准分数的计算公式及其性质 ①没有实际单位; ②可正可负,可为零;

③一组原始数据中,各个Z 分数的标准差为1;

④正态分布的原始数据,转换得到的Z 分数是标准的正态分布(0,1)。 (2)Z 分数的作用

Z分数可以表明原始分数在团体中的相对位置,因此称为相对位置量数。 把原始分数转换成Z分数,就把单位不等距的和缺乏明确参照点的分数转换成以标准差为单位、以平均数为参照点的分数。 (3)标准分数的优点

● 可比性:标准分数以团体的平均数为基准,以标准差为单位,因而具有可比性。 ● 可加性:标准分数使不同的原始分数具有相同的参照点,因而具有可加性。 ● 明确性:标准分数较原始分数的意义更为明确。 ● 合理性:标准分数保证了不同性质的分数在总分数中的权重相同,使分数更合理地 反映事实。

第五章 相关分析 一、相关概述 (一)相关的概念

两个变量之间不精确、不稳定的变化关系,称为相关关系。

两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。 两个变量之间的变化方向有:

? 正相关:两个变量的变化方向相同。 ? 负相关:两个变量的变化方向相反。

? 零相关:两个变量的变化方向无一定规律。

从关系密切程度来看,两个变量的变化程度可大致分为 ? 完全相关:两个变量的变化程度完全一致。 ? 强相关:两个变量变化的一致性比较强。 ? 中等相关:两个变量变化的一致程度中等。 ? 弱相关:两个变量变化的一致性比较差。 ? 完全不相关:两个变量变化程度没有一致性。 (二)相关系数

用来描述两个变量相互之间变化方向及密切程度的统计指标称为相关系数,一般样本的相关系数用r 表示,总体的相关系数用ρ表示。

s

X

X Z -=

?相关系数的取值: -1≤ r ≤+1

?0≤∣r∣≤1

?相关系数的符号:“+”表示正相关,“-”表示负相关。

相关系数的性质

相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、乘、除运算。

二、积差相关

(一)积差相关及其适用条件

积差相关是英国统计学家皮尔逊于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积积相关。

积差相关适用于:

1、两个变量都是连续数据;两变量总体都为正态分布;两变量之间为线性关系。

2、成对数据,样本容量要大。

积差相关条件的判断方法:

连续变量:根据得到数据的方式判断,测量数据。

正态分布:一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。

线性关系:根据相关散布图可判断两个变量之间是否线性关系。

(二)相关系数的等距转换及其合并

相关系数不是等距数据,更不是比率数据,它只能比较相对大小,不能进行加减乘除运算。但我们常会遇到需要将取自同一总体的几个样本的相关系数合成、求平均的相关系数这一问题。这时,可以先将相关系数r转换成具有等距单位的Zr值。

三、斯皮尔曼等级相关

等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。

主要包括斯皮尔曼二列等级相关和肯德尔和谐系数多列等级相关。

(一)斯皮尔曼等级相关的概念及适用条件

斯皮尔曼等级相关是等级相关的一种。它适用于两个以等级次序表示的变量,并不要求两个变量总体呈正态分布,也不要求样本的容量必须大于30。

当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。

四、肯德尔和谐系数

?肯德尔等级相关方法有许多种,肯德尔和谐系数是其中一种。

?肯德尔和谐系数常以rW表示,适用于多列等级变量的资料。

?肯德尔和谐系数可以反映多个等级变量变化的一致性。

肯德尔U系数与W系数的适用资料相同。

五、质与量的相关

(一)点二列相关

适用条件

一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变

量之间的相关,称为点二列相关。

有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。

多用于评价是非类测验题目组成的测验内部一致性。 (二)二列相关

两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关。

将连续变量人为划分为二分变量时,应注意尽量使分界点接近平均数。 教育或心理测验中问答题的区分度指标。

六、品质相关

两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。

品质相关处理的一般是计数数据而不是连续数据,变量划分为不同的品质类别,主要用于双向表或称为列联表(R ×C 表)。

品质相关的方法有多种,最常用的是四分相关、Φ相关和列联表相关。

第六章 概率分布

一、概率的定义 (一)基本概念

概率(probability ):表明随机事件可能性大小的客观指标。 概率的两种定义:后验概率和先验概率。 后验概率(或统计概率)

随机事件的频率:

当n 无限增大时,随机事件A 的频率会稳定在一个常数P ,这个常数就是随机事件A 的概率。

先验概率(古典概率)

古典概率模型要求满足两个条件:

⑴ 试验的所有可能结果是有限的; ⑵ 每一种可能结果出现的可能性相等。 (二)概率的公理系统

1.任何随机事件A的概率都是在0与1之间的正数,即 0 ≤ P (A )≤1

2.不可能事件的概率等于零,即 P (A )= 0 3.必然事件的概率等于1,即 P (A )= 1 (三)概率分布类型

概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。

依不同的标准,对概率分布可作不同的分类。 1、离散型分布与连续型分布

依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正

n m W A =)(n

m

P A =)

(

态分布。

2、经验分布与理论分布

依分布函数的来源,可将概率分布分为经验分布与理论分布。

? 经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。

? 理论分布是按某种数学模型计算出的概率分布。 3、基本随机变量分布与抽样分布

依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。

? 基本随机变量分布是随机变量各种不同取值情况的概率分布,抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。

二、概率分布——正态分布 (一)正态分布特征

正态分布也称为常态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。 1.正态分布曲线函数

正态分布曲线函数又称概率密度函数,其一般公式为:

公式所描述的正态曲线,由σ和μ两个参数决定。 2、正态分布的性质

? 正态分布是以

为中心的对称分配。 ? 正态分布有 2 个参数: m (平均数)以及 s (标准差) ,其决定了分配的位置及形状。

? 正态分布曲线下面的面积总和等于1。

? 正态分布 在 时有一转折点。 ? 正态分布曲线的两尾无限延伸。

? 正态分布是一族曲线,标准正态分布是一条曲线。 3、标准正态分布曲线

将标准分数代入正态曲线函数,并且,令σ=1,则公式变换为标准正态分布函数:

标准正态分布曲线的特点

⑴.曲线在Z=0处达到最高点

⑵.曲线以Z=0处为中心,双侧对称

⑶.曲线从最高点向左右缓慢下降,向两侧无限延伸,但永不与基线相交。 ⑷.标准正态分布曲线的平均数为0,标准差为1。从Z=-3至Z=+3之间几乎分布着全部数据。

⑸.曲线的拐点为正负一个标准差处。

()2

2

22σ

μπσ--?=X e N Y μ)

(x f σμ±=X ()22

221σμπσ--

?=X e Y 2221

Z e Y -?=π

4、正态分布表的使用 已知Z 值求概率

⑴.求Z=0至某一Z值之间的概率:直接查表 ⑵.求两个Z值之间的概率

? 两Z值符号相同:PZ1-Z2=PZ2-PZ1 ? 两Z值符号相反:PZ1-Z2=PZ2+PZ1 ⑶.求某一Z 值以上的概率

? Z >0时,PZ -∞=0.5-PZ ? Z <0时,PZ -∞=0.5+PZ ⑷.求某一Z 值以下的概率

? Z >0时,P -∞-Z =0.5+PZ ? Z <0时,P -∞-Z =0.5-PZ 已知面积(概率)求Z 值

⑴.求Z =0以上或以下某一面积对应的Z 值:直接查表

⑵.求与正态曲线上端或下端某一面积P 相对应的Z 值:先用0.5-PZ ,再查表 ⑶.求与正态曲线下中央部位某一面积相对应的Z 值:先计算P /2,再查表

已知概率P或Z 值,求概率密度Y

⑴.直接查正态分布表就能得到相应的概率密度Y值。

⑵.如果由概率P求Y值,要注意区分已知概率是位于正态曲线的中间部分,还是两尾端部分,才能通过查表求得正确的概率密度。 三、概率分布——二项分布 (一)二项试验与二项分布

二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。 1.二项试验

满足以下条件的试验称为二项试验:

? 一次试验只有两种可能的结果,即成功和失败; ? 共有n 次试验,并且n 是预先给定的任一正整数; ? 各次试验相互独立,即各次试验之间互不影响; ? 各次试验中成功的概率相等,失败的概率也相等。 2.二项分布函数

? 二项分布是一种离散型随机变量的概率分布。

? 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X =0,1…)的概率分布,叫做二项分布函数。 二项展开式的通式(即二项分布函数):

3、二项分布的平均数和标准差

? 如果二项分布满足p >q 且 nq ≥5(或者p <q 且 np ≥5时,二项分布接近于正态分布。可用下面的方法计算二项分布的平均数和标准差。

? 二项分布的平均数为: ? 二项分布的标准差为:

4、二项分布的应用

X n X X n q p C p n x b -??=),,(np =μnpq =σ

二项分布函数除了用来求成功事件恰好出现X 次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。 四、概率分布——样本分布 (一)、抽样分布

区分三种不同性质的分布:

? 总体分布:总体内个体数值的频数分布 ? 样本分布:样本内个体数值的频数分布 ? 抽样分布:某一种统计量的概率分布 1. 抽样分布的概念

抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。 抽样分布是一个理论的概率分布,是统计推断的依据。 2.平均数抽样分布的几个定理

⑴.从总体中随机抽出容量为n 的一切可能样本的平均数之平均数等于总体的平均数。

⑵.容量为n 的平均数在抽样分布上的标准差(即平均数的标准误),等于总体标准差除以n 的平方根。

⑶.从正态总体中,随机抽取的容量为n 的一切可能样本平均数的分布也呈正态分布。

⑷.虽然总体不呈正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。 (二)标准误

某种统计量在抽样分布上的标准差,称为标准误。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。

平均数标准误的计算

1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

平均数的标准误为:

2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本

平均数标准误的估计值为:

(三)平均数离差统计量的分布

1.总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

平均数离差的的抽样分布呈正态分布

正态总体,样本平均数的抽样分布 μ

=)(E n X σσ=n X σσ=1-=

n S σn

X X Z X

σμσμ-=-=μμ=X n

X 22σσ=

2.总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本

平均数离差的的抽样分布呈t 分布 t 分布的特点

⑴.形状与正态分布曲线相似

⑵.t 分布曲线随自由度不同而有一簇曲线

⑶.自由度的计算:自由度是指能够独立变化的数据个数。

⑷.查t 分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。

3.总体σ未知,大样本时的近似处理

样本容量增大后,平均数的抽样分布接近于正态分布,可用正态分布近似处理:

第七章 参数估计

一、点估计、区间估计与标准误 (一)总体参数估计的基本原理

? 根据样本统计量对相应总体参数所作的估计叫作总体参数估计。 ? 总体参数估计分为点估计和区间估计。

? 由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。 (二)点估计

1、良好的点估计量应具备的条件 ? 无偏性

如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。 ? 有效性

当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。 ? 一致性

当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。 ? 充分性

一个容量为n 的样本统计量,应能充分地反映全部n 个数据所反映的总体的信息。 2、点估计量的缺点

有偏差

1

--=

-=n S X X t μ

σμn

S X X Z μσμ-=-='

没有提供正确估计的概率,即不能提供估计值与参数真值的接近程度和可靠程度

(三)区间估计

区间估计可以解决这个问题。区间估计得出的不是一个单一数值,而是一个数值区间。它既可以告诉我们参数的真值在什么范围内,又能告诉我们参数的真值落在这个范围的概率有多大。

区间估计的基础——抽样分布

?根据抽样分布的特点及原理,不同总体条件下,可能会有不同的抽样分布,则可得到不同条件下总体参数的区间估计的计算方法。

?区间估计涉及和置信区间和显著性水平。

1、区间估计

以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。

对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。

?⑴要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;

?⑵要求出该种统计量的标准误;

?⑶要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。

置信区间

?置信度,即置信概率,是作出某种推断时正确的可能性(概率)。

?置信区间,也称置信间距是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。

显著性水平

?对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。

P=1-α

2、平均数区间估计的基本原理

通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n>30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。

根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。

三、总体平均数的估计

(一)总体平均数的区间估计

1.总体平均数区间估计的基本步骤

①.根据样本的数据,计算样本的平均数和标准差;

②.计算平均数抽样分布的标准误;

③.确定置信概率或显著性水平;

④.根据样本平均数的抽样分布确定查何种统计表;

⑤.计算置信区间;

⑥.解释总体平均数的置信区间。 2.平均数区间估计的计算

①总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本

样本平均数的分布呈正态,平均数的置信区间为:

②总体正态,σ未知(不管样本容量大小),或总体非正态,σ未知,大样本

样本平均数的分布为t 分布,平均数的置信区间为:

③总体正态,σ未知,大样本

平均数的抽样分布接近于正态分布,用正态分布代替t 分布近似处理:

④ 总体非正态,小样本

不能进行参数估计,即不能根据样本分布对总体平均数进行估计。

第八章 假设检验

一、假设检验的原理 (一)、假设检验的基本原理

利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。 1、假设

假设检验一般有两互相对立的假设。

? H0:零假设,或称原假设、虚无假设、解消假设;是要检验的对象之间没有差异的假设。

? H1:备择假设,或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。

进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。 2、小概率事件

样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。

当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。 3、显著性水平

n Z X n Z X σ

μσαα?+<

2()()112

2-?+<<-?-n S

t X n S t X df df ααμn S

Z X n S Z X ?+<

αμ

?统计学中把拒绝零假设的概率称为显著性水平,用α表示。

?显著性水平也是进行统计推断时,可能犯错误的概率。

?常用的显著性水平有两个:α=0.05 和α=0.01。

4.假设检验中的两类错误及其控制

对于总体参数的假设检验,有可能犯两种类型的错误,即α错误和β错误。

(1)两类错误既有联系又有区别

α错误只在否定H0时发生

β错误只在接受H0时发生

α错误增加β错误减小

β错误增加α错误减小

(2)n , σ2 可使两类错误的概率都减小.

?为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对α错误进行控制,如α=0.05或α=0.01。

?对β错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使β误差得到控制。

在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,α被分散在概率分布曲线的两端,因此称为双侧检验。

双侧检验的假设形式为:H0:μ=μ0, H1:μ≠μ0

凡是检验大于或小于某一特定条件的假设检验,α是在概率分布曲线的一端,因此称为单侧检验。

单侧检验的假设形式为:

H0:μ≥μ0,H1:μ<μ0

或者 H0:μ≤μ0,H1:μ>μ0

5.假设检验的基本步骤

一个完整的假设检验过程,一般经过四个主要步骤:

⑴.提出假设

⑵.选择检验统计量并计算统计量的值

⑶.确定显著性水平

⑷.做出统计结论

二、平均数的显著性检验

(一)总体平均数的显著性检验

总体平均数的显著性检验是指对样本平均数与总体平均数之间的差异进行的显著性检验。若检验的结果差异显著,可以认为该样本不是来自当前的总体,

而来自另一个、与当前总体存在显著差异的总体。即,该样本与当前的总体不一致。

1.总体平均数显著性检验的原理

检验的思路是:假定研究样本是从平均数为μ的总体随机抽取的,而目标总体的平均数为μ0,检验μ与μ0之间是否存在差异。如果差异显著,可以认为研究样本的总体不是平均数为μ0的总体,也就是说,研究样本不是来自平均数为μ0的总体。

2.总体平均数显著性检验的步骤

一个完整的假设检验过程,一般经过四个主要步骤: ⑴.提出假设

⑵.选择检验统计量并计算统计量的值 ⑶.确定显著性水平 ⑷.做出统计结论 ⑴.提出假设

? 双侧检验的假设形式为:

H0:μ=μ0, H1:μ≠μ0 ? 单侧检验的假设形式为:

H0:μ≥μ0,H1:μ<μ0 (左侧检验) 或者 H0:μ≤μ0,H1:μ>μ0 (右侧检验) ⑵.选择检验统计量并计算结果

直接应用原始数据检验假设是有困难的,必须借助于根据样本构造出来的统计量,而且针对不同的条件,需要选择不同的检验统计量。 ⑶.确定显著性水平

在假设检验中有可能会犯错误。如果零假设是正确的,却把它当成错误的加以拒绝,就会犯α错误。 α表示做出统计结论时犯错误的概率,称为显著性水平。

显著性水平一般为0.05和0.01。 ⑷.做出统计结论

根据已确定的显著性水平,查统计量的分布表,找到该显著性水平时统计量的临界值,并以计算得到的统计量值与查表得到的临界值比较,根据统计决断规则做出拒绝或接受零假设的决定。 3.平均数显著性检验的几种情形 ⑴.总体为正态,总体标准差σ已知

平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:

例1:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?

解:H0:μ=μ0, H1:μ≠μ0

学生汉语拼音成绩可以假定是从正态总体中抽出的随机样本。总体标准差已

n X X Z X

σμσμ0

0-=

-=

知,样本统计量的抽样分布服从正态,以Z 为检验统计量

显著性水平为α=0.05,双侧检验

查表得Z α=1.96,而计算得到的Z=1.09 |Z|<Zα,则概率P >0.05

差异不显著,应在0.05显著性水平接受零假设

结论:该校应届毕业生与历届毕业生汉语拼音测验成绩一致,没有显著差异。

⑵.总体为正态,总体标准差σ未知,样本容量小于30

平均数的抽样分布服从t 分布,以t 为检验统计量,计算公式为: 例3:某区初三英语统一测验平均分数为65,该区某校20份试卷的平均分数为69.8,标准差为9.234。问该校初三年级英语平均分数与全区是否一样?

⑶.总体标准差σ未知,样本容量大于30

平均数的抽样分布服从t 分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z 代替t 近似处理,计算公式为:

⑷.总体非正态,小样本

不能对总体平均数进行显著性检验。

n X Z σμ0-=187.116669-=09.1=1

0--=-=n S X X t X μσμ1-=n df n S X X Z 0

0μσμ-=

-='

三、平均数差异的显著性检验

平均数差异显著性检验的统计量及计算公式 (一)两总体正态,两总体方差已知

总体方差已知条件下,平均数之差的抽样分布服从正态分布,以Z作为检验统计量,计算公式为:

1.两样本独立

2.两样本相关

两样本相关的判断:两个样本的数据之间存在着一一对应的关系时,称两样本为相关样本。常见的情形主要包括三种:一是同一组被试在前后两次在同一类测验上的结果;二是同一组被试分别接受两种不同实验的测验结果;三是按条件相同的原则选择的配对实验结果。

例1:某幼儿园在儿童入园时对49名儿童进行了比奈智力测验(σ=16),结果平均智商为106。一年后再对同组被试施测,结果平均智商分数为110。已知两次测验结果的相关系数为r=0.74,问能否说随着年龄的增长和一年的教育,儿童智商有了显著提高?

解:H0:μ1≤μ2 H1: μ1>μ2

正常儿童的智力测验结果,可以认为是从正态总体中随机抽出的样本。总体标准差已知,而同一组被试前后两次的测验成绩,属于相关样本。因此平均数之差的抽样分布服从正态分布,应选用Z作检验统计量,并选择相关样本、总体标准差已知的计算公式。

提示:σ1=σ2=16 显著性水平为α=0.05

单侧检验时Z0.05=1.65,Z0.01=2.33 而计算得到的Z=1.71﹡

Z0.05 <|Z|<Z0.01,则概率 0.05>P >0.01 差异显著,应在0.05显著性水平接受零假设

结论:可以说随着年龄的增长和一年的教育,儿童智商有了显著提高。

D S

E X X Z 21

-=22

21212

1n n X X Z σσ+

-=

n r X X Z 212

2212

12σσσσ??-+-=

n r X X Z 2

122212

12σσσσ???-+-=49161674.02161611010622???-+-=34.2=

(二)两总体正态,两总体方差未知

总体方差未知条件下,平均数之差的抽样分布服从t 分布,以t 作为检验统计量,计算公式为: 1.两样本独立,两总体方差一致

方差齐性检验

方差齐性检验是对两总体方差是否齐性(即是否一致或是否存在显著性差异)进行的检验。

方差齐性检验的统计量是F,其概率分布遵循F分布。

若从方差相同的两个正态总体中,随机抽取两个独立样本,以此为基础,分别求出两个相应总体方差的估计值,这两个总体方差的估计值的比值称为F 比值,其计算公式为 实际应用中,常需以样本方差估计总体方差,因此公式为 当两样本容量相差不大时,上式可简化为

2、两样本独立,两总体方差不齐性

对于方差不齐性的独立样本,平均数差异的显著性可能由两方面的原因造成:一是两平均数确实存在显著差异;二是两总体方差之间存在显著差异。

当两总体的方差之间差异显著时,运用一般的t 检验不准确,需要进行特别的检验。

总体方差不齐性的两个独立样本平均数之差的标准误,可用两个样本方差分别估计出的两个平均数标准误平方之和再开方来表示。

这时样本平均数之差与相应总体平均数之差的离差统计量,既不是Z 分布,也不是t 分布,而是与t 分布相近似的t ′分布。

这种检验方法被称为柯克兰—柯克斯t 检验,其统计量的计算公式为

t ′临界值的计算公式

3.总体方差未知,独立样本和相关样本

(三)两总体非正态,n1和n2大于30(或50)

总体标准差未知条件下,平均数之差的抽样分布服从t 分布,但样本容量较

X

D

SE X X t 2

1-=

2

121212222112

12n n n n n n S n S n X X t ?+?-+?+?-=

221-+=n n df 2

2

2

1σσ=F ()()1/1/22221211--=n S n n S n F 22

2

1S S

F

=1122

21212

1-+--='n S n S X X t ()()222

22

12211df X df X SE SE t SE t SE t +?+?='ααα

111-=n df 122-=n df

统计学复习提纲

旅游统计学复习提纲 考试题型 一、单项选择题(每小题1分,共10分) 二、多项选择题(每小题2分,共10分) 三、名词解释(每小题4分,共20分) 四、简答题(每小题6分,共30分) 五、计算题(每小题15分,共30分) 第一章绪论 第一节统计的概念及其产生和发展 一、“统计”的概念(三种涵义,两重关系) 1、统计工作:资料收集、整理和分析研究等活动。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计的科学定义: 它是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。 第三节旅游统计的基本方法 二、旅游统计的基本环节 (一)统计调查 有组织、有计划地搜集资料。要求:准确、完整、及时。 (二)统计整理 对调查资料去伪存真、去粗取精、科学分类、浓缩简化。 (三)统计分析 运用各种统计方法,揭示被研究对象的发展变化趋势和规律性,作出科学结论。包括描述性分析、推断分析、决策分析。要求:定性定量结合。 第四节旅游统中的几个基本概念 一、统计总体和总体单位 ①统计总体:统计研究所确定的客观对象,是具有共同性质的许多单位组成的整体。 ②总体单位:组成总体的各个单位(或元素),是各项统计数字的原始承担者。 二、标志与指标 ①标志:说明总体单位属性、特征的名称,标志值是标志的具体表现。 ②指标:综合反映总体数量特征的概念和数值,由指标名称和指标数值组成。

三、变异和变量 ①变异:总体各单位的标志表现存在一定的差异,是统计存在的前提。分 为品质变异和数量变异。 ②变量:可变的数量标志和统计指标。分为⑴确定性变量和随机性变 量、 ⑵离散性变量和连续性变 量。 第二章统计调查 第一节统计调查的意义 一、统计调查的概念和意义 ㈠概念:统计调查是根据统计目的,取得相应数据的统计资料搜集活动。 ㈡意义:①是统计工作的开始阶段;②是统计整理和统计分析的前提; ③统计调查在整个统计工作中,担负着提供基础资料的任务,是一切 统计资料的来源。 二、统计调查的任务和要求 ⑴基本任务:根据统计指标体系,通过每一项的具体调查,取得反映社 会经济总体现象及各个部分间相互关系的原始统计资料 ⑵基本要求:准确性、及时性、全面性、系统性(前三个是衡量统计调查 工作质量的重要标志) 第二节统计调查的基本方法 ★统计调查的基本方法有哪些? 答:直接观察法、报告法、采访法、问卷法、通讯调查法、特尔菲法(专家调查法)、 集中意见法 第三节统计调查方案 第四节几种专门调查 第三章统计资料的整理与分析 第二节资料的整理 一.资料整理的概念 资料整理是指对统计调查所搜集到的数据进行分类和汇总,使其系统化、条理化、科学化,以得出反映事物总体综合特征的资料的工作过

《统计学基础(第2版)》教学大纲

《统计学基础》课程教学大纲 适用专业工商企业管理、市场营销、金融保险、电子商务课程类型职业基础课学分数3 学时数48 第一部分总纲 一、课程性质、教学目的 1.课程性质 统计学基础是为经济与管理学科各专业学生开设的一门必修的重要的专业基础课,也是经济管理工作者和经济研究人员所必备的一门知识。它研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律,也是进一步学习其他相关学科的基础。 2.教学目的通过教学,培养学生系统地掌握统计工作的基础理论、主要方法和基本技能;以社会经济统计工作的一般原理和原则为主,密切联系实际,培养学生获取信息的能力以及分析问题和解决问题的能力,为从事各项经济工作、财会工作和管理工作奠定分析研究的基础。 3.前导课程与后续课程 该课程的开出一般在经济数学、经济学基础之后。

二、推荐教材及主要参考资料 1. 宋粉鲜,陈世文.《统计学基础》,现代教育出版社,2012年1月。 2. 宋粉鲜,陈世文.《统计学基础——习题与实训》,现代教育出版社,2012年1月。 3. 栗方忠.《统计学原理》,东北财经大学出版社,2011年1月。 4. 栗方忠.《统计学原理标准化题型习题集》,东北财经大学出版社,2011年1月。 5. 马庆国.《管理统计》,科学出版社,2 002年8月。 6. 贾俊平.《统计学基础》,中国人民大学出版社,2006年。 7. Douglas A. Lind, William G. Marchal, Robert D. Ma son. Statistical Techniques in th Business and Economics(11 ed.).中信出版社,2002年。 8. Ron Larson, Betsy Farber. Elementary Statistics.清华大学出版社,2004。 三、大纲执行说明 本课程教学内容包括理论教学和实训教学两部分。

经济统计学复习题

经济统计学复习题 一、简答题 1. 给出标准差S与离散系数Vσ的计算公式,并简要说明它们的作用和适用场合。 2. 试就大学生创业问题设计一份调查问卷(要求至少包括:调查目的,被调查者基本信息,创业意向,创业项目的领域,创业资金来源,大学生在校期间创业的可行性,最大的困难,对大学生创业所持的态度和建议等等)。 3. 试就统计数据的四种类型给出统计整理与显示的方法(统计图要求划出示意图)。 4. 统计学是怎样一门学科?描述统计和推断统计各有什么特点?举出常用的三种统计分析方法和统计学在工商管理领域的两种应用。 5. 什么是个体指数? 什么是总指数?它们的作用分别是什么? 6. 试简要说明总量指标、平均指标和相对指标的在统计学中的作用。 7. 某高校2008届本科毕业生的毕业去向情况如下:考研及出国30%,国企:20%, 政府机关及金融机构:20%,高校及科研机构:12% ,外企及合资企业:8%,自主创业、民营企业:5%,其他:5%,请根据这些数据,画出两种统计图形的示意图,并给出其它三种常用的统计图形的名称。 二、填空题 1. 某只股票周二上涨了5%,周三跌了5 %,则两天累计变化的幅度是。 2. 按照计入指数的项目的个数多少,指数分为总指数和两种。 3. 某地区2008年10月份与去年同期相比,如果用同样多的人民币比上年同期少购买 3% 的商品,则该地区2008年10月份的同比物价指数是。 4. 以某一时期的价值总量为权数,对个体指数加权平均计算的指数是。 5. 某企业近三年的年利润率分别为8% ,5% 和10%,则该企业这三年的 年平均利润率的计算公式应为。 6. 将下列指标分类: (1)2005年我国人均占有粮食产量(2)我国第五次人口普查总人口数 (3)股价指数(4)销售量指数(5)单位产品成本 (6)某商店全年销售额 (7)某企业在岗职工人数和下岗职工人数的比例 (8)我国高等院校“十五”期间年平均招生人数 哪些是时期指标哪些是时点指标;哪些是一般平均数, 哪些是序时平均数;哪些是相对指标 7. 个体指数是反映项目或变量变动的相对数;反映多种项目或 变量变动的相对数是。 8. 普查是,而抽样调查 则是。 9. 甲、乙两个班级学生的综合考评成绩如下,优秀:2名和3名,良好:12名和15名,中等4名和6名及格2名和4名,那么这两组成绩中离中趋势 较小的班级是,其异众比率为;如果要比较它们的相对离散程度,应该使用的是,它的计算公式为 Vσ= 。 10. 若某种商品1-4季度季节指数分别为80%,98%,122%,100% ,则说明第1季度的平均水平 总平均水平20% ,受季节因素影响最大的季度是。 11. 假定某商品的销售量具有趋势和季节两种因素,根据以往6年的季度数据测得某商品的销售量具有显著的直线趋势为Yt=500+0.2 t ,又计算得1季度和2季度的季节指数分别为102%和105% 。根据以上信息,第7年第1,2季度该商品的销售量的预测值较高的季节应是。

统计学提纲第五章

第五章抽样推断 第一节抽样推断的相关基本概念 一、抽样调查 (一)什么是抽样调查抽样调查是按随机原则从总体中选取部分单位进行 观察,用所获得的样本数据推算总体数量特征的一种非全面调查。 (二)抽样调查的特点: 1.按随机原则去抽取调查单位。随机原则也就是机会均等的原则,每个 单位被抽中的机会相等。其目的是保证抽出的样本是随机样本。 2.以样本数据估计总体参数或检验总体的某种假设。抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。 3.抽样误差可以事先计算并加以控制。 (三)抽样调查的适用范围: 1.能够解决全面调查无法或难以解决的问题; 2.对能取得全面资料,但不必进行全面调查的情况。 3.可以补充和订正全面调查的结果;4.可用于对总体的某种假设进行检验,为行动决策提供依据。(四)抽样调查的基本形式 基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。 1.简单随机抽样按随机原则直接从总体中抽选样本单位进行调查。这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。 2.类型随机抽样(分层抽样)先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。 4.整群抽样(集团抽样)整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。 二、抽样推断的概念及主要内容 (一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。 (二)抽样推断的主要内容为:参数估计和假设检验 三、抽样的有关基本概念 (一)全及总体和样本总体 1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。也就是具有某种共同性质的许多单位的集合体。 2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全

《统计学(第六版)》教学大纲

《统计学》课程教学大纲 课程编号:×××××××× 课程类别:学科基础课 授课对象:经济管理类各专业、社会学专业、档案学专业、新闻学专业等 开课学期:第3、4、5、6学期 学分:4学分 主讲教师:……等 指定教材:贾俊平、何晓群、金勇进编著,《统计学》(第六版),中国人民大学出版社,2015年教学目的: 《统计学》是为我校非统计专业本科生开设的一门基础必修课,总课时约54学时。设置本课程的目的在于培养学生有关统计知识方面的基本技能,培养学生应用统计方法分析和解决问题的实际能力。教学应达到的总体目标是: 使学生能系统地掌握各种统计方法,并理解各种统计方法中所包含的统计思想。 使学生掌握各种统计方法的不同特点、应用条件及适用场合。 培养学生运用统计方法分析和解决实际问题的能力。 第1章导论 课时:1周,共3课时 教学内容 第一节统计及其应用领域 一、什么是统计学 统计学的概念。描述统计。推断统计。 二、统计的应用领域 统计在共生管理中的应用。统计在其他领域的应用。统计的误用与正确使用。 三、历史上著名的统计学家 一些主要的统计学家。 第二节统计数据的类型 一、分类数据、顺序数据、数值型数据 分类数据。顺序数据。数值型数据。 二、观测数据和实验数据 观测数据。实验数据。 三、截面数据和时间序列数据 截面数据。时间序列数据。 第三节统计中的几个基本概念 一、总体和样本 总体。有限总体和无限总体。样本。样本容量。 二、参数和统计量 参数。统计量。 三、变量 变量。变量的类型。 第2章数据的收集 课时:1周,共3课时

第一节数据来源 一、数据的间接来源 二手数据。 二、数据的直接来源 统计调查方式。数据的收集方法。 第二节调查设计 一、调查方案的结构 调查目的。调查对象和调查单位。调查项目和调查表。 二、调查问卷设计 问卷的结构。提问项目设计。回答项目的设计。问题顺序的设计。第三节数据质量 一、数据的误差 抽样误差。非抽样误差。 二、数据的质量要求 第3章数据的图表展示 课时:1周,共3课时 教学内容 第一节数据的预处理 一、数据审核 原始数据的审核。二手数据的审核。 二、数据筛选 数据筛选的意义。用Excel进行数据筛选。 三、数据排序 数据排序的作用。用Excel进行数据排序。 第二节分类和顺序数据的整理与显示 一、分类数据的整理与显示 频数与频数分布。用Excel制作频数分布表。分类数据的图示方法。 二、顺序数据的整理与显示 累积频数与累积频率。顺序数据的图示方法。 第三节数值型数据的整理与显示 一、数据分组 分组方法。 二、数值型数据的图示 直方图。茎叶图和箱线图。线图。雷达图。 第四节统计表 一、统计表的构成 二、统计表的设计 第4章数据的概括性度量 课时:1周,共3课时 教学内容 第一节集中趋势的度量

统计学复习提纲

统计学基础复习提纲 复习内容: 第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。 重点内容: 第一章统计和数据 (1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。 (3)统计中的基本概念:总体与样本;参数与统计量;变量。 第二章数据搜集 (1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计 (3)统计数据质量 第四章数据分布特征的测度 (1)集中趋势的测度:平均数;中位数和分位数;众数 (2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数 (3)偏态与峰态度量:偏态系数;峰态系数 第五、六章参数估计与假设检验 (1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。(5)总体均值的检验:大样本检验方法;小样本检验方法。第七章相关与回归分析 (1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。 (2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。(3)利用回归房产进行估计和预测 第八章时间序列分析与预测 (1)时间序列的分解和描述:图形描述;增长率分析 (2)预测方法的选择和估计 (3)平稳序列的预测:移动平均法;指数平滑法 (4)趋势序列的预测:线性趋势预测;非线性趋势预测

医学统计学复习提纲

《医学统计学》复习提纲 第二章 统计描述 公式:几何均数 (1)直接法: n n X X X G ...21= 或 )lg (lg )lg ...lg lg ( lg 1211 n X n X X X G n ∑--=+++= (2)加权法: )lg (lg ....lg ...lg lg (lg 12122111 ∑ ∑--=++++++=f X f f f f X f X f X f G k k k 中位数(median ) (1) 直接法: n 为奇数 , 2 ) 1(+=n X M n 为偶数,)(21 12 2 ++= n n X X M (2)频数表法:用于频数表资料。 ∑-+ =)2 (L M f n f i L M 标准差(standard deviation ): n X ∑-= 2 ) (μσ 1 ) (2 --= ∑n X X S 离均差平方和 2 ) (∑-X X 常用SS 或l XX 表示。∑∑∑- =-= =N X X X X l SS XX 2 22 )() ( 直接法: 1 )(2 2 --= ∑∑n n X X S 加权法: 1 )(2 2 -- =∑∑ ∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。 率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 3. 应用相对数时应注意哪些问题? 4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。 制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。

统计学课程教学大纲.doc

《统计学》 教 学 大 纲 郑州大学商学院

绪论 内容 绪论中所阐述的内容,是对课程全面的概括和归纳,学习好绪论中的有关概念和思想,对本课程学习的全过程是十分必要的。 (一)考核知识点 1、统计数据与统计学 2、统计学的产生和发展 3、统计学与其他学科的关系 (二)考核要求 1、统计数据与统计学 (1)了解:统计学的概念。 (2)理解:统计数据与统计学、统计方法与数量规律性的关系。 2、统计学的产生和发展 (1)了解:统计学的三个源头。 (2)理解:统计学的发展原因。 3、统计学与其他学科的关系 (1)了解:统计学与数学的关系。 (2)理解:统计学与其他学科的关系。 第一章统计数据的搜集与整理 内容 统计数据是我们利用统计方法进行分析的基础。那么,我们从哪里取得所需的统计数据呢?在取得统计数据之后,怎样才能使这些数据适合于我们分析的需要呢?本章所讲述的就是有关数据的搜集与整理方法,具体内容包括数据的计量与类型、统计数据的搜集、整理和显示的方法等问题。

学习本章时,应在了解数据的计量尺度和类型的基础上,系统掌握统计调方案的内容,并能根据特定的调查内容设计具体的调查方案;掌握统计调查的具体方法以及不同方法的特点及适用条件;重点掌握统计数据的整理及显示方法,能够运用所学习的方法将原始数据整理成适当的频数分布表,并能利用图形显示统计数据;掌握统计表的构成内容和设计方法。 (一)考核知识点 1、数据的计量尺度 (1)数据的计量尺度。 (2)数据的类型。 2、统计数据的搜集 (1)统计调查方案。 (2)统计调查方法。 (3)统计数据的间接来源。 3、统计数据的整理 (1)统计数据的审核。 (2)统计分组与频数分布。 (3)频数分布的图示和类型。 (4)统计表。 (二)考核要求 1、统计数据的计量与类型 (1)数据的计量尺度 ① 了解:四种数据计量尺度的含义。 ② 理解:四种数据计量尺度的区别和特征。 (2)数据的类型 ① 了解:数据两种类型的含义。 ② 理解:数据两种类型的区别和应用。 2、统计数据的搜集 (1)统计调查方案 ① 了解:统计调查方案的作用。 ② 理解:统计调查方案的主要内容。 ③ 掌握:调查对象、调查单位、变量、变量值的涵义。 (2)统计调查方法 ① 了解:统计报表、普查、典型调查、重点调查的涵义。

《统计学》复习题(专升本)

《统计学》复习题(专升本) 一、单项选择题 1、在进行组距式分组时,凡遇到某单位的标志值正好等于相邻两组的上下限的数值时,一般将此值()。 A. 归于上限组 B. 归于下限组 C.归于上限组或下限组均可 D. 重新分组 2、把两个地区的粮食产量相对比,所得到的相对指标是()。 A. 比例相对指标 B. 结构相对指标 C. 比较相对指标 D. 强度相对指标 3、加权算术平均数的大小()。 A. 只受变量值大小的影响 B. 只受权数大小的影响 C. 受权数和变量值的双重影响 D. 都无影响 4、某企业计划规定产品单位成本降低6%,实际降低10%,则计划完成程度()。 A.97.94% B. 166.67 % C. 100.5% D. 95.74% 5、某企业2010年A产品销售收入比上一年增长8%,其中由于价格上涨增加销售收入为3%。那么,产量比上年增长()。 A. 5% B. 4.85% C. 11.24% D. 24% 6、一个统计总体()。 A. 只能有一个标志 B. 只能有一个指标 C. 可以有多个标志 D. 可以有多个指标 7、下列属于品质标志的是()。 A. 工人年龄 B. 工人性别 C. 工人体重 D. 工人工资 =270-0.5x,8、每吨铸件的成本(元)与每一个工人劳动生产率(吨)之间的回归方程为y c 这意味着劳动生产率每提高一个单位(吨),成本就会()。 A. 提高270元 B. 提高269.5元 C. 降低 0.5元 D. 提高0.5元

9、 判断现象之间相关关系密切程度的主要方法( )。 A. 编制相关表 B. 进行定性分析 C. 绘制相关图 D. 计算相关系数 10、对某地区工业企业职工状况进行了解,统计总体是( )。 A .该地区全部工业企业 B .某个工业企业 C .该地区工业企业的全部职工 D .每个工业企业的全部职工 11、按数量标志分组的关键是确定( )。 A .变量值的大小 B .组数 C .组中值 D .各组界限 12、拉氏的数量指标综合指数编制公式是( )。 A . ∑∑0 001p q p q B . ∑∑0 10 p q p q C . ∑∑0 1 11p q p q D . ∑∑1 11p q p q 13、构成总体的每个单位所有方面的特征是( )。 A .必须完全相同 B .不完全相同但至少有一个方面相同 C .完全不相同 D .既可以相同,也可以不相同 14、从纯理论出发,在直观上最符合随机原则的抽样方式是( )。 A. 简单随机抽样 B. 类型抽样 C. 等距抽样 D. 整群抽样 15、 如果零售物价上涨8%,销售量下降8%,则销售额( )。 A .没有变化 B .有所增长 C .有所下降 D .无法判断 16、连续变量分组,若第一组为200以下,第二组为200-300,第三组为300-400,第四组为400以上,则数据( )。 A. 200在第一组 B. 200在第二组 C. 200在第三组 D. 200在第四组 17、某种产品产量2014年比2013年增长了10%,2015年比2013年增长了12%,则2015年比2014年增长了( )。 A. 12%÷10% B.(112%÷110%)—1

统计学原理韩兆洲期末考试复习提纲

第一章绪论(小题) 1、统计的含义 人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点 数量性、具体性、综合性 3、统计学的若干基本概念 (1)总体与总体单位;总体的特征; 总体是指在某种共性的基础上由许多个别事物结合起来的整体。 例:制造业企业是一个总体、由所有从事制造业的企业所组成,每一个制造业企业都是一个总体单位。 特征:同质性(都是制造业)、大量性、差异性(不同的总体单位间,除了某方面必须有共性之外,其他方面的差异性,如员工人数等等) (2)总体的分类:有限总体与无限总体 总体单位有限为有限总体,总体单位无限称为无限总体 (3)标志、变异与变量 标志:指说明总体单位特征的名称,由标志名称+标志值构成。 变异:可变的品质标志 变量:离散变量、连续变量,(指的是标志,不是标志值) 例:中华人民共和国人口普查 总体:具有中华人民共和国国籍的所有公民 总体单位:每一位公民

标志名称标志值 国籍:中国(不变标志) 姓名:张三(品质标志) 性别:男(品质标志) 民族:汉(品质标志) 婚姻状况:已婚(品质标志) 数量标志: 家庭成员数:4人(离散变量) 年龄:50(连续变量) 身高:172cm (连续变量) 体重:72.5kg(连续变量) 收入:2000元/月(连续变量) (4)连续型变量与离散型变量联系和区别 离散变量:以整数出现 连续变量:可做无限分割的变量 在某些特殊场合,连续变量可做离散化处理。(当人口按年龄分组)(5)指标与标志 指标:是说明总体数量特征的概念。由指标名称+指标值组成。例:工业普查 总体:工业企业 总体单位:每一个工业企业 指标名称指标值

统计学课程教学大纲简介教(学)案

《统计学》课程教学大纲 课程编号:1331050 课程名称:《统计学》 总学时数:54 实验或上机学时:12 先修课程:高等数学(微积分、概率论与数理统计)、计算机基础、会计学。 后续课程:计量经济学、国际贸易、国际金融、国际投资学、市场营销学等。 一、说明部分 1、课程性质: 统计学是研究如何搜集数据,分析数据,以便得出正确认识结论的方法论科学。它是国家教育部规定的财经类专业的核心课程,主要研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律。本课程在非统计专业的本科教学中,一般作为专业基础课程安排在第三学期开设。 2、教学目标及意义: 通过本课程的教学,使学生了解统计学的基本原理,掌握统计学的基本方法,在定性分析基础上做好定量分析。用统计学的知识去“发现问题、分析问题、解决问题”,提高学生们专业的应用技能,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。同时,也为学习计量经济学、国际投资学、市场营销学等其他分支学科课程奠定基础。 3、教学容及教学要求: 教学容共计8章: 第一章总论 Introduction 第二章统计调查Statistical surveys 第三章统计整理 Statistical Date Arrangement 第四章统计指标分析 Statistical Indicator Analysis 第五章统计抽样Sampling 第六章统计相关与回归分析 Correlation and regression 第七章时间数列分析 Time series analysis 第八章统计指数Index numbers analysis 教学要求:考虑到财经类专业把本课程作为专业基础课开设,本课程的容既包括统计方法,也包括必要的社会经济指标核算的基本知识。在各章的教学要求中,有关基本概念、基本理论、统计的基本公式、计算方法及数量分析方法的容按“了解、掌握和重点掌握及综合应用”三个层次要求。 4、教学重点、难点:请见各章节详述。 5、教学方法与手段:课堂讲授、调查实验、案例讨论及课外调查等。

专业型硕士《统计学》考试大纲

专业型硕士《统计学》考试大纲 考试科目:统计学 科目代码:432 适用专业:应用统计 参考书目:《统计学》,贾俊平,中国人民大学出版社,2015 《概率论与数理统计教程》,茆诗松、程依明、濮晓龙,高等教育出版社,2011 考试内容要求 I 考查目标 全国硕士研究生入学统一考试应用统计硕士专业学位《统计学》考试是为高等院校和科研院所招收应用统计硕士生设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利用选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。 具体来说,要求考生: 1.掌握基本的概率论知识。 2.掌握数据收集和处理的基本方法。 3.掌握数据分析的基本原理和方法。 4.具有运用统计方法分析数据和解释数据的基本能力。 II考查内容 一、统计学 1.调查的组织和实施。 2.概率抽样与非概率抽样。 3.数据的预处理。 4.定性、定量数据的图标表示。 5.用统计量描述数据的水平:平均数、中位数、分位数和众数。 6.用统计量描述数据的差异:极差、标准差、样本方差。 7.参数估计的基本原理。 8.一个总体和两个总体参数的区间估计。 9.样本量的确定。 10.假设检验的基本原理。 11.一个总体和两个总体参数的检验。 12.方差分析的基本原理。 13.单因子和双因子方差分析的实现和结果解释。 14.变量间的关系;相关关系和函数关系的差别。

统计学复习题1要点

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间? 4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150~155 155~160 160~165 165~170 22 108 95 43 70~75 75~80 80~85 85~90 26 83 39 28

统计学课后习题答案第五章 指数

第五章指数 一﹑单项选择题 1.广义的指数是指反映 A.价格变动的相对数 B.物量变动的相对数 C.总体数量变动的相对数 D.各种动态相对数 2.狭义的指数是反映哪一总体数量综合变动的相对数? A.有限总体 B.无限总体 C.简单总体 D.复杂总体 3.指数按其反映对象范围不同,可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 4.指数按其所表明的经济指标性质不同可以分为 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 5.按指数对比基期不同,指数可分为 A.个体指数和总指数 B.定基指数和环比指数 C.简单指数和加权指数 D.动态指数和静态指数 6.下列指数中属于数量指标指数的是 A.商品价格指数 B.单位成本指数 C.劳动生产率指数 D.职工人数指数 7.下列指数中属于质量指标指数的是 A.产量指数 B.销售额指数 C.职工人数指数 D.劳动生产率指数 8.由两个总量指标对比所形成的指数是 A.个体指数 B.综合指数 C.总指数 D.平均指数 9.综合指数包括 A.个体指数和总指数 B.数量指标指数和质量指标指数 C.定基指数和环比指数 D.平均指数和平均指标指数 10.总指数编制的两种基本形式是 A.个体指数和综合指数 B.综合指数和平均指数 C.数量指标指数和质量指标指数 D.固定构成指数和结构影响指数 11.数量指标指数和质量指标指数的划分依据是 A.指数化指标性质不同 B.所反映的对象范围不同 C.所比较的现象特征不同 D.指数编制的方法不同 12.编制综合指数最关键的问题是确定 A.指数化指标的性质 B.同度量因素及其时期 C.指数体系 D.个体指数和权数 13.编制数量指标指数的一般原则是采用下列哪一指标作为 同度量因素 A.基期的质量指标 B.报告期的质量指标 C.报告期的数量指标 D.基期的数量指标 14.编制质量指标指数的一般原则是采用下列哪一指标作为

统计学原理课程教学大纲-南海广播电视大学

成人学院《统计学原理》课程教学大纲 一、课程的性质 统计学原理是为成人学院会计专业学生开设的一门必修的重要的基础课,也是经济管理工作者和经济研究人员所必备的一门知识。它研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律,也是进一步学习其他相关学科的基础。 该课程的开出在政治经济学、经济数学基础、基础会计学课程之后。设置本课程的目的,一方面是为了进一步学习专业统计和计量经济课程奠定理论和方法基础。另一方面也为学习经济与管理学科各专业的后继课程和进行社会经济问题研究提供数量分析方法。 二、课程的教学目的和要求 考虑到经济与管理学科各专业把本课做为基础课开设,本课的内容既包括统计方法,也包括必要的社会经济指标核算的基本知识。使学生能掌握统计学的基本知识和技能,能运用所学的统计理论对社会经济现象进行调查研究,并能运用统计方法分析、研究有关经济问题,为国民经济的管理提供真实可靠的数字资料,提高经济管理水平。因此,在教学上要通过本课程的学习,使学生能够掌握统计学的基本原理、基本方法及基本统计指标的核算,并能运用所学知识,完成对统计资料的搜集、整理和分析,提高学生对社会经济问题的数量分析能力。 在经济与管理学科各专业的教学中,对统计知识的需求不一样,因此有的内容对不同的专业有不同的要求,具体的要求将在各章的教学内容中加以说明。 在各章的教学要求中,有关基本概念、基本理论的内容按"了解、一般理解、重点理解"三个层次要求;有关指标的基本公式、计算方法及数量分析方法等内容按"会、掌握、熟练掌握"三个层次要求。 三、媒体使用和教学过程建议 (一)学时和学分 1、学时:课内学时90课时(电视学时29课时、教学辅导学时45课时、自学及作业16课时) 2、学分:5学分 (二)教材 本课程教材是由文字教材、音像教材和其他教材等多种媒体组成的一体化教材,要求学生能正确使用。 1、文字教材

统计学复习提纲(整理)

统计学复习提纲(学生用) 一、单选题 1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( C ) A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费 D.1000个消费者的平均花费 2.为了调查某学校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( D ) A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样 3.某班学生平均成绩是80分,标准差10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70-90分之间的学生大约占( C )一个标准差范围 A. 95% B.89% C.68% D.99% 4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的期望(等于总体均值)和抽样分布的标准差分别为( B ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生考试分数的置信区间为75-85分。全班学生的平均分数( B&D )【有争议,两个中任选一个都对】A.肯定在这一区间内 B.有95%的可能在这一区间内 C.有5%的可能在这一区间内 D. 或者在区间内,或者不在。 6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所做的一项调查中,随机抽取120个新车主中有57人为女性,检验2005年薪车主中女性的比

例是否显著增加,建立的原假设和备择假设为( C ) A. H 0: π=40%,H 1: π≠40% B. H 0: π≥40%,H 1: π<40% C. H 0: π≤40%,H 1: π>40% D. H 0: π<40%,H 1: π≥40% 7.在回归分析中,因变量的预测区间估计是指( B )。 A. 对于自变量x 的一个给定量x 0,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定量x 0,求出因变量y 的个别值的区间 C. 对于自变量y 的一个给定量y 0,求出自变量x 的平均值的区间 D. 对于自变量y 的一个给定量y 0,求出自变量x 的个别值的区间 8.在多元线性回归分析中,如果F 检验表明线性关系显著,则意味着( A ) A. 至少有一个自变量与因变量之间的线性关系显著 B. 所有自变量与因变量之间的线性关系显著 C. 至少有一个自变量与因变量之间的线性关系不显著 D. 所有自变量与因变量之间的线性关系不显著 9.如果时间序列的逐期观察值按一定的增长率增长(即增长的增长)或衰落,则适合的预测模型是( D ) A.移动平均模型 B.指数平滑模型 C.线性模型 D.指数模型 10.设p 为商品价格,q 为销售量,则指数∑∑0010 q p q p 的实际意义是综合反映了( C ) A. 商品销售额的变动程度 B.商品价格变动对销售额的影响 [D. 商品价格和销售量的变动对销售额的影响 11. 根据所使用的计量尺度,统计数据分为( A ) A.分类数据,顺序数据和数值型数据 B.观测数据和试验数据

统计学复习纲要A

201203学期《统计学》复习纲要A 一、单选题 1. 统计研究的数量必须是()。 A.抽象的量 B.具体的量 C.连续不断的量 D.可直接相加的量 2. 某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。 A.指标 B.标志 C.变量 D.标志值 3. 编制总指数的两种形式是()。 A.数量指标指数和质量指标指数 B.综合指数和平均数指数 C.算术平均数指数和调和平均数指数 D.定基指数和环比指数 4. 某商品价格发生变化,现在的100元只值原来的90元,则价格指数为()。 A.10% B.90% C.110% D.111% 5. 年劳动生产率x(千元)和职工工资Y(元)之间的回归方程为Y=10+70x。这意味着年 劳动生产率每提高1千元时,职工工资平均()。 A.增加70元 B.减少70元 C.增加80元 D.减少80元 6. 在由三个指数所组成的指数体系中,两个因素指数的同度量因素通常()。 A.都固定在基期 B.都固定在报告期 C.一个固定在基期,一个固定在报告期 D.采用基期和报告期的平均数 7. 若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为()。 A.不相关 B.负相关 C.正相关 D.复相关 8. 加权调和平均数指数用于编制()指数。 A.工业生产指数 B.零售商品价格指数 C.居民消费价格指数 D.农副产品收购价格指数 9. 下面现象间的关系属于相关关系的是()。 A.圆的周长和它的半径之间的关系 B.价格不变条件下,商品销售额与销售量之间的关系 C.家庭收入愈多,其消费支出也有增长的趋势 D.正方形面积和它的边长之间的关系 10. 假设检验是检验()的假设值是否成立。 A.样本指标 B.总体指标 C.样本方差 D.样本平均数 二、多选题 1. 从表式上看,统计表由哪些部分构成?() A.总标题 B.主词 C.纵栏标题 D.横行标题 E.指标数值

2018统计学课程教学大纲

2018《统计学》课程教学大纲一、课程总述

二、教学时数分配

三、单元教学目的、教学重难点和内容设置 第一章数据与统计学 教学目的: 通过本章的学习,要求明确统计学的性质和特点,掌握数据的基本类型,正确地理解统计学中常用的基本术语,了解统计学的基本应用范围,从大的方面、从体系和主线上掌握这门课程的内容,这是学习《统计学》的起点。 本章的重点、难点: 重点:统计学的学科性质及其特征;描述统计与推断统计的区分;统计 学的基本概念。 难点:统计学的基本概念;统计研究方法 内容设置: 1.1统计学的性质及其种类 1.2统计的应用领域 1.3统计学中的几个基本概念 1.4 统计研究方法

第二章数据的采集、整理和显示 教学目的: 通过本章的学习,使学生了解统计数据搜集与整理的基本方法,掌握各种方法的特性。能够灵活运用各种数据调查方式和方法,并对所得数据进行科学的加工整理,为以后各章学习统计分析方法打下基础。 本章的重点、难点: 重点:统计调查方法;统计调查体系;统计分组;频数分布与变量数列 的编制;全距、组距与组数的关系 难点:统计分组;频数分布数列的编制方法与技巧 内容设置: 2.1数据的采集 2.2数据的整理 2.3频数分布 2.4数据的显示 第三章统计数据的描述 教学目的: 通过本章学习,掌握数据分布集中趋势和离散趋势的测度,重点掌握分组数据的均值和标准差及变异系数的计算,并能加以灵活运用,了解数据分布形状(即偏度与峰度)及其测度。 本章重点、难点: 重点:集中趋势的测度指标及其计算方法;离散趋势的测度指标及其计算方法; 难点:调和平均数、几何平均数的计算方法与应用场合;离散程度测度指标的计算方法与应用场合 内容设置: 3.1集中趋势的测度 3.2离散趋势的测度 3.3偏度和峰度的测度(自学) 3.4 相对位置的测度及异常值的检测 第四章时间序列分析 教学目的: 通过本章的学习,了解时间数列的定义、种类,掌握计算时间序列的水

西南财经大学2019统计学432考试大纲

2019年全国硕士研究生入学统一考试 应用统计硕士专业学位《统计学》考试大纲 Ⅰ考核目标 《统计学》考试是为高等院校和科研院所招收应用统计硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平和有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以便选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据收集、处理和分析的一些基本统计方法。 具体来说。要求考生具有以下的能力: 1.能熟练掌握数据收集、整理和分析的基本方法。 2.具有运用统计方法分析数据和解释数据的基本能力。 3.能掌握基本的概率论知识,并将其应用于推断统计中。 Ⅱ考试形式 一、试卷满分及考试时间 试卷满分为150分,考试时间180分钟。 二、答题方式 答题方式为闭卷笔试。 Ⅲ考试主要范围 一、描述统计与数理统计学部分 1.统计调查的组织和实施; 2.抽样调查的基本理论; 3.用图表展示定性数据的方法; 4.用图表展示定量数据的方法; 5.用统计量描述数据的分布特征:平均数、中位数、分位数和众数;

6.用统计量描述数据的差异:方差和标准差 7.参数估计的基本原理,一个总体参数的区间估计; 8.样本量的确定; 9.假设检验的基本原理和基本步骤; 10.一个总体参数的假设检验; 11.方差分析的基本原理; 12.单因素和双因素方差分析的实现和结果解释; 13.变量间的关系、相关关系和函数关系的差别,相关关系的检验; 14.一元线性回归模型的估计和检验; 15.多元线性回归模型的估计和检验; 16.时间序列的指标分析法与组成要素分析; 17.统计指数理论和编制方法; 18.多指标综合评价。 二、概率论部分 1.事件及关系和运算; 2.事件的概率; 3.条件概率、全概率公式和贝叶斯公式; 4.随机变量的定义; 5.离散型随机变量的分布列和分布函数:离散型均匀分布、二项分布和泊松分布; 6.连续型随机变量的概率密度函数和分布函数:均匀分布、指数分布、正态分布; 7.随机变量的期望与方差;

相关主题
文本预览
相关文档 最新文档