当前位置:文档之家› 社会统计学期末章节复习

社会统计学期末章节复习

社会统计学期末章节复习
社会统计学期末章节复习

第一章统计学在社会研究中的应用

(一)社会学研究的过程

提出问题:首先明确要做什么?进行研究的目的?

形成假设:假设是对两个变量之间关系的陈述,是一种尝试性的回答;

收集数据:确定收集的变量、方法和总量等等;

分析数据:对原始数据进行审核、整理、归类、统计和分析;

检验假设:支持或不支持该假设。

(二)变量类型

定类变量、定序变量、定距变量、定比变量

离散变量、连续变量

因变量、自变量

(三)抽样方式

普查、抽样调查、非概率抽样、概率抽样

总体、样本、抽样框、抽样单位

简单随机抽样、整群抽样、分层抽样、系统抽样、定额配比抽样

判断抽样、偶遇抽样、滚雪球抽样、定额抽样

(四)归纳法与演绎法

归纳法是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;

演绎法则与归纳法正好相反,是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。

考试题型分析

1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为(D)

A.简单随机抽样

B.系统抽样

C.整群抽样

D.分层抽样

备注:此题考察的概率抽样的具体方法,其中四个选项都作为重点的方法的理解和运用,重点是整群抽样和分层抽样,区分好两种即整群和分层抽样的具体含义和做法,具体知识点参照教材P13

2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是(A)

A.332.1万户家庭

B.3000户家庭

C.332.1户家庭的年均收入

D.3000户家庭的年均收入

备注:此类题型出现概率较高,主要考察学生对样本和总体的区别,区分两个概念是关键,具体内容参照教材P11

3.简答题:判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是连续变量。

(1)考研辅导班参加者的姓名(定性变量)

(2)家庭月消费(定量变量连续变量)

(3)温度(定量变量连续变量)

(4)上个月外出吃饭的次数(定量变量离散变量)

(5)产品等级(定性变量)

备注:考察具体的变量的各种分类,主要是按照测量水平分类和离散连续变量,具体参照教材P7-P10

第三章数据的组织与展示

(一)组距分组

将全部变量值按照次序划分为多个区间,每一区间里的值作为一组。

频数、频率、百分比、比率;

条形图、饼图、环形图、直方图、折线图、线图

考试题型分析

1.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为(C)

A.5小时

B.6小时

C.5.5小时

D.6.5小时

备注:此题考查的内容是分组数据的组中值问题,尤其是针对没有上限值和没有下限值的组的组中值,具体计算参照P44

2.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形(A)

A.环形图

B.饼图

C.直方图

D.条形图

备注:此题考查的是统计图的运用,尤其是作为集中代表性的统计图,要严格区分每种统计图使用的范围和数据类型,具体内容参照P58-P64

3.简答题:简述直方图与条形图相同点与区别

(1)条形图适用于所有类型数据,而直方图只适用于数值型数据;

(2)条形图中条形的宽度是固定的,是用条形的长度(或高度)表示各类别频数的多少;而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义;

(3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩形通常是紧密排列的。

备注:此题考查的是统计图的运用,尤其是作为集中代表性的统计图,要严格区分每种统计图使用的范围和数据类型,具体内容参照P58-P64

第四章中心趋势测量

(一)中心趋势

反映一组数据中各个数值向中心值集中的程度,是指一组数据向某一中心值靠拢的趋势。

众数、中位数、均值(分组数据与未分组数据)

计算与比较

对称分布:Mo=Me= X

左偏态分布:X

右偏态分布:Mo

变差来源SS df MS F Sig.

组间1602708.6 B D F 0.000

组内40158.08 C E ——

总计 A 11 ———

考试题型分析

1.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是(D)

A.86

B.77

C.90

D.88

备注:此题考察内容为中位数的计算,中位数计算要先排序后找中位数,尤其是要注意偶数序列的中位数,是处于中间位置的两个数的和平均作为中位数,具体参照教材P74

2.对于左偏分布,平均数、中位数和众数之间的关系是(C )

A.平均数>中位数>众数

B.中位数>平均数>众数

C.众数>中位数>平均数

D.众数>平均数>中位数

备注:考察集中趋势测量指标间的关系,要注意左偏态和右偏态的区别,极大值和极小值都会影响到平均数,具体参照教材P82

3.计算题

(1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。

(2)如果按照规定,销售额在125万元以上的为先进企业,115万-125万之间的为良好企业,105万-115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。计算题

企业

编号销售额

企业编

销售额

企业

编号

销售额

企业

编号

销售额

1152 11105 21103 31136 2105 12123 22103 32146 3117 13116 23137 33127 497 14115 24138 34135

5124 15110 2591 35117

6119 16115 26118 36113

7108 17100 27120 37104

888 1887 28112 38125

9129 19107 2995 39108

10115 20119 30142 40126

(1)销售额由低到高排序:87、88、91、95、97、100、103、103、104、105、105、107、108、108、110、112、113、115、115、115、116、117、117、118、119、119 、120、123、124、125 、126、127、129、135、136、137、138、142、146、152

众数:115;中位数:115.5

平均数:=(152+146+……+88+87)÷40=4647÷40=116.175

按销

售额分组(万元)企

频率

(%)

累积

频率

(%)

先进

企业

11 11 27.5 % 27.5 % 良好

企业

12 23 30 % 57.5% 一般

企业

8 31 20 % 77.5%

落后

9 40 22.5 % 100%

企业

合计40 ----- 100 % -----

第五章离散趋势测量

(一)方差

各数值与均值离差平方的平均数,数值型数据离散趋势最主要的测量值。

方差与标准差的计算

(二)离散系数

一组数据的标准差与该组数据均值之比,也称为变异系数。

计算:标准差与均值的比率;V=σ/x

离散系数越大,数据的离散程度就越大,越不稳定;

离散系数越小,数据的离散程度就越小,越稳定。

考试题型分析

1.一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克,那么(B)

A.一班学生体重的离散程度大

B.二班学生体重的离散程度大

C.两个班学生体重的离散程度相同

D.无法判断

备注:此题考查的是离散系数的计算及其含义的理解,公式要记清楚,V=标准差/均值,具体参照教材P100

2.离散系数的主要目的是(D)

A.反映一组数据的平均水平

B.比较多组数据的平均水平

C.反映一组数据的离散程度

D.比较多组数据的离散程度

备注:此题考查的是离散系数的计算及其含义的理解,公式要记清楚,V=标准差/均值,具体参照教材P100

第六章正态分布

(一)正态分布

正态分布的函数;

正态分布是对称分布;

正态分布的中央点最高;

曲线的陡缓程度由σ决定,当均值μ相等时,标准差σ越大,峰值越低,覆盖范围越广即峰越宽;

正态曲线下面的面积为1,中心轴平均划分0.5

(二)Z值的计算

以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数。

Z值说明了一组数据中各数值的相对位置;

例如,某个数值的Z值为-1.5,则说明这个数值低于均值1.5倍的标准差。

(三)68-95-99.7规则

X的取值几乎全部落在(μ-3σ,μ+3σ)之间;

X取值几乎不可能在区间(μ-3σ,μ+3σ)之外取值。

(四)标准正态分布表

对于负的变量值,可由下面公式转化:ф(-x)=1-ф(x)

一般情况下,设X~(0,1),则有:

P(X

P(a

P(X>a)=1-ф(a)

考试题型分析

1.已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的(B)

A.95%

B.68%

C.89%

D.90%

备注:此题考查的Z值计算,68-95-99.7规则,具体参照教材P106与P112例题

第七章统计推断

(一)统计推断

根据统计量的分布和概率理论,由样本统计量来推断总体参数的过程,包括参数估计和假设检验两部分内容。

参数:研究者想要了解的总体的某种特征值(平均数、标准差、比例等);

统计量:根据样本数据计算出来的一个量(样本平均数、样本标准差、样本比例等)。

(二)抽样分布

样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。

(三)中心极限定理

不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2 /n的正态分布。

(四)参数估计

点估计:直接用估计量θ^ 作为总体参数Θ的估计值。

区间估计:估计总体参数时给出的不是一个数值,而是一个区间,是根据统计量的抽样分布的特点进行估计,同时给出总体参数落入这一区间的可能性大小;

置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间,它有估计量加减抽样误差构成;

置信水平:将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。

(五)参数估计的计算

总体均值的区间估计P137

总体比例的区间估计P138

(六)假设检验

首先对总体参数建立一个假设,然后根据样本信息去检验这一假设是否正确。

虚无假设:需要我们通过样本信息来推断其正确与否的命题称为虚无假;也成为原假设或者零假设H0;

替换假设:如果虚无假设不成立,我们就拒绝虚无假设,需要在另个一假

设中进行选择,即替换假设H1。

考试题型分析

1.在假设检验中,虚无假设和备择假设(C)

A.都有可能成立

B.都不可能成立

C.有且只有一个成立

D.备择假设一定成立,虚无假设不一定成立

备注:此题考查的是假设检验中备择假设和虚无假设的关系问题,两者是对立的,只能有一个存在,不能同时存在。虚无假设和替换假设是相互对立的关系,假设检验的结果是要么虚无假设成立,要么替换假设成立,二者选一。不可能同时成立,也不可能都不成立。

2.根据一个具体的样本求出的总体均值95%的置信区间(A)

A.以95%的概率包含总体均值

B.5%的可能性包含总体均值

C.绝对包含总体均值

D.绝对不包含总体均值

备注:此题考查的是总体均值区间估计的解释和说明,关键是置信区间的概念,具体参照教材P135

3.计算题

为估计某地区每个家庭日均生活用水量为多少,抽取了450个家庭的简单随机样本,得到样本均值为200升,样本标准差为50升。

(1)试用95%的置信水平,计算该地区家庭日均用水量的置信区间。

(2)在所调查的450个家庭中,女性为户主的为180个。以95%的置信水平,计算女性为户主的家庭比例的置信区间。

注:Z0.025=1.96

答:已知:n=450,标准差=50,Z0.025=1.96

(1)用户每天平均用水量的95%的置信区间为:

置信区间公式P137 ,带入相应的数值计算即可,即(195.38,204.62)

(2)样本比例:P=180/450

户主为女性的家庭比例的95%的置信区间为:

置信区间公式P138,带入相应的数值计算即可,即(35.5%,44.5%)

备注:此题考查总体均值和总体比例的区间估计,只要把公式套用进去计算就可以了,具体的例题教材讲解清楚,参照教材P137(总体均值)、P139(总体比例)

第八章二维列联表:双变量关系考察

(一)二维表

一种行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。

在预测变量Y的值时,知道变量X的值时所减少的误差(E1- E2)与总误差E1的比值称为误差减少比例,称PRE;

PRE的取值范围为0~1,PRE值越大,说明用变量X去预测变量Y是能够减少的误差所占的比例越大,即变量X与变量Y之间的相关性越大;

反之,PRE越小,说明变量X与变量Y之间的关系越小。

第九章相关系数和简单回归

(一)相关关系

各变量之间存在一定的依赖或影响,但是一个变量的值不能由另一个或另几个变量唯一确定,即当一个或多个变量取某个值时,另一个变量的值并不是唯一确定的。

正线性相关:两个变量的变动方向一致,即一个变量增加,另一个变量也随之增加,反之亦然;

负线性相关:一个增加,一个减少;反之亦然。

(二)相关关系的解释

相关系数:对变量之间相关关系程度和方向的度量;

相关系数的取值在-1~1之间,“+”表示正相关“-”表示负相关,相关系数的绝对值表示相关关系的程度,绝对值越大,相关程度越大,即r越接近1;反之,绝对值越小,及r越接近0,相关程度越弱。

当r=1时,说明两变量之间存在完全正相关,r=-1时,两变量之间完全负相关。

当0

当r=0时,只能说变量之间不存在线性相关,而不能说它们之间不相关。

(三)散点图

散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。

(四)回归分析

通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。

作用:1由已知变量确定变量关系式;2对关系式进行检验,找出影响显著的变量;3利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的取值。

(五)最小二乘法

使因变量的观察值与估计值之间的离差平方和达到最小来求参数β0和β1的方法。

一元线性回归:y的期望值是x的线性函数E(y)=β0+ β1x

β0是回归直线在y轴的截距,是x=0时y的期望值;β1是直线的斜率,表示当x变动一个单位时,y的平均变量值。

(六)判定系数

回归直线与各观测点的接近程度称为拟合优度,用判定系数度量估计的回归方程的拟合优度。

判定系数:R2=SSR/SST

判定系数测量了回归直线对观测数据的拟合程度,它的取值范围为0~1。

考试题型分析

1.某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适(A)

A.回归分析

B.方差分析

C.卡方检验

D.列联表分析

备注:此题考查的是回归分析的作用,是用来测量定类变量与数值型变量之间的关系的一种计算方法,参照教材P177

2.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。收集了过去12年的有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差平方和SSE=450。要求:

(1)写出销售量y与广告费用x之间的线性回归方程。

(2)假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销售量。

(3)计算判定系数R2,并解释它的意义。

答:

(1)回归方程为:y=363+1.42x

(2)当x=25时,y=363+1.42×25=398.5万(辆)

(3)判定系数:R2=SSR/SST=1600÷(1600+450)=0.7805

表明在汽车销售量的总变差中,有78.05%可以由回归方程解释,说明回归方程的拟合程度很高。

第十章卡方检验

(一)拟合优度检验

卡方检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显著差异时,称为拟合优度检验。例如,不同职业的人群中对某项改革措施的支持率是否一致。

(二)独立性检验

卡方检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关系,则称为独立,我们用判断它们之间是否关联,这时称为独立性检验。例如,对性行为的态度是否与受教育程度有关。

(三)独立样本与配对样本

独立样本是指我们得到的样本是相互独立的。

配对样本就是一个样本中的数据与另一个样本中的数据相对应的两个样本。配对样本可以消除由于样本指定的不公平造成的差异。

第十一章T检验

(一)单样本T检验基本步骤

1.给出均值检验的零假设;

2.选择检验统计量;

3.计算检验统计量的观测值及其发生的概率;

4.给定显著性水平,做出统计推断结果。

考试题型分析

1.简答题:简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别

分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著关系。

t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量的双变量关系的统计显著性检验。

方检验主要用于对两个分类变量之间的相关性进行统计检验,判断变量之间是否存在显著关系。

例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用两独立样本t检验。

如果我们想考察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异。

2.简答题:如何对配对样本进行t检验

配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检验两个相关的样本是否来自具有相同均值的总体。

在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值;然后再检验其差值的均值是否为零,如果差值的均值接近零(在给定的置信区间内),说明两个总体

均值在给定的置信水平上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差异。

第十二章方差分析

(一)方差分析

检验多个总体均值是否相等的一种统计方法;通过检验各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

总误差平方和SST、组内误差SSE、组间误差SSA;

SST=SSE+SSA

(二)组间均方

组间误差的自由度为因素水平个数减1,即k-1,其中k为因素水平的个数。SSA的均方记作MSA,称为组间均方。

(三)组内均方

组内误差的自由度为全部观察值个数减去因素水平个数,即n-k,其中n为全部观察值个数,k为因素水平的个数。SSE的均方记作MSE,称为组内均方。

考试题型分析

1.方差分析的目的是(D)

A.比较不同总体的方差是否相等

B.判断总体是否存在方差

C.分析各样本数据之间是否存在显著差异

D.研究各分类自变量对数值型因变量的影响是否显著

备注:此题考察队方差分析的理解,具体内容参照教材P213

2.下列哪种情况不适合用方差分析(C)

A.性别对收入的影响

B.专业对收入的影响

C.年龄对收入的影响

D.行业对收入的影响

备注:此题考查的是对方差分析概念的理解,具体内容参照教材P213

3.计算题:某单位为研究其商品的广告费用(x)对其销售量(y)的影响,收集了过去12年的有关数据。通过分析得到以下结果:

SS df MS F Sig.

1602708.6 B D F 0.000

40158.08 C E ——

A 11 ———

(1)计算上面方差分析表中A、B、C、D、E、F处的值。

(2)商品销售量的变差中有多少是由广告费用的差异引起的?

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计复习题

第一章 1.一般来说,统计这个词包括三个含义:统计工作、统计资料和()。 4.统计按其内容主要包括两个方面:描述统计和()。 5.推断统计有两个基本内容:参数估计和()。 7.总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为()。凡能用数量的多少来表示的标志,称为()。凡不能用数量的多少来表示而只能文字表述的标志,称为()。 9.统计指标和标志的区别与联系在于:统计指标是说明()特征的,标志则是说明()特征的;统计指标的数值是由标志的数值()而成的。 1.统计总体同时具备三个特征( ) 。 A 同质性、大量性、可比性 B 同质性、大量性、变异性 C 数量性、具体性、综合性 D 数量性、具体性、可比性 8.按变量的性质,可把变量分为( ) 。 A 连续变量和随机变量 B 离散变量和确定性定量 C 连续变量和离散变量 D 确定性变量和随机变量 14.统计一般有三个含义,即()。 A 统计调查、统计整理、统计分析 B 统计工作、统计资料、统计学 C 统计活动、统计管理、统计预测 D 统计咨询、统计监督、统计信息 名词解释:大数规律社会统计学 第二章 4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。 7.统计调查从调查范围上分,可分为()和()。 8.统计调查按调查登记时间是否连续,可分为()和()。 9.统计调查从调查目的上,可分为()和专项调查。 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 6.下面能进行除法运算的测量尺度是()。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 7.教育程度是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 8.智商是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 9.籍贯是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 简答:何谓抽样调查?抽样调查的优点是什么?

2018年春社会统计学期末复习训练题

2018年春社会统计学期末复习题 、单项选择题 1. 以下关于因变量与自变量的表述不正确的是() A. 自变量是引起其他变量变化的变量 B. 因变量是由于其他变量的变化而导致自身发生变化的变量 C. 自变量的变化是以因变量的变化为前提 D. 因变量的变化是以自变量的变化为前提 2. 在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为 () A. 频率 B. 累积频数 C. 累积频率 D. 比率 3. 离散系数的主要目的是() A. 反映一组数据的平均水平 B. 比较多组数据的平均水平 C?反映一组数据的离散程度 D.比较多组数据的离散程度 4. 经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A. 50%勺数据

B. 68%勺数据 C. 95%勺数据 D. 99%勺数据 5?在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25. 0、26.9、29.0,那么这10家企业7月份利润额均值为() A. 39.19 B. 28.90 C. 19.54 D. 27.95 6. 用样本统计量的值直接作为总体参数的估计值,这种方法称为() A. 点估计 B?区间估计 C. 有效估计 D. 无偏估计 7. 在频数分布表中,比率是指() A. 各组频数与上一组频数之比 B. 各组频数与下一组频数之比 C?各组频数与总频数之比 D.不同小组的频数之比 8. 下面哪一项不是方差分析中的假定() A. 每个总体都服从正态分布

B. 观察值是相互独立的 C?各总体的方差相等 D.各总体的方差等于0 9. 判断下列哪一个不可能是相关系数( A. -0.9 B. 0 C. 0.5 D. 1.2 10. 用于说明回归方程中拟合优度的统计量主要是() A. 相关系数 B. 离散系数 C?回归系数 D.判定系数 11. 在假设检验中,不拒绝虚无假设意味着() A. 虚无假设是肯定正确的 B?虚无假设肯定是错误的 C?没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12. 下列变量属于数值型变量的是() A. 工资收入 B?产品等级 C?学生对考试改革的态度

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题 一、单项选择题 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是() A.332.1万户家庭B.3000户家庭 C.332.1户家庭的年均收入D.3000户家庭的年均收入 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有( ) A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19B.28.90C.19.54D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比B.各组频数与下一组频数之比 C.各组频数与总频数之比D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9B.0C.0.5D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数B.离散系数C.回归系数D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

2013春社会统计学期末复习训练

2013春社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是() A.样本B.总体C.统计量D.变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有() A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例 ()偏高。如果要检验该说法是否正确,则假设形式应该6为() A.:≥0.1; :<;0.1 B.:≤0.1; :>0.1 C.:=0.1; :≠0.1 D.:>0.1; :≤0.1 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是()

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

社会统计学复习整理

社会统计学复习整理 一、变量的测量层次 二、判断变量层次的技巧 1.首先所有的变量都是定类变量。 2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。 3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。 三、变量层次的比较 定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法 第二节简化一个变项的分布 一、定类变量 1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。 2.统计表必备的容: (1)表号、标题 (2)标识行:变量名、对应数据说明(频次、频率) (3)主题行:变量取值的统计数据 (4)表尾:如果是引用必须说明资料来源 二、定序变量 1.适合定序变量的简化资料的方法 (1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和

向下累加次数(cf↓)。 (2)累加频率:把各级的百分率逐渐相加。也分为向下累加百分率和向下累加百分率。 2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。 3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。 ?cf↑表示低于某个等级的频数有多少 ?cf↓表示高于某个等级的频数有多少 三、定距变量 1.定距变量的简化工具是:分组、直方图和折线图。 2.连续型定距变量的分组统计 (1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。 (2)组限:包括上限(up)和下限(low) (3)标识下限和标识上限,例500—699 (4)真实下限:标识下限—0.5;真实上限:标识上限+0.5. (5)组距:真实上限与真实下限之差。 (6)组中值:真实上限与真实下限的平均值。 第三节集中趋势测量法 1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数 值来代表变项的资料分布,以反映资料的集结情况。 2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的 数值。

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

统计学期末复习

2、解释分类数据、顺序数据、数值型数据的含义 分类数据,是只能归于某一类别的非数字型数据,他是对数据分类的结果,数据表现为类别, 是用文字表述的。 顺序数据,是只能归于某一有序别的非数字型数据。 数字型数据,是按数字尺度测量的观察值,其结果表现为具体的数值。 2、按照统计数据的收集方法,可以将其分为观测数据和实验数据。(会区分) 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件 下得到的,有关社会经济现象的统计数据几乎都是观测数据。 实验数据:是在实验中控制实验对象而收集的数据 6、非抽样误差的类型有? (1)抽样框误差(2)回答误差(3)无回答误差(4)调查员误差(5)测量误差 8直方图与条形图有何区别 区别:1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。2)由于分组数据具有连续性,直方 图的各矩形通常是连续排练,而条形图则是分开排列。3)条形图主要用于展示分类数据, 而直方图则主要用于展示数值型数据。 9、饼图和环形图有什么不同 饼图是用圆形及圆内扇形的面积来表示数值大小的图形,它主要用于表示总体中各组成 部分所占的比例,对于研究结构性问题十分有用。 环形图与饼图类似,但它们之间也有区别。环形图中间有一个“空洞”,总体或样本中 的每一部分数据由环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于我们进行比较研究。 13、简述中心极限定理的内容 设从均值为卩、方差为d 2 (有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值一的抽样分布近似服从均值为□、方差为d 2/n的正态分布。 14、假设检验和参数估计有什么相同点和不同点?解:参数估计与假设检验是统计推断的两个组成部分。 相同点:它们都是利用样本对总体进行某种推断。 不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数卩在估计前是未知的。而在假设检验中,则是先对卩的值提出一个假设,然后利用样本信息去检验这个假设是否成立。 15、置信区间的理解,有以下几点需要注意: (1 )如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%勺区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平的95%勺置信区间。 16、简述评价估计量好坏的标准 (1 )无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2 )有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

秋社会统计学期末复习训练题

秋社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平, 某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查, 其中44%回答她们的月收入在6000元以上, 30%回答她们每月用于娱乐消费在1000元以上。此处800人是( ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中, 将各个有序类别或组的百分比逐级累加起来称为( ) A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度

D.比较多组数据的离散程度 4.经验法则表明, 当一组数据正态分布时, 在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业, 7月份利润额( 单位: 万元) 分别为72.0、 63.1、 20.0、 23.0、 54.7、 54.3、 23.9、 25.0、 26.9、 29.0, 那么这10家企业7月份利润额均值为( ) A. 39.19 B. 28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值, 这种方法称为( ) A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%, 而该

车间主任认为该比例( π) 偏高。如果要检验该说法是否正确, 则假设形式应该为( ) A. H: π≥0.1; 1H: π<0.1 B. H: π≤0.1; 1H: π>0.1 C. H: π=0.1; 1H: π≠0.1 D. H: π>0.1; 1H: π≤0.1 8.下面哪一项不是方差分析中的假定( ) A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318)

最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318) 考试说明:本人汇总了历年来该科所有的试题及答案,形成了一个完整的标准考试题库,对考生的复习和考试起着非常重要的作用,会给您节省大量的时间。内容包含:单项选择题、名词解释题、简答题、计算题。做考题时,利用本文档中的查找工具(Ctrl+F),把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有其他网核、机考及教学考一体化试题答案,敬请查看。 一、单项选择题 1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生 中随机抽出成绩为第3名的学生,后面以10为间隔依次选出第13、23、33、43、53、63、73、83、93九 名同学进行调查。这种调查方法属于( )。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样 2.以下关于因变量与自变量的表述不正确的是( )。 A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化不以自变量的变化为前提 3.某地区2001- 2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111, 114,115,下列哪种图形最适合描述这些数据?( ) A.茎叶图 B.环形图 C.饼图 D.线图 4.以下关于条形图的表述,不正确的是( )。 A.条形图中条形的宽度是固定的 B.条形图中条形的长度(或高度)表示各类别频数的多少 C.条形图的矩形通常是紧密排列的 D.条形图通常是适用于所有类型数据 5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5 分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。 A.数学

社会统计学综合练习题资料

社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是()A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业

7月份利润额均值为( ) A. 39.19 B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数

2020电大社会统计学期末复习训练及部分答案必考重点

电大社会统计学期末复习训练及部分答案小抄 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是(B) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C ) A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19 B. 28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为(A ) A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为(C) A. H:π≥0.1; 1 H:π<0.1 B. H:π≤0.1; 1 H:π>0.1 C. H:π=0.1; 1 H:π≠0.1 D. H:π>0.1; 1 H:π≤0.1 8.下面哪一项不是方差分析中的假定()

相关主题
文本预览
相关文档 最新文档