当前位置:文档之家› 社会统计学期末复习题

社会统计学期末复习题

社会统计学期末复习题
社会统计学期末复习题

社会统计学课程期末复习题

一、名词解释

1、社会统计学:社会统计学就是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。也就是对社会现象的资料进行收集、整理和分析,以便对社会学的假设、理论进行求证的一门方法论学科。

4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。

5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。

7、消减误差比例:变量间的相关程度,可以用不知Y与X有关系时预测Y的误差

E,减去知道Y

与X有关系时预测Y的误差

1

E,再将其化为比例来度量。将削减误差比例记为PRE。

8、因果关系:变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。

9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。

13、大数定理:当我们的观察次数n趋向无限时,随机事件可能转换为不可能事件或必然事件。即,在大量观察的前提下,观察结果具有稳定性。多次重复试验,随机变量的平均值接近数学期望(即总体均值)。

7.描述性统计就是讨论范围仅以搜索的资料本身为限,而不予以扩大。早期的统计都是描述统计。8.推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。

9.样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。

10.标志是说名总体单位属性或数量特征的名称。11.虚拟变量——当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。

12.指标体系就是一系列有内在联系得统计指标集合体。

13.总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。

14.中位数把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。

15.众数在一组资料中,出现次数(或频数)呈现“峰”值的那些变量值。

16.调和平均数N个变量值倒数算术平均数的倒数,也称倒数平均数。

17.几何平均数:N个变量值连乘积的N次方根。18.平均指标:就是表明同质总体在一定条件下某一数量标志所达到的一般水平。

19.显著水平能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。

20.总体参数已知一总体分布,可求得它的特征值。根据总体分布计算的特征值,即根据总体各个单位标志值计算的统计指标,在推论统计中称为总体参数。总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个总体参数,习惯上分别记作μ和σ(或σ2)。

21.检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。

22.中心极限定理如果从一个具有均值

μ和方差2

σ的总体(可以具有任何形式)中重复抽取容量为n 的随机样本,那么当n 变得很大时,样本均值的抽样分布接近正态,并具有均值

μ和方差2

σ/n 。

23.超几何分布超几何分布以样本内的成功事件的个数x为随机变量。若总体单位数为N,其中成功类共有K个,设从中抽取n个为一样本,则样本中成功类个数x 的超几何概率分布为

P(x)=H(x:N,n,K)=

n

N

x

n

K

N

x

K

C

C

C-

-

式中:x≤K,0≤x≤n,0≤K≤N。

超几何分布的数学期望μ=N

nK

,方差σ2=

)1

(

)

)(

(

-

-

-

N

N

K

K

N

n

N

n

24.泊松分布

泊松分布为离散型随机变量的概率分布,随机变量为样本内成功事件的次数。若μ为成功次数的期望值,假定它为已知。而且在某一时空中成功的次数很少,超过5次的成功概率可忽不计,那么稀有事件出现的次数x的泊松概率分布为

P(x)=P(x;λ)=

λ

λ

-

e

x

x

!

泊松分布的期望值和方差均等于它的唯一参数λ。25.卡方分布

设随机变量X1,X2,…Xk ,相互独立,且都服从同一的正态分布N (μ,σ2)。那么,我们可以先把它们变为标准正态变量Z1,Z2,…Zk ,k 个独立标

准正态变量的平方和被定义为卡方分布(2χ分布)的随机变量2

χ

2χ(k )=(

σμ-1X )2+(

σ

μ

-2X )2+…+

σ

μ

-k X )2

∑=-k i i

X

1

2

2)

(1

μσ=∑=k

i i

Z

1

2

其中k 为卡方分布的自由度,它表示定义式中独立变量的个数。

2

χ分布的期望值是自由度k ,方差值为自由度

的2倍。 26.F 分布

F 分布是连续型随机变量的另一种重要的小样本分布。设2

χ(1k )和2

χ(2k )相互独立,那么随机变量

F (1k ,2k )=2221

12/)(/)(k k k k χχ

服从自由度为(1k ,2k )的F 分布。其中,分子上的自由度1k 叫做第一自由度,分母上的自由度2

k 叫做第二自由度。

30.所谓独立样本,指双样本是在两个总体中相互独立地抽取的

31.所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。

32.单一试验组的试 单一实验组实验是对同一对象在某种措施实行前后进行观察比较的一种简单实验,它只有实验组而没有控制组。或者说,同一个组在实施实验刺激之前是实验中的“控制组”,在实施实验刺激之后就成了“实验组”。 33.一试验组与一控制组的试验

配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设μd =0的单样本检验来处理。

34.拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。

35.列联表:是按品质标志把两个变量的频数进行交互分类的统计表格。

36.理论频数:是按照理论分布计算出的样本各组频数。

37.方差分析:研究多个总体均值是否存在差异的统计检验方法。

38.方差分析表:用于表达方差分析结果的标准形

式的表格。其基本形式如下:

项目 SS 自由度 MS 检验统计量 临界值 显著性

组间 SSB (c ―1) MSB MSB / MSW F α(c ―1,n ―c) (待定)

组内 SSW (n ―c ) MSW —— —— ——

总 SST (n ―1) —— —— —— ——

39.总变差:记作SST ,它表示

ij

Y 对于总均值Y 的

偏差之平方和,即 SST =

2

11

)(∑∑==-c

i n j ij

i

Y Y

40.组内变差:记作SSW ,它是各观测值

ij

Y 对其所

属类别均值i Y 的偏差的平方和,即

∑∑==-c

i n j i ij

i

Y Y

11

2

)(

41.组间平方和:记作SSB ,是自变量因素所没有

解释的ij Y

的变异,即21)(Y Y n c

i i i -∑= 42.相关比率:方差分析中把已解释的变差对总变

差的比值称为相关比率,用符号2η表示。 2η=

1―T

W

SS SS

43.估计标准误差:为回归剩余方差MSW 的平方根,

即SY/X =22--∑

n Y Y c

)(

44.零假设 概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。

45.第一类错误 零假设Ho 实际上是正确的,却被否定了。

46.第二类错误 零假设Ho 实际上是错误的,却没有被否定。

正态分布 由德国数学家高斯提出,也叫高斯分布;2、自然界、社会经济生活中大量存在的分布规律;3、经典统计推断的基础;4、在所有的分布中,正态分布居于首要位置;基本特征一个高峰 一条对称轴 一条渐近线 众值=中位值=均值 M0=Md=μ

正态曲线的位置由均值μ 决定;

正态曲线的形状“高,矮,胖,瘦”的特点由标准差σ 决定;

二、选择题

11.关于学生t分布,下面哪种说法不正确( B )。

A 要求随机样本

B 适用于任何形式的总体分布

C 可用于小样本

D 可用样本标准差S代替总体标准差σ

12.在统计检验中,那些不大可能的结果称为( D )。如果这类结果真的发生了,我们将否定假设。

A 检验统计量

B 显著性水平

C 零假设

D 否定域

13.在用样本指标推断总体指标时,把握程度越高则( B )。

A 误差范围越小

B 误差范围越大

C 抽样平均误差越小

D 抽样平均误差越大

14.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在( A )关系。

A 直线正相关

B 直线负相关

C 曲线正相关

D 曲线负相关

15.评价直线相关关系的密切程度,当r在0.5~

0.8之间时,表示( C )。

A 无相关

B 低度相关

C 中等相关

D 高度相关

16.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。

A在相关分析中,相关的两变量都不是随机的;

B在回归分析中,自变量是随机的,因变量不是随机的;

C在回归分析中,因变量和自变量都是随机的;

D在相关分析中,相关的两变量都是随机的。17.关于相关系数,下面不正确的描述是( B )。A当0≤

≤r1时,表示两变量不完全相关;

B当r=0时,表示两变量间无相关;

C两变量之间的相关关系是单相关;

D如果自变量增长引起因变量的相应增长,就形成正相关关系。

18.欲以图形显示两变量X和Y的关系,最好创建( D )。

A 直方图

B 圆形图

C 柱形图

D 散点图19.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为( C )。

A 0.50

B 0.80

C 0.64

D 0.90 20.在完成了构造与评价一个回归模型后,我们可以( D )。

A 估计未来所需样本的容量

B 计算相关系数和判定系数

C 以给定的因变量的值估计自变量的值

D 以给定的自变量的值估计因变量的值

21.两变量的线性相关系数为0,表明两变量之间( D )。

A 完全相关

B 无关系

C 不完全相关

D 不存在线性相关

22.身高和体重之间的关系是( C )。A 函数关系 B 无关系

C 共变关系

D 严格的依存关系

23.在相关分析中,对两个变量的要求是( A )。

A 都是随机变量

B 都不是随机变量

C 其中一个是随机变量,一个是常数

D 都是常数24.在回归分析中,两个变量( D )。

A 都是随机变量

B 都不是随机变量

C 自变量是随机变量

D 因变量是随机变量25.一元线性回归模型和多元线性回归模型的区别在于只有一个( B )。

A 因变量

B 自变量

C 相关系数

D 判定系数

26.以下指标恒为正的是( D )。

A 相关系数r

B 截距a

C 斜率b

D 复相关系数27.下列关系中,属于正相关关系得是( A )。

A 身高与体重

B 产品与单位成本

C 正常商品的价格和需求量

D 商品的零售额和流通费率

1、统计调查按调查登记的时间是否连续划分,可以分为( D )。

A全面调查和非全面调查 B一般调查和专项调查

C抽样调查和普遍调查 D经常性调查和一次性调查2、在回归分析中,估计值

y?

与各实际观测值的平均数

y

的离差平方和称为( A )。

A回归变差 B剩余变差 C判定变差 D总变差3、若某总体次数分布呈轻微右偏分布,则有( C )式成立。

A o

M

<X<e

M

B X<e

M

<o

M

C o

M

<e

M

<X D e

M

<X<o

M

4、若某总体次数分布呈轻微左偏分布,则有( B )式成立。

A o

M

<X<e

M

B X<e

M

<o

M

C o

M

<e

M

<X D e

M

<X<o

M

5、某城市居民家庭按年收入水平分为六组:10000元以下,10000~20000元;20000~30000元;30000~40000元;40000~50000元;50000元以上。则第一组和第六组的组中值分别为(D;

A 15000和45000

B 15000和55000

C 5000和45000

D 5000和55000

6、( C )是现象各期环比发展速度的平均数,其计算方法是各期环比发展速度连乘积开n次方根。A平均发展水平 B平均增长水平

C平均发展速度 D平均增长速度

7、家庭月收入x(元)和家庭月支出y(元)之间的回归方程为

y?=1+2x,这意味着家庭月收入每提高1元时,家庭月支出平均( B )。

A减少2元 B增加2元 C减少3元 D增加3元8、异众比率越大,各变量值相对于众数越( A )。A离散 B集中 C离散或集中 D无法判断

9、(B )是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差。 A 登记性误差 B 随机误差 C 系统性误差 D 非随机误差

10、如掌握的是分组资料中各组标志总量而缺少各

组次数的资料,则可以采用( C )公式计算平均数。

A 位置平均数

B 算术平均数

C 调和平均数

D 几何平均数

11、若按季平均计算,则各季度季节比率之和为

( A )。

A 400%

B 800%

C 1200%

D 1600%

三、填空题

1、第五次人口普查南京市和上海市的人口总数之

比为 比较 相对指标;某企业男女职工人数之比为

比例相对指标;某产品的废品率为结构相对指标;

某地区福利机构网点密度为强度相对指标。

2、各变量值与其算术平均数离差之和为零;各变

量值与其算术平均数离差的平方和为 最小值 。

3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为剩余 变差。

4、平均增长速度= 平均发展速度 —1(或100%)。

5、正J 形 曲线的特征是变量值分布的次数随变量

值的增大而逐步增多;反J 形曲线的特征是变量值

分布的次数随变量值的增大而逐步减少。

6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于重点调查。

7、要了解某市大学多媒体教学设备情况,则总体

是该市大学中的全部多媒体教学设备;总体单位是

该市大学中的每一套多媒体教学设备;。

8、若某厂计划规定A 产品单位成本较上年降低6%,

实际降低了7%,则A 产品单位成本计划超额完成程度为

100%7%A 100% 1.06%100%6%

-=-=-产品单位成本计划超额完成程度;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,

100%10%100% 4.76%100%5%

+=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯

属于品质 标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词 和宾词 两个部分组成;从格式上看,统计表由总标题、 横行标题、纵栏标题 和指标数值(或统计数值); 四个部分

组成。

11、从变量间的变化方向来看,企业广告费支出与

销售额的相关关系,单位产品成本与单位产品原材

料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产

总值属于数量指标;单位成本属于质量指标。

13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 1.社会调查资料有 随机性 、统计规律性的特点。 2.在 左偏或负偏 分布之下,众数>中位数。 3.对某一班级50名学生的体育达标情况进行测评,发现有35名同学达到合格标准,则达标率的均值是 70% 。 4.参数优良估计的三个标准是 无偏性 、有效性、一致性。

5.抽样误差是由于抽样的随机性而产生的误差,

这种误差不可避免,但可以 控制 。

6.抽样推断运用 概率估计 的方法对总体的数

量特征进行估计。

7.一个回归方程只能作一种推算,即给出自变量的数值,估计_因变量_的可能值。

8.袋中有4个白球,7个黑球,从中任意取一个球.则取出白球的概率为 4/11。 9.设X1, X2,…, X10是来自总体X ~N(0,σ 2)的样本,则∑

=10

122

i i X σ服从 自由度为10的 2χ 分布。

10.三次独立的试验中,成功的概率相同,已知至

少成功一次的概率为2719

,则每次试验成功的概率为 1/3 。

4.在一副扑克牌中单独抽取一次,抽到一张红桃

或K 的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃K 的概率是( 1/52 )。

5.不论总体是否服从正态分布,只要样本容量n 足够大,样本平均数的抽样分布就趋于(正态)分

布。

6.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平 ),它决定了否定域的大小。 7.假设检验中若其他条件不变,显著性水平的取

值越小,接受原假设的可能性越( 大 ),原假

设为真而被拒绝的概率越( 小 )。 8.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和( 区间估计 )。 9.变量间的相关程度,可以用不知Y 与X 有关系

时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 11.根据资料,分析现象之间是否存在相关关系,

其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回

归分析 )

五、计算题(计算结果保留两位小数)

标准差系数/离散系数 离散系数越大差异越大,

s σ

%100%100?=?=x

S

V X V s 或σσ

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

2014年秋社会统计学期末复习训练题

2014年秋社会统计学期末复习训练题 一、单项选择题 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。这项研究的总体是() A.332.1万户家庭B.3000户家庭 C.332.1户家庭的年均收入D.3000户家庭的年均收入 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为()A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有( ) A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、 54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19B.28.90C.19.54D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比B.各组频数与下一组频数之比 C.各组频数与总频数之比D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9B.0C.0.5D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数B.离散系数C.回归系数D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的D.没有证据证明虚无假设是错误的

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2008年中山大学823社会研究方法和社会统计学考研真题【圣才出品】

2008年中山大学823社会研究方法和社会统计学考研真题 中山大学 2008年攻读学位研究生入学考试试题 科目代码:823 科目名称:社会研究方法和社会统计学 社会研究方法部分(75分) 一、名词解释(每小题3分,共18分) 1.社会研究(social research) 2.双盲实验(double—blind experiment) 3.探索性研究(exploration research) 4.封闭式问题(closed—ended questions) 5.同期群研究(cohort studies) 6.语义差异量表(semantic differential scale) 二、简答题(每题7分,共21分) 1.在问卷调查中,一般都是采取由样本“自我报告”或“自我陈述”的方式进行测量。请问:有哪些因素干扰这种测量方式的可靠性? 2.请解释“经典实验设计”(the classical experiment design,也称双组前后测模式)

的基本含义及其基本要素。 3.在抽样中,影响样本规模(sample size)确定的因素主要有哪些? 三、分析:请从下列各小题中任意选择三小题予以回答,多选无效(每题12分,共36分) 1.请简单解释社会研究中的“创新原则”的基本意义,并列举研究中的创新都有哪些方式。 2.对问卷调查的批评之一是认为在测量中将会受到“研究者的主观预设”的影响从而妨碍资料及其研究的真实可靠性,请谈谈你的看法。 3.常有人说可以在一个实证研究项目中结合使用“定量研究方法”和“定性研究方法”,你认为这种结合有没有可能性,如果有,可以采取什么样的具体方式? 4.简述“理论检验”的程序并试举一例说明(不要求在每一步都举例)。 社会统计学部分(75分) 一、选择题(在ABCD四项答案中选择一项最合适的答案写在答题纸上,每题2分,共20分) 1.下列哪种基本技术最适合描述职业的分布() A.折线图 B.直方图 C.箱线图 D.环形图

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

社会统计学_1_试题卷

山东工商学院 2020学年第一学期社会统计学课程试题 A卷 (考试时间:120分钟,满分100分) 特别提醒:1、所有答案均须填写在960数字加起来827参考答案207上,写在试题纸上无效。 2、每份答卷上均须准确填写函授站、专业、年级、学号、姓名、课程名称。 一单选题 (共20题,总分值40分 ) 1. 标准差的大小取决与()(2 分) A. 平均水平的高低 B. 各标志值与平均水平离差的大小 C. 标志值水平的高低 D. 各标志值与平均水平离差的大小和平均水平的高低 2. 当变量X的值减少时,变量Y的值也随之减少,则变量X与变量Y之间存在()(2 分) A. 直线相关关系 B. 曲线相关关系 C. 正相关关系 D. 负相关关系 3. 抽样调查和典型调查都是非全面调查,二者的根本区别在于()。(2 分) A. 灵活程度不同 B. 作用不同 C. 组织方式不同 D. 选取调查单位的方法不同 4. 统计报表大多数属于()。(2 分) A. 一次性全面调查 B. 经常性全面调查 C. 经常性非全面调查 D. 一次性非全面调查 5. 分配数列中,当标志值较小的一组权数较大时,计算出来的算术平均数()。(2 分) A. 接近标志值大的一方 B. 接近标志值小的一方 C. 不受权数的影响 D. 不能确定其移动方向 6. 在一定的抽样平均误差条件下,()(2 分)

A. 扩大极限误差范围,可以提高推断的可靠程度 B. 扩大极限误差范围,会降低推断的可靠程度 C. 缩小极限误差范围,可以提高推断的可靠程度 D. 缩小极限误差范围,不改变推断的可靠程度 7. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。(2 分) A. 标准差系数 B. 平均差 C. 全距 D. 均方差 8. 反映样本指标与总体指标之间的平均误差程度的指标是()(2 分) A. 抽样误差系数 B. 概率度 C. 抽样平均误差 D. 抽样极限误差 9. 下列相对指标中,可以用有名数表示的有()。(2 分) A. 计划完成相对指标 B. 结构相对指标 C. 动态相对指标 D. 强度相对指标 10. 在销售量综合指数中,表示()(2 分) A. 商品价格变动引起销售额变动的绝对额 B. 价格不变的情况下,销售量变动引起销售额变动的绝对额 C. 价格不变的情况下,销售量变动的绝对额 D. 销售量和价格变动引起销售额变动的绝对额 11. 下列调查中,调查单位与填报单位一致的是()(2 分) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 12. 已知某企业总产值2001年比1998年增长187.5%,2000年比1998年增长150%,则2001年比2000年增长()(2 分) A. 37.5% B. 125% C. 115% D. 15% 13. 如果两变量之间的相关系数为-1,说明两变量之间存在()(2 分)

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318)

最新国家开放大学电大本科《社会统计学》期末标准题库及答案(试卷号:1318) 考试说明:本人汇总了历年来该科所有的试题及答案,形成了一个完整的标准考试题库,对考生的复习和考试起着非常重要的作用,会给您节省大量的时间。内容包含:单项选择题、名词解释题、简答题、计算题。做考题时,利用本文档中的查找工具(Ctrl+F),把考题中的关键字输到查找工具的查找内容框内,就可迅速查找到该题答案。本文库还有其他网核、机考及教学考一体化试题答案,敬请查看。 一、单项选择题 1.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生 中随机抽出成绩为第3名的学生,后面以10为间隔依次选出第13、23、33、43、53、63、73、83、93九 名同学进行调查。这种调查方法属于( )。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样 2.以下关于因变量与自变量的表述不正确的是( )。 A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化不以自变量的变化为前提 3.某地区2001- 2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111, 114,115,下列哪种图形最适合描述这些数据?( ) A.茎叶图 B.环形图 C.饼图 D.线图 4.以下关于条形图的表述,不正确的是( )。 A.条形图中条形的宽度是固定的 B.条形图中条形的长度(或高度)表示各类别频数的多少 C.条形图的矩形通常是紧密排列的 D.条形图通常是适用于所有类型数据 5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5 分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩考得更好。 A.数学

11级本科社会统计学试题A

2011—2012学年第二学期期末考试 2011级社会工作本科专业《社会统计学》试题A (本试卷满分100分,考试时间110分钟) 特殊说明:本考试允许使用计算器。 一、填空题(每小题1分,共10分) 1.凡不能用数量的多少来表示而只能文字表述的标志,称为________。 2. 变量数列中各组标志值出现的次数称,各组单位数占单位总数的比重称_____。 3. 在位置平均数中,出现频率最高的变量值称为__________。 4. 各变量值对其算术平均数离差的平方的算术平均数,称之为________。 5.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于________分布。 6.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越________,原假设为真而被拒绝的概率越________. 7.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和_______。8.如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应增大到____倍. 9.符号检验的零假设就是配对观察结果的差平均起来等于________。 10.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是________变量。 二、判断题(每小题1分,共10分) ( )1. 重点调查的单位是有意识的从总体中挑选出来的,通常是那些地位较特殊的单位。( )2. 将收集到得的数据分组,组数越少,丧失的信息越多。 ( )3.根据组距式数列计算得到的算术平均数只能是一个近似值。 ( )4.标准差的数值越小,则其平均数的代表性越大,说明该组变量值分布越集中。( )5. 把随机现象的全部结果及其概率,或者把随机现象的或几个结果及其概率列举出来,就可以称作概率分布。 ( )6.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( )7.泊松分布的数学期望和方差是相等的。 ( )8.样本均值是总体均值的一个无偏估计量。 ( )9.在参数估计中,概率度的大小由显著性水平 所决定,它可以认为是决定区间估计信度的关键因素。 ( )10.配对样本均值差的区间估计是两个的单样本区间估计。 三、单项选择题(每小题2分,共20分) 1.按变量的连续性,可把变量分为( ) 。 A 连续变量和随机变量 B 离散变量和确定性定量

社会统计学综合练习题资料

社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是()A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业

7月份利润额均值为( ) A. 39.19 B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数

社会统计学试题4

社会统计学试题[五] 一、选择题[每小题1分,共15分] 1.以下变量中属于定距测量层次的有[ ] A 温度 B 工资 C自行车牌号 D 技术等级 2.向上累加百分比是[ ] A 以低等级向高等级累加 B 由高等级向低等级累加 C 某一等级以下个案所占百分比 D 某一等级以上个案所占百分比 3.在正态情况下,众值[Mo],中位值[Md],均值[X]的关系为[ ] A Md5 B np>5,n[1-p]>5 C n[1-p]>5 D np>3 9.以哪种情况是甲种误差[ ] A 接受Ho时,Ho为真 B 接受Ho时,Ho为假 C 拒绝Ho时,Ho为真 D 拒绝Ho时,Ho为假 10.交互分类表检验[Х2检验][ ] A 通过频次比较进行的 B 通过相对频次比较进行的 C 左边检验 D 右边检验 二、判断题[每小题1分,共5分] 1.二项是连续性分布。[ ] 2.假设检验时,样本越在,越难以通过检验。[ ] 3.只要是两个定序变量,都可以进行斯皮尔曼等级相关分析[ ] 4.非概率抽样中,抽样原则是根据主观判断或为了其它操作上的方便。[ ] 5.在比例计算中,所有各类别的个案比例相加,结果应等于100。 [ ] 三、计算题[共85分] 1.美国70年代的年通货膨胀率如下[1970至1979年]: 5.9%,4.3%,3.3%, 6.6%,11.0%,9.1%,5.8%,6.5% 7.7%,10.9%

管理统计学期末复习

1、统计学方法可以解决的主要问题有哪些? 1)现状的客观描述(如不同状况的百分比、均值)2)均值、方差、百分比等统计值是否有本质区别(随机差异?本质差异?)3)依据样本推断总体的概率分布是什么4)依据数据找出问题的显著因素与关键因素5)寻找变量的相互关系(相关关系)6)寻找变量间的数量规律7)依据规律把变量分为具有某些共同特性的类别8)依据已有规律,判别新数据属于哪个类别等。 2、统计学的发展经历了哪些阶段?说明每个阶段的特点。 1)古典统计学时代:政治算术派国势学派2)近代统计学时代:数理统计学派社会统计学派3)现代统计学时代:区间估计理论假设检验理论 1、数据计量尺度分为哪几种?不同计量尺度各有什么特点? 答:一、定类尺度二、定序尺度三、定距尺度四、定比尺度A 定类尺度特点: (1)定类尺度是最粗略、计量层次最低的计量尺度。(2)定类尺度作为代码的数值不反映各类的优劣、量的大小或顺序,不可以区分大小或进行任何数学运算。(3)对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数。 B、定序尺度的特点:(1)定序尺度可以将研究对象分为不同的类别,而且可以反映各类的优劣、量的大小或顺序。(2)定序尺度比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的精确差

值。(3)计量结果只能比较大小,不能进行加、减、乘、除。C、定距尺度特点: (1)定距尺度不但可以用数字表示现象各类别的不同和顺序大小的差异,还可以用确切的数值反映现象之间在量方面的差异。(2)反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等(3)结果可以进行加减。D、定比尺度的特点: (1)反映现象的结构、比重、速度、密度等数量关系(2)定比尺度的计量结果可以进行加、减、乘、除等数学运算 2、统计变量分类有哪些?统计数据有哪几种? 统计变量定类变量、定序变量、数字变量;统计数据有定类数据、定序数据、定距数据和定比数据。 定类变量的值就是定类数据;定序变量的值就是定序数据;数字变量的值即为定距数据或定比数据(这两者统称为定量数据)。 3、抽样调查分为哪两类?各有什么特点?抽样调查分为随机抽样和非随机抽样。 随机抽样:在目标总体中不按任何规则抽取一定数量的样本。特点:总体中每个单位被抽中的概率是相同的,完全由许多随机因素综合作用来决定,既排除了抽样时人的主观随意性,也排除了人的主观能动性。当总体变异性大时,随机抽得的样本代表性差。误差可以估计且所需样本数量大,操作不灵活,成本较高。适合结论性调查非随机抽样:在目标总体中按某种规则抽取一定数量的个体作为样本。特点:误差不可估计,使用与探索性研究。

相关主题
文本预览
相关文档 最新文档