当前位置:文档之家› 统计学课后习题

统计学课后习题

统计学课后习题
统计学课后习题

第一章导论

1.Q:什么是统计学?

A:统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

2.Q:解释描述统计和推断统计。

A:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。统计推断是研究如何利用样本数据来推断总体特征的统计方法。

3.Q:统计数据可分为哪几种类型?不同类型的数据各有什么特点?

A:①按计量尺度不同,可分为:分类数据(只能归类于某一类别的非数字型数据)、顺序数据(只能归类于某一有序类别的非数字型数据)、数值型数据(按数字尺度测量的观察值);

②按统计数据的收集方法不同,可分为:观测数据(通过调查或观测而收集到的数据)、实验数据(在

实验中控制实验对象而手机到的数据);

③按被描述的现象和时间的关系,可分析:截面数据(在相同或近似相同的时间点上收集的数据)、时

间序列数据(在不同时间上收集的数据,用于所描述的现象随时间变化的情况)。

4.Q:解释分类数据、顺序数据和数值型数据的含义。

A:见3。

5.Q:举例说明总体、样本、参数、统计量、变量这几个概念。

A:总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用于描述总体特征的概括性数字度量;统计量是用于描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。

6.Q:变量可分为哪几类?

A:分类变量(说明事物类别的一个名称);顺序变量(说明事物有序类别的一个名称);数值型变量(说明事物数字特征的一个名称)。

7.Q:举例说明离散型变量和连续性变量。

A:离散型变量:企业数、产品数量;连续型变量:年龄、温度、零件尺寸的误差。

8.Q:请举例统计应用的几个例子。

A:要了解一个地区的人口特征、对产品的质量进行检验等。

9.Q:请举例统计应用的几个领域。

A:政府部门、学术研究领域、日常生活、公司或企业的生产经营管理(企业发展战略、产品质量管理、市场研究、财务分析、经济预测、人力资源管理)。

第二章数据的搜集

大纲重点:1、调查的组织与实施;2、概率抽样和非概率抽样;

1.Q:什么是二手资料?使用二手资料需要注意些什么?

A:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据,即二手资料。二手资料具有搜集方便、数据采集快、采集成本低等优点,但也有很大的局限性,如资料的相关性不够,口径可能不一致,数据也许不准确,也许过时了等等

2.Q:比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用

非概率抽样。

A:(1)概率抽样也叫随机抽样,

有3个特点:①抽样时按一定的概率以随机原则抽取样本②每个单位被抽中的概率是已知的或是可以计算出来的③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率,即估计量不仅与样本单位的观测值有关,也与其入样概率有关;

分为2类:等概率抽样和不等概率抽样;

常用方式5个,如下:

(2)非概率抽样常用方式5个,如下:

(3)概率抽样与非概率抽样的比较

3.Q:调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?

A:观察式。

4.Q:自填式、面访式、电话式各有什么长处和弱点?

5.Q:请举出(或设计)几个实验数据的例子。

A:略。

6.Q:你认为应当如何控制调查中的回答误差。

A:数据的误差分为抽样误差和非抽样误差。抽样误差与样本量大小和总体的变异性有关;非抽样误差分为:抽样框误差、回答误差(理解误差——设计一份好的问卷调查、记忆误差——缩短调查所涉及的时间范围或以年度为调查期、有意识误差——说服、保密、避免敏感性问题)、无回答误差、调查员误差、测量误差。

7.Q:怎样减少无回答?请通过一个例子,说明你所考虑到的减少误会大的具体措施。

A:。无回答误差是随机的,增大n,调查数据的质量与调查员的责任心和耐心密切相关;无回答的系统性误差主要有两个解决途径:预防;分析无回答产生原因,采取补救措施。

第三章数据的图表处理

大纲重点:3、数据的预处理;4、定性数据;5、定量数据;

1.Q:数据的预处理包括哪些内容?

A:①数据审核:直接数据——完整性(条目数)、准确性(异常值);二手数据——适用性、时效性;

②数据筛选;③数据排序;④数据透视表(列联表)。

2.Q:分类数据和顺序数据的整理和图示方法各有哪些?

A:⑴分类数据:①整理及描述:频数分布表,频数、比例、百分比、比率;

②图示:条形图/柱形图、帕累托图(左侧频数、右侧累计百分比)、饼图(研究结构性问题)、环形图

(两总体或样本分类相同且问题可比)。

⑵顺序数据:①整理及描述:(向上/向下)累积频数、累积频率、累积百分比;

②图示:累积频数分布、频率图;

3.Q:数值型数据的分组方法有哪些?简述组距分组的步骤。

A:⑴分组方法有:单变量分组(适合离散变量且值较少)、组距分组(连续变量或值较多)。

⑵组距分组步骤为:①确定组数(5-15);②确定各组的组距;③根据分组整理成频数分布表。两原则:

不重不漏、上组限不在内(区间左闭右开)。

⑶图示:①分组数据——直方图、折线图、曲线图;②未分组数据——茎叶图、箱线图;③时间序列数

据——线图;④多变量数据——散点图(两变量)、气泡图(三变量)、雷达图(多变量)。

4.Q:条形图和直方图有何区别?

A:前者用长度表视频数(率),宽度固定,各矩形分开排列,主要展示分类数据;后者用面积表示频数(率),宽度为组距,各矩形连续排列,主要展示数值型数据。

5.Q:绘制线图应注意哪些问题?

A:①时间一般绘在横轴,观测值绘在纵轴;②一般应绘制横轴略大于纵轴的长方形,其长度比例大致为10:7;③一般情况下,纵轴下端应从“0”开始,以便于比较;如果数据与“0”之间的间距过大,可以采取折断的符号将纵轴折断。

6.Q:饼图和环形图有什么不同?

A:前者只能显示一个样本或总体的比例数据;后者可以同时显示多个样本或总体的比例数据,有利于比较。

7.Q:茎叶图与直方图相比有什么优点?它们的应用场合是什么?

A:前者类似于横直直方图,既能展示数据分布状况,又保留了原始数据,适用于小批量数据;后者也能很好显示数据分布状况,但不能保留原始数据,适用于大批量数据。

8.Q:鉴别图表优劣的准则有哪些?

A:略。

9.Q:制作统计表应注意哪几个问题?

A:略。

第四章数据的概括性度量

重要知识点:

1、描述统计量:

2、众数、中位数、平均数的比较:

①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大量的分类数据。

②中位数:一组数据中间位置的代表值,不受极端值影响,只利用了一个数据,信息浪费严重,适用于偏斜度较大的顺序数据。

③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。

课后题答案:

1.Q:一组数据的分布特征可以从哪几个方面进行测度?

A:集中趋势、离散程度、分布的形状(偏态、峰态)。

2.Q:怎样理解平均数在统计学中的地位?

A:平均数在统计学中具有重要地位,它是进行统计分析和统计推断的基础。平均数是一组数据的中心所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。平均数也是应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。

3.Q:简述四分位数的计算方法?

A:首先对数据进行排序,然后通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。中间的四分位数就是中位数,25%和75%位置上的数值分别成为下四分位数和上四分位数。

4.Q:对于比率数据的平均为什么采用几何平均?

A:略。

5.Q:简述众数、中位数和平均数的特点和应用场合?

A:①众数:一组数据分布的峰值,不受极端值影响,不具有唯一性,没有利用全部数据,适用于较大

量的分类数据。

②中位数:一组数据中间位置的代表值,不受极端值影响,只利用了一个数据,信息浪费严重,适用于偏斜度较大的顺序数据。

③平均数:一组数据的重心,应用最广泛的集中趋势测度值,具有优良的数学性质,是统计推断的基础,利用了全部数据,易受极端值影响,适用于偏斜度不大的数值型数据。

6.Q:简述异众比率、四分位差、方差或标准差的适用场合。

A:对于分类数据,主要用异众比率来测量其离散程度;对于顺序数据,虽然也可以计算异众比率,但主要是用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率、四分位差、极差和平均差等,但主要是用方差和标准差来测度其离散程度。

7.Q:标准分数有哪些用途?

A:测度每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。

8.Q:为什么要计算离散系数?

A:方差和标准差是反映数据分散程度的绝对值,其数值的大小一方面受原变量本身水平高低的影响,另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。

9.Q:测度数据分布形状的统计量有哪些?

A:偏态系数SK(高度偏态分布|SK|>1、中等偏态分布0.5-1;右偏SK>0、左偏SK<0)、峰态系数K(正态分布的K=0,尖峰分布K>0,平峰分布K<0)。

第五章概率与概率分布

大纲重点:概率论

㈠、事件及关系和运算:随机事件、必然事件、不可能事件;

㈡、事件的概率:古典定义(结果有限、可能性相同)、统计定义(大量重复试验)、主观概率主义;

㈢、条件概率和全概率公式:条件概率:P(A|B)=P(AB)/P(B);全概率公式:P(A)=P(A|B1)*P(B1) + P(A|B2)*P(B2) + ... + P(A|Bn)*P(Bn);贝叶斯公式/逆概率公式:P(A|B)=P(B|A)*P(A)/P(B);

㈣、随机变量的定义:表示随机现象(在一定条件下,并不总是出现相同结果的现象称为随机现象)各种结果的变量(一切可能的样本点);

㈤离散型随机变量的分布列和分布函数:

①离散型均匀分布:其中有限个数值拥有相同的概率;

②二项分布(n重贝努力试验—有放回):P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),记作ξ~B(n,p),期望:Eξ=np,方差:Dξ=npq;

③超几何分布(无放回—古典概率求解):P(X=k)=C(k,M)*C(n-k,N-M)/C(n,N);

②二项分布与③超几何分布的关系:N→无穷,limC(k,M)*C(n-k,N-M)/C(M,N)=B(n,p) (二项分布),即“无放回”可当“有放回”处理;因此,在实际应用时,只要样品个数N>=10n试验次数,可用二项分布近似描述不合格品的概率。

④泊松分布:描述单位时间(或空间)内随机事件发生的次数。,期望:Eξ=λ,方差:Dξ=λ。

②二项分布与④泊松分布的关系:当二项分布的n很大而p很小时,二项分布可近似等于泊松分布,其中λ=np。通常当p≦0.05,n>20,n p≦5时,就可以用泊松公式近似二项分布计算。

㈥连续型随机变量的概率密度函数和分布函数:均匀分布、正态分布、指数分布;

①均匀分布:设连续型随机变量X的分布函数为F(x)=(x-a)/(b-a),a≤x≤b ,则称随机变量X服从[a,b]上的均匀分布,记为X~U[a,b];

②指数分布:

期望:Eξ=1/λ,方差:Dξ=1/λ2,离散系数V=1

③正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:X~N(μ,σ2),则其概率密度函数为

正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。

重要性质:P(a≤X≤b)=;

二项分布与正态分布的关系:参数为n和p的二项分布,在n很大,而0

泊松分布与正态分布的关系:泊松分布带有参数λ,当取样样本数很大时,近似服从正态分布且μ= λ,σ2 = λ。

㈥随机变量的期望与方差:

①离散型:

a、期望:,

b、方差:设X为服从分布F的随机变量,则称D(X) = ∑(Xi-E(X))2 Pi= E(X2) ? E2(X)为随机变量X或者分布F的方差。如果是随机变量X的期望值(平均数),则其方差为: D(X)= ,

c、离散系数:V=σ/u

②连续型:

期望:,

方差:D(X) =E{[X-E(X)]2}

③期望与方差的性质:

(1)设c是常数,则E(c)=c,D(c)=0。

(2)设X是随机变量,c、d是常数,则有E(cX+d)=cE(X)+d,D(cX+d)=c2D(X)。

(3)设 X 与 Y 是两个随机变量,则

D(X+Y)= D(X)+D(Y)+2E{[X-E(X)][Y-E(Y)]}

特别的,当X,Y是两个相互独立的随机变量,上式中右边第三项为0(常见协方差),

则D(X+Y)=D(X)+D(Y)。此性质可以推广到有限多个相互独立的随机变量之和的情况。

(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。

㈦随机变量函数的期望与方差:

课后题:

1.Q:频率与概率有什么关系?

A:频率和概率是度量事件出现可能性大小的两个统计特征数。频率是试验值,具有随机性,可能取多个值,近似反映事件出现可能性的大小,容易得到,应用更广。概率是个理论值,由事件的本质所决定的,取唯一值,精确反映事件出现可能性的大小,需通过大量试验才能得到。由大数定理,随着试验次数的增大,该频率围绕某一常数p上下波动,且波动幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,即为P(A)=m/n=p。

2.Q:独立性与互斥性有什么关系?

A:互斥事件一定是相互依赖(不独立)的,独立事件不可能是互斥的。

3.Q:根据自己的经验体会举几个服从泊松分布的随机变量的实例。

A:在某企业中每月发生事故的次数;单位时间内达到某一服务台需要服务的顾客人数。

4.Q:根据自己的经验体会举几个服从正态分布的随机变量的实例。

A:某公司销售量;身高、体重、肺活量。

第六章统计量及其抽样分布

大纲重点:6、描述水平:平均数、中位数、分位数、众数;7、极差、标准差、样本方差;

1.Q:什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数?

A:在实际应用中,当我们从总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行判断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中我们关心的信息集中起来,针对不同的研究目的构造不同的样本函数,这种函数在统计学中成为统计量。

2.Q:什么是次序统计量?什么是充分统计量?什么是自由度?

A:略。

3.Q:简述χ2分布、t分布、F分布及正态分布之间的假设条件、应用及关系。

A:三大抽样分布一般是指χ2分布、t分布和F分布;χ2分布、t分布和F分布是在正态总体条件下求出的精确的抽样分布。

χ2分布

定义: 设随机变量X1, X2,......X n相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2= X12+ X22所服从的分布为自由度为n 的χ2分布。

2+......+X

n

卡方分布最常用的是拟合优度检验。

t分布

定义:设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t= X1/(X2/n的平方根)所服从的分布为自由度为n的t分布。

t分布是在小样本场合下的正态分布(大样本场合下可以用正态分布来近似),有时候在信息不足的情况下,只能用t分布,比如在整体方差不知的情况下,对总体均值的估计和检验通常要用t统计量,这里自由度要比方差已知情况上构造的正态统计量少了一个自由度,因为损失信息肯定要损失自由度的。

F分布

定义:设X1服从自由度为m的χ2分布, X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=( X1/m)/( X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。F分布在方差分析、回归方程的显著性检验中有重要的地位。

4.Q:什么是抽样分布?

A:从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。

5.Q:简述中心极限定理的意义。

A:设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

6.Q:简述Z检验、t检验、F检验、卡方检验。

A:①Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。

②T检验主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。T检验是用于小样

本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,

从而判定两个平均数的差异是否显著。

③F检验又称“变异数分析”或“方差分析(ANOVA)”,用于两个及两个以上样本均数差别的显著性检验。

基本思想:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。前提:可比性、正态性、方差齐性。方差分析主要用于:均数差别的显著性检验;分离各有关因素并估计其对总变异的作用;分析因素间的交互作用;方差齐性检验。

④卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及

两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。应用实例:适合度检验、独立性检验、统一性检验。

第七章参数估计(贾俊平)

大纲重点:8、参数估计的原理;9、一个总体参数、二个总体参数的区间估计;10、样本量的确定;

1.参数估计:参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的重要内容之一,是数理统计学的一个重要分支,分为点估计和区间估计两部分。(用样本统计量来估计未知总体参数)

2.估计量:估计总体参数的统计量。

3.估计值:用具体样本计算出的估计量的值,即估计量的实现。

4.点估计:用某个估计值作为总体参数的估计。

5.区间估计:以点估计为基础,给出总体参数估计的一个区间范围,由点估计量加减边际误差得到。能由抽样分布给出估计量与总体参数接近程度的概率度量,即置信水平。

6.置信区间:总体参数的估计区间。统计学家在某种程度上确信它会包含总体参数真值,是随机区间。

7.置信水平(置信度):重复构造置信区间多次,其中包含总体参数真值的区间个数所占的比例。它是针对随机区间而言的。

8.估计量评价标准:无偏性、有效性、一致性。

9.理论基础

①大数定律:揭示了大量随机现象均值的稳定性。常见的有伯努利大数定律(频率稳定性),辛钦大数定律(简单随机样本均值依概率收敛于总体均值),切比雪夫大数定律。是用样本估计总体的理论基础。

②中心极限定理:揭示了独立同分布随机变量之和的极限分布是正态分布。常见的有伯努利试验场合、独立同分布试验场合的中心极限定理。是区间估计和假设检验的理论基础。

③抽样分布基本定理(正态假定)

a.

2

~(,/)

X N n

μσ

; b.

222

(1)/~(1)

n S n

σχ

--;

c. X与2S相互独立;

d.

~(1)

X

t n-

e.

22

12

12

22

12

/

~(1,1) () /

S S

F n n

σσ

--独立样本

f. 22

1212~(2) (=)

X Y t n n σσ+-独立样本,。

10.单总体参数估计

①目标量:μ,π,2

σ。

②影响因素:a.是否是正态总体;b.总体方差是否已知;c.是大样本还是小样本。 ③抽样分布

a. ~(0,1)

X Z N =;

b. ~(1) ~~(0,1) () t n X t N -?=??,大样本;

c.

~(0,1) (5()5)

Z N np n n p =

≥-≥大样本,,;

d.

2222

(1)/~(1)n S n χσχ=--。 11.两总体参数估计

①目标量:12μμ-,12ππ-,22

12σσ-。

②影响因素:a.是否是正态总体;b.两总体总体方差是否已知、是否相等;c.是大样本还是小样本,两样

本量是否相等;d.是独立样本还是匹配样本。

③抽样分布

a.

~(0,1) ()

X X Z N =

独立样本;

b.

~(0,1) ()

X X Z N =

独立大样本;

c.

22

1212~(2) ()

X X t t n n σσ=

+-独立样本,=;

d.

~(0,1) ()

d Z N =

匹配样本;

e.

~(0,1) ()

d Z N =

匹配大样本;

f.

~(0,1) ()

Z N =

独立大样本;

g.

22

12

22

12

/

~(1,2) () /

S S

F F n n

σσ

=--独立样本

12.确定样本量

22

/2

/22

(1)

z

E z n E

E

α

α

σ

α

=?=-表示可靠性,表示精度

课后题:

1.Q:解释估计量和估计值。

A:估计量是用来估计总体参数的统计量,估计值是根据一个具体样本计算出来的估计量的数值。

2.Q:怎样评价估计量好坏的标准?

A:无偏性:估计量抽样分布的数学期望等于被估计的总体参数。

3.Q:怎样理解置信区间、置信水平?

A:样本统计量所构造的总体参数的估计区间,某种程度上,确信这个区间会包含真正的总体参数。置信区间中包含总体参数真值的次数所占的比例称为置信水平。

4.Q:解释95%的置信区间。

A:在用同种方法构造的总体参数的所有区间中,有95%的区间包含该总体参数。

5.Q :的含义是什么?

A:估计总体均值的估计误差。

6.Q:解释独立样本和匹配样本的含义。

A:独立(匹配)样本:一个样本的元素与另一个样本中的元素相互独立(相对应)。

7.Q:在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?

A:两个总体都服从正态分布,两个随机样本独立地分别抽自两个总体。

8.Q:简述样本量与置信水平、总体方差、估计误差的关系。

A :。

补充Q:置信区间与置信水平、样本量的关系。

A:置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。在置信水平固定的情况下,样本量越多,置信区间越窄。在置信区间不变的情况下,样本量越多,置信水平越高。

第八章假设检验(贾俊平)

大纲重点:8、假设检验的基本问题;9、一个总体参数、二个总体参数的检验;10、检验问题的进一步说明;

1.假设检验:统计推断的重要内容之一,先对总体参数提出一个假设,然后利用样本来检验该假设是否成立。

2.原假设与备择假设:假设检验是围绕原假设是否成立展开的,若拒绝原假设,就用备择假设来替换。推翻原假设需要样本落入否定域,这是小概率事件,故在一次试验中原假设具有优势而备择假设不易发生,一旦发生,我们就有足够的理由推翻原假设,这意味着新结论的诞生。

3.弃真错误(α错误)与取伪错误(β错误):前者是原假设为真却被拒绝所犯的错误,后者是原假设为假

却没被拒绝所犯的错误。样本量一定时,两者是此消彼长的关系;若增大样本量,则两者同时变小。假设检验中遵循“首先控制犯α错误”的原则(①遵循统一原则;②原假设明确,备择假设模糊,更愿意接受前者,因此更为关心H0为真而我们拒绝了)。

4.小概率原理:发生概率很小的随机事件在一次试验中几乎不可能发生。

5.统计量检验与P值检验:

①否定域:由一个直观上有明确意义的统计量确定。

②P值:当原假设为真时,得到所观测结果或更极端结果的概率。

③比较:统计量检验是先确定一个显著性水平α从而获得一个否定域,进行决策的界限清晰但面临的风险是笼统的,确定临界值要查表,检验统计量一般与自由度有关因而可比性较差;P值是检验的真实显著性水平,可利用P值直接决策或将P值与α进行比较,不需要查表,具有可比性。

6.假设检验流程图:

课后题:

1.Q:假设检验和参数估计有什么相同点和不同点?

A:它们都是利用样本对总体进行某种推断。不同点是:参数估计是利用(从总体中抽取的样本计算出来的)样本统计量去估计未知的总体参数;假设检验是先对总体参数提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.Q:什么是假设检验中的显著性水平?统计显著是什么意思?

A:原假设为真时被拒绝的概率或风险。不同总体之间的差异进行比较时,由于各总体存在内在的差异性,而只有当不同总体间的差异大于这个总体内部差异,则它们间的差异才具有统计显著性,否则不具有。

3.Q:什么是假设检验中的两类错误?

A:一类错误是原假设为真却被我们拒绝了,称为弃真错误;另一类错误是原假设为伪我们却没有拒绝,称为存伪错误。

4.Q:两类错误之间存在什么样的数量关系?

A:样本量一定时,两者是此消彼长的关系;若增大样本量,则两者同时变小。

5.Q:解释假设检验中的P值。

A:当原假设为真时,所得到的样本观察结果或更极端结果出现的概率。(拒绝原假设的最小显著性水平)如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒

绝原假设,P越小,我们拒绝原假设的理由就越充分。

6.Q:显著性水平与P值有何区别。

A:显著性水平a在统计学中叫做凡第一类错误的大小,第一类错误就是原假设为真时但被拒绝的概率,我们一般把这个显著性水平事先预定为0.05;P值是利用样本信息计算得到的真实显著性水平,即当原假设为真时,所得到的样本观察结果或更极端结果出现的概率。当显著性水平a从5%增大到10%,引起拒绝域变宽,即冒风险的概率增大,H0越容易被拒绝;P值是一个条件概率数值,P越小,即拒绝H0的统计证据越强。

7.Q:假设检验依据的基本原理是什么?

A:假设检验是除参数估计之外的另一类重要的统计推断问题,即先对总体参数u提出一个假设,然后利用样本信息去验证这个假设是否成立。它的基本思想可以用小概率原理来解释。小概率原理:发生概率很小的随机事件在一次试验中是几乎不可能发生的。但一旦发生,我们就有理由怀疑这一假设的真实性,拒绝原假设。

8.Q:你认为在单侧检验中原假设和备择假设的方向应该如何确定。

A:对尚未正式的事件,H0持否定态度。

第九章列联分析

1.Q:简述列联表的构造与列联表的分布。

A:两个以上的变量进行交叉分类的频数分布表。包括观察值的分布与期望值的分布。

2.Q:用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并

提出进行检验的问题。

A:一种原料来自三个不同的地区,原料质量被分成三个不同等级,从这批原料中随机抽取500件进行检验,要求检验各个地区和原料质量直接是否存在依赖关系。H0:地区和原料等级之间是独立的(不存在依赖关系)。

3.Q:说明计算χ2统计量的步骤。

A:步骤一:用观察值f0减去期望值f e;步骤二:将(f0-f e)之差平方;步骤三:将(f0-f e)2的结果除以f e;步骤四:将步骤三的结果加总。

4.Q:简述 系数、c(列联相关)系数、V 相关系数的各自特点。A:

5.Q:构造下列维数的列联表,并给出χ2检验的自由度。

A:略。自由度=(R-1)×(C-1).

补充Q:拟合优度检验和独立性检验的区别。

A:①两种检验抽取样本的方法不同:

拟合优度检验:抽样是在各类别中分别进行,依照各类别分别计算其比例。

独立性检验:抽样时并未事先分类,抽样后根据研究内容,把入选单位按两类变量进行分类,形成列联表。

②两种检验假设的内容有所差异:

拟合优度检验,原假设通常是假设个类别总体比例等于某个期望概率,

独立性检验中原假设则假设两个变量之间独立。

③期望频数的计算:

拟合优度检验:利用原假设中的期望概率,用观察频数乘以期望概率,直接得到期望频数。

独立性检验:两个水平的联合概率,是两个单独概率的乘积。

第十章 方差分析

1.基本思想:表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源。观察到的数据一般是参差不齐的,我们用SST 度量数据总的变异,将它分解为可追溯到来源的部分变异SSE 与SSA 之和,若后者的平均MSA 明显比前者的平均MSE 大, 就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。

2.基本假定:a.各总体服从正态分布;b.各总体方差相同;c.各观测值相互独立。

3.方差分析与两两均值检验:两两均值检验会增加犯第Ⅰ类错误的概率((1)/2

1(1)

n n αα--->),而且随着

检验次数的增多,偶然因素导致差别的可能性也会增加;方差分析是同时考虑所有样本,排除了错误的累积,减少了偶然因素的不利影响,也简化了检验的过程。

4.单因素方差分析: ①数据结构

1C 2C k C 11x 12x 1k x 21x 22x

2k x

1

1n x 21n x

k n k x

表1

②方差分析模型

由基本假定,2

~(,), 1,,;1,

,ij j j x N i n j k μσ==

令2

~(0,)ij ij j x N εμσ=-

有ij j ij x με=+

令总均值11

1 ()k

k

j j j j j n n n n μμ====∑∑

1

1

()0k

k

j j

j j j j n n μ

μα==-==∑∑ (j α称为第j 个水平的效应)

得单因素方差分析模型

2

1, 1,,;1,

,~(0,), 0ij j ij j

ij ij k

j j

j x i n j k

N n μαεεσεα=?=++==????=??∑各相互独立

其中,

为总体均值;

是各组均值与总均值的误差,为因素(第j 个水平的)效应;是每个水平或组的

各样本数据与其组均值的误差,为残差效应。

③步骤 a.提出假设:

0111:0:(1,

,)k k j H H j k μμααμ==?===?=不全相等;

b.构造检验统计量:0

~ (1,)H MSA F F k n k MSE

=

--; c.统计决策。 ④方差分析表

表2

5.有交互作用的双因素方差分析(等重复试验情况): ①数据结构(见表3) ②方差分析模型

由基本假定,2

~(,), 1,,;1,,;1,,ijl ij x N i s j k l m μσ===

令2

~(0,)ijl ijl ij x N εμσ=- 有ijl ij ijl x με=+

表3

令1111

111, , s k k s

ij i ij j ij i j j i sk k s μμμμμμ??=======∑∑∑∑ 令行、列、交互效应, , ()i i j j ij ij i j αμμβμμαβμμμμ????=-=-=--+ 得有交互作用因素方差分析模型

2

111

1(), 1,,;1,,;1,

,~(0,), ()()0ijl i j ij ijl

ijl ijl s k s k

j j ij ij i j i j x i s j k l m

N μαβαβεεσεαβαβαβ====?=++++===????====??∑∑∑∑各相互独立

③原假设与检验统计量

0111021103

11:0:0

:()()0

s s k s sk H H H μμααμμββαβαβ????==?===??

==?===???=

==?两因素个水平间无交互作用

/(1)/(1)/[(1)(1)]

, , /[(1)]/[(1)]/[(1)]

R C RC SSR s SSC k SSRC s k F F F SSE sk m SSE sk m SSE sk m ----=

==---

6.无交互作用的双因素方差分析: ①数据结构(见表4) ②方差分析模型

由基本假定,2

~(,), 1,,;1,,ij ij x N i s j k μσ==

令2

~(0,)ij ij ij x N εμσ=-

表4

有ij ij ij x με=+

令111

1111, , s k k s

ij i ij j ij i j j i sk k s μμμμμμ??=======∑∑∑∑ 令行、列、交互效应, , ()0i i j j ij ij i j αμμβμμαβμμμμ????=-=-=--+= 得无交互作用因素方差分析模型

2

11, 1,,;1,,~(0,), 0ij i j ij

ij ij s k

j

j i j x i s j k

N μαβεεσεαβ==?=+++==????==??∑∑各相互独立

③原假设与检验统计量

01110211:0:0

s s k s H H μμααμμββ????==?===??

=

=?=

==?

/(1)/(1)

, /[(1)(1)]/[(1)(1)]

R C SSR s SSC k F F SSE s k SSE s k --=

=----

7.多重比较:当方差分析拒绝原假设时,为进一步分析到底是哪些均值不相等,于是将各均值配对检验,但检验统计量不是t 统计量。(最小显著差异方法,计算LSD )

8.试验设计:

①含义:收集样本的计划,通过科学安排试验,用尽可能少的试验获得尽可能多的信息。主要数据分析方法是方差分析。

②完全随机化设计:将各种处理随机指派给试验单元。数据分析方法是单因素方差分析。

③随机化区组设计:将试样单元划分为若干区组,再将各种处理随机指派给各区组。划分区组可消除试验单元的差异造成的影响。因每个区组只做一次试验,故只能采用无交互作用双因素方差分析方法。

④ 因子设计:考虑两个或多个因素搭配的试验设计,每种搭配可重复试验。数据分析方法是有交互作用双因素

方差分析。

课后题:

1. Q :什么是方差分析?它研究的是什么?

A : 通过检验各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,从数据误差

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出 如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer :B Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为: 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组 的试验结果。 如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱 绿色的人数的期望值? A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为: 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

医学统计学第六版马斌荣课后习题答案

第一章绪论部分 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗

患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1

统计学(第三版课后习题答案

Hah 和网速是无形的 1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%) 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

统计学课后习题答案修订稿

统计学课后习题答案 WEIHUA system office room 【WEIHUA 16H-WEIHUA WEIHUA8Q8-

第一章统计学及基本概念 3 第二章数据的收集与整理 10 第三章统计表与统计图19 第四章数据的描述性分析 25 第五章参数估计37 第六章假设检验49 第七章方差分析62 第八章非参数检验 70 第九章相关与回归分析78 第十章多元统计分析89 第十一章时间序列分析101 第十二章指数108 第十二章指数108 第十三章统计决策 120 第十四章统计质量管理128 第一章统计学及基本概念 统计的涵义(统计工作、统计资料和统计学) 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)统计学的发展史(学派与主要代表人物) 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数) 变量:连续与离散;确定与随机 总体、样本与个体 标志、指标及指标体系 统计计算工具 习题 一、单项选择题 1. 推断统计学研究()。(知识点:答案:D) A.统计数据收集的方法B.数据加工处理的方法

C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法 2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。 (知识点:答案: D) A.数理统计学派 B.政治算术学派 C.社会统计学派 D.国势学派 3. 下列数据中哪个是定比尺度衡量的数据()。(知识点:答案:B) A.性别 B.年龄 C.籍贯 D.民族 4. 统计对现象总体数量特征的认识是()。(知识点:答案:C) A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体 5. 调查10个企业职工的工资水平情况,则统计总体是()。(知识点:答案:C) 个企业个企业职工的全部工资个企业的全部职工个企业每个职工的工资 6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:答案:A) A. 样本 B. 总体单位 C. 个体 D. 全及总体 7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。(知识点:答案:D) A. 指标 B. 标志 C. 变量 D. 标志值 8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:答案:A) A. 品质标志 B. 数量标志 C. 质量指标 D. 数量指标 9. ()表示事物的质的特征,是不能以数值表示的。(知识点:答案:A) A. 品质标志 B. 数量标志 C. 质量指标 D. 数量指标

统计学原理_第六版_课后答案解析

《统计学原理(第六版)》计算题解答 第三章 综合指标 1. 见教材P427 2. %86.12270 25 232018=+++= 产量计划完成相对数 发 3. %85.101% 108% 110%%(%)===计划为上年的实际为上年的计划完成程度指标 劳动生产率计划超额1.85%完成 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本未完成计划,实际单位成本比计划规定数高2.22% 5. %105% 103% %%(%) 计划为上年的计划为上年的实际为上年的计划完成程度指标=∴= 1.94% % 94.101103% 105% % 即计划规定比上年增长计划为上年的解得:== 6. 见教材P427 7. 见教材P428 )/(2502500625000)/(2702500 675000亩千克亩千克乙 甲====== ∑ ∑∑∑f xf X x m m X 在相同的耕地自然条件下,乙村的单产均高于甲村,故乙村的生产经营管理工作做得好。但由于 甲村的平原地所占比重大,山地所占比重小,乙村则相反,由于权数的作用,使得甲村的总平均单产高于乙村。

%.f x X 9103=? =∑ ∑平均计划完成程度 10. 见教材P428 11. %74.94963.09222.09574.03=??=G X 12. (1) % 49.51X %49.105 08.107.105.104.102.1 X 1624632121=-=????=∑??????=G f f n f f G n X X X 平均年利率:平均本利率为: (2) % 50.5 16 2 %84%76%53%4%2X =?+?+?+?+= = ∑∑f Xf

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

统计学课后第一章习题答案.doc

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是()A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中,关于推断统计的描述是() A、一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌; B、.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学(第六版)贾俊平课后习题集规范标准答案

第一章导论 1.1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。

第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学贾俊平第五版课后习题答案完整版

亲爱的,一章一章来,肯定能弄完的,你是最棒的! 统计学(第五版)贾俊平课后习题答案(完整版) 第一章思考题 i.i什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得岀结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。 2.2 比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

统计学第五版课后题答案

第一章导论 1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5.请举出(或设计)几个实验数据的例子。 不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。 6.你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。 7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。 第三章数据的图表搜集 一、思考题 3.1数据的预处理包括哪些内容? 答:审核、筛选、排序等。 3.2分类数据和顺序数据的整理和显示方法各有哪些? 答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,

相关主题
文本预览
相关文档 最新文档