当前位置:文档之家› 统计学教案习题08卡方检验

统计学教案习题08卡方检验

统计学教案习题08卡方检验
统计学教案习题08卡方检验

第八章 2

χ

检验

一、教学大纲要求

(一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。

(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容

频数分布拟合优度的2χ检验。 (三) 了解内容 1.2

χ分布的图形。

2.四格表的确切概率法。

二、教学内容精要

(一)

2χ检验的用途

2χ检验(Chi-square test )用途较广,主要用途如下:

1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二)

2χ检验的基本思想

1.2χ检验的基本思想是以2

χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :

21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2

χ值不应该很大,若实际计算出的2

χ值较大,超过了设定的

检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑

-=

T

T A 2

2

χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格

表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2

χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法: n

p )

1(ππσ-=

,π为总体率,或 (8-1)

n

p p S p )

1(-=

, p 为样本率; (8-2) 2.总体率的可信区间

当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2

χ检验的基本计算

表8-1

2检验的用途、假设的设立及基本计算公式

01四格表

①独立资料两

样本率的比较

②配对资料两 样本率的比较

0H :两总体率相等 1H :两总体率不等

①专用公式

)(22

n

bc ad -=

χ

②当n 40但1T<5时,校正公式

)

)()()(()2/(22d b c a d c b a n n bc ad ++++--=

χ

③配对设计c

b c b +--=

2

2

)1(χ

R ?C 表

①多个样本率、 构成比的比较

②两个变量之 间关联性分析

0H :多个总体率(构成比)相等

(0H :两种属性间存在关联)

1H :多个总体率(构成比)不全相等

(0H :两种属性间存在关联)

)1(

2

2-=∑

C

R n n A n χ (R-1)(C-1)

频数分布表 频数分布的拟合优

度检验

0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布

∑-T

T A 2)( 据频数表

的组数而定

(五)四格表的确切概率法:当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。 (六)2

χ检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正2

χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

2.对于R ?C 表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5;

(2)注意考察是否有有序变量存在。对于单向有序R ?C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ?C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ?C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

三、典型试题分析

(一)单项选择题

1.下列哪项检验不适用2

χ检验( )

A . 两样本均数的比较

B . 两样本率的比较

C . 多个样本构成比的比较

D . 拟合优度检验

答案:A [评析] 本题考点:2

χ检验的主要用途。2

χ检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )

A .140

B .T <5

C .T 1≤或n 40≤

D .T 1≤或n 100≤

答案: C [评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2χ检验,应用Fisher 精确概率法。 3.2

χ值的取值范围为

A .∞-<2

χ<∞+ B .+∞≤≤2

0χ C .12

≤χ D .02

≤≤∞-χ

答案: B [评析]根据2

χ分布的图形或2

χ的基本公式可以判断2

χ值一定是大于等于零且没有上界的,故应选B 。

(二)是非题

两样本率的比较可以采用2

χ检验,也可以采用双侧u 检验。答案:正确。 [评析]就两个样本率的比较而言,双侧u 检验与2

χ检验是等价的。 (三)简答题

1.四格表的2

χ检验和u 检验有何联系与区别?

答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2

χ检验,两者是等价的,即2

2

χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2

χ检验可用于2?2列联表资料有无关联的检验。

2.R ?C 表2χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么?

答案:R ?C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

正常体重 合计 发生 未发生 发 生

19 5 24 未发生 12 86 98 [评析]这是一个配对设计的资料,因此用配对2χ检验公式计算。 H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α c

b c b +--=

2

2)1(χ=

()12.212

511252

=+--,1=ν

2χ=2.11<2

1,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。对三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较

矫治方法

有效人数 无效人数 合计

有效率(%)

夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计 62 123 185

33.51

[评析]

0H :三种措施有效率相等

1H :三种措施有效率不相等或不全相等 05.0=α

)1(22

-=∑c r n n A n χ=185????

? ??-?+?+?+?+?+?11812313

18625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2 查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%)

颈麻

100 41 注药

100 94 置栓

100 89 对照

100 27 [评析] 为了应用2

χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

颈麻 41 59 100 注药 94 6 100 置栓 89 11 100 对照 27 73 100 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同

05.0=α

)1(22

-=∑c r n n A n χ=400???

?

??-?++?+??110014973...1001495910025141222=146.175, ν=(4-1)

(2-1)=3 查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2

χ分布

C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布

D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验

C . 两样本率比较时,有2χ=u

D . 两样本率比较时,有22χ=t

3. 率的标准误的计算公式是: A .

)1(p p - B .

n

p p )

1(- C.1-n p D.

n

p p )

1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43?表进行检验时,11=ν C .对四格表检验时,ν=4

D .若2

,05.02,05.0ηνχχ>,则ην>

5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?

A .不能确定

B .甲、乙法一样

C .甲法优于乙法

D .乙法优于甲法

6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是: A .分性别比较 B .两个率比较的2χ检验 C .不具可比性,不能比较 D .对性别进行标准化后再做比较 7.以下说法正确的是

A .两个样本率的比较可用u 检验也可用2χ检验

B .两个样本均数的比较可用u 检验也可用2χ检验

C .对于多个率或构成比的比较,u 检验可以替代2χ检验

D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释

1. 实际频数与理论频数

2. 2χ界值表 3. 拟合优度 4. 配对四格表

5. 双向有序分类资料 6. 率的标准误

7. 多个率的两两比较 8. Fisher 精确概率 9. McNemar 检验 10. Yates 校正 (三) 是非题

四个样本率做比较,2

)3(05.02χχ> ,可认为各总体率均不相等。 (四) 计算题

1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?

2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?

表8-6 冠心病诊断结果与眼底动脉硬化级别的关系

眼底动脉硬化级别 冠心病诊断结果

合计 正常 可疑 冠心病 0 340 11 6 357

I 73 13 6 92 II 97 18 18 133 III 3 2 1

6 合计

513 44 31 588

3.表8-7是用两种方法检查已确诊的乳腺癌患者120名的检查结果,问:两种方法何者为优?

表8-7 两种方法检查结果比较

乙法 甲法 合计 + - - 30 30 60 合计

4.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?

表8-8 两种方法检查结果比较 组 别

观察人数 粪见检阴性人数 阴转率(%)

试验组 29 25 86.2 对照组 28 17 60.7 合 计 57

42 73.7

5.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9,问三个疗程组的有效率之间有无显著差异?

一疗程 二疗程 150 130 86.7 三疗程 63 56 88.9 合 计

323 268 83.0

6.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表8-10。问两组肝波型的差异有无显著性?

表8-10 急性黄疸型肝炎与正常人的超声波波形

组别 波 型

合计 正常 可疑 较密

黄疸型肝炎组

12 43 232 287

正 常 人 组

277 39 11 327 合计

289 82 243 614

7.有人研究惯用手与惯用眼之间是否存在一定关系,得资料如表8-11,试作统计分析。

表8-11 冠心2号方治疗心绞痛的有效率

惯用左眼 两眼并用 惯用右眼 合计 惯用左手 34 62 28 124 两手并用 27 28 20 75 惯用右手 57 105 52 214 合 计

118 195 100

413

8.苏格兰西南部两个地区献血人员的血型记录如下表(表8-12),问两地的血型分布是否相同?

表8-12 两个地区献血人员的血型分布

地区

血 型

合计

A B O AB Eskdale

33 6 56 5 100 Annandale 54 14 52 5 125 合计

87 20 108 10

225

五、习题答题要点

(一) 单项选择题

1.C

2.A

3.D

4.D

5.A

6.D

7.A (二) 名词解释

1.实际频数:actual frequency ,即实际观察值。理论频数:theoretical frequency ,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

2.2χ界值表:将2χ分布右侧尾部面积等于α时所对应的2χ值称为2χ分布的临界值,对于不同的自由度及α有不同的临界值,由这些临界值构成的表即2χ界值表。

3.拟合优度 :指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

4.配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A 处理,另一个接受B 处理,每种处理的反应都按二项分类。全部n 对实验结果的资料以表8-12表示,这样的表称为配对四格表。

表8-12 配对四格表的形式 A 处理 B 处理 + - + a b -

c

d

5.

双向有序分类资料:对于R ?C 表资料,当两个定性变量都有序时,这样的资料称为双向有序分类资料,如

“急性放射病分度与放射烧伤面积占不同体表面积的百分比”,这里的两个变量均为有序的。

6.

率的标准误:用以衡量由于抽样引起的样本率与总体率之间的误差的统计量,记为P σ。n

p )

1(ππσ-=

,π

为总体率,n 为样本容量;当总体率π未知时,以样本率P 作为π的估计值,率的标准误为n

p p S p )

1(-=

。 7. 多个率的两两比较:指当假设检验确定了多个率之间存在差别后,检验哪两个两个样本率之间的差别具有统计学意义的方法。

8.

Fisher 精确概率: 指当四格表中出现理论数小于1或n <40时,用R.A.Fisher (1934)提出的方法直接计算

出的有利于拒绝H 0的概率。

9. McNemar 检验:McNemar’s test for correlated proportions ,是分析配对四格表资料的方法,其计算公式为c

b c b +--=

2

2

)1(χ,v =1。

10.Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates’ correction )。

(三) 是非题

错。多个样本率做比较时,H 1为各总体率不全相等,所以当接受H 1时,并不能说明各总体率均不相等。 (四) 计算题:

1.将资料整理成四格表

手术方法 合并症

电切术 开放手术

用四格表校正公式算得37.22=χ,P >0.05,尚不能认为两种手术的合并症发生率有差异。 2.该资料属双向有序分类资料,用2χ检验解决。

H 0: 冠心病诊断结果与眼底动脉硬化级别无关联 H 1: 冠心病诊断结果与眼底动脉硬化级别有关联

05.0=α

2χ=61.59, 2χ<2

6,01.0χ,P <0.05,

按05.0=α水准拒绝H 0接受H 1,故可认为冠心病与眼底动脉硬化有关联。 3.采用配对2χ检验。

H 0: 两法不分优劣 H 1: 两法能分优劣 05.0=α

2χ=3.00,按05.0=α水准不拒绝H 0,尚不能认为检出率有差别。

4.可用u 检验或2χ检验。用2χ检验时,首先将资料整理成四格表形式,然后再代入公式。算得2χ=4.774,按

05.0=α水准拒绝H 0接受H 1,认为两组阴转率差别有统计学意义。

5.用R ?C 表2χ检验公式算得2χ=8.539,v =2,P <0.05,,按05.0=α水准拒绝H 0接受H 1,三个疗程有效率的差异有统计学意义。

6.用R ?C 表2χ检验公式算得2χ=443.456,v =2,P <0.05,,按05.0=α水准拒绝H 0接受H 1,两组肝波型的差异有统计学意义。

7.由2χ检验公式算得2χ=4.020,v =4,P >0.05,,按05.0=α水准不拒绝H 0,尚不能认为惯用手与惯用眼之间存在关系。

8.本例只有一个格子的理论频数小于5,故仍可用2χ检验。2χ=5.710,v =3,P >0.05,,按05.0=α水准不拒绝H 0,尚不能认为两地的血型分布不同。(徐勇勇 马跃渊)

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

统计学原理测试题及答案

统计测试一 注:这是基础统计前两章的测试题;准备本月下旬测试。 一、单项选择题 1.要了解某班50名学生的性别构成情况,则总体是(C)。 A.每一个学生 B.每一个学生的性别 C.全体学生 D.全体学生的性别 2.要了解全国的人口情况,总体单位是(A)。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口 3.某班四名学生金融考试成绩分别为70分、80分、86分和90分,这四个数字是(A)。 A.变量值 B.标志 C.指标 值 D.指标 4.工业企业的职工人数、职工工资是(B)。 A.离散变量 B.前者是离散变量,后者是连续变量 C.连续变量 D.前者是连续变量,后者是离散变量 5.统计学与统计工作的关系是(C)。 A.理论与应用的关系 B.工作与结果的关系 C.理论与实践的关系 D.工作与经验的关系 6.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的90%的五个大型水泥厂的生产情况进行调查,这种调查方式是(B)。 A.典型调查 B.重点调查 C.抽样调查 D.普查 7.某地进行国有商业企业经营情况调查,则调查对象是(B)。 A.该地所有商业企业 B.该地所有国有商业企业 C.该地每一家商业企业 D.该地每一家国有商业企业

8.对企业先按经济类型分组,再按企业规模分组,属于(C)。 A.简单分组 B.平行分组 C.复合分组 D.再分组 9.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是(C)。 A.100 B.500 C.650 D.700 10.统计表的宾词是用来说明总体特征的(A)。 A.统计指标 B.总体单位 C.标志 D.统计对象 11.下面属于时期指标的是(A)。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 12.用水平法检查长期计划完成程度,应规定(B)。 A.计划期初应达到的水平 B.计划期末应达到的水平 C.计划期中应达到的水平 D.整个计划期应达到的水平 13.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为(D)。 A.绝对数 B.结构相对数 C.比较相对 数 D.强度相对数 14.某商场计划11月份销售利润比10月份提高2%,实际提高了3%,则销售利润计划完成程度为(A)。 A.100.98% B.95.10% C.99.00% D.105.10% 15.平均数反映了(C)。 A.总体分布的集中趋势 B.总体分布的离中趋势 C.总体中各单位分布的集中趋势 D.总体变动的趋势 16.中位数和众数是一种(B)。

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

统计学原理模拟试卷及参考答案

统计学原理模拟试卷及参考答案

统计学原理模拟试卷及参考答案 统计学原理试卷(一) 一、单项选择题(每题2分,共20分): 1、以所有工人为总体,则“工龄”是() A、品质标志 B、数量标志 B、标志值 D、质量指标 2、在变量数列中,若标志值较小的组而权数大时,计算出来的平均数() A、近标志值较大的一组 B、接近标志值较小的一组 C、不受次数影响 D、仅受标志值的影响 3、由组距数列确定众数时,如果众数相邻两组的次数相等时,则() A、众数为零 B、众数就是那个最大的变量值 C、众数组的组中值就是众数 D、众数就是当中那一组的变量值

4、某企业产品产量增长30%,价格降低30%,则总产值() A、增长 B、不变 C、无法判断 D、下降 5、已知某厂甲产品的产量和生产成本与直线存在线性相关关系,当产量为1000件时,其生产总成本为3万元,不随产量变化的成本为0.6万元,则成本总额对产品产量的回归方程为 ()(4分) A、Yc=6+0.24X B Yc=6000+24X C、Yc=24+6000X D、Yc=2400+6X 6、在简单随机重复抽样的情况下,如果抽样误差减少一半(其他条件不变),则样本单位必须() A、增加两倍 B、增加到两倍 C、增加四倍 D、增加三倍 7、抽样误差的大小() A、即可避免,也可控制 B、既无法避免,也无法控制

C、可避免,但无法控制 D、无法避免,但可控制 8、如果时间数列环比增长速度大体相同,可以拟合() A、指数曲线 B、抛物线 C、直线 D、无法判断 9、若职工平均工资增长10.4%,固定构成工资指数增长15%,则职工人数结构影响指数为 A、96% B、126.96% C、101.56% D、125.4% 二、多项选择题(每题2分,答案有选错的,该题无分;选择无错,但未选全的,每选对一个得 0.5分,共10分) 1、影响样本单位数的主要因素是 () A、总体标志变异程度 B、抽样推断的可靠程度 C、极限误差的大小 D、抽样方法和组织形式的不同

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2 检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 ))()()(()(22 d b c a d c b a n bc ad ++++-=χ ②当n ≥40但1≤T<5时,校正公式 1

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学原理试题(2)

《统计学原理》试题(2) 一、单项选择题(1分×25=25分) 1、设某地区有60家生产皮鞋的企业,要研究他们的产品情况,总体是()。 (1)每一个企业(2)所有60家企业 (3)每一双皮鞋(4)所有企业生产的皮鞋 2、某班4名学生统计学考试成绩分别为:65分、78分、85分、91分,这4个数字是()。 (1)数量指标(2)质量指标(3)变量(4)变量值 3、根据较大总体计算的质量指标与较小总体范围计算的质量指标相比,前者()。 (1)一定大于后者(2)一定等于后者 (3)一定小于后者(4)可能大于后者也可能小于后者 4、最先叫出统计学之名的是()。 (1)政治算术学派(2)凯特勒(3)国势学派(4)恩格尔 5、以下哪种调查的调查单位和报告单位是一致的()。 (1)工业普查(2)工业设备普查(3)职工调查(4)未安装设备调查 6、统计分组的关键在于确定()。 (1)组中值(2)组距 (3)组数(4)分组标志和分组界限 7、用组中值代表各组内一般水平的假定条件是()。 (1)各组的次数均相等(2)各组的组距均相等 (3)各组的变量值均相等(4)各组变量值在本组内呈均匀分布 8、某连续变量数列,其末组为500以上。又知其邻近组的组中值为480,则末组的组中值为()。 (1)520 (2)510 (3)530 (4)540 9、某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的5个大型水泥厂的生产情况进行调查。这种调查方式是()。 (1)典型调查(2)重点调查(3)抽样调查(4)普查 10、某商场计划4月份销售利润比3月份提高2%,实际却下降了5%, 则销售利润计划完成程度为()。 (1)66.97%(2)105.03% (3)93.14%(4)92.78% 11、已知5个水果商店苹果的单价和销售额,要求计算5个商店苹果的平均单价,应该采用()。 (1)简单算术平均法(2)加权算术平均法 (3)加权调和平均法(4)几何平均法 12、对于同一变量分布,其标准差永远()。 (1)小于平均差(2)大于平均差 (3)等于平均差(4)不会小于平均差 13、下面属于结构相对数的有()。

统计学基础教案

统计学基础教亲 哈尔滨金融髙等专科学校管理系 第一章总论 学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统讣学的基本概念,难点是统计学概念的理解和运用以及概念之间的相互关系。 第一节统计学的产生和发展 看了上面的资料,你能说出什么是统计吗?你能否体会到统计已是人们在社会经济生活中必不可少的工具,是人们认识世界、探索现象数量差异的本质极其规律的方法,是人们进行明智决策的一门艺术,随着人类社会进入信息时代,统计作为一种方法和工具就变得越来越重要。 一、统计的概念

在日常生活中,我们经常会接触到“统计”这一术语。一提到统计,很多人可能首先想到的是统讣工作,这种理解是不全面的。统计作为一种社会实践活动, 已有悠久的历史,可以说,自从有了国家就有了统计实践活动。最初,统计只是一种讣数活动,为统治者管理国家的需要而搜集资料,通过统计计数以弄清国家的人力、物力和财力,作为国家管理的依据。然而在今天,"统计”一词已被人们赋予多种含义,在不同的场合、不同的语言环境中已有许多种不同的解释。 请思考:下列资料中"统计” 一词的含义是什么? (1)小王是学统计的 (2)他已搞了儿十年统计了 (3)据统计,今年一季度物价指数出现负增长 (4)请找统计登记一下 (5)请统计一下今天的销售量 那么,把统讣作为一种专业用语,其含义到底是什么?目前,在国际统计理论界,关于统计?一词的含义比较趋于一致的解释为:统计包含统计工作、统计资料和统计学三个方面的含义。 一是统计工作,即统讣实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。一个完整的统汁工作过程一般包括统计设计、统计调查、统计整理、统计分析等环节。 统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。如银行的讣划统计科,每月编制项LI报表,这个过程就是统计?工作。乂如:我国进行人口普查时要经过方案设计、入户登记、数据汇总、分析总结和资料公布等一系列过程都是统计工作。在我国, 各级政府机构基本上都有统计部门,如统讣局,它们的职能主要就是从事统计数据的搜集、整理和分析工作。 二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。如: (1)我国国土面积960万平方公顷,其中山地约320万平方公顷,高原约250 万平方公顷,平原约"5万平方公顷,丘陵约95万平方公顷。 (2)2003年我国全年全部工业增加值53612亿元,比上年增长12.6%,其中规模以上工业企业(即国有工业企业及年产品销售收入500万元以上的非国有工业企业)增加值增长17.0%。工业产品销售率98.1%,比上年提i?0.1个白分点。 这些山文字和数字共同组成的数字化的信息就是统汁资料,是统计提供数据信息的基本表现形式,是统计工作的直接成果。 统计资料包括原始资料和整理后的资料即次级资料。例如企业各车间的统计抬帐、人口普查时初次登记的资料就是原始资料,而统讣公报、调查分析报告等现实和历史资料就是次级资料。统讣资料的表现形式有统计表、统计图、统计分析报告、统

【自考】00974统计学原理201401【真题及答案】

. 2014年1月广东省高等教育自学考试 统计学原理试卷及答案 (课程代码 00974) 一、单项选择题(本大题共15小题,每小题1分,共15分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1、统计是对事物数量特征进行分析的方法体系,统计的基本方法有大量观察法、综合分析法和( B ) A 、数量对比法 B 、归纳推新法 C 、逻辑推理法 D 、全面观察法 2、统计学的早期发展中,政治算术学派的主要代表人物是( B ) A 、格朗特 B 、配第 C 、康令 D 、阿亨瓦尔 3、次数分布中各组频率的总和应该( D ) A 、大于100% B 、小于100% C 、不等于100% D 、等于100% 4、为了获得重要的统计资料,为常规调查提供重要数据或背景数据,需要采用的调查方式是( B ) A 、抽样调查 B 、重点调查 C 、典型调查 D 、普查 5、次数分布可以形成一些典型的类型,并用曲线表示。其中,“中间大,两头小”的分布曲线是( B ) A 、正态分布曲线 B 、钟型分布曲线 C 、U 型分布曲线 D 、J 型分布曲线 6、反映现象在一段时间变化总量的统计指标是( B ) A 、时点指标 B 、时期指标 C 、动态指标 D 、绝对指标 7、确定中位数的近似公式是( A ) A 、d f S f L m m ?-+-∑1 2 B 、d L ??+??+211 C 、∑∑?f f x D 、 ∑-)(x x 8、进行抽样调查时必须遵循随机的规则,其目的是( A ) A 、每一个单位都有相同的被抽中的机会 B 、人为地控制如何抽取样本单位总不可靠

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

2018年度医学统计学试卷及其规范标准答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1.设某地区有200家独立核算的工业企业,要研究这些企业的产品生产情况, 总体是( )。 A.每一家工业企业 B.200家工业企业 C.每一件产品 D.200家工业企业的全部工业产品 2.有600家公司每位职工的工资资料,如果要调查这些公司的工资水平情 况,则总体单位是()。 A.600家公司的全部职工 B.600家公司的每一位职工 C.600家公司所有职工的全部工资 D.600家公司每个职工的工资 3.一个统计总体()。 A.只能有一个指标 B.可以有多个指标 C.只能有一个标志 D.可以有多个标志 4.以产品等级来反映某种产品的质量,则该产品等级是()。 A.数量标志 B.品质标志 C.数量指标 D.质量指标 5.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是()。 A.变量值 B.变量 C.指标值 D.指标 6.年龄是()。 A.变量值 B.连续型变量 C.离散型变量 D. 连续型变量,但在实际应用中常按离散型处理 7.人口普查规定统一的标准时间是为了()。 A.登记的方便 B.避免登记的重复与遗漏 C.确定调查的范围 D.确定调查的单位 8.以下哪种调查的报告单位与调查单位是一致的()。 A.职工调查 B.工业普查 C.工业设备调查 D.未安装设备调查 9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。这 种调查方式是()。 A.典型调查 B.抽样调查 C.重点调查 D.普查 10.某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定是()。 A.调查时间 B.登记期限 C.调查期限 D.标准时间 11.统计分组的关键问题是()。 A.确定分组标志和划分各组界限 B.确定组距和组中值 C.确定组距和组数 D.确定全距和组距

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

应用统计学试题及答案1电子教案

应用统计学试题及答 案1

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示

A.时间每增加一个单位,产品成本平均增加1.75个单位 B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

相关主题
文本预览
相关文档 最新文档