当前位置:文档之家› 生物统计学复习

生物统计学复习

生物统计学复习
生物统计学复习

生物统计学复习

一、选择题(在每小题给出的四个选项中,选择正确的一项。每小题2分,共计20分)

1.某一变数服从正态分布,当以进行随机抽样时,样本平均数大于Y ()10,10N 10n =12的概率为( B )。

A 、0.005

B 、0.025

C 、0.05

D 、0.01

2.偏态分布资料的集中趋势描述宜用( C )。

A 、算术均数

B 、标准差

C 、中位数

D 、四分位数间距

3.单个方差的假设测验用( B )测验。

A 、u

B 、

C 、t

D 、F

2χ4.两样本均数不一致,t 检验时P>0.05,可以说这种差异是( A )。

A 、抽样误差

B 、总体均数不同

C 、样本均数不同

D 、样本数不同

5.正态分布曲线与横轴之间的总面积等于( D )。

A 、次数总和

B 、次数总和+1

C 、0.95

D 、1

n n 6.对一批棉花种子做发芽试验,抽样1000粒,得发芽种子850粒,若规定发芽率达90%为合格,测验这批种子是否合格的显著性为( A )。

A 、不显著

B 、显著

C 、极显著

D 、不好确定

7.对于一组呈正态分布的计量资料,若对每一个个体同减去一个不为零的数,则( B )。

A 、均数、标准差均不变

B 、均数变、标准差不变

C 、均数、标准差均改变

D 、均数不变、标准差改变

8. 下列哪个P 值通常推论为差异有统计意义( D )。

A 、P>0.1

B 、P>0.05

C 、P<0.5

D 、 P<=0.05

9. 方差分析的主要目的是比较( A )。

A 、总体均数之间的差异性

B 、样本均数之间的差异性

C 、总体方差之间的差异性

D 、总体变异系数之间的差异性

10. 对于同一组资料,哪个指标没有考虑到每个观察值的变异( D )。

A 、方差

B 、总体标准差

C 、变异系数

D 、四分位差

11. 在统计分析中,最常用的反映变量集中趋势的统计数是( A )。

A 、算术平均数

B 、几何平均数

C 、调和平均数

D 、众数

12. 试验误差主要是由( D )的差异引起。

A 、水平

B 、处理

C 、供试因素

D 、非试验因素

13. 当Y ~N (100,100)时, 以样本容量4抽得样本平均数大于110的概率( C

)。n =A 、≈0.05 B 、≈0.10 C 、≈0.025

D 、≈0.0114. 若否定,则( C )。

0H A 、必犯错误

B 、必犯错误 αβ

C 、犯错误或不犯错误

D 、犯错误或不犯错误αβ15. 已知,则在区间[]的概率为( A )

。2~(,)Y N ms Y 1.96, 1.96m s m s -+A 、0.95 B 、0.05 C 、0.01 D 、0.99

16. 最小显著差数测验法又称为( a

)。A 、LSD 法 B 、SSR 法 C 、q 法

D 、T 检验法17. 两个方差之间的差异显著性测验一般用( B )。测验。

A 、

B 、

C 、

D 、 或

2χF u 2χu 18. 测验线性回归的显著性时,遵循自由度为( B

)。的分布。()/b t b s β=-A 、n -1 B 、n -2 C 、n -m -1 D 、n

19. 成对比较的特点不包括( D )。

A 、加强了试验控制

B 、可减小误差

C 、不必考虑总体方差是否相等

D 、误差自由度大

20.由样本推断总体不可避免产生的误差称( B )。

A. 系统误差 B .随机误差 C .主观误差D .操作误差

21.对一批棉花种子做发芽试验,抽样1000粒,得发芽种子880粒,若规定发芽率达90%为合格,这批种子是否合格的测验为( A )。

A 、不显著

B 、显著

C 、 极显著

D 、 不好确定

22.两个方差比例的假设测验用( D )测验。

A 、u

B 、

C 、t

D 、F

2χ23.算术平均数的重要特性之一是离均差平方和( A )。

A 、最小

B 、最大

C 、等于零

D 、接近零

24.正态分布曲线与横轴之间的总面积等于( D )。

A 、次数总和

B 、次数总和+1

C 、0.95

D 、1n n 25.累积频率分布指的是( A )的频率。

A 、 f(Y≤Y0 )

B 、 f(Y=Y0 )

C 、 f(Y≥Y0 )

D 、 f(Y

26. 方差分析的主要目的是比较( A )。

A 、总体均数之间的差异性

B 、样本均数之间的差异性

C 、总体方差之间的差异性

D 、总体变异系数之间的差异性

27. 在统计分析中,最常用的反映变数离散特征的统计数是( C )。

A 、算术平均数

B 、几何平均数

C 、标准差

D 、变异系数

28. 在统计学中,计算平均增长率用( B )。

A 、算术平均数

B 、几何平均数

C 、调和平均数

D 、众数

29.完全随机设计、随机区组设计、拉丁方设计的总变异分别可分解成几( D )。

A 、2,2,4

B 、2,3,3

C 、2,2,2

D 、2,3,4

30连续性变数次数分布的组区间是( A )区间。

A 、 半闭半开

B 、 半开半闭

C 、 左右均开

D 、 左右均闭

31.一个单因素试验不可用( D )试验设计方法。

A 、完全随机

B 、随机区组

C 、拉丁方

D 、裂区

32.累积频率分布指的是( A )的频率。

A 、 f(Y≤Y0 )

B 、 f(Y=Y0 )

C 、 f(Y≥Y0 )

D 、 f(Y

33.可估计和减少试验误差的手段是( C )。

A 、局部控制

B 、随机

C 、重复

D 、唯一差异原则

34.在一个平均数和方差均为100的正态总体中以样本容量10进行抽样,其样本平均数服从( D )分布。

A. N (100, 1)

B. N (10, 10)

C. N (0, 10)

D. N (100, 10)

35.试验的误差主要由( D )引起。

A 、水平

B 、处理

C 、唯一差异原则

D 、环境变异

36.假定我国大陆居民和台湾居民年龄方差相同。现各自用随即抽样的方法抽取本国人口的0.5%计算平均年龄,则平均年龄的标准误( C )。

A 、两者相等

B 、前者比后者大

C 、前者比后者小

D 、不能确定

二、判断题(正确的打“√”,错误的打“×”。每小题1.5分,共计15分)

1. 连续性变数在分组时的组距必须为整数。(× )

2. 接受无效假设不一定犯错误。(√ )

0H β3. 事件A 和事件B 和事件的概率,等于事件A 的概率与事件B 的概率之和。(× )

4. 分布的图形是左右对称的。( × )

2

χ5. 一个显著的相关或回归说明和的关系必为线性。(× )

X Y 6. 描述总体的特征数叫统计数。( × )

7. 关于方差的假设测验均可用测验。(× )

F

8. 成组比较分析时需要考虑两者的总体方差是否相等。( √ )

9. 正态()分布的累积频率分布图是左右对称的。( × )

u 10. 一元回归分析时,。(√ )1?()()n

i i i

i X x Y Y Q =--=∑

11. 二项分布的平均数为( √ )

np 12. 关于方差的假设测验均可以用F 测验。( × )

13. 一个显著的相关系数或回归系数说明和变数的关系必为线性关系。( × )

X Y 14. 在一组变量中,出现频率最多的观察值,称为中位数。( × )

15.只要样本容量n>30,我们通常就可以用正态分布计算一定区间概率的方法计算样本平均数或样本平均数差数在任何区间的概率。(√ )

16.一个显著的相关或回归都具有实践上的预测意义。( × )

17.当否定一个真实假设时,我们就犯了第一类错误。(× )

18.当正态分布 u=1.96时,统计假设测验的右尾概率为0.01。( × )

19. 分布的累积频率分布图是左右对称的。(× )

u 20.χ2分布是一组随自由度变化的曲线系统,间断性的,用于间断性资料的假设测验。(× )

21.精确性是指观测值与真值的接近成度。( × )

22.一个试验是固定模型还是随机模型在进行方差分析时是有区别的。( √ )

23.在二因素完全随机化设计试验结果的方差分析中,误差项自由度为。( (1)(1)n ab --√ )

24. 二因素完全随机化试验设计下结果的方差分析可以按两向分组资料的方法进行处理。( × )

25. 随机区组试验只应用了随机和局部控制两个原则。(× )

二、填空题(每小题1.5分,共计15分)

1. 已知,则Y 在区间[]]的概率为 0.95 。

2~(,)Y N ms 1.96, 1.96m s m s -+2. 直线回归方差主要应用三个方面: 、 和

。3. 以7月10日为0,某昆虫日发生量遵循N(10, 36),则该螟蛾发生的始盛日期为 7月14日 ,盛末日期为 7月26日

。4. 水稻亚优二号的单株产量(克)为一正态分布,其总体方差为36,若以n=9抽样,要在a =0.05水平上否定和,则其接受区分别为 [96.08 ,103.92] 0:100H μ=0:100H μ≥和 >=96.71 。

5. 根据遗传学原理,豌豆的红花纯合基因型和白花纯合基因型杂交后,在F2代白花植株

出现的概率为0.25。若一次试验中观测2株F2植株,则至少有一株为白花的概率为

0.4375;若希望有99%的把握获得1株和1株以上的白花植株,则F2需种植16株。

6.μ=0, 5σ2=1的正态分布,在区间[0,+∞]上的概率为0.5 。

7.为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用回归分析。8.一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为

0.96 ;若希望有0.99的概率保证每穴至少出一苗,每穴至少应播粒。9.对于t分布来说,固定显著性水平的值,随着自由度的增大,t的临界值将会怎样减少。

10.为了测验两个样本所属的总体平均数有无显著差异,一般会因设计的不同分为成组比较

和成对比较两种。

11.常用的变量转换有反正弦转换、平方根转换和对数转换三种方式。

12.事件A、B互相独立,P(A)=0.3,P(B)=0.5,则P(AB)= 0.15 。

13.以黄色子叶、圆粒种子的豌豆与绿色子叶、皱粒种子的豌豆杂交,在F2代观察得“黄圆”

315粒,“黄皱”101粒,“绿圆”108粒,“绿皱”32粒。假设H0:此结果符合9:3:3:1的理论比例,测验H0的χ2值为 0.47 。

14.以7月31日为0,某水稻品种抽穗日发生量遵循N(15, 36),则该水稻品种抽穗的始盛日期为:8月9日,盛期为:8月15日。

15.一个二因素试验,裂区设计,主区因素A具2个水平,副区因素B具5个水平,重复

4次,则df(AB)= 4 。

16.记号为L8(27)的正交表,,其中“L”代表正交表;括号内的底数“2”表示因素的水平数,

括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个2水平因素,合计试验。

17.试验设计的三大原则为重复、随机化和局部控制。

三、名词解释题(本大题共5小题,每小题3分,共计15分)

1. 独立性检验:是研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计

方法。

2.样本平均数的标准误

3.中心极限定理:假设被研究的随机变量Y,可以表示为许多相互(独立)的随机变量Yi的和。那么,如果的Yi数量很(大),而且每一个别的Yi对于Y所起的作用很(小),则可以被认为Y服从或近似地服从(正态)分布。

4.两尾测验:假设检验的两个否定去分别位于分布的尾部,具有两个否定区的检验称~。

5.相关系数与决定系数相关系数:通过计算来表示两个变量相关程度和性质的统计数。决定系数:相关系数r的平方称为~。

6. 小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但在多次重复试验中几乎是必然发生的,数学上称之小概率原理。

7.精确性和准确性精确性:是对同一物体的重复观察值或估计值彼此之间的接近程度。准确性:是指观测值或估计值与真值的接近程度。

8. 吻合度检验

9. 样本与样本容量样本:在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。

样本容量:样本中个体的数目称为样本容量。

10. F分布:在正态总体中随机抽取两个样本,它们的均方比称F值,如果抽取许多样本可得到若干个F值,这些F值的分布称F分布。

11. χ2分布

12. t分:T分布又称学生分布,是在正态总体中随机抽取一系列小样本,其标准化离差t值的分布称t 分布。

13.方差和标准差方差:用样本容量n来除离均差平方和,得到平均的平方和,简称~。标准差:是一组数值自平均值分散开来的程度的一种测量观念。

14.总体和样本总体:具有相同性质的个体所组成的集合。样本:研究中实际观测或调查的一部分个体称为样本.

15.参数和统计量参数:从总体中计算所得的用以描述总体特征的数值,称为参数。

统计量:是由样本计算所得是数值,它是描述样本特征的数量。

16.随机误差和系统误差随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。系统误差:是由于试验处理以外的其他条件明显不一致所产生的带有倾向性的或定向性的偏差。

17. 概率和频率概率:某事件A在n次重复试验中,发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)越来越接近某一确定值p,于是定义p为事件A发生的概率。

频率:单位时间内发生的次数,是描述发生频繁程度的量.

18.分布函数和概率密度函数分布函数:设X是随机变量,对任意实数x,函数F(x)

=P{X<=x},称为X的分布函数。概率密度函数:对于随机变量X,如果存在一个

定义(f(x),对任一实数x,总有F(x)=P(X<=x)=∫x-称连续型变量,f(x)为随机变量X的概率密度函数。

19.正态分布和标准正态分布正态分布:是一种连续型随机变量的概率分布。

标准正态分布:又称为u分布,是以0为均数、以1为标准差的正态分布,记为

N (0,1)。

20. 拉丁方设计:是在行和列两个方向上都进行局部控制,使行、列两向皆完全区组或重复,是比随机区组设计多一个区组的设计。

21. 实验设计:为使获得的数据能准确可靠地反映事物的真实规律,在进行试验或调查之前,对整个试验或调查应做一个全面安排,这就是~。

四、 简答题(每小题5分,共计25分)

1. 简述参数和统计量的概念及两者的区别和联系。

答:参数和统计量 参数:从总体中计算所得的用以描述总体特征的数值,称为参数。统计量:是由样本计算所得是数值,它是描述样本特征的数量。

2. 样本平均数、样本平均数差数的分布各有哪些特征? P48 P49

3. 正态分布有什么基本特征? 有哪几个参数?

正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。

4. 检验的主要步骤是什么?需要注意哪两个方面的问题?

2

x2检验的步骤为:

(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起即观测值=理论值

备择假设HA :观测值与理论值的差值不等于0,即观测值≠理论值

(2)确定显著水平a.一般可确定为0.05或0.01

(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi ,代入公式,计算出样本的x2。

(4)进行统计推断

5. 统计假设测验的几何意义是将统计数的分布分为两个区间,这两个区间分别指什么?请

加以图示。

6.简述方差分析的基本原理和主要步骤。

答:原理:是将测量数据的总变异按照变异原因的不同分解为处理效应和误差效应,并作出其数量估计,从而确定试验处理对研究结果影响力的大小。

步骤:(1)将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。

(2)列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。

(3)若F检验显著,对各处理平均数进行多重比较。

7. 根据所学内容简述统计方法的主要功用。

答:⑴提供了整理和描述数据的科学的方法;

⑵提供了由样本推论总体的科学的方法;

⑶提供了通过误差分析鉴定处理效应的科学的方法;

⑷提供了进行科学试验设计的一些重要的原则;

⑸提供了分析多个变数间相关密切程度的科学的方法。

8. 一个变量的分布一般具有哪两大基本特征?反映这两大特征的特征数有哪些?

9.什么t分布?其主要特征是什么?

T分布又称学生分布,是在正态总体中随机抽取一系列小样本,其标准化离差t值的分布称t 分布。

特征:⑴t分布曲线是左右对称的,围绕平均数μ=0向两侧递降。

⑵t分布受自由度df=n-1的制约,每个自由度都有一天t分布曲线。

⑶和正态分布相比,t分布的顶部偏低,尾部偏高,自由度df>=30时,其曲线就比较接近正态分布曲线,当df趋近无穷大时和正态分布曲线重合。

10.简述直线回归分析的基本假设。P137

11.测验玉色和红色金鱼草杂交F2代的玉色株(O1)与粉色株(O2)及红色株(O3)的比例与期望

比率1:2:1是否相符用什么方法?如何进行?

12. 什么叫假设检验?简述统计假设测验的主要步骤。

答:假设检验是在总体理论分布和小概率原理基础上,通过提出假设、确定显著水平、计算统计数、作出推断等步骤来完成的在一定概率意义上的推断。

步骤:⑴提出假设

⑵确定显著水平

⑶计算统计数

(4)作出推断

13. 什么是假设检验?假设有哪两种?其含义分别是什么?

答:假设检验是在总体理论分布和小概率原理基础上,通过提出假设、确定显著水平、计算统计数、作出推断等步骤来完成的在一定概率意义上的推断。

14.简述次数分布的功用和制作次数分布表的基本步骤。

15.什么叫随机区组设计,简述其优缺点。P175 P176

16.简述实验设计的基本原则和主要作用。

试验设计有3项基本原则:重复,随机和局部控制。

重复原则的主要作用是估计试验误差,降低试验误差;随机原则的主要作用是提供无偏的试验误差估计。局部控制原则的主要作用是降低试验误差。总之,只有遵循重复,随机,局部控制3项基本原则的试验设计,才能由试验获得真实的处理效应和无偏的,最小的试验误差估计,从而对各处理间的比较得出可靠的结论来。

17. 什么叫拉丁方设计?简述其优缺点。

拉丁方设计:是在行和列两个方向上都进行局部控制,使行、列两向皆完全区组或重复,是比随机区组设计多一个区组的设计。(1)优点:①拉丁方的行与列皆为配伍组,可用较少的重复次数获得较多的信息;②双向误差控制,使观察单位更加区组化和均衡化,进一步减少实验误差,比配伍组设计优越。(2)缺点:①要求三因素的水平数相等且无交互作用。虽然当三因素的水平数不等时,可以通过调整次要因素的水平数以满足设计的要求,但有时无法达到;况且因素间可能存在交互作用,故在实际工作中有一定的局限性;②当

因素的水平数(γ)较少时,医.学教育网搜集整理易受偶然因素的影响。

18. 常用的实验设计有哪几种?这些方法适宜在什么情况下使用?

五、 应用题(第1小题10分,第2小题15分,共计25分)

1. 研究土壤中的NaCl 含量(,)对植物单位叶面积干物重的影响,得到了相应X 1

g kg -g 的干物质重(,),并得到了以下的统计数:,,Y 2mg dm -g 7n =17.92X SS =,,,。

2585.714Y SS =200SP = 2.4x =108.57y =试求:(1)。 (2) Q 和U 。 bX a Y

+=?(3)) r 和。 (4) 测验该线性方程的显著性。

2r

2. 为了研究粒肥的增重效果,随机取5个样点喷施粒肥,得喷施后各样点小麦千粒重(克)

为:47,47,50,49,49;另随机取同样条件下种植但未喷施粒肥的4个样点,得各样点小麦千粒重为:35,40,38,39。试测验喷施粒肥是否可以显著提高产量。

3.有一品种(分A1和A2两个水平)和施肥量(分B1和B2两个水平)的二因素试验,随

机区组设计。重复2次。(1)已知

,试作方差分析,并解释所得194,20,168,128,32T R t A B SS SS SS SS SS =====结果。(2)已知四个处理、、和的平均数依次为

11A B 12A B 21A B 22A B 30、28、24、18,试用LSD 法对不同处理平均数进行多重比较。

4.研究温度(X , ?C )与某一昆虫幼虫生长速率(Y )的关系,得有关统计数分别为:。试求:(1)

10,5,110,147,34500,2070X Y n x y SS SS SP ======-。 (2)Q 和U 。 (3)。 (4)r 和。(5)测验该线性方程的显著性。bX a Y +=?2/Y X

s 2r

5. 在甲、乙两地进行水牛体型调查,将体型按优、良、中、劣四个等级分类,其结果见下

表,问两地水牛体型构成比是否相同。

优良中劣

甲10106010

乙1052010

6. 四个品系的家兔,每一种用兔7只,测定其不同室温下的血糖值,以每100mg血中含葡

萄糖的毫克数表示,问各种家兔正常血糖值有无差异?室温对家兔的血糖有无影响(多重比较不做要求)?试验资料见下表:

室温

品种

3530252015105Ⅰ1401201108282110130Ⅱ16014010083110130120Ⅲ160120120110100140150Ⅳ1301101008274100120

7. 为了考查菌种和温度对发酵产物的影响,从三种不同菌种和三种不同温度中选出最适宜

的条件,设计了一个二因素试验,并得到发酵产物量(国际单位)结果如下表,请对该资料进行方差分析(可不进行多重比较)。

温度B(℃)

菌种A

B1(20)B2(30)B3(40)

A1 4.6 4.3 3.8 6.1 6.5 6.3 6.8 6.4 6.5

A2 6.3 6.7 6.4 3.4 3.6 3.8 4.0 3.9 3.8

A3 4.7 4.3 4.5 3.9 3.5 3.7 6.5 7.0 6.7

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学教案(5)

生物统计学教案 第五章统计推断 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。 讲授难点:一个、两个样本的差异显著性检验 统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。 参数估计:通过样本统计量估计总体参数。 5.1 单个样本的统计假设检验 5.1.1 一般原理及两种类型的错误 例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。 1、假设: H 0: μ=μ 或H0: μ-μ0=0 H A : μ>μ μ<μ μ≠μ 三种情况中的一种。 本例的μ =10.00g,因此 H : μ=10.00 H A : μ>10.00或μ<10.00或μ≠10.00 2、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。 从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数

服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即 P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。如果得到的值很小,则 x 抽自平均数 为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。 显著性检验:根据小概率原理建立起来的检验方法。 显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。 3、临界值 例 从上述动物群体中抽出含量n =10的样本,计算出 x =10.23g ,并已知 该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。根据以上条件进行统计推断。 H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求 出u 值。 P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。 在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。从 正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。接受域的端点一般称为临界值。本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。 4、单侧检验和双侧检验 上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。对应于H A :μ>μ0时的检验称为上尾单侧检验。 下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。 n x n x u 40 .000.100 -= -= σ μ82 .110 40 .000 .1023.100 =-= -= n x u σ μ

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

生物统计学(自理重点)

生物统计学复习资料(70%) 填空:10题×1’=10’选择:5题×1’=5’ 名词解释:5题×2’=10’ 判断:5题×1’=5’ 简答:3题×5’=15’ 统计推断:4题10’+10’+10’+20’=50’ 第1章绪论 生物统计学:是研究收集、整理、分析和解释生物科学试验数据的科学,是统计学原理在生物学研究领域的应用。 生物统计学的主要内容 生物统计学包括试验数据的获取、整理和分析等相关内容,具体来说,包括试验或调查设计、数据的整理(描述统计学)、概率论基础(统计理论基础)、统计推断方法(推断统计学)等内容。 调查设计:是指整个调查计划的制订,包括调查研究的目的、对象与范围,调查项目及调查表内容,抽样方法的选取,抽样单位和抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写等内容。 试验设计:是指试验单位的选取、生物学重复数的确定及试验单位的分组等。 生物统计学发展简史 (1)古典记录统计学 (2)近代描述统计学 (3)近代推断统计学 总体:是研究对象的全体。 个体:是总体中的一个研究单位。 样本:是从总体中抽取的用于代表总体的一部分个体。 样本容量记为n,通常把n≤30的样本称为小样本,n>30的样本称为大样本。(判断区别)随机抽样:是指总体中的每一个个体都有同等的被抽取的机会组成样本。 参数:由总体计算的特征数。 统计数:由样本计算的特征数。 准确性:也叫准确度,是指在试验中某一试验指标的观测值与其真值接近的程度。 精确性:也叫精确度,是指同一试验指标的重复观测值彼此接近的程度。 随机误差:是由于无法控制的内在和外在的偶然因素所造成的,是客观存在的,在实验中,即使十分小心也难以消除。 系统误差:也叫片面误差,是由试验材料的初始条件不同或测量仪器不准等引起的倾向性或定向性偏差。 (小题)误差怎么控制? (小题)随机误差可完全避免(×) (小题)减小统计误差的方法是(B) A、提高准确度 B、提高精确度 C、减少样本容量 D、增加样本容量

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学简答题

1. 什么是生物统计学?生物统计学的主要容和作用是什么? 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别?随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别? 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处?他们各有哪些特性?平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S的观测值个数占总个数的68.26%,X-+2s的观测值个数占总个数的95.49%,x-+3s 的观测值个数占总个数的99.73%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布?什么是标准正太分布?正态分布曲线有什么特点?μ和σ对正态分布曲线有何影响?

相关主题
文本预览
相关文档 最新文档