当前位置:文档之家› 生物统计学作业

生物统计学作业

生物统计学作业
生物统计学作业

第一章概论

习题1.1 答:

(1)生物统计学(biostatistics)——是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。

(2)主要内容内容有:

试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法;统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相关分析、协方差分析等。

(3)生物统计学的作用:

①提供整理、描述数据资料的科学方法并确定其特征;

②判断试验结果的可靠性;

③提供由样本推断总体的方法;

④试验设计的原则。

习题1.2 答:

(1)总体(popilation):研究对象的全体,是具有相同性质的个体所组成的集合;

(2)个体(individual):组成总体的基本单元;

(3)样本(sample):由总体中抽出的若干个体所构成的集合,当n>30时属于大样本,n<30属于小样本;

(4)样本容量(sample size):样本中个体的数目;

(5)变量(variable):又称变数,是相同性质的事物间表现差异性的某项特征;(6)参数(parameter):也称参量,是描述总体特征的数量;

(7)统计数(statistic):描述样本特征的数量。由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数;

(8)效应(main effect):“主效”的简称;由因素而引起试验差异的作用;(9)互作(Interaction effct):两个或两个以上处理因素间的相互作用产生的效应;

(10)试验误差(experimental error):也叫误差,是指试验中不可控因素所引起的观测值偏离真值的差异。

习题1.3 答:

随机误差(random)也称抽样误差或偶然误差,他是有实验中许多无法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消除随机误差。

系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所差生的倾向性的或定向性的偏差。系统误差主要有一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的

习题1.4 答:

准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的

观测值与其真值接近的程度。精确性(precision )也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程度的大小。准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。

第二章 试验资料的整理与特征数的计算

习题 2.1

答:对于一组大小不同的数据划出等距的分组区间(称为组距),然后将数据按其

数值大小列入各个相应的组别内,便可以出现一个有规律的表式。这种统计表称之为次数分布表。

次数分布图就是在次数分布表的基础上,把次数分布资料画成统计图形。

制表和绘图的基本步骤是:(1)求全距;(2)确定组数和组距;(3)确定租限和组中值;(4)分组,编制次数分布表,或根据需要绘制条形图、饼图、直方图等。

习题 2.2

答:如果有n 个数:1x ,2x ,…n x ,那么这组数据的平均数x =n x x x n

+++ 21,

这个平均数叫做算术平均数。

一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的

一组数据的平均数为n

n

n f f f f x f x f x ++++++ 212211。这个平均数叫做加权平均数,其中

f 1,f 2,…,f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即i f (i =1,2,…k )越大,表明i x 的个数越多,“权”就越重。

算数平均数是加权平均数的一种特殊情况(当各项的权相等时),由于它们都反映的是一组数据的平均水平,所以实质上是一样的。

习题2.3

答:平均数(mean)的用处有: ① 平均数指出了一组数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平;

②作为样本或资料的代表数据与其它资料进行比较。

平均数的特性是:①离均差之和等于零;②离均差平方和为最小。 标准差(standard deviation)的用处: ① 标准差的大小,受实验或调查资料中多个观测值的影响,如果观测值与观测值之间差异较大,其离均差也大,因而标准差也大,反之则小; ② 在计算标准差时,如果对各观测值加上火减去一个常数a ,标准差不变;如果给各观测值乘以或除以一个常数a ,则所得的标准差扩大或缩小了a 倍; ③在正态分布中,一个样本变量的分布可以作如下估计:x ±s 内的观测值个数约占观测值总个数的68.26%,x ±2s 内的观测值个数约占总个数的95.49%,

x±3s内的观测值个数约占观测值总个数的99.73%。

标准差的特性:

①表示变量的离散程度,标准差小,说明变量的分布比较密集在平均数附近,标准差大,则说明变量的分布比较离散,因此,可以用标准差的大小判断平均数代表性的强弱;

②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;

③估计平均数的标准误,在计算平均数的标准误时,可根据样本标准差代替总体标准差进行计算;

③进行平均数区间估计和变异系数的计算。

习题2.4

答:总体和样本的平均数都等于资料中各个观测值的总和除以观测值的个数所得的商。二者区别在于,总体平均数用μ表示,μ=∑x/N,公式中分母为总

体观测值的个数N,样本平均数用x=∑x/n,公式中的分母为样本观测值的个

数n。样本平均数是总体平均数μ的无偏估计值。

总体和样本的标准差都等于离均差的平方和除以样本容量后的方根。二者的

区别在于,总体标准差用σ表示,σ

= ,分母上总体观测值的个

数N,标准差用s 表示,,分母上是样本自由度n-1。样本标准差s是总体标准差σ的无偏估计值。

习题2.5

习题 2.6 答:

男子血清总胆固醇次数分布直方图

51015202530 2.5

3

3.5

4

4.5

5

5.5

6

6.5

7

7.5

男子血清总胆固醇次数分布多边形图

51015202530 2.75

3.75

4.75

5.75

6.75

由直方图和多边形图像可以得出结论:该地区30-40岁健康男子血清总胆固醇在2.50-7.50(mol/l )之间的分布呈现 两头少 中间集中 的规律,即3.50-6.00(mol/l )之间较为普遍。

习题 2.7 答:

由SPSS 统计分析可知: 平均数=4.7398 标准差=0.86616

变异系数:CV=(s/x )*100%=(0.86616/4.7398)*100%=18.27%

习题 2.8 答:

由SPSS 统计分析可知:

中值(即中位数)=4.6600 ,与平均数=4.7398比较可知:样本数据中存在许多较大的极端值。

(1)相同点:都是用来描述数据集中趋势的统计量;都可用来反映数据的一般

水平;都可用来作为一组数据的代表。

(2)不同点:均值反映了一组数据的平均大小,常用来代表一般数据的总体平均水平。中值像一条分界线,将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”。

均值由于和每个数据都相关,比较可靠和稳定,反映出来的信息最充分。既可描述一组数据本身的整体平均情况,也可用来作为不同组数据比较的一个标准。中值可比性比较差,因为他只利用了部分数据。

习题2.9 答:

由SPSS统计分析结果可知:

单养平均数为:x=42.70(kg);单养极差为: R=极大值—极小值=55-25=30(kg);

单养标准差为: S =7.078(kg);单养变异系数为: CV=s/x*100%=16.58%

混养平均数为:x =52.10(kg)混养极差为: R=69-39=30(kg);

混养标准差为:S=6.335(kg);混养变异系数为: CV= s/x*100%=12.16%

从单养和混养的贻贝重量数据可以看出,混养贻贝平均重量大于单养。二者极差相等,说明最大值、最小值差距相等。但单养的标准差和变异系数都大于混养,说明单养贻贝的重量的整齐度没有与海带混养整齐度高。以上结果表明,贻贝与海带混养效果较好。

第三章概率与概率分布

习题3.1

答:在一定条件下必然出现的事件叫必然事件;相反,在一定条件下必然不出现的事件叫不可能事件;而在某些确定条件下可能出现,也可能不出现的事件,叫随机事件。例如,发育正常的鸡蛋,在39°C下21天会孵出小鸡,这是必然事件;太阳从西边出来,这是不可能事件;给病人做血样化验,结果可能为阳性,也可能为阴性,这是随机事件。

习题3.2

答:事件A和事件B不能同时发生,即A2B=V,那么称事件A和事件B为互斥事件,如人的ABO血型中,某个人血型可能是A型、B型、O型、AB型4中血型之一,但不可能既是A型又是B型。事件A和事件B必有一个发生,但二者不能同时发生即A+B=U, A2B=V,则称事件A与事件B为对立事件,如抛硬币时向上的一面不是正面就是反面。事件A与事件B的发生毫无关系。反之事件B的发生与事件A的发生毫无关系,则称事件A与事件B为独立事件,如第二胎生男生女与第一台生男生女毫无关系。

习题3.3

答:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加

时,事件A 发生的频率W(A)就越来越接近某一确定值p ,则p 即为事件A 发生的概率。二者的关系是:当试验次数n 充分大时,频率转化为概率 。

习题3.4 答:正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:

①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值πσ21

②、正态分布是以μ为中心向左右两侧对称的分布;

③、σ

u

x -的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x 轴为渐

近线,x 的取值区间为(-∞,+∞);

④、正态分布曲线完全由参数μ和σ来决定 ⑤、正态分布曲线在x=μ±σ处各有一个拐点; ⑥、正态分布曲线与x 轴所围成的面积必定等于1。

正态分布具有两个参数μ和σ,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;σ决定正态分布曲线的展开程度,σ越小曲线展开程度越小,曲线越陡,σ越大曲线展开程度越大,曲线越矮宽。

习题3.5 答:

(1) P (0.3<μ≦1.8)=F(μ=1.8)-F(μ=0.3)=0.96407-0.6179=0.34617 (2) P (-1<μ≦1)=F(μ=1) - F(μ=-1)=0.8413-0.1379=0.7034 (3) P (-2<μ≦2)=F(μ=2)-F(μ=-2)=0.97725-0.01831=0.95894

(4) P (-1.96<μ≦1.96)=F(μ=1.96) - F(μ=-1.96)=0.9750-0.025=0.95 (5) P (-2.58<μ≦2.58)=F(μ=2.58) - F(μ=-2.58)=0.99506-0.00494=0.99

习题3.6 答:

(1)

μ

1=

σ

u

x -=

4

43--=-1.75,μ2=

σ

u

x -=4

44-=0, P (-3

(2) μ=

σ

u

x -=442.4-=-0.4,

P (x ≦2.4)= P (μ≦-0.4)=0.3446

(3) μ=

σ

u

x -=4

4

1.48--=-1.37

P (x >-1.48)= P (μ>-1.37)=1- P (μ=-1.37)

=1-0.08379=0.916

(4)μ=

σ

u x -=441--=-1.25

P (x >-1)= P (μ>-1.25)=1- P (μ=-1.25)=1-0.1056=0.89

习题3.7答: (1)F1代非糯杂合体Ww 与糯稻亲本ww 回交,后代非糯杂合体Ww 与糯稻纯合体ww 各占一半,即概率均为0.5,故在后代N=200株中预期糯稻和非糯稻均为0.53200=100(株)。

(2)F1代非糯杂合体Ww 自交,后代非糯杂合体WW :非糯杂合体Ww :糯稻杂合体ww=1:2:1,但表型非糯:糯稻=3:1,即非糯和糯稻的概率分别为0.75和0.25,故在后代N=2000株中,糯稻应为0.2532000=500(株),非糯稻应为0.7532000=1500(株)。

习题3.8答:

解: 根据研究的目的基因,可将F2代分为纯合正常抗绣植株和非纯合正常抗绣植株,且不同大麦出现该目的基因为独立的,同时出现纯合正常抗绣植株的概率p=0.0036,非常小,故该题可用二项分布或泊松分布的概率函数公式计算。 (1)λ= np=200*0.0036=0.72,代入泊松分布概率函数公式:

P (X )=

x *72.0e

x

72

.0-X=0,1,2 (200)

F2代出现纯合正常抗锈植株的各种可能株数的概率分别为: P (0)=0.487 P (1)=0.350 P (2)=0.126 P (3)=0.030 P (4)=0.005 P (5)=0.001

P (X ≥6)=1- P (0)- P (1)- P (2)- P (3)- P (4)-P (5) =1-0.487-0.350-0.126-0.030-0.005-0.001=0.001

出现6或6株以上纯合正常抗锈植株的概率总共为0.001,已经非常小了,不必再一一计算。

(2)欲求P (X ≥1)=0.99.则P (0)=0.01,即

P (X )=!

00

e

λ

λ

-=0.01,

对两边求对数,则有:

n =4.605/0.0036=1279株

因此,希望有0.99的概率保证获得1株或1株以上纯合正常抗锈植株,则F2代至少应种1279株。

习题3.9答:

解:小白鼠接种病菌后,要么生存要么死亡,个体间又相互独立,故服从二项分布。设事件A为接种病菌后生存,由已知得ρ=0.425,n=5,x=4,则“四生一死”的概率为:

Ρ(4)=

q45

4

4

5

-

P

C

=53

425

.04

3(1-0.425)1=0.0938

习题3.10答:

(1)μ1=σu

x-

=

216

10-=-3,μ2=σu x-=

216

20-=2,

因而落于10到20之间的数据的百分数为:

P(10

(2)μ1=σu

x-

=

216

12-=-2,μ2=σu x-=

216

20-=2,

因而小于12的数据的百分数为:

P(x<12)=P(μ<-2)=F(μ=-2) =0.02275=2.3%

大于20的数据的百分数为:

P(x>20)= P(μ>2)=1-F(μ=2)=1-0.97725=0.02275=2.3%

习题3.11答:

(1)df=5时,P(t≦-2.571)=0.05 ,P(t>4.032)=0.99 ;

(2)df=2 时,P(x2≤0.05)=0.975 ,P( x2>5.99)=0.95 ,

P(0.05<x2<7.38) =0.95 ;

(3)df 1= 3,df2=10 时,P(F≧3.71)=0.95,P(F≧6.55)=0.99 。

第四章统计推断

习题4.1

答:统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。统计推断主要包括参数统计和假设检验两个方面。假设检验是根

据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,进过一定的计算,作出在一定概率水平(或显著水平)上应该接受或否定的那种假设的推断。参数估计则是由样本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计和区间估计。

习题4.2

答:小概率原理是指概率很小的事件在一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的时间作为小概率事件。他是假设检验的依据,如果在无效假设H 0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H 0,否定H A ;如果某事件的概率小于0.05或0.01,说明无效假设不成立,则否定H 0,接受H A 。

习题4.3

答::在假设检验中如果H 0是真实的,检验后却否定了它,就犯了第一类错误,即α错误或弃真错误;如果H 0不是真实的,检验后却接受了它,就犯了第二类错误,即β错误或纳伪错误。

假设检验中的两类错误是弃真错误和取伪错误。为了减少犯两类错误的概率要做到:①显著水平a 的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。

习题4.4 答:区间估计指根据一个样本的观测值给出总体参数的估计范围给出总体参数落在这一区间的概率。点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。置信度与区间估计的关系为:对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。

习题4.5 解:(1)假设H 0:μ=μ0=21g,即新饲养方法与常规饲养方法所育对虾体重相同。 对H A :μ≠μ0;

(2)选取显著水平α=0.05;

(3)检验计算:x σ=n

σ

=1002.1=0.12;μ=x σu x -=12.02120-=-8.33;

(4)推断:μ分布中,当α=0.05时,μ

0.05

=1.96。实得μ>1.96,P<0.05,故在

0.05显著水平上否定H 0,接受H A ,认为新饲养方法的对虾体重与常规饲养方法

有显著差异。

由此可知,对虾体重的区间估计为: L 1=σαu x -=20—1.9630.12=19.76(%), L 2=x σαu x +=20+1.9630.12=20.24(%)

习题4.6

解: ①建立无效假设:该测量结果和常规枝条氮含量无差别。

从SPSS 数据输出可以看出,

自由度为df=9,t 值为-0.371, 双尾检验p=0.719>0.05,故接受无效假设,认为该测量结果和常规树枝含氮量无差别。

习题4.7

解:(1)假设H 0:μ=μ0=47.3g,即三化螟两代每卵块的卵数相同。 对H A :μ≠μ0;

(2)选取显著水平α=0.01; (3)检验计算:

2

2

2121-

2

1n s

n s s x x +=

=

69

8.461284.252

2+=6.07

μ=

2

1-2

1x x x s x -=

07

.69

.743.47-=-4.55;

(4)推断:现实得μ>μ

0.01

=2.58,P<0.01,故否定H 0,接受H A ,即三化螟两代

每卵块的卵数存在极显著差别,由于21x x <,所以可以得出三化螟第二代每卵块的卵数极显著高于第一代的结论。

习题4.8

解:(1)建立假设,认为北方动物比南方动物具有较短的附肢; (2)SPSS 数据分析(见文件)

(3)结果分析由SPSS数据输出表格可知,方差齐性检验F=0.355,P=.561>0.05,故接受假设,认为北方和南方动物附肢无差别。

习题4.9

解:(1)建立假设,认为中草药青木香没有降低血压的作用。

(2)SPSS数据分析操作(见文件)

(3)由表格的内容可知,治疗前后,t=5.701,df=12,P=0<0.05,所以拒绝假设,认为治疗前后有明显的疗效。

习题4.10

解:(1)建立假设,认为A、B两种病毒对药草的致病力一样。

(2)SPSS数据分析操作(见文件)

(3)由表格的内容可知,接种A 、B 两种病毒后,t=2.625,df=7,P=0.034<0.05,所以拒绝假设,认为A 、B 两种病毒对药草的致病力不一样,有显著差别。

习题4.11

(1) 假设H 0:p ≦p 0,即该批棉花种子不合格。对H 0:p>p 0。 (2) 确定显著水平α=0.05.

(3) 检验计算:q=1-p=1-0.80=0.20, p ?=n x =100

77=0.77, p ?σ=

n pq =100

20

.080.0?=0.04,c μ=p n p p

?

5.0?σ--=04

.01005

.080.077.0--=0.625

(4) 推断:由于c μ<05.0μ=1.64,P>0.05,故接受H 0,认为这批棉花种子不合格。

(5) 由上可知,置信度为95%的棉花种子发芽率的区间估计为:

L 1=p ?-αμp ?

σ=0.77-1.9630.04-1005

.0=0.69 L 2=p ?+αμp ?

σ=0.77+1.9630.04+100

5

.0=0.85

习题4.12

解:(1)假设H 0:即两医院乳腺癌手术后5年的生存率间没有显著差异; H A :即两医院乳腺癌手术后5年的生存率间有显著差异。

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 独立样本T 检验得到如下结果:

(4)作出推断:由上表可知 P=0.296 >α=0.05,故接受H 0,否定H A ;即两医院乳腺癌手术后5年的生存率间未达著差异。

习题4.13

(1) 建立假设,认为A 、B 两种饲料对鱼的体重增加量方差同质。 (2)SPSS 数据分析操作(见文件)

所以接受假设,认为A、B两种饲料对鱼的体重增加量方差同质。

第五章x2检验

习题5.1

答:x2检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著;适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。

习题5.2

答:x2检验的步骤为:

(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起,即观测值=理论值;备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值

(2)确定显著水平a,一般可确定为0.05或0.01

(3)计算样本的x2,求得各个理论次数E i,并根据各实际次数O i,代入公式,计算出样本的x2。

(4)进行统计推断

习题5.3

:野兔性别比例符合1:1;

解:(1)H

H

:野兔性别比例不符合1:1;

A

(2)确定显著性水平α=0.01

(3)计算统计量,经SPSS统计分析检验得到如下结果:

性别

观察数

期望数

残差 雄性 57 71.5 -14.5 雌性 86 71.5

14.5

总数

143

(4)查χ2 值表,当df=1时,χ2 0.01=6.63。

而经SPSS 统计分析实际得到的的χ2 =5.881>χ2 0.01=6.63

故应否定H 0,接受H A ,即认为野兔性别比例不符合1:1的比率。

习题5.4

解:(1)H 0:大麦F2的芒性状表型符合9:3:4; H A :大麦F2的芒性状表型不符合9:3:4;

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 统计分析检验得到如下结果:

(4)查χ2 值表,当df=2时,χ2 0.05=5.99。

而经SPSS 统计分析实际得到的的χ2 =0.041<χ2 0.05=5.99,

故应接受H 0,否定H A ,即认为大麦F2的芒性状表型符合9:3:4。

习题5.5

解:(1)H 0:这群儿童的性别比例符合1:1; H A :这群儿童的性别比例不符合1:1;

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 统计分析检验得到如下结果:

检验统计量

性状

卡方 .041a

df 2 渐近显著性

.980

a. 0 个单元 (0.0%) 具有小于 5 的期望频

率。单元最小期望频率为 116.3。

检验统计量

性别1

卡方 12.082a

df 1 渐近显著性

.001

a. 0 个单元 (0.0%) 具有小于 5 的期望频

率。单元最小期望频率为 373.5。 (4)查χ2 值表,当df=1时,χ2 0.05=3.84。

而经SPSS 统计分析实际得到的的χ2 =12.082>χ2 0.05=3.84,

故应否定H 0,否定H A ,即认为这群儿童的性别比例不合理,不符合1:1。

习题5.6

解:(1)H 0:这两种苹果耐贮性不同; H A :这两种苹果耐贮性相同;

(2)确定显著性水平α=0.05

(3)计算统计量,经SPSS 统计分析检验得到如下结果:

(4)查χ2 值表,当df=1时,χ2 0.05=3.84。

而经SPSS 统计分析实际得到的的χ2 >χ2 0.05=3.84,

故应否定H 0,接受H A ,即认为这两种苹果耐贮性相同,没有显著差异。

习题5.7

解:(1)H 0:小麦的品种与赤霉病的发生无关; H A :小麦的品种与赤霉病的发生有关系;

(2)确定显著性水平α=0.01

(3)计算统计量,经SPSS 统计分析检验得到如下结果:

B 499 1232.96

C 513 1219.31

D 674 1733.44

E 544 1251.88

总数

2750

(4)查χ2 值表,当df=4时,χ2 0.01=。13.28。

而经SPSS 统计分析,χ2 =420.5>χ2 0.01=13.28,P<0.01,

故应拒绝H 0,接受 H A ,说明小麦的品种与赤霉病的发生有密切关系,不同品种的小麦感染赤霉病的概率有差异。

习题5.8

解:(1)H 0:灌溉方式的不同与叶片的衰老无关; H A :灌溉方式的不同与叶片的衰老有关系;

(2)确定显著性水平α=0.05 (3)计算统计量,经SPSS 统计分析检验得到如下结果:

灌溉方式 N 秩均值 叶片

1

160 264.80 2

205

270.51

3 182 286.02

总数

547

(4)查χ2 值表,当df=2时,χ2

0.05

而经SPSS 统计分析实际得到的的χ2 =5.3<χ2 0.05=5.99

故应接受H 0,否定 H A ,说明三种类型的灌溉方式对叶片的衰老没有影响。

第六章 方差分析

习题6.1

答:(1)方差分析是对两个或多个样本平均数差异显著性检验的方法。

(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。

(3)方差分析的基本步骤如下:

a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。

b.列方差分析表进行F 检验,分析各变异因素在总变异中的重要程度。

c.若F 检验显著,对个处理平均数进行多重比较。 习题6.2

检验统计量a,b

健康患病

卡方

420.518

df 4 渐近显著性

.000

a. Kruskal Wallis 检验

b. 分组变量: 小麦品种

答:(1)多个平均数两两间的相互比较称为多重比较。

(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和q检验法。

(3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然后在最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相差显著的则标以字母b。再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,凡有一个相同标记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写字母标记。

梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数>LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数>LSD(LSR)0.01说明处理平均数间的差异达到极显著水平,在差数的右上角标上“**”号。差数< LSD(LSR)0.05,说明差异不显著。

习题6.3

答:方差分析有3个基本假定,即正态性、可加性和方差同质性。方差分析有效性是建立在3个基本假定的基础上的。

因为通常情况下,在生物学研究中我们得到的样本数据是非正态性分布,且有可能方差不同质,所以必须经过适当的数据转换改善样本数据,才能进行方差分析。

习题6.4

解:根据题目所给信息可知该题属于组内观测次数相等的单因素方差分析,SPSS

理种子后,对芽长有极显著的影响。

a. 将使用调和均值样本大小 = 3.000。

多重比较的结论:

用LSD法、SSR法、q法进行多重比较的结果是相同的,多重比较结果表明,用氟化钠浸种后,与对照相比,芽长降低,其中10μg/g与对照相比,差异不显著;对照与50μg/g,100μg/g差异达到极显著水平;10μg/g与50μg/g差异达显著水平,与100μg/g差异达极显著水平;50μg/g与100μg/g差异不显著。

习题6.5

解:根据题目所给信息可知该题属于组内观测次数不等的单因素方差分析,SPSS 方差分析,结果如下:

方差分析结果见下表:

由上述方差分析计算所得到的F值达到极显著水平,表明母猪对仔猪体重存

在极显著的影响作用。

习题6.6

解:根据题目所给信息可知该题是两因素无重复观测值得方差分析,可以分别对品种、室温这两个因素的效应进行分析,且品种、室温均为固定因素,可依固定模型进行分析。

以家兔品种作为因素A,该因素有4个水平;以室温作为因素B,该因素有7个水平,经SPSS统计分析结果如下:

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学教案(5)

生物统计学教案 第五章统计推断 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。 讲授难点:一个、两个样本的差异显著性检验 统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。 参数估计:通过样本统计量估计总体参数。 5.1 单个样本的统计假设检验 5.1.1 一般原理及两种类型的错误 例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。 1、假设: H 0: μ=μ 或H0: μ-μ0=0 H A : μ>μ μ<μ μ≠μ 三种情况中的一种。 本例的μ =10.00g,因此 H : μ=10.00 H A : μ>10.00或μ<10.00或μ≠10.00 2、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。 从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数

服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即 P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。如果得到的值很小,则 x 抽自平均数 为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。 显著性检验:根据小概率原理建立起来的检验方法。 显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。 3、临界值 例 从上述动物群体中抽出含量n =10的样本,计算出 x =10.23g ,并已知 该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。根据以上条件进行统计推断。 H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求 出u 值。 P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。 在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。从 正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。接受域的端点一般称为临界值。本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。 4、单侧检验和双侧检验 上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。对应于H A :μ>μ0时的检验称为上尾单侧检验。 下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。 n x n x u 40 .000.100 -= -= σ μ82 .110 40 .000 .1023.100 =-= -= n x u σ μ

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学作业

生物统计学SPSS作业 4.6 桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问测定结果与常规枝条含氮量有无差别。 解:1、假设H1:u1=u2,即新品枝条与常规枝条含氮量无差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。

(3)在下图中将左边方框中的“新品枝条含氮量”放到右边的“检验变量”方框中,并选择“确定”。即可得出“单样本T检验”的检验结果。

4、结果分析 由SPSS “单样本T检验”检验结果可知t=-0.371 Sig. (2-Tailed)是双尾t检验显著概率0719大于0.05,所以可以接受假设H1,即新品枝条与常规枝条含氮量无差别

4.8 假说:“北方动物比南方动物具有较短的附肢。”未验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120 113 125 118 116 119 ;南方的:116 117 121 114 116 118 123 120 。试检验这一假说。 解:1、假设H1:u1=u2,即北方动物和南方动物的附肢没有差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。 (3)在下图中将左边方框中的“翅长”放到右边的“样本变量(s)”方框中,将“状态”放到“分组变量”中,并选择“定义组”。

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

014福师《生物统计学》在线作业一、二

014福师《生物统计学》在线作业一 黄镇 一、单选题(共25 道试题,共50 分。) 1. 对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?C A. tr>tb B. trx)<α,就认为x是抽不到的。A. 假设检验原理B. 小概率原理C. 中心极限定理D. 概率分布律 13. 设配对资料的变量值为x1和x2,则配对资料的秩和检验D A. 分别按x1和x2从小到大编秩 B. 把x1和x2综合从小到大编秩 C. 把x1和x2综合按绝对值从小到大编秩 D. 把x1和x2的差数按绝对值从小到大编秩 14.可能影响试验结果的因素分为处理因素和______因素。服药后病好了,则“病好了”这个结果可能是药导致的(药无效)、______药导致的(药无效)。C A. 非处理因素,也可能不是 B. 误差因素,也可能不是 C. 误差因素,不可能不是 D. 非处理因素,不可能不是 15.由于所选的特征在“药有效”时可能出现、在“药无效”时也可能出现,所以除了__D____外,所选

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

李春喜生物统计学第三版课后作业答案

《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编着) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下四个方面:①提 供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性; ④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。 (7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随 机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因素所造成的实验 结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所产生的倾 向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接 近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程 度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映 多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。 习题1.3 误差与错误有何区别? 答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。 第二章实验资料的整理与特征数的计算(P22、P23)

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学(自理重点)

生物统计学复习资料(70%) 填空:10题×1’=10’选择:5题×1’=5’ 名词解释:5题×2’=10’ 判断:5题×1’=5’ 简答:3题×5’=15’ 统计推断:4题10’+10’+10’+20’=50’ 第1章绪论 生物统计学:是研究收集、整理、分析和解释生物科学试验数据的科学,是统计学原理在生物学研究领域的应用。 生物统计学的主要内容 生物统计学包括试验数据的获取、整理和分析等相关内容,具体来说,包括试验或调查设计、数据的整理(描述统计学)、概率论基础(统计理论基础)、统计推断方法(推断统计学)等内容。 调查设计:是指整个调查计划的制订,包括调查研究的目的、对象与范围,调查项目及调查表内容,抽样方法的选取,抽样单位和抽样数量的确定,数据处理方法,调查组织工作,调查报告撰写等内容。 试验设计:是指试验单位的选取、生物学重复数的确定及试验单位的分组等。 生物统计学发展简史 (1)古典记录统计学 (2)近代描述统计学 (3)近代推断统计学 总体:是研究对象的全体。 个体:是总体中的一个研究单位。 样本:是从总体中抽取的用于代表总体的一部分个体。 样本容量记为n,通常把n≤30的样本称为小样本,n>30的样本称为大样本。(判断区别)随机抽样:是指总体中的每一个个体都有同等的被抽取的机会组成样本。 参数:由总体计算的特征数。 统计数:由样本计算的特征数。 准确性:也叫准确度,是指在试验中某一试验指标的观测值与其真值接近的程度。 精确性:也叫精确度,是指同一试验指标的重复观测值彼此接近的程度。 随机误差:是由于无法控制的内在和外在的偶然因素所造成的,是客观存在的,在实验中,即使十分小心也难以消除。 系统误差:也叫片面误差,是由试验材料的初始条件不同或测量仪器不准等引起的倾向性或定向性偏差。 (小题)误差怎么控制? (小题)随机误差可完全避免(×) (小题)减小统计误差的方法是(B) A、提高准确度 B、提高精确度 C、减少样本容量 D、增加样本容量

生物统计学作业操作步骤及分析3

第一次作业 习题2.5 某地100例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 试根据所给资料编制次数分布表. 解:1.求全距7.22-2.70=4.52(mol/L) 2.确定组数和组距组数10 组距=4.52/10=0.452(mol/L)取组距为0.5(mol/L) 3.确定组限和组中值 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~ 7.0~ 习题2.7 根据习题2.5的资料,计算平均数、标准差和变异系数。 习题2.8 根据习题2.5的资料,计算中位数,并与平均数进行比较。 习题2.9 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据: 45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47, 44,43,46,55,42,27,42,35,46,53,32,41,48,50,51,46,41,34,44,46;

相关主题
文本预览
相关文档 最新文档