当前位置:文档之家› 试验统计方法第四版盖钧镒

试验统计方法第四版盖钧镒

试验统计方法第四版盖钧镒
试验统计方法第四版盖钧镒

实验误差:真值与测定值之间的误差。类型:系统误差,随机误差,过失误差

准确性:指观测值与理论真值间的符合程度。

精确性:指观测值之间的符合程度。

如何提高准确性和精确性。

一是人员素质与水平的提高;二是好的设施和环境;三是方法选择,正确地选择检测方法对提高检测数据的准确性至关重要。四是样品的抽区和制备,正确抽样具有代表性的均匀样品,是保障检测数据准确性的重要环节;五是质量控制。检测结果质量是实验室始终关注的重点。

消除系统误差的方法:控制环境条件;正确选用检测指标;保证检测仪器的准确性;保证试剂质量。采样方法,样品制备,储藏标准化;注意药物或其他因素干扰。

控制实验误差方法:减少环境误差;相对测量法;直接替代法;交替测定法;补偿法;动态操作法

Gosset用实验方法发现了t分布(假设检验) Fisher提出了方差分析。

重复:实验中同一处理种植的小区数为重复次数。

完全随机设计:将各处理随机分布到各个实验单元中,每一处理的重复数可以相等或不相等。

完全抽样:样本数量和总体数量完全一致的抽样。

常见的实验方法:单因素实验设计;均分法;对分法;黄金分割法;

多因素实验设计;旋升法

常见的实验设计:完全随机设计;配对设计;随机区组设计

总体:具有共同性质个体所组成的集团

样本:从总体抽取若干个个体来研究,这些个体的集合

实验资料:数量性状资料:连续性变数;间断性变数

计数资料:先将观察单位按其性质或类别分组,然后清点各组观察单位个数所得资料。

计量资料:连续的数据,通常有具体的数值,如身高,体重等。计量资料是用仪器、工具1或其他定量方法对每个观察单位某项标志进行测量,并把测量结果用数值大小表示出来的资料。

统计推断的意义:通过样本推断总体是通过总体分布的数量特征。即参数来反映的。因此,统计推断包括:对总体的未知数进行估计;对于参数的假设进行检查;对总体进行预测预估等。

算术平均数特征:离均差的总和等于0;离均差平方和最小

为什么变异系数与平均数,标准差要配合使用?

由于变异系数是一个不带单位的纯数,故可以用两个事物的变异都大小,若只从标准差来看,例如甲比乙的变异大,但因两者的均数不同。标准差不宜直接比较。在使用变异系数使。应该认识到的是由标准差与平均数构成的比数,既受标准差的影响,又受平均数的影响,因此,在使用变异系数表示样本变异程度时,宜同时列举平均数和标准差,否则会误会。

和事件:事件A和事件至少有一个发生而构成的新事件成为事件A和

事件B的和事件。

什么叫小概率原理?

“小概率事件实际上不可能发生”原理接受或否定假设,当概率很小时就可认为该事件在一次实验中几乎是不可能事件,就可认为它不可能属于抽样误差,从而否定假设

假设检验的两类错误:第一类错误:无效假设是正确的,但是假设检验结果却否定了无效假设;第二类是无效假设是错误的,备择假设本来是正确的,但是检测结果却接受了无效假设。

为什么在多个处理的平均数相互比较时,不选t检验和w检验?

T检验及数量大;没有统一标准;犯I型错误的概率大

多重比较的方法:最小显著差数法;新复级差法

什么情况下进行多重比较?

通常样本数大于2,且方差分析结果的P<=0.05时做多重比较。

多重比较结果的表示方法:列梯形表法;标记字母法:凡有一个相同标记字母的即为差异不显著,没有标记相同字母的即为差异显著。在什么情况下要进行数据转换:数据不满足:效应可加性,方差的异质性,非正太性。

数据转换的方法:平方根转换;对数转换;反正玄转换

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

试验统计方法复习题集

试验统计方法复习题 一、名词(术语、符号)解释: 1、总体:具有相同性质的个体所组成的集团特区为总体。 2、样本:从总体中抽出的一部分个体。 3、试验指标:用于衡量试验效果的指示性状称为试验指标。 4、试验因素:是人为控制并有待比较的一组处理因素,简称因素或因子。 5、试验水平:是在试验因素所设定的量的不同级别或质的不同状态称为试验水平,简称水平。 5、处理:单因素试验是指水平,多因素试验是水平与水平的组合。 6、简单效应:一个因素的水平相同,另一个因素不同水平间的性状(产量)差异属于简单效应。 7、参数:由总体的全部观察值而算得的特征数称为参数。 8、统计数:由样本观察值计算的特征数。 9、统计假设:是根据试验目的对试验总体提出两种彼此对立的假设称为统计假设。 10、无效假设:是指处理效应与假设值之间没有真实差异的假设称为无效假设。 11、准确度:是指试验中某一性状的观察值与其相应理论真值的接近程度。 12、精确度:是指试验中同一性状的重复观察值彼此之间的接近程度。 13、复置抽样:指将抽出的个体放回到原总体后再继续抽样的方法叫复置抽样或有放回抽样。 14、无偏估计:一个样本统计数等于所估计的总体参数,则该统计数为总体相应参数的无偏估计值。 15、第一类错误:否定一个正确H0 时所犯的错误。 16、第二类错误:接受一个不真实假设时所犯的错误。 17、互斥事件:事件A与B不可能同时发生,即AB为不可能事件,则称事件A与B为互斥事件。 18、随机事件:在一定条件下,可能发生也可能不发生,可能这样发生,也可能那样发生的事件。 19、标准差:方差的正根值称为标准差。 20、处理效应:是指因素的相对独立作用,亦是因素对性状所起的增进或减少的作用称为处理效应。 21、概率分布:随机变数可能取得每一个实数值或某一围的实数值是有一定概率的,这个概率称为 随机变数的概率分布。 22、随机抽样:保证总体中的每一个体,在每一次抽样中都有同等的概率被取为样本。 23、两尾测验:有两个否定区,分别位于分布的两尾。 24、显著水平:否定无效假设H0的概率标准。 25、试验方案:根据试验目的与要求拟定的进行比较一组试验处理的总称为试验方案。 26、随机样本:用随机抽样的方法,从总体中抽出的一个部分个体。 27、标准误:抽样分布的标准差称为标准误。 28、总体:具有相同性质的个体所组成的集团称为总体。 29、独立性测验:主要为探求两个变数间是否相互独立测验的假设。

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学模拟试题5

一、名词解释(每小题2分,共20分)得分:分 1. 典型抽样 2. 随机误差 3. “小概率事件实际不可能性”原理 4. 试验指标 5. 试验因素 6. 适合性检验 7. 极差 8. 自由度 9. Ⅱ型错误 10. 随机区组设计 二、填空题(每空1分,共20分)得分:分 1. 在二项分布中,如果事件A发生某一结果的概率为0.46,则其对立事件的概率为。 2. 利用Excel软件对配对资料进行t检验时,首先打开Excel电子表格,然后输入原始数据,接着点击工具栏中的“”,打开“”工具对话框,在变量区域中输 第 1 页共8 页

入相应变量,选定标志项,在输出区域中输入输出区域的单元格后,按确定按钮即可得到结果。 3. 统计学上,符号S表示,μ表示,σ2表示。 4. 标准正态分布的两个参数μ= ,σ2= 。 5. 方差分析的三个基本假定是、 和。 6. 准确性和精确性的含义是不同的。设某一试验指标的真值为μ,观测值为x,若x与μ差的绝对值|x-μ|越小,则观测值x的越高;反之则低。若观测值彼此接近,即任意两个观测值x i、x j差的绝对值|x i-x j|小,则观测值的高;反之则低。 7. 拉丁方设计的特点是=横行单位组数=直列单位组数=重复数。 8. 在进行次数资料的 2检验时,需要进行连续性矫正的条件是自由度等于。 9. 某一猪场饲养的长白成年母猪的平均体重为190 Kg,标准差为13 Kg,那么其变异系数C.V等于(小数点后保留两位)。 10. 算术平均数的基本性质是、。 11. 方差分析的多重比较中LSD法是的简称。 12. 在进行方差分析时,对于单因素完全随机设计试验资料的数学模型,其中观测值x ij= 。 三、选择题(每小题 1 分,共15分)得分:分 1. 在生物统计中,样本容量记为n。关于小样本容量描述正确的是()。 A. n≤20 B. n≤30 C. n>20 D. n>30 2. 正态分布曲线与横轴之间的总面积等于()。 A. 次数总和n B. 次数总和n+1 C. 0.95 D. 1.0 第 2 页共8 页

生物统计学名词解释大全

1.样本: 样本从总体中抽出的若干个体所构成的集合称为样本。 2.总体: 总体指具有相同性质的个体所组成的集合称为总体。 3.连续变量:表示在不变量范围内可抽出某一范围的所有值。 4.非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常 是整数。 准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。 精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。 资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。 数量性状资料:指一般是由计数和测量或度量得到的。 质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。 计数资料;指由计数得到的数据。 计量资料:有测量或度量得到的数据。 普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。 全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组限下线和上限的中间值。 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。 几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。 方差:指用样本容量n 来除离均差平方和,得到平均的平方和。 标准差:指方差的平方根和。 变异系数:指将样本标准差除以样本平均数得出的百分比。 概率:指某事件 A 在n 次重复试验中,发生了几次,当试验次数n 不断增大时,事件 A 发生的频率W(A)概率就越来越接近某一确定值P,于是则定P 为事件 A 发生的概率. 和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件 A 和事件 B 的事件。 积事件:指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A 和事件 B 的积事件。 互斥事件:指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B 互斥。 对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时发生。 独立事件:指事件 A 的发生与事件 B 的发生毫无关系。 完全事件系:指如果多个事件A1、A2、、、、、、An 两两相斥,且每次试验结果必然发生其一,则称事件A1、完全事件系A2、、、、、、An 为一个完全事件系。概率加法定理:指互斥事件 A 和 B 的和事件的概率等于事件 A 和事件 B 的概率之和,P(A+B)=P(A)+P(B)。 概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同时发生的概率等于事件 A 和事件 B 各自概率乘法定理的乘积,即:P(A*B)=P(A)*P(B)。 伯努利大数定律:设M 是n 次独立试验中事件 A 出现的次数,而不是事件 A 在每次试验中出现的概率,则对于任意小的正数ε ,有如下关系:limp{m/n-p< ε }=1

试验统计方法复习题

试验统计方法复习题 1.何谓实验因素和实验水平?何谓简单效应、主要效应和交互效应?举例说明之。 实验因素: 被变动并设有待比较的一组处理的因子或试验研究的对象。 实验水平: 实验因素的量的不同级别或质的不同状态。 简单效应: 同一因素内俩种水平间实验指标的相差。 主要效应:一个因素内各简单效应的平均数。 交互效应:俩个因素简单效应间的平均差异。 2.什么是实验方案,如何制定一个正确的实验方案?试结合所学专业举例说明之。 试验指标:用于衡量试验效果的指示性状。 制定实验方案的要点○1.目的明确。 ○2. 选择适当的因素及其水平。 ○3设置对照水平或处理,简称对照(check,符号CK)。 ○4应用唯一差异原则。 3.什么是实验误差?实验误差与实验的准确度、精确度以及实验处理间的比较的可靠性有什么关系? ○1.试验误差的概念:试验结果与处理真值之间的差异. ○2随机误差影响了数据的精确性,精确性是指观测值间的符合程度,随机误差是偶然性的,整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。系统误差是可以通过试验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。 4.试分析田间实验误差的主要来源,如何控制田间实验的系统误差?如何降低田间实验的随机误差? 误差来源:(1)试验材料固有的差异 (2)试验时农事操作和管理技术的不一致所引起的差异 (3)进行试验时外界条件的差异 控制误差的途径:(1)选择同质一致的试验材料 (2) 改进操作和管理技术,使之标准化 (3) 控制引起差异的外界主要因素 选择条件均匀一致的试验环境; 试验中采用适当的试验设计和科学的管理技术; 应用相应的科学统计分析方法。 尽量减少实验中的随机波动因素、环节和时间可以有效的降低随机误差。 5.田间实验设计的基本原则是什么?完全随机设计、完全随机区组设计、拉丁设计各有何特点?各在什么情况下使用? (1)基本原则是:○1.重复○2随机排列○3局部控制 (2)完全随机设计的特点是设计分析简便,但是应用该设计的条件是要求试验的环境因素相当均匀,所以一般用于实验室培养试验及网、温室的盆钵试验。 完全随机区组设计○1.特点: 根据“局部控制”的原则,将试验地(或试验环境)按肥力变异梯度(或条件变异梯度)划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。○2应用条件:对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。 拉丁方设计的○1.特点:将处理从纵横二个方向排列为区组(或重复),使每个处理在每一

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

生物统计学最新复习题

《生物统计学》复习题 一、填空题(每空1分,共10分) 1.变量之间的相关关系主要有两大类:(),() 2.在统计学中,常见平均数主要有()、()、() 3.样本标准差的计算公式() 4.小概率事件原理是指() 5.在标准正态分布中,P(-1≤u≤1)=() (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(),Y称为() 二、单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: D A A、总体平均数 B、自变量 C、依变量 D、样本平均数 2、下面一组数据中属于计量资料的是 D A、产品合格数 B、抽样的样品数 C、病人的治愈数 D、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 B C A、12 B、10 C、8 D、2 4、变异系数是衡量样本资料 A 程度的一个统计量。 A、变异 B、同一 C、集中 D、分布 5、方差分析适合于, A 数据资料的均数假设检验。 A、两组以上 B、两组 C、一组 D、任何 6、在t 检验时,如果t = t0、01,此差异是:B A、显著水平 B、极显著水平 C、无显著差异 D、没法判断 7、生物统计中t检验常用来检验 A A、两均数差异比较 B、两个数差异比较 C、两总体差异比较 D、多组数据差异比较 8、平均数是反映数据资料 B 性的代表值。 A、变异性 B、集中性 C、差异性 D、独立性 9、在假设检验中,是以 A 为前提。 A、肯定假设 B、备择假设 C、原假设 D、有效假设 10、抽取样本的基本首要原则是 B A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则 11、统计学研究的事件属于 D 事件。 A、不可能事件 B、必然事件 C、小概率事件 D、随机事件 12、下列属于大样本的是 A A、40 B、30 C、20 D、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 D

生物统计学课后习题解答-李春喜汇总

生物统计学课后习题解答-李春喜汇总

第一章概论 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 第二章试验资料的整理与特征数的计算习题 2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 计算平均数、标准差和变异系数。 【答案】=4.7398, s=0.866, CV =18.27 % 2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。 24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ; 金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。 【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。 2.3 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取 50 绳测其毛重(kg) ,结果分别如下:

《生物统计学》试题A

《生物统计学》基本知识题 一、填空题 第一章 1.填写下列符号的统计意义:①SS ②S x ③ S2 ④ SP xy。 2.t检验、u检验主要用于____ 组数据的差异显著性检验; F 检验主要用于____ _ 组数据的差异显著性检验。 3.试验误差指由因素引起的误差,它不可,但可 以和。 4.参数是由____计算得到的,统计量是由____计算得到的。 5.由样本数据计算得到的特征数叫,由总体数据计算 得到的特征数叫。 9.一般将原因产生的误差叫试验误差,它避免, 但可以和。 第二章 4.变异系数可用于当两个样本的、不同时 变异程度的比较。变异系数的计算公式为。 5.变异系数可用于当两个样本的、不同时 的比较。变异系数的计算公式为。 7.连续性随机变量等组距式次数分布表的编制方法步骤为: ①_____、②____、③____、④____、⑤___。 8.计算标准差的公式是S=。 9.变异系数的计算公式是CV=。 10. 标准差的作用是①、②、③。 12.算术平均数的两个重要性质是①②。 13.样本平均数的标准差叫。它与总体标准差的关系 是。 第三章 1.若随机变量x~N(μ,σ2),欲将其转换为u~N(0,1),则 标准化公式为u=。 第四 1.统计量与参数间的误差叫,其大小受①② ③的影响,其大小可以用来描述,计算公式 为。 2.抽样误差是指之差。抽样误差的大小可用来表 示。影响抽样误差的因素有、和。 6.在两个均数的显著性检验中,若检验结果是差异显著,则说 明。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这 时犯的错误是:型错误。 8. 显著性检验时,犯Ⅰ型错误的概率等于。 9.显著性检验分为_______ 检验和______检验。 10.显著性检验的方法步骤为:、、。 12.若服从N(, 2)分布,则值服从分布, 值服从分布。 第五章 1.方差分析是以为检验对象的。在实际分析时常常以 作为它的估计值。 2.多重比较的方法有①和②两类;①一般适用于 组均数的检验,②适用于组均数间的检验。 3.多重比较的LSD法适用于组均数比较;LSR法适用于 组均数间的比较。 4.多重比较的方法有和两类。前者一般用于 组均数检验,后者又包含和法,适用于组 均数的比较。第六章 1.χ2 检验中,连续性矫正是指用性分布检验性数据所产生的差异,当或时,必须进行矫正。 2.在χ2检验时,当和时必须进行连续性矫正。3.χ2检验中,当或时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ2检验的计算公式为χ2=,当、时,必须矫正,其矫正方法为、。 第七章 1.在直线相关回归分析中,相关系数显著,说明两变量间直线相关关系。 2.相关系数的大小,说明相关的紧密程度,其说明相关的性质。 相关系数r是用来描述两变量之间相关的和的指标,r 的正负号表示相关的,r的绝对值大小说明相关的。 3.变量间存在的关系,统计上称为相关关系。 4.回归分析中表示,byx表示,。 5.在回归方程中,表示依变量的,b表示,a表示。 6.已知r=-0.589*,则变量间存在的直线相关关系。 7.统计分析中,用统计量来描述两个变量间的直线相关关系,其取值范围为,其绝对值的大小说明相关的,其正负符号说明相关的。 第九章 1.试验设计的基本原则是、和。 二、单选题 1.比较胸围与体重资料的变异程度,以最好。 a.标准差b.均方c.全距d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量较合适。 ①CV ②S ③R ④S2 4.若原始数据同加(或同减)一个常数,则。 a不变,S改变b.S不变,改变 c.两者均改变d.两者均不改变 5.比较身高和体重资料的变异程度,以指标最好。 a.CV b.Sc.Rd.S2 6.离均差平方和的代表符号是。 a.∑(x- )2 b.SP c.SS 7 .样本离均差平方和的代表符号是。 ①S2 ②③ ④SS 8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数②标准差 ③全距④标准误 1.二项分布、Poisson分布、正态分布各有几个参数:() A、 (1,1,1 ) B、 (2,2,2) C、 (2,1, 2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率:()

试验统计方法名词解释问答题目精选

试验方案:根据试验目的和要求所拟进行比较的一组-试验处理的总称。 试验因素:被变动并设有待比较的一组处理的因子。 试验因素的量的不同级别或质的不同状态称为水平。 单因素试验:指整个试验中只变更、比较一个试验因素的不同水平,其他作为试验条件的因素均严格控制一致的试验。 多因素试验:指在同一试验方案中包含两个或两个以上的试验因素,各个因素都分为不同水平,其他试验条件均应严格控制一直的试验。各因素不同水平的组合成为处理组合。处理组合数是各供试因素水平数的乘积。 试验指标:用于衡量试验效果的指示性状。 试验效应:试验因素对试验指标所起的增加或减少的作用。 简单效应:在同一因素内两种水平间试验指标的相差。 平均效应(主要效应、主效):一个因素内各简单效应的平均数。 交互作用效应(互作):两个因素简单效应间的水平差异。 对照:试验方案中应包括有对照水平或处理。 唯一差异原则:处理要比较的试验因素的水平变更外,其余都要保持一致。 小区:在田间实验中,安排一个处理的小块地段。 边际效应:指小区两边或两端的支柱,因占较大空间而表现的差异。 小区的方向必须是使长的一边与肥力变化最大的方向萍乡,使区组方向与肥力地图方向垂直。 对比法设计:特点:每一供试品质均直接排列于对照区旁边,使每一小区可与其邻旁的对照区直接比较,常用于少数品质的比较试验及示范试验。 间比法设计:在一条地上,排列的第一个小区和末尾的小区一定是对照区,每二对照区之间排列相同数目的处理小区,通常是4-9个,重复2-4次。有点:精确度高,有利于设置与观察。缺点:对照区占较多的实验田面积,重复不能多,一般2-4次。 完全随机设计:将各处理随机分配到各个实验单元中,每一处理的重复数科院相等或不相等。有点:1.这种设计对实验单元的安排灵活机动,单因素或多因素皆可英语2.设计分析简便缺点:实验的环境因素相当均匀,一般用于实验室培养及网、温室的盆钵实验。原则:随机排列、重复。 随机区组设计:将试验地按肥力程度划分为等于重读次数的区组,一区组安排一重复,去组内各处理都能独立地随机排列。优点:1.设计简单,容易掌握2.富于伸缩性,单因素、多因素以及中和性的实验都可应用3.能提供无偏的误差估计,并有效地减少单向的肥力差异,降低无哈4.对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。缺点:该种设计不允许处理数太多,一般不超过20个。因为处理多,区组必然增大,局部控制的效率降低,而且只能控制一个方向的土壤差异。原则:重复、随机排列、局部控制。总体:具有共同性质的个体所组成的集团。 样本:从总体中抽取若干个个体的总称。 数量性状:具有连续变异的性状。它的度量有计数(不连续性或间断性变数)和量测(连续性变数)。 质量性状:能观察而不能量测的性状(统计次数法、给分法)。 自由度:指样本内独立而能自由变动的离均差个数。 正态分布:连续性变数的理论分布。 多重比较:一个实验中k个处理平均数间可能有k(k+1)/2个比较,这种比较是复式比较又称多重比较。 卡方:相互独立的多个正态离差平方值的总和。

生物统计学试题及答案范文

生物统计学考试

一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - x ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计算平 均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。若 想对完成工作所需时间总体构造一个90%置信区间,则() A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 D.置信水平 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 A.方差的齐性检验 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 在一个有限总体中要随机抽样应采用放回式抽样方法。 12. 在实际抽样工作中,为了减小标准误,最常用的办法就是增大样品容量。 13. 已知F分布的上侧临界值(1,60)=,则左尾概率为,自由度为(60,1)的F分布的临界 值为 14. 衡量优良估计量的标准有无偏性、有效性和相容性。 15.已知随机变量x服从N (8,4),P(x < )=。(填数字) 四.综合分析题(共60分) 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。 算术平均数的性质: 1.离均差之和为零 2. 离均差平方之和最小 17.计算5只山羊产绒量:450,450,500,550,550(g)的标准差。 标准差 18.一农场主租用一块河滩地,若无洪水则年终可获利20000元,若发洪水则会损失12000元。 根据经验,该地发洪水的概率为40%。现有某保险公司允诺:若每年投保1000元,将补偿因洪灾所造成的损失。问农场主该不该买这一保险? 未投保的期望赢利:E(X)= 20 000 ×+ (12 000) ×= 7 200(元) 投保后的期望赢利:E(X)= (20 000 – 1 000) ×+ (?1 000) ×= 11 000(元)。 故要买这一保险。

《生物统计学》复习题

《生物统计学》复习题 一、 填空题(每空1分,共10分) 1.变量之间的相关关系主要有两大类:( 因果关系 ),( 平行关系 ) 2.在统计学中,常见平均数主要有( 几何平均数 )、( 调和平均数 )(算数平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指( 发生的概率很小,人为认为不会发生 ) 5.在标准正态分布中,P (-1≤u ≤1)=( 0.6826 ) (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为( 自变量 ),Y 称为( 依变量 ) 二、 单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 原假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则

生物统计学名词解释

生物统计学 1、参数与统计量 参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。如:总体平均数、总体标准差。 统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。如:样本平均数、样本标准差。 2、标准差与变异系数 标准差和变异系数都是反映离散性的特征数即变异数中的一种。 标准差有总体标准差和样本标准差之分:б=N x 2) (∑-μ、S=1)(2--∑n x x 。标准差的大小受多个变量影响,若各变量间差异大标准差也大。标准差的值较大时,x 的代表性受到削弱。要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。 变异系数是度量数据资料变异程度的常用指标。变异系数CV=x s ×100%,是样本变量的相对差异量,是为不带单位的纯数。变异系数CV 可比较多个样本的变异系数。 3、精确性与准确性 准确性也称准确度,是指测定值与真值的符合程度大小。 精确性也称精确度,是指多次测定值的变异程度。 4、单侧检验与双侧检验 双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。备择假设为

HA :0μμ≠(或21μμ≠)。单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。备择假设为HA :0μμ> (0μμ<),或:21μμ>(21μμ<) 5、假设检验的两类错误 若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。犯第一类错误(“弃真”)的概率即为显著性水平α。若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。犯第二类错误(“纳伪”)的概率为β。当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。 6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么? 若用t 检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为 1-0.05=0.95。比如对五个样本进行t 检验,需比较1025=C 次,那么10次检验都不 犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为401.0)05.0(11=P 10=--。 故比较多个样本平均数时不适用于t 检验,而用方差分析可有效地控制第一类错误。 用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。方差分析比t 检验运算简便,也比t 检验更为精确。 7、独立事件和概率的乘法原则

海南大学生物统计题库

海南大学生物统计 一、名词解释。 ★集团:也称总体或母体,是符合指定条件的所有个体所组成(有限与无限)。 ☆集团参数:由集团的全部个体观测值按一定方法计算出来的、反应集团特征的数值。 ☆个体:构成集团的基本单位;对每个个体的同一特征(性状)进行观测可得到1个观测数据。 ☆样本:按一定方法从集团中抽取出的一部分个体构成一个样本。 ☆样本统计量:由样本中的全部个体观测值按一定方法计算出来的、反应样本特征的数值。 ★偶然误差(机误):由非研究因素(环境条件)的随机波动对研究对象的影响而行成的试验指标的随机变化(实际观测值以真值为对称中心随机波动)。 ☆系统误差:由非研究因素(环境条件)的趋势性(方向性)变化对研究对象的影响而行成的试验指标的方向性变化(实际观测值表现为普遍比真值大或小)。 ☆准确度:实际观测值与真值间的符合程度。 ☆精确度:实际观测值相互间的符合程度。 ☆重复:每个处理在试验结束后能获得2个或更多的观测值。 ★局部控制(区组化):将试验空间分范围地控制环境因素,使其对处理小区的影响达到最大程度的一致。

☆随机排列:各处理在小区中的位置由机会(而非主观意愿)决定且每个处理被安排在每个小区的机会要相等。 ☆重复区:试验空间内人为根据环境变化情况划分的、各种非研究因素能够保持最大程度一致性的区域。 ☆小区:安排试验处理的最小空间区域。 ☆试验方案(狭义):根据试验目的和要求所拟定进行比较的一组试验处理的总称。 ★试验因子:对试验对象在某方面的表现(试验指标)有影响的,试验过程中需要进行考查的条件。 ★试验因素:有待比较的一组处理的因子。 ★试验处理:预先设计好实施在试验单位上的一种具体措施。 ☆试验水平:在试验中被人为设置的每种状态。 ★试验指标:在某一项研究活动中,并不可能对所有的经济性状都进行研究,故而只能确定其中的某一个或某几个性状为需要进行研究和分析的目标性状,其余均为非目标性状,则相应的目标性状即为试验研究中的试验指标。 ☆试验效应:试验指标因研究因子水平的不同而表现出的数量变化。☆主效应:试验指标在单个因子水平间表现出的平均差异称为该因子的主效应。 ☆交互效应:不同因子间的相互影响从而导致的试验指标的变化,即复因子试验中去除各因子主效应后的剩余效应则为因子间的交互效应。☆试验空间:放置试验对象并实施研究活动的空间。

相关主题
文本预览
相关文档 最新文档