当前位置:文档之家› 试验设计与统计方法实验指导

试验设计与统计方法实验指导

试验设计与统计方法实验指导
试验设计与统计方法实验指导

实验一数据整理与基本分析

一、实验目的与要求

熟悉Excel数据分析模块的安装;基本函数运算;熟悉SPSS数据的基本录入格式;掌握用Excel 和SPSS软件对数据分组描述、基本特征和常见统计图绘制的方法。

二、实验内容:

(一)Excel(2000)数据分析模块及函数功能简介;数据的录入格式;资料基本特征值计算1.Excel(2000)数据分析模块及函数功能简介

Microsoft Excel可以解决一般试验和生产实际中数据的统计分析问题,如u检验、t检验、方差分析和回归分析等。其统计分析过程主要通过内置的“分析工具库”和粘贴函数来完成。

分析工具库提供的常用统计分析方法有单因素方差分析,二因素交叉有重复及无重复的方差分析,描述统计分析,频数分布表及直方图的绘制,两样本均数差数的u检验及t检验,多元回归和直线回归分析等。

Excel电子表提供的统计分析粘帖函数有平均值、方差、标准差的计算;常用统计分布函数如t 分布、F分布、正态分布、 2分布等函数的计算。

2.分析工具库的安装

分析工具库只有在安装后才能使用,分析工具库的安装过程如下:

在“工具”菜单中打开“加载宏”命令→选择并启动“分析工具库”→再次打开“工具”菜单时,就能在“工具”菜单中发现“数据分析”命令,表明数据分析库已经正确安装。

3.次数分布表的编制及统计直方图的绘制

对于连续性资料需要事先确定全距、组数、组距、组中值和组限,然后将各个变量分别纳入相应的组内。

连续性变量资料的数据输入格式为:将变量数据连续输入到一列,再将预分组的组下限值输入到另一列。

绘制统计直方图的步骤为:在“工具”菜单中选定“数据分析”→选定“直方图”,打开直方图对话框→输入选项的“输入区域”中输入变量所在区域,在“接受输出区域”中选择分组组下限值所在区域;在输出选项中选定一空白输出区域的左上角单元格→选定“图表输出”→“确定”,得到次数分布表及直方图。

对于离散型数据可以直接按照用数据表示的变量值进行分组,通常收集到的数据就是已经按变量值分组的数据,如果原始数据没有分组,同样可以采用直方图分析工具来编制次数分布表及绘制直方图。在编制次数分布表及绘制直方图时,只要在接收区域中输入与原始数据相同的变量值就可以了,其它过程同连续型数据。对于用文字描述的变量,必须先进行变量转换,将文字转换成数字即可。完成次数分布表的编制后,再将数字反转成原变量。

4.描述统计分析

进行描述统计分析时,变量数据在电子表格中的排列必须严格按单行或单列放置。为便于数据输入,推荐变量以列放置。

操作步骤如下:

“工具”→“数据分析”→“描述统计”→在“输入区域”中选定变量所在区域,分组方式中选定“逐列”,在输出选项中选定空白“输出区域”→根据需要选定汇总统计、平均数置信度为95%或99%等→得到描述统计分析表。

(二)SPSS软件(11.0)简介,SPSS数据录入格式,利用SPSS进行资料基本特征值计算、绘制统计图形。

1.SPSS软件简介

SPSS(Statistical Product and Service Solutions)是世界上优秀专业统计软件之一。SPSS界面友好,采用Windows下拉菜单式界面,通过直接点击软件菜单按钮,实现大多数统计功能。对于每一项功能的详细描述,可通过单击鼠标右键弹出的即时帮助显示,也可以通过学习SPSS的帮助菜单中的选项来了解。另外,SPSS还在帮助中提供了该软件的指导教程(Statistics Coach),以活动图片形式直观地逐步介绍各项功能。

从第10.0版起,在数据管理的界面操作上与以前版本有较大差别;随后的版本直到12.0版,其界面与10.0基本一致,只是增加了一些功能。本书以SPSS 11.0版为基础,介绍本科阶段所涉及的统计分析内容。

本教材中所涉及的统计方法大都可在SPSS中完成。

Graphs可进行各种统计图形的绘制;

Transform中的Compute可进行各种数据的转换;

Analyze 中包含常用的统计分析方法,其中,

Discreptive Statistics可进行基本统计量的计算;

Compare Means可进行t检验和单因素方差分析;

General Linear Model可进行多因素方差分析;

Correlate可进行简单相关系数、偏相关系数的计算;

Regression可进行直线回归、多元回归和常见曲线回归分析;

Classify中的Discriminant可进行判别分析;

Nonparametric Tests可进行χ2检验和各种非参数检验。

2.SPSS数据录入格式

(1)定义变量与数据输入

点击SPSS图标,或从开始菜单程序中找到SPSS for Windows下的SPSS 11.0 for Windows,进入数据录入界面。进入SPSS系统时会出现一个导航对话框,初次进入时可单击右下方的Cancel 按钮即可进入数据录入主界面,此时窗口顶部显示为“SPSS Data Editor”。在已录入数据并存盘的情况下可在导航对话框中直接打开已录入的数据文件,并进入数据录入主界面。

①定义变量在输入数据之前,为了以后方便,应首先定义数据的结构和性质。进入数据录入主界面后,系统默认为Data View窗口。这个窗口显示的是一个二维电子表格。单击左下角的灰色Variable View标签,将数据视图(Data View)窗口切换到变量视图(Variable View)窗口。

变量名:单击“name”所在行的第一列,输入要定义的第一个变量(Var)的变量名。需要说明的是,尽管SPSS11.0没有中文版本,但可以支持中文。但为了数据转换方便,推荐为每个变量起一个英文变量名。试验的各个因素和试验指标均作为变量看待。

变量类型:点击相应变量“Type”下的空格,出现省略号,再单击省略号,就会出现定义变量

类型的对话框。系统默认变量为数值型(Numeric)。一般说来数值型可以满足大多数情况的分析。对于分类变量来说,虽然大多数应属于字符串类型(String),但定义为字符串后,在统计学运算时会造成不识别,因此通常分类变量也要保持默认的数值型变量。选择变量类型后,可直接在此对话框中定义数据宽度和小数点位。小数点位并不影响运算过程的精度,只改变输出结果的显示宽度。

标签:用于定义变量名标签,以便在结果输出时方便阅读,可用中文表示。

变量标签值:尤其对分类变量(试验因素)的输入和显示有用。单击Value框右半部的省略号,弹出变量值标签对话框Value Labels。其中上部一长一短两个小窗口应分别填入变量赋值和变量标签,填写好后,下面的Add按钮变黑,单击后该变量值标签就被加入到下方的标签框中。如药物试验中,涉及pH 10.3 的2.5%及pH 8.3 的5%恩诺沙星注射液,为了方便变量输入,我们可以将这两种药物剂量分别赋值1、2,在变量标签中写入相应的药物剂量。这样在进行数据输入时,只需输入简单的数字,就可以显示具体的药物剂量。

测量尺度:在这一栏中,有三个备选项。对于数值型变量,且应用这些数值进行计算,应选Scale 选项;数值型或字符型变量表示有序分类时,应选Ordinal选项;表示无序分类的数值型或字符型变量选Nominal选项。

数据占位宽度(Width)和小数位(Decimals)已在变量类型中定义过,缺失值显示(Missing)、列宽显示(Columns)、对齐方式(Align)等项格式均可遵从系统默认,不必专门修改。

②数据录入变量定义好以后,就可以输入数据了。单击左下角的Data View,从Variable View 窗口转到数据视图窗口界面。

在SPSS中数据的录入格式有如下原则:

每个变量都在电子表格中占一列位置;分类变量尽可能用数字表示,这样不仅输入方便,而且也便于统计计算;每个数据占用一个单元格,同一观察对象的分类因素和试验指标数据应独占一行。

SPSS统计软件的数据录入有一套统一的格式。为了更好地说明数据录入的格式,下面我们用一个实际例子来说明。

【例1】选45只体重相近、健康的Wistar大白鼠,随机分为3组,每组15只,第2组和第3组每日皮下注射利血平1mg/kg建立脾虚模型,第2组每日每只蒸馏水灌胃2ml,第3组每只每日四君子汤水煎液灌胃2ml,第1组为对照组,每日皮下注射生理盐水、灌服蒸馏水相应剂量。14天后每组随机屠宰各7只,分别测定肝脏和肌肉中糖原含量,并比较各组的差异。数据见表1。

表1肝脏和肌肉中琥珀酸脱氢酶含量

采样部位

组别

肝脏肌肉对照组 3.51,3.77,3.49,3.33,3.11,2.76,3.17 2.46,2.59,2.85,2.18,2.51,2.49,2.87 脾虚组 3.37,4.41,3.83,3.62,3.64,4.18,3.75 3.53,3.75,3.65,4.01,3.96,3.96,3.24

脾虚治疗组 2.72,3.00,3.16,2.58,2.61,2.42,2.66 2.39,2.61,2.44,1.58,2.35,2.18,2.55 定义三个变量,两个是数据的分类变量,即组别和采样部位,其余一个是数据变量,即试验指标糖原含量。

图1 SPSS软件定义变量Variabl view界面示意图

定义好变量后,转到数据视图窗口输入数据,格式如下:

图2 SPSS软件数据输入data view窗口示意图

【例2】选120只艾维茵肉用仔鸡混合雏随机平均分为4组,第4组为对照组,饲喂基础日粮,第1组到第3组在基础日粮中添加1%三种复方中药添加剂。测定4周龄时血清中总胆固醇(TC)、甘油三酯(TG)的含量,数据如表2。

表2中药复方添加剂对肉用仔鸡血清总胆固醇和甘油三酯含量的影响

组别总胆固醇mg/L 甘油三酯mg/L 中药添加剂1组701 644 …719 829 602 737 …644 792 中药添加剂2组797 627 …652 594 744 818 …829 600 中药添加剂3组805 760 …688 770 775 689 …675 751 对照组817 791 …794 711 587 554 …586 680

定义三个变量,一个是数据的分类变量,即组别,其余两个是数据变量,分别为总胆固醇和甘油三酯。

图3 定义两个试验指标变量示意图

定义好变量后,转到数据视图栏输入数据,格式见图4。

……………………………………………………

图4 两试验指标变量数据输入示意图

(2)数据文件的保存选择菜单File→Save,选择保存文件的地址和文件名填写入对话框中。这与我们常用的其他Windows支持的文件没有多大区别。通常SPSS默认的数据文件类型为*.sav,同时也可以保存为Excel文件(*.xls)和数据库文件(*.dbf)。

3.利用SPSS进行资料基本特征值计算、绘制统计图形

操作步骤和结果解释如下:

(1)Frequencies过程

在这个过程中可以产生算术平均数、中位数、众数、合计值、标准差、方差、最大值、最小值、极差、标准误等统计值,并可绘出分组资料的统计图。

定义变量并录入数据→Analyze→Descriptive Statistics→Frequencies→显示Frequencies Variables 对话框→选中要分析的变量,点击箭头按钮将选中的变量选入右侧框中,点击对话框下部Statistics 按钮,打开Frequencies:Statistics对话框→可将对话框中相应选项打上对号,如算术平均数(Mean)、中位数(Median)、众数(Mode)、合计值(Sum)、标准差(Std. Deviation)、方差(Variance)、最大值(Maximum)、最小值(Minimum)、极差(Range)、标准误(S.E.Mean)等。选择完成后,点击Continue回到上一对话框→点击Charts按钮进入Frequencies:charts对话框→根据资料性质选择所需要的图形:如果资料属于间断性变量,可选条形图(Bar charts);资料属于连续性变量资料,选直方图(Histograms),选中With normal curve,则直方图带有正态曲线,可以观察资料的正态性质。选择完成后,点击Continue回到上一对话框,点击OK按钮显示结果界面(Output1-SPSS viewer),显示统计表和图。

点击File下的Save,将结果保存为*.spo文件。

(2)Descriptives过程

用于连续型变量统计描述部分与Frequencies过程相似。所不同的是选入Variables对话框的变量可以是多个,如果选入多个,系统会对其逐次进行描述,但输出在同一张表格内。如确定“Save standardized values as variables”选项,则将原始数据的标准正态变换结果存为新变量,并将新变量自动命名为“Z+原变量名”。

(3)Explore过程

可以进行数据资料按分类变量进行分组分析。需要说明的是在Explore过程中,还可以在Statistics

选项中选择平均数的置信区间,具体操作为:选中Descriptives,填入置信区间(Confidence Interval for Means)的置信度95或99。

(4)统计图绘制专门模块

点击Graphs→根据资料的性质,选条形图(Bar Chart)、线形图(Line Chart)、饼图(Pie Chart)、直方图(Histogram)、散点图(Scatter Chart)等图形。

若选择条形图,在Bar Charts对话框中,选择简单条形图(Simple)形式,在对话框下面的Data in Chart Are单选框组中,选择Summaries for groups of cases对应分类变量中的每一类观察值生成一个简单条形图(选Summaries of separate variables对应两个或两个以上变量生成一个直条,选Values of individual cases对应分类轴变量中每一观测值生成一个直条)→点击Define进入Define Simple Bar:Summaries for groups of cases对话框→在Bars Represent栏中,如资料按照记录个数汇总作图,选N of cases(按累计记录数汇总,选Cum. n of cases;按记录数所占百分比汇总,选% of cases;按记录数所占累计百分比汇总,选Cum. % of cases;按照其他变量作为汇总变量,选择Other Summary Function,并将相应的汇总变量选入下方的Variable框,在单击下面的Change Summary进入下一对话框对汇总变量进行详细定义),将所需分类变量选入Category Axis框中;点击Titles按钮进入Titles 对话框,输入统计图的标题后点击Continue→点击OK完成绘图。

若选择线形图,在Line Charts对话框中,选择简单线形图(Simple)形式。做饼图时,在Pie Charts 对话框中选择作图所用数据格式。其余各项可参考条形图相应选项。

如选择直方图,在Histogram对话框中,将分组变量选入Variable框,如要绘制直方图的同时,需要加绘正态曲线,则同时选中对话框下方的Display normal curve,点击OK完成绘图。

散点图显示某变量在两个不同影响条件下的分布情况。选择Scartter Charts进入Scartterplot对话框→在Scartterplot对话框中选Simple图形,点击Define进入Simple Scartterplot对话框→选中相应分组变量进入X轴(X Axis)和Y轴(Y Axis),点击Titles输入统计图的标题→点击OK完成绘图。

完成统计图形后,还可以在结果界面(Output—SPSS Viewer)中对图形进行修改。方法是双击图形相应部位,如图、坐标、坐标名称等,按照弹出的对话框进行各项目的选择调整,在此不再详述。

三、作业

第一、二章课后习题

实验二差异显著性检验

一、实验目的与要求

掌握用Excel与SPSS软件进行差异显著性检验的方法及总体均数的区间估计。

二、实验内容

(一)利用Excel数据分析模块进行单个样本、2个样本(含配对、非配对资料)的均数差异显著性检验

1.二样本均数等方差假设时的t检验

首先将两个样本原始数据分别按列输入电子表格,在两列的第一行,可输入变量的名称作为标志→“工具”→“数据分析”→“t检验:双样本等方差假设”,打开对话框,在输入框的变量1和变量2区域中分别输入变量所在区域。如果选定了变量名称,则应选定标志项→在“输出区域”中输入欲输出空白区域的左上角单元格→确定。

输出区域显示计算结果。表中由上至下依次排列的统计数是算术平均数、样本方差、样本含量、合并方差、假设平均差、总自由度、t值、计算所得t值的单尾概率、一尾检验时的临界t值(根据设定的显著水平值所确定的,本例为α=0.05)、计算所得t值的双尾概率和二尾检验时的临界t值(显著水平同一尾检验)。

2.二样本均数异方差假设时的t检验

输入数据方式同二样本均数等方差假设。操作方式中应选择“t检验:双样本异方差假设”。与前者不同的是此结果表中缺少一项合并方差,其余项目除自由度、单尾和双尾的临界值不同外,其它项目都相同。表中的自由度是根据公式计算后,4舍5入取整数的。由于自由度发生了变化,所以临界t也发生了变化。

3.配对资料的t检验

输入数据方式同二样本均数等方差假设。操作方式中选择“t检验:平均值的成对二样本分析”。结果表中的泊松相关系数与一般的相关系数相同。

4.单个均数差异显著性检验

根据置信区间与显著性检验的关系,当欲比较的总体均数落在根据样本数据所求出的置信概率为(1-α)时的总体均数的置信区间以外时,就表明在α显著水平时样本均数与总体均数差异显著的原理,就可以利用描述统计分析工具来进行样本均数与总体均数的t检验。

操作步骤:按照列将样本数据输入表中→从描述统计对话框中的输入区域中输入样本数据所在区域→分组方式选项选定逐列→在输出选项中选定输出区域左上单元格→在选项中选定汇总统计和平均数置信度为95%→确定。

得到计算结果包括算术平均数、标准误差、中位数、众数、标准差、方差、峰度、偏度、最小值、最大值、合计值、样本含量(观测数)、置信度等。

(二)利用SPSS软件进行单个样本、2个样本(含配对、非配对资料)的均数差异显著性检验,并进行总体均数的区间估计。

1.单个均数的显著性检验

操作步骤:Analyze→Compare Means→One-Sample T Test→将要分析的变量选入Test Variables

→Test V alue项填入已知总体均数→点击Options按钮,进入Options子对话框,Confidence Interval 选项中填入95或99,确定显著水平后返回上一对话框→点击OK,显示结果界面。

结果界面包括描述统计表(One-Sample Statistics)和t 检验表(One-Sample Test)两个表格。描述统计表中输出样本含量、均数、标准差和标准误;t 检验表中显示t值(t)自由度(df)、双尾p值(Sig. 2-tailed)、样本均数与已知总体均数的差值(Mean Difference)、差值的95%或99%置信区间之下限与上限(95%Confidence Interval of the Difference, Lower, Upper)

2.成组资料的t检验

操作步骤:Analyze→Compare Means→Independent-Samples T Test→将要检验的数据变量选入到Test Variable(s)→将要检验资料的分类变量选至Grouping Variable,此时变量名后出现[??],再点击Define Groups,定义分类变量(必须与数据文件中录入的分类变量值一致)→点击Options按钮,进入Options子对话框,Confidence Interval选项系统默认95,也可根据需要改为99,确定置信水平后返回上一对话框→点击OK,显示结果界面。

结果界面中:

描述统计表(Group Statistics)给出两组变量的基本情况描述。

t检验表(Independent-Samples Test)较为复杂,第一部分列出的是两样本方差齐性检验(Levene’sTest for Equality of Variances)的F值(F)和显著概率值(Sig.)。除此之外的两行数据分别表示方差同质(Equal variances assumed)与方差不齐(Equal variances not assumed)时的t检验结果与差异置信区间,当齐性检验显著时,选下一行的结果;检验不显著时,选上一行结果。

3.配对资料的t检验

数据输入格式:将两处理分别定义为一个变量(列),每条记录(行)代表一对数据。

操作步骤:Analyze→Compare Means→Paired-Samples T Test进入配对样本t检验对话框→选要比较的两个变量名进入Paired Variables栏→点击OK,显示结果界面。

结果界面中:

描述统计表(Paired Samples Statistics)给出两组变量的基本情况描述。

Paired Samples Correlations表给出的是配对变量间的相关性分析,等价于Analyze→Correlate→Bivariate,详见实验五中回归与相关分析部分。

t检验表(Paired -Samples Test)给出最终的配对t检验结果。结果中显示差值均数(Mean)、差值标准差(Std. Deviation)、差值标准误(Std. Error Mean)、差值的95%置信区间的下限和上限(95% Confidence of the Difference,Lower,Upper)、t值(t)、自由度(df)、双侧检验概率(Sig. 2-tailed)。

三、作业

第四章课后习题

实验三方差分析

一、实验目的与要求

掌握用Excel和SPSS软件进行方差分析的方法。

二、实验内容

(一)利用Excel软件进行单因素方差分析、二因素(无重复、有重复)资料方差分析

1.单因素方差分析

处理内观察次数相等和不相等采用的分析工具相同,操作步骤如下:

将各组数据按列输入到Excel电子表格中→“数据分析”对话框→选定“方差分析:单因素方差分析”打开,在对话框中的输入区域中输入各组数据所在区域,分组方式选定列,如果包括各组名称应选定标志项→在输出区域中输入输出区域的左上角单元格→确定。

计算结果包括2张表,其中一张表是各组情况概述表,内容有各组的总和、平均数、方差和样本含量,另一张为方差分析表。

在Excel软件的方差分析功能中不能进行多重比较。

2.二因素交叉无重复资料的方差分析

用下面的例题说明二因素交叉无重复资料的方差分析的操作方法。

【例3】4个品种猪(A因素),每品种3头,分别在基础日粮中添加1种中草药添加剂(B因素),得三个月的增重结果。进行方差分析以研究品种与中草药饲料添加剂对猪增重的影响。

数据输入格式见图5。

操作步骤:打开“数据分析”对话框,选定“方差分析:无重复双因素分析”→在对话框的输入区域中输入$A$1:$D$5,选定标志项,在输出区域中输入输出区域的左上角单元格→确定。

图5 二因素交叉无重复方差分析数据输入格式

计算结果包括2张表:

一张表是各因素情况的概述表,内容有二因素各水平的总和、平均数、方差和样本含量;

另一张为方差分析表。本例品种间差异极显著(p 0.01),添加剂间差异显著,品种及添加剂间都需要另外进行多重比较。

3.二因素交叉等重复方差分析

仍以实例介绍二因素交叉等重复方差分析的操作方法。

【例4】为了考察饲料中钙和磷的含量对幼猪生长发育的影响,将钙(A)和磷(B)在饲料中的含量各分为4个水平进行试验,每个水平组合3头猪,经2个月饲养试验,得仔猪增重结果。试分析钙和磷及它们之间的交互作用对幼猪生长发育的影响。

数据输入格式见图6。

图6 二因素交叉等重复方差分析数据输入格式

操作步骤:打开数据分析对话框,选定“方差分析:可重复双因素分析”→在对话框输入区域中输入$A$2:$E$13,在每一样本的行数输入区域中输入3,在输出区域中输入输出区域的左上角单元格→确定。

计算结果包括2张表,其中一张表是各因素情况的概述表,内容有二因素各水平及水平组合的总和、平均数、方差和样本含量,另一张为方差分析表。本例钙用量对幼猪增重有显著影响(p<0.05),磷用量对幼猪增重有极显著影响(p<0.01),钙和磷的交互作用同样达极显著水平,因而还需要进一步对各水平组合进行多重比较。

(二)利用SPSS软件进行单因素、二因素资料方差分析及多重比较。

1.单因素完全随机试验资料的方差分析

数据输入格式:试验因素和试验指标分别作为一个变量,输入格式可参考实验一。

操作步骤:Analyze→Compare Means→One Way ANOV A,打开对话框→将试验指标变量选入Dependent List栏,分类变量(因素)选入Factor栏→点击Post Hoc按钮,进入Post Hoc Multiple Comparisons对话框→根据要求选S-N-K或Duncan’s 多重比较法后回到主对话框→点击Options按钮,进入Options对话框→如选择Descriptive选项,在结果中将显示常用统计描述指标;如选择Fixed and random effects选项,结果中将按固定效应模型输出标准差、标准误和95%置信区间,按随机效应模型输出标准误、95%的置信区间和组间方差估计值;如选择Homogeneity-of-variance选项,将进行方差齐性检验。其余选项可遵从默认值。选完相应功能后回到主对话框→其余部分可不做选择,点击OK,显示结果界面。

结果界面中:

Descriptive表列出各组及指标变量总样本的基本统计量;

Test of Homogeneity of Variances表显示方差齐性检验结果;

ANOV A表是我们常见的方差统计表,其中列出了组间(Between Groups)、组内(within Groups)以及总变异(Total)的离均差平方和(Sum of Squares)、自由度(df)、均方(Mean Square)、F值(F)、显著性概率p值(sig.);

多重比较(Post Hoc Tests)表在不同的方法有不同的表达方式。Benferroni法是多个组的均值和

某一个组均值进行比较,Multiple Comprisons表中列出每组均值的差值、差异标准误、显著概率值以及差值的95%置信区间;用Duncan’s法进行比较的结果显示在Homogeneous Subsets表中,表中按照均值的大小由上向下排列,如果各组均值差异不显著(p>0.05)则均值排在一列,差异显著(p <0.05=排在不同列。

如果方差齐性检验的结果p<0.05,则上述方差分析结果由于资料误差不能满足方差分析的同质性要求,因此有必要对数据进行转换后再作方差分析,这里不再赘述。

2.多因素析因设计试验资料的方差分析

数据输入格式:两试验因素和试验指标分别作为一个变量,每一行代表一个重复。输入格式可参考实验一。

操作步骤:Analyze→General Linear Model→Univariate,打开Univariate对话框→将要分析的试验指标变量选入Dependent Variable栏,将两个分类变量(因素)根据其性质,选入固定因素栏(Fixed Factor)或随机因素栏(Random Factor),如果是混合模型,则两栏中均含有因素→打开Model子对话框→在Specify Model栏中,选Custom自定义方差分析模型,选Full Factorial则包括全部主效应和交互效应;将中间Build Terms选项根据要分析的效应,选取主效应(Main effects)或交互效应(Interaction),同时将左侧因素与协变量栏(Factors & Covariates)中列出的分类变量都选到Model 栏中→其余项默认,返回主对话框→打开Post Hoc Multiple Comparisons for Observed Means子对话框→将要比较的因素由Factors栏选入Post Hoc Tests for栏,在假设等方差栏(Equal Variances Assumed)中选定合适的多重比较方法,其余项默认,返回主对话框→点击OK,显示结果界面。

结果界面中:

Between Subjects Factors表列出分析因素的各水平设置的重复数。

Tests of Between Subjects Effects表即方差分析表中第一行是对所用方差分析模型的检验,检验显著概率如小于0.05,则说明所用模型有统计学意义。第二行在此无实际意义。其余部分则是我们熟悉的方差分析表。多重比较部分的表格在前面已作过介绍,不再赘述。

3.用SPSS软件进行随机区组设计试验资料的方差分析

数据输入格式、操作步骤和结果解释可参考析因设计试验资料方差分析。

需要指出的是,在操作步骤中,打开Model子对话框自定义方差分析模型时,只选择主效应(包括试验因素和区组因素变量)。

(三)用SPSS软件进行拉丁方、正交、反转设计资料的方差分析。

1.拉丁方设计试验资料的方差分析

数据输入格式:同析因设计试验资料方差分析,试验因素、两个区组因素和试验指标分别作为变量定义,共定义4个变量。定义方差分析模型时,也只选择主效应。

2.正交设计试验资料的方差分析

数据输入格式:按照试验设计安排,每个因素或交互作用均作为一个变量,将正交表中试验安排及试验指标结果分别输入数据。没安排因素或交互作用的列可不列入。

操作步骤:Analyze→General Linear Model→Univariate,打开Univariate对话框→将要分析的试验指标变量选入Dependent Variable栏,将因素选入固定因素栏(Fixed Factor)→打开Model子对话框→在Specify Model栏中,选Custom自定义方差分析模型,将各试验因素作为主因素(Main effects)从Factors & Covariates栏全部选入Model栏,如有两因素的交互作用,则再同时选中相应两因素作

为交互作用(Interaction)选入Model栏→其余项默认,返回主对话框→(如属于多水平,亦可通过Post Hoc选定合适的多重比较方法)→点击OK,显示结果界面。

结果界面的含义可参见多因素析因设计试验资料的方差分析。

3.反转设计试验资料的方差分析

数据输入格式:将处理、阶段、试验单元和试验指标分别作为变量定义,对应行输入数据。

操作步骤:Analyze→General Liner Model→Univariate,打开Univariate对话框→将要分析的试验指标变量选入Dependent Variable栏→将要分析的试验指标变量选入Dependent Variable栏,将处理和阶段选入固定因素栏(Fixed Factor),试验单元选入随机因素栏(Random Factor)→打开Model 子对话框→在Specify Model栏中,选Custom自定义方差分析模型,将处理、阶段和试验单元均作为主因素(Main effects)从Factors & Covariates栏全部选入Model栏,其余项默认,返回主对话框→点击OK,显示结果界面。

结果界面的含义可参见多因素析因设计试验资料的方差分析。

三、作业

第五、六章课后习题

实验四 χ2

检验

一、 实验目的与要求

掌握Excel 、SPSS 软件进行资料是否服从特定分布的适合性检验、分类数据的适合性检验、独立性检验的分析方法。

二、 实验内容

(一)Excel 软件的分析方法

Excel 软件没有提供χ2检验的分析工具,只有一个χ2检验的粘贴函数,所以要利用该粘贴函数,必须先手工计算出理论值,与实际值的排列方式相同,才能使用χ2检验的粘贴函数。

具体操作方法为:打开CHITEST 粘贴函数→在实际值区域中输入实际值,在期望值区域中输入理论值→确定。

计算结果为概率值,可以直接与显著水平进行比较。

(二)SPSS 软件的分析方法

1.适合性检验

数据录入格式:将分类类型和发生频数分别作为2个变量,对应行录入数据。

操作步骤:Data →Weight Cases →选频数变量进入Frequency Variable 栏→点击OK 。

Analyze →Nonparametric Tests →Chi-Square →选分类变量进入Test Variable List 栏→系统默认各类型的理论比率一致,如果不一致,如:理论比例为1:2:1,则须在Expected Values 中选Values ,顺序填入期望值,用Add 加入到下面候选框中→点击OK ,显示结果界面。

结果界面显示2张表:

TYPE 表中列出观察值频数、期望值频数及差值;

Test Statistics 表列出卡方值、自由度及检验概率。

2.独立性检验(列联表检验)

数据录入格式:列联表中两项因素及发生频数均作为变量。

例如:表5中数据在SPSS 数据录入中应采用图7格式:

表5 两种药物治疗效果列联表

图7 列联表数据输入格式示意图

操作步骤:

Data →Weight Cases →将频数变量选入Frequency Bariable →点击OK 。

Analyze →Descriptive Statistics →Crosstable →将药物和效果两变量分别填入行(Rows )栏和列药物

无效 好转 治愈 A

13 32 78 B 19 27

56

(Columns)栏→点击Statistics,选中Chi-Square,配对资料还要选中McNemar进行配对卡方检验,返回主界面→点击OK显示结果界面。

结果显示内容:

Case Processing Summary表列出有效、缺失及总频数和频率;

Crosstabulation为列联表;

χ检验表,其中Chi-Square表示普通2χ检验的2χ值;在2×2列联表检验,Chi-Square Tests为2

χ值(Continuity Correction)和精确概率法(Fisher’s Exact Test)的检验结果。还包括连续性校正的2

表中的Asymp.Sig.(2-sided)表示双侧近似概率,Exact Sig.表示精确概率。

三、作业

第七章课后习题

实验五 回归与相关分析

一、 实验目的与要求

掌握用Excel 、SPSS 软件进行回归和相关分析的方法

二、 实验内容

(一) 利用Excel 软件进行直线回归、简单相关、多元线性回归分析

1.直线回归分析与多元回归分析

先介绍直线回归分析。

将X 、Y 变量分别按列输入表格→“工具”→“数据分析”→ “回归”→将Y 值输入区域和X 值输入区域分别选入Y 和X 所在区域,选定“置信度”,若两变量的输入区域中均包括变量名称,则应选定“标志”项→如果要以残差输出表的形式查看残差,须选中残差复选框;如果在残差输出表中包含标准残差,须选中标准残差复选框;如果要生成一张图表,绘制每个自变量及其残差,须选中残差图复选框;如果要为预测值和观测值生成一个图表,须选中线性拟合图复选框;如果要绘制正态概率图,须选中正态概率图复选框→选定输出区域→确定。

SUMMARY OUTPUT 表中,列出复回归系数(Multiple R )、决定系数(R Square )、校正决定系数(Adjusted R Square )、标准误差和样本含量(观测值)。标准误差为回归方程估计的误差等于回归方程方差分析表中MS e 的平方根。校正决定系数不常用,由以下公式计算:

()()

()??????----=p n R i n R 2211

上式中,当方程中有截距时i 取值为1,否则为0,n 是样本含量,p 是待估计的参数个数,直线回归时等于2,即回归系数和回归截距。

第二张表为方差分析表。

第三张表为回归系数和回归截距(Intercept )的显著性检验表,表中显示对回归系数和回归截距的显著性检验及区间估计。表头依次为系数(Coefficients )、系数的标准误差、t 值、概率值、置信上限和置信下限。

第四张表是用实际的x 值所估计的y 值的表,根据选项的情况可包括残差和标准残差的分析。 多元回归分析的输入格式、分析操作和输出结果与直线回归分析基本相同。利用Excel 电子表格进行多元回归分析,最多可以分析16个自变量。

2.可直线化的曲线回归分析

数据输入格式同上。

(1)首先应根据两变量形成的散点图判断属于何种曲线。操作步骤为:插入→图表→选XY 散点图→下一步→选定数据区域,选择数据系列产生在“列”,即可由散点图显示X 、Y 间的回归曲线趋势进行判断→取消(由于仅仅是要判断选择何种曲线来描绘两变量的关系,因此不必保留曲线图)。

(2)进行数据转换。在空白列中调用粘贴函数LN (自然对数)、LOG (对数)、ASIN (反正弦)、SQRT (平方根)或直接输入“=公式”进行计算,将原变量转换为新的变量。

(3)对转换后的新变量,按照直线回归的分析操作过程进行回归分析。

(4)将直线回归系数及截距分析结果再经相应转换变换成曲线回归方程的相应参数估计值。依次列出曲线回归方程。

3.相关分析

数据输入格式同回归分析。

在“工具”中打开“数据分析”,选择“相关系数”→将各变量数据区域选入“输入区域”,分组方式选“逐列”,若有输入区域中第一行为变量名则选定“标志位于第一行”→输出区域→确定。

结果显示各变量间简单相关系数的下三角方阵。

(二)利用SPSS软件进行直线回归、简单相关、多元线性回归分析

1.相关分析

数据录入格式:将各项指标作为单独变量,各变量的重复对应成行。

操作步骤:Analyze→Correlate→点击偏相关Partial(或简单相关Bivariate)选项,其中仅计算各因素的简单相关系数及其显著性用Bivariate,同时计算各因素间的简单相关系数和偏相关系数及其显著性用Partial,两项功能操作界面无区别(此处以Partial选项为主介绍)→进入对话框后,将需要分析的各项变量选入Variables栏,其余可遵从默认→点击Options按钮,进入Options子对话框→选中Means and standard deviations,结果中将显示每个变量的均数和标准差;在Partial过程中,选Zero-order correlations,结果将给出包括协变量在内所有变量的简单相关系数方阵;在Bivariate 过程中,选Cross-product deviations and covariances,结果将给出包括协变量在内所有变量的方差和协方差阵→其余选项默认,点击OK,显示结果界面。

结果将包括描述统计表和相关统计表两部分,其结果清晰明了,无需此处再作解释。

2.线性回归

数据录入格式:与相关分析录入格式相同。

操作步骤:Analyze→Regression→Linear,进入线性回归对话框→将自变量选入Independents栏,在多元线性回归中,自变量可以是多个;将因变量选入Dependent栏;在Method选项中,默认选项为Enter,即将全部自变量纳入回归方程中;如果要将经检验不显著的自变量剔除,则应选用Backward,如果选用Stepwise,则为逐步回归法→在Statistics子对话框中,选中Estimates可在结果中输出回归系数及其标准误、t值、p值、标准化的回归系数Beta;选中Confidence intervals可输出每个回归系数的95%置信区间;选中Covariance Matrix可输出各自变量的相关矩阵和方差、协方差矩阵。选中R squared change将输出决定系数;选中Descriptives可显示一些描述统计量;选中Part and partial correlations可显示自变量间的相关和偏相关系数。回到主对话框→在Options子对话框中,Include constant in equation决定是否在模型中包括常数项(constant),默认选中。回到主对话框→点击OK,显示结果界面。

(三)利用SPSS软件进行曲线回归的拟合

数据录入格式同上。

在进行曲线回归分析之前,应首先把握数据资料的分布变化趋势,以便选择将要拟合的曲线。方法是点击Graphs→Scatter→选择Simple图形,点击Define,进入Simple Scatterplot对话框→将要分析的两变量分别选入X轴栏和Y轴栏→点击OK,显示散点图结果。

操作步骤:Analyze→Regression→Curve Estimation,进入主对话框→将自变量选入Independents 栏→将因变量选入Dependent栏→根据前面所作出的散点图中两变量显示的趋势,选择回归模型。

SPSS可以拟合包括线性(Linear)、对数(Logarithmic)、倒数(Inverse)、二次方程曲线(Quadratic)、三次方程曲线(Cubic)、幂曲线(Power)、复合曲线(Compound)、S形曲线(S)、Logistic曲线(Logistic)、等比级数曲线(Growth)和指数曲线(Exponential),各种曲线的数学表达式可右键点击该项显示→选中Include constant in equation表示在方程中包含常数项;选中Plot models表示在结果中对模型作图,包括原始数值的连线图和拟合模型的曲线图;选中对话框下部的Display ANOV A table,表示在结果中显示模型检验的方差分析表→点击OK进入结果界面。

三、作业

第十章课后习题

《生物统计附试验设计》第五版-课后习题[前六章]

生物统计 第一章绪论 1.什么是生物统计?它在动物科学研究中有何作用? 2.什么是总体、个体、样本、样本容量?统计分析的两个特点是什么? 3.什么是参数、统计数?二者有何关系? 4.什么是试验或调查的准确性与精确性?如何提高试验或调查的准确性与精确性? 5.什么是随机误差与系统误差?如何控制、降低随机误差,避免系统误差? 6.统计学发展的概貌可分为哪三种形态?拉普拉斯、高斯、高尔顿、皮尔森、哥塞特、费 舍尔对统计学有何重要贡献? 第二章资料的整理 1.资料可以分为哪几种类型?它们有何区别与联系? 2.为什么要对资料进行整理?对于计量资料,整理成次数分布表的基本步骤是什么? 3.统计表与统计图有何用途?常用统计表、统计图有哪些?编制统计表、绘制统计图有 何基本要求? 4.某品种100头猪的血红蛋白含量资料单位:g/100ml列于下表,将其整理成次数分布表, 并绘制次数分布直方图与折线图。 表格1 4某品种100头猪的血红蛋白含量(g/100ml) 13. 4 13. 8 14. 4 14. 7 14. 8 14. 4 13. 9 13. 13. 12. 8 12. 5 12. 3 12. 1 11. 8 11. 10. 1 11. 1 10. 1 11. 6 12. 12. 12. 7 12. 6 13. 4 13. 5 13. 5 14. 15. 15. 1 14. 1 13. 5 13. 5 13. 2 12. 7 12. 8 16. 3 12. 1 11. 7 11. 2 10. 5 10. 5 11. 3 11. 8 12. 2 12. 4 12. 8 12. 8 13. 3

本科《生物统计附实验设计》2793

本科《生物统计附试验设计》课程代码:02793 一,名词解释题 1.中位数:将资料所有观测值按从小到大的顺序排列,处于最中间的数. 2.I型错误:是拒绝H0时犯下的错误,其错误是把真实差异错叛为非真实差异. 3.总体:是由研究目的的确定的研究对象的个体总和. 4.参数:是指由总体计算的特征数. 5.相关分析:即两个以上的变量之间共同受到另外因素的影响. 6.回归分析:即一个变量的变化受到一个或几个变量的影响. 7.精确性:是重复观测值之间彼此接近的程度. 8.显著水平:是检验无效假设的水准.但另一方面它也是进行检验时犯错误概率大小. 9.随机单位组设计:它的原理与配对设计类似,抽每一头试验动物具有相等的机会,接受任一处理而不受人为影响. 10.统计量:由样本计算的特征数. 11.准确性:是观察值与真实值间的接近程度. 12.随机误差:是由试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差,是不可避免的. 13.系统误差:是由于试验处理以外的其它条件明显不一致所产生的带有倾向性的偏差. 14.样本:是在总体中进行抽样,从中抽取的部分个体. 15.众数:资料中出现最多的观测值或次数最多的一组中值. 16.样本标准差:统计学中样本平方差S^2的平方根 17.试验处理:在一项试验中,同一条件下所做的试验称为一个处理.

18.几何平均数:几个观测值相乘之积开n次方所得的方根称为几何平均数. 19.顺序抽样法:是将有限总体内所有个体编号,然后按照一定顺序每隔一定的数目,均匀抽出一个个体,组成样本,对样本进行调查. 20.试验指标:用来平衡量试验效果的量. 21.随机抽样法:是将总体内所有的个体编号,然后采取抽签,拈阄或用随机数字表的方法将部分个体取出而做为样本进行调查. 22.小概率原理:小概率事件在一次试验中实际不可能发生的原理. 23.重复:在试验中,同一处理内设置的动物数量,称为重复. 24.局部控制:在试验设计时采用各种技术措施,控制和减少非试验因素对试验指标的影响. 25.算术平均数:资料中各观测值的总和除以观测个数所得的商. 26.变异系数:是标准差相对平均数的百分数,用CV表示. 27.II型错误:在接受H0时犯下的错误,其错误是把真实差异错判为非真实差异. 28.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)称为因素水平. 29.配对设计:是指将条件一致的两头动物酿成对子,然后采取随机的方法在同一对子内两头动物进行分配处理. 30.试验处理:指对受试对象给予的某种外部干预或措施,是试验中实施的因子水平的一个组合. 31.调和平均数:资料中各观测值倒数的算术平均数的倒数称调和平均数. 32.效应:是指因素对某试验指标所起的增进或减退的作用. 33.顺序抽样:它是按某种既定顺序从总体(有限总体)中抽取一定数量的个体构

医学统计学学时的次实验要求及习题

实验一定量资料的统计描述 实验目的及要求: (1)掌握定量资料统计描述的概念、公式、意义及应用条件。 (2)熟悉正态分布的概念和特点。 (3)了解:正态分布的应用及医学参考值的制定方法。 实验内容:《实验指导与练习》p6 4.某地120名12岁健康男孩身高(cm)资料如下表。计算x、S、CV及正常值范围。 表2-4某地12岁健康男孩身高数据 身高分组120~125~130~135~140~145~150~155 人数8 15 23 29 22 22 16 四、思考题 1.算术均数、几何均数、中位数应用条件是什么? 2.标准差、四分位数间距各自应用条件是什么? 3.简述正态分布的特点及应用? 实验二t、u检验与方差分析 实验目的及要求: (1)掌握:均数t检验和u检验适用条件及计算方法,方差分析的基本思想。 (2)熟悉:总体均数区间估计的概念、意义及计算方法。 (3)了解:方差齐性检验的概念。 实验内容:《实验指导与练习》p9-10 1.据下表问:中草药治疗后舒张压有否变化? 表3-1某医院用中草药治疗10名高血压病人的舒张压值 治疗前115 110 129 109 110 116 116 116 120 104 治疗后116 90 108 87 92 90 110 120 88 96 5.健康成年男子脉搏平均次数为72次/分。现调查25名某山区健康成年男子脉搏平均次数为74.2次/分,标准差为 6.5次/分。问:山区健康成年男子脉搏数与一般健康成年男子脉搏数有否不同? 10.调查18岁泰安市区及乡村男生各60名的身高数据(cm),市区平均身高170.6cm,标准差5.62cm;乡村的平均身高166.86cm,标准差为5.08cm, ①试比较泰安城乡之间男生身高有无显着差别? ②试估计泰安城区男生身高总体均数的95%及99%可信区间。 四、思考题 1.标准差与标准误的区别主要有哪几点? 2.参考值范围与可信区间的区别是什么? 3.简述假设检验的基本思想。

生物统计附试验设计

《生物统计附试验设计》 习题集 (动物医学专业用) 第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 二、简答题 1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 2、统计分析的两个特点是什么? 3、如何提高试验的准确性与精确性? 4、如何控制、降低随机误差,避免系统误差? 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 二、简答题 1、资料可以分为哪几类?它们有何区别与联系? 2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 4、统计表与统计图有何用途?常用统计图、统计表有哪些? 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题

1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 4、为什么变异系数要与平均数、标准差配合使用? 三、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10 96—100 29 104—108 28 112—116 20 120—124 15 128—132 13 136—140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm)如下表,试比较两地成年母水牛体高的变异程度。 甲地137 133 130 128 127 119 136 132 乙地128 130 129 130 131 132 129 130 第四章常用概率分布 一、名词解释 随机事件概率的统计定义小概率原理正态分布标准正态分布双侧概率(两尾概率)单侧概率(一尾概率)二项分布波松分布标准误t分布

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

生物统计附实验设计(明道绪__第四版)题库及答案

,生物统计 1,总体:根据研究目的确定的研究对象的全体 2、个体:总体中的一个研究单位 3、样本:实际研究中的一类假象总体 4、样本含量:样本中所包含的个体数目称为样本含量或大小 5、随机样本:一类从总体中随机抽得到的具有代表性的样本 6、统计量:由样本计算的特征数 7、参数:由总体计算的特征数 8、精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度9、系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 10、偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 11、连续性变数资料:指用量测方式获得的数量性状资料 12、离散型变数资料:指用计数方式获得的数量性状资料 13、算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 14、平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 15、标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 16、方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。 17、离均差平方和:样本各观测值变异程度大小的另一个统计数 18、试验:在一定条件下对自然现象所进行的观察或试验统称为试验 19、随机事件:随机试验的每一种可能结果 20、概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率 21、正态分布:若连续性随机变量X的概率分布密度函数,则X服 从正态分布 22、标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0, 1) 23、双侧概率:我们把随机变量X在平均 数u加减不同倍数标准差σ区间 (u-kσ,u+kσ)之外,取值的概率称为双 侧概率 24、单侧概率:对应于两尾概率可以求得 随机变量x小于小于u-kσ或大于u+kσ的 概率 标准误:反映样本平均数的抽样误差的大 小的一种指标 25、假设检验(显著性检验):假设检验是 数理统计学中根据一定假设条件由样本推 断总体的一种方法。 26、t检验:两总体方差未知但相同,用 以两平均数之间差异显著性的检验。 27、无效假设:被检验的假设,通过检验可 能被否定,也可能未被否定。 28、备择假设:是在无效假设被否定时准 备接受的假设。 29、显著水平:用来确定无效假设是否被 否定的概率标准。 30、Ⅰ型错误:把非真实差异错判为真实 差异。 31、Ⅱ型错误:把真实差异错判为非真实 差异。 32、双侧检验(双尾检验):利用两侧尾部 的概率进行的检验。 33、单侧检验(单尾检验):利用一侧尾部 的概率进行的检验。 34、分位数:又称百分位点。若概率 0Za)=α的 实数 35、配对设计:是指先根据配对的要求将 试验单位两两配对,然后将配对成子的两 个实验单位随机分配到两个处理组中。 36、区间估计:是指在一定概率保证下指 出总体参数的可能范围。 置信区间:是指在进行区间估计时所给出 的可能范围。 37、置信度(置信概率):是指在进行区间 估计时所给出的概率保证。 38、方差分析:实质上是关于观测值变异 原因的数量分析。 39、试验指标:用来衡量试验结果的好坏 或处理效应的高低,在试验中具有测定的 性状或观测的项目。 40、试验因素:实验中所研究的影响试验 指标的因素。 41、因素水平:试验因素所处的某种特定 状态或数量等级。 42、试验处理:率先设计好的实施在试验 单位上的具体项目。 43、试验单位:在试验中能够接受不同试 验处理的独立的试验载体。 44、多重比较:统计学上指多个平均数两两 之间的相互比较称为多重比较。 45、主效应:由于因素水平的改变而引起 试验指标观测值平均数的改变量称为主效 应。 46、简单效应:在某因素同一水平上,另 一因素不同水平试验指标观测值之差称为 简单效应。 47、适合性检验:判断实际观察的属性类 别分配是否符合已知属性类别分配理论或 学说的假设检验。 48、独立性检验:根据次数资料判断两类 因子彼此相关或相互独立的假设检验。 49、相关变量:存在相关关系的变量叫做 相关变量。 50、回归分析:是确定两种或两种以上变 数间相互依赖的定量关系的一种统计分析 方法。 51、相关分析:研究随机变量之间相关性 的统计分析方法。 52、直线回归分析:如果在回归分析中, 只包括一个自变量和一个因变量,且二者 的关系可用一条直线近似表示,这种回归 分析称为直线回归分析 53、直线相关分析:对两个相关变量间的 直线关系进行相关分析称为直线相关分析 54、相关系数:统计学上把决定系数r2 的平方根称为x与y的相关系数 55、试验设计:以概率论和数理统计为理 论基础,经济地,科学地安排试验的一项 技术。 56、随机:使用随机方法对试验动物分组, 使参试动物分入各试验处理组的机会相 等,以避免试验动物分组事试验人员主观 倾向的影响 57、重复:试验的每一个处理都实施在两

生物统计与试验设计试卷A

2006-2007第1学期生物统计考试试卷(B 卷)答案 一、名词解释(10×2) 1、参数:描述总体的特征数。 2、连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数 3、唯一差异原则:除了被研究的因素具有的不同水平外,其余各种环境因素均应保持在某一特定的水平上。 4、两尾测验:有两个否定区,分别位于分布的两尾。 5、显著水平:否定无效假设0H 的概率标准。 6、互斥事件:如果事件1A 和2A 不能同时发生,即12A A 为不可能事件,则称事件1A 和2A 互斥。 7、无偏估计:在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估值。 8、相关系数:表示两组变数相关密切程度及性质的变数,r *9、否定区:否定无效假设0H 的区间。 *10、偏回归系数:任一自变数(在其他自变数皆保持一定数量水平时)对依变数的效应。 二、是非题(5×1) 1、二项分布的平均数为np ( √ ) 2、在二因素完全随机化设计试验结果的方差分析中,误差项自由度为(1)(1)n ab --。( × )

3、2χ分布是随自由度变化的一簇间断性曲线,可用于次数资料的假设测验。( × ) 4、一个显著的相关系数或回归系数说明X 和Y 变数的关系必为线性关系。( × ) 5、在一组变量中,出现频率最多的观察值,称为中位数。( × ) 三、选择题(10×2) 1、算术平均数的重要特征之一是离均差的总和( C ) A 、最小 B 、最大 C 、等于零 D 、接近零 2、一批种子的发芽率为0.75p =,每穴播5粒,出苗数为4时的概率( A ) A 、0.3955 B 、0.0146 C 、0.3087 D 、0.1681 3、回归截距a 的标准误等于( D ) A 、X SS n Q )2(- B 、 X X Y SS x X n S 2 )(1-+ C 、X X Y SS x X n S 2 )(11-++ D 、 X X Y SS x n S 2 1+ 4、Y~N(10, 80),当以1210n n ==进行抽样时,128y y ->的概率约为[ B ]。 A. 0.10 B. 0.05 C. 0.025 D. 0.01 5、成对比较的特点不包括( D ) A 、加强了试验控制 B 、可减小误差 C 、不必考虑总体方差是否相等 D 、误差自由度大 6、方差分析基本假定中除可加性、正态性外,尚有[ C ]假定。 A 、无偏性 B 、无互作 C 、同质性 D 、重演性 7、若否定 H ,则( ) A 、必犯α错误 B 、必犯β错误 C 、犯α错误或不犯错误 D 、犯β错误或不犯错误 8、随机抽取200粒棉花种子做发芽试验,得发芽种子为150粒,其与00.8p =的差异显著性为( A )。 A 、不显著 B 、显著 C 、极显著 D 、不能确定 9、当30n ≤时,测验一个样本方差2 s 和某一指定值C 是否有显著差异的方法用( B ) A 、F 测验 B 、2 χ测验 C 、t 测验 D 、u 测验 *10、多元线性回归方程的假设测验可用( A )。 A 、F 测验 B 、F 或t 测验 C 、t 测验 D 、u 测验

医学统计学名词解释

1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学 2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。 3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示 4.同质:是指事物的性质、影响条件或背景相同或相近。 5.变异:是指同质的个体之间的差异 6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 12.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 13.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 14.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称有序变量 15.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。16随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变

生物统计附试验设计题目

《生物统计附试验设计》复习题 (考试共有五种题型:其中名称解释5道共10分,单选10道共10分,判断题10道共10分,计算题4道共60分,问答题2道共10分) 一、名词解释题 1.总体: 4.准确性: 7.系统误差: 8.样本: 11.随机样本: 12.样本容量: 13.假想总体:, 15.数量性状资料: 17.全距: 18.简单表: 20.众数: 21.样本标准差: 22.几何平均数: 23.算术平均数: 24.调和平均数: 26.离均差: 28.变异系数: 29.统计推断: 30.小概率事件实际不可能性原理: 31.显著水平: 32.I型错误: 34.非配对设计: 35.配对设计:, 37.试验处理: 38.试验指标: 39.重复: 40.试验单位:

41.因素水平: 42.多重比较。 44.独立性卡方检验: 46.相关分析: 47.回归分析: 51.相关系数: 52.试验设计(狭义): 53.试验方案: 56.局部控制: 57.完全随机设计: 59.多因素试验: 试验中只进行一种因素的测定 62.完全随机抽样: 二、单项选择题 1、单因素方差分析的数学模型是()。 ①x ij =μ+αi+εij ②x ij =μ+αi③x i =μ+αi+βj +εij ④x ij =αi +εij 2、.在单因素方差分析中一定有() ①SST=SSt+SSe②SSt〉SSe③SSt=SSe④SSt<SSe 3、一元线性回归的假设检验()。 ①只能用t检验②只能用F检验③两者均可④两者均不可 4、在单因素方差分析中一定有() ①dfT=dft+dfe②dfT≠dft+dfe ③dfT=dft ④dft=dfe 5、简单相关系数的取值范围是() ①-1MSe②MST≠MSt+MSe ③MST=MSt+MSe④MSt<MSe 8、生物统计学创始人的是()

统计学实验指导书(Excel)

《统计学》实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel、SPSS 的应用,理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 一、Excel中的统计分析功能 包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。 2、计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 3、利用Excel进行推断统计。 4、利用Excel进行相关回归分析。 试验一:数据的整理与显示 (一)数据的筛选和排序 1、数据的筛选 在对统计数据进行整理时,首先需要进行审核,以保证数据的质量。对审核中发现的错误应尽可能予以纠正。如果对发现的错误无法纠正,或者有些数据不符合调查的要求而又无法弥补时,就要对数据进行筛选。 数据筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,不符合特定条件的数据予以剔除。数据筛选可借助于计算机自动完成。 下面通过一个实例说明用Excel进行数据筛选的过程。 【例】下表是8名学生4门课程的考试成绩数据(单位:分)。试找出统计学成绩等于75分的学生,英语成绩最高的前三名学生,4门课程都高于70分的学生。 8名学生的考试成绩数据 首先,选择“工具”菜单,并选择“筛选”命令。如果要筛选出满足给定条件的数据,可使用自动筛选命令。如图所示。

医学统计学重点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学 课后问题详解

1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。故参数检验依赖于特定的分布类型,比较的是总体参数 2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。适用围广,可适用于任何类型资料 参数检验 ?优点:资料信息利用充分;检验效能较高 ?缺点:对资料的要求高;适用围有限 2.非参数检验 ?优点:适用围广,可适用于任何类型的资料 ?缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验 对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观

《医学统计学》学习指南

《医学统计学》课程 ——学习指南 第一章医学统计学概论 教学要求: 1.能够了解“医学统计学”的概念以及统计工作的一般步骤。 2.能够解释并举例说明医学统计学中所涉及的基本概念。 3.能够识别医学资料的类型。 教学重点、难点: 重点: 1.统计学中的几个基本概念。 2.医学研究中常见的资料类型。 难点: 1.小概率事件与小概率原理。 第二章计量资料的统计描述 教学要求: 1.能够了解频数分布表的编制方法及分布图的绘制,并以此描述资料的频数分布特征。 2.能够了解正态分布的概念、特征及应用,掌握标准正态分布的基本规律。 3.能够掌握各种平均数指标的计算,特点及其适用条件。 4.能够掌握各种离散趋势指标的计算,特点及其适用条件。 教学重点、难点: 重点: 1. 集中趋势与离散趋势指标的特点与适用范围。 2. 正态分布的基本概念和特征。 难点: 1. 95%参考值范围的计算。 第三章计数资料的统计描述 教学要求: 1.能够识别常用相对数指标的概念和计算方法,并能举例说明。 2.能够理解应用相对数的注意事项。 3.能够了解动态数列的作用和常用指标。

4.能够了解Simpson悖论的原理和标准化率的计算方法。 教学重点、难点: 重点: 1.常用相对数指标的类型与计算方法。 2.应用相对数指标的注意事项。 难点: 1.应用相对数指标的注意事项。 第四章统计表与统计图 教学要求: 1.了解统计表的基本结构和绘制的基本要求。 2.了解统计图的基本结构、绘制的基本要求。 3.能够选用正确的统计图描述数据资料。 4.能够运用统计软件绘制常用的统计图。 教学重点、难点: 重点: 1.错误统计表的修改。 2.常用统计图绘制及其图形选择。 难点: 1.统计图的正确选用。 第五章参数估计 教学要求: 1.掌握样本均数(率)抽样误差基本概念及计算。 2.掌握总体均数(率)置信区间的概念和估计方法。 3.了解t分布的分布特征和应用。 4.了解标准误和标准差的区别。 教学重点、难点: 重点: 1. 抽样误差的概念和计算。 2. 单个总体均数置信区间和两个总体均数差的置信区间的估计方法。难点: 1. 单个总体均数置信区间基于的理论分布。 2. 两个总体均数差的置信区间的估计方法的理论分布。

生物统计附实验设计(明道绪第四版)复习题与答案

总体:根据研究目的确定的研究对象的全体 个体:总体中的一个研究单位 样本:实际研究中的一类假象总体 样本含量:样本中所包含的个体数目称为样本含量或大小 随机样本:一类从总体中随机抽得到的具有代表性的样本 统计量:由样本计算的特征数 参数:由总体计算的特征数 精确性:指在试验或调查中某一试验指标或性状的重复观察值彼此接近的程度 系统误差:系统误差又叫做片面误差。它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。 偶然误差:一类由于偶然的或不确定的因素所造成的每一次测量值的无规则变化(涨落),叫做偶然误差,或随机误差。 连续性变数资料:指用量测方式获得的数量性状资料 离散型变数资料:指用计数方式获得的数量性状资料 算术平均数:指资料中的各观测值的总和除以观测值个数所得的商,简称平均数或均数 平均数:资料或代表数,主要包括算术平均数,中位数,众数,几何平均数及调和平均数 标准差:是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 方差:度量总体(或样本)各变量间变异程度的参数(总体)或统计量(样本)。

离均差平方和:样本各观测值变异程度大小的另一个统计数 试验:在一定条件下对自然现象所进行的观察或试验统称为试验 随机事件:随机试验的每一种可能结果 概率:事件本身所固有的数量指标,不随人的主观意志而改变,人们称之为概率小概率原理:小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能原理 正态分布:若连续性随机变量X的概率分布密度函数,则X服从正态分布 标准正态分布:我们把平均数u=0,σ2 =1时,称为标准正态分布,记为N(0,1) 双侧概率:我们把随机变量X在平均数u加减不同倍数标准差σ区间(u-kσ,u+k σ)之外,取值的概率称为双侧概率 单侧概率:对应于两尾概率可以求得随机变量x小于小于u-kσ或大于u+kσ的概率 二项分布:设随机变量x所有可能取得的值为0或正整数,且有P(ξ=K)=Cn(k)P(k)q(n-k),k=0,1,2….n,则称随机变量x服从n和p的二项分布标准误:反映样本平均数的抽样误差的大小的一种指标 t分布:由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换t=,统计量t 值的分布称为t分布。 假设检验(显著性检验):假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。

医学统计学绪论完整课件

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学绪论完整课件 医学统计学(( Medical Statistics))绪论(( Instruction )) 3 工作和生活中常见的统计学问题明天是否下雨?体育彩票能否中奖?( 概率论子女为什么象父母,其强度有多大?( 相关与回归归人口普查、疾病调查是如何进行的?( 调查设计,抽样如何判断药物的疗效?( 假设检验统计学是对令人困惑费解的数字问题做出设想的艺术。 4 统计是一种对客观现象数量方面进行的调查研究和分析; 是收集、整理、分析、推断、判断等认识活动的总称。 统计学(Statistics )的定义 A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data ( Webster International Dictionary ) The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results (A Dictionary of Epidemiology) 统计学:是关于数据收集、整理、表达、分析与推断的普遍原理和方法,是一门处理数据变异性的科学与艺术,其目的是求得可靠的结果。 统计学是工具学科,指导专业学科的学习和应用。 7 医学统计学是应用统计学基本原理 1 / 12

(整理)医学统计学实验指导.

医用统计方法练习 1、某医师研究用春雷素治疗小儿急性菌痢的疗效,实验组治疗患儿30例(4-5岁)都已用过氯霉素加痢特灵治疗无效,其中10例还曾用过OQPST(羟喹酞磺胺噻唑)加TMP 治疗无效;对照组用OQPST加TMP治疗患儿50例(4-5岁)。结果试验组治愈率83%,对照组治愈率80%。是否可以说明两组疗效近似? 2、指出下表不足之处,并进行修改。 两个治疗组对比 并发症 西药组中西结合组 例数 结果 例数 结果 良好死亡良好死亡 休克13 6 7 10 10 0 3、某医院传染科用侧柏叶注射合并化疗(简称合并组,34例)与单纯化疗(简称化疗组,34例)治疗肺结核的疗效比较如下表,指出下表绘制的缺点,并加以修正。 两组病例主要症状及体症恢复正常所需平均日数 症状体征例数组别 咳嗽吐痰潮热肺部湿罗音痰结核菌转阴 例平均差% 例平均差% 例平均差% 例平均差% 化疗34例 合并34例 4、用下表中资料绘成统计图 身高 (厘米) 122~126~130~134~138~142~146~150~154~158~合计人数 4 9 10 22 33 20 11 6 4 1 120 6、用下表所列资料绘图 传染病病死率(%) 白喉 流行性乙型脑炎流行性脑脊髓膜炎伤寒及副伤寒10.9 18.0 11.0 2.7

痢疾 急性脊髓灰质炎1.2 3.4 7、根据下表所列资料绘成统计图 某地某年3~4岁儿童急性传染病构成 疾病病例数构成比(%) 猩红热麻疹百日咳白喉痢疾2920 2640 1450 530 470 36.5 33.0 18.1 6.6 5.8 合计8010 100.0 8、某医师检查了21名从事作业工人的血红蛋白量(g/100ml),资料如下表,试计算均数及标准差。 14.8 14.7 15.4 14.4 13.7 13.7 14.1 15.4 14.4 16.4 15.3 12.5 14.2 17.0 14.8 14.4 14.9 14.4 12.8 15.6 15.9 9、某市110名健康男工人的血红蛋白(g/100ml)列于下表,将此资料编制频数表, 并计算均数,标准差及标准误。 11.8 14.9 13.8 15.6 14.8 13.3 14.5 14.5 14.6 12.3 14.0 14.8 16.5 14.8 14.9 13.5 12.7 13.4 14.1 12.1 14.3 13.9 15.8 16.0 13.9 13.5 14.6 13.8 14.3 15.0 14.3 14.0 14.0 16.3 11.9 16.8 14.8 15.8 15.5 12.8 15.2 13.0 14.0 12.5 13.8 17.4 16.0 13.8 13.7 13.4 14.7 12.5 14.1 14.7 14.7 15.6 13.7 12.0 13.8 15.3 13.8 13.7 14.7 15.0 13.0 12.9 13.4 15.2 15.1 15.0 14.2 13.9 14.2 14.4 12.8 14.1 14.9 14.0 15.4 10.1 13.2 15.5 13.1 11.9 13.1 14.2 12.6 14.2 15.2 14.0 14.6 15.3 11.4 14.8 13.9 16.2 15.0 15.1 15.4 13.2 12.2 13.5 14.0 14.7 13.5 13.1 13.8 10.7 14.9 15.1 10、调查某地107名正常人尿铅含量(毫克/升)结果列于下表,计算平均数(及第95百分位数) 尿铅含量(毫克/升)0~4~8~12~16~20~24~28~合计例数14 22 29 18 15 6 1 2 107 11、102名健康人的钩端螺旋体血凝抗体滴度分布如下表,试计算平均滴度。

医学统计学部分试题及答案(供参考)

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历 3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念 答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随机抽取2000人,分别测得其红细胞数,组成样本,其样本含量为2000。第二章调查研究设计 1. 以下五个问题中,最符合调查问卷设计要求的是 A.你一个月工资多少? B.你一个月吃多少克盐? C.你是否有婚外恋:①有②无

相关主题
文本预览
相关文档 最新文档