当前位置:文档之家› X2检验-spss

X2检验-spss

X2检验-spss
X2检验-spss

X2检验

X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。在SPSS中,所有X2检验均用Crosstabs完成。

Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现。

界面说明

【Rows框】

用于选择行*列表中的行变量。

【Columns框】

用于选择行*列表中的列变量。

【Layer框】

Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。

【Display clustered bar charts复选框】

显示重叠条图。

【Suppress table复选框】

禁止在结果中输出行*列表。

【Statistics】按钮

弹出Statistics对话框,用于定义所需计算的统计量。

Chi-square复选框:计算X2值。

Correlations复选框:计算行、列两变量的Pearson相关系数和Spearman等级相关系数。Norminal复选框组:选择是否输出反映分类资料相关性的指标,很少使用。

Contingency coefficient复选框:即列联系数,其值界于0~1之间;

Phi and Cramer's V复选框:这两者也是基于X2值的,Phi在四格表X2检验中界于-1~1之间,在R*C表X2检验中界于0~1之间;Cramer's V 则界于0~1之间;

Lambda复选框:在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;

Uncertainty coefficient复选框:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。

Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,很少使用。

Gamma复选框:界于0~1之间,所有观察实际数集中于左上角和右下角时,其值为1;Somers'd复选框:为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;Kendall's tau-b复选框:界于-1~1之间;

Kendall's tau-c复选框:界于-1~1之间;

Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;Kappa复选框:计算Kappa值,即内部一致性系数;

Risk复选框:计算比数比OR值;

McNemanr复选框:进行McNemanr检验,即常用的配对计数资料的X2检验(一种非参检验);

Cochran's and Mantel-Haenszel statistics复选框:计算X2M-H统计量(分层X2,也有写为X2CMH 的),可在下方输出H0假设的OR值,默认为1。

【Cells】按钮

弹出Cells对话框,用于定义列联表单元格中需要计算的指标:

Counts复选框组:是否输出实际观察数(Observed)和理论数(Expected);

Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)以及合计百分数

(Total);

Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj. Standardized);

【Format钮】

用于选择行变量是升序还是降序排列。

分析实例

一、四格表资料的X2检验

例6.1 某医生用呋喃硝胺和甲氰咪胍治疗十二指肠溃疡,结果如下表,问两种药物治疗效果有无差别?

组别愈合未愈合合计有效率(%)

呋喃硝胺54 8 62 87.09

甲氰咪胍44 20 64 68.75

合计98 28 126 77.78

【建立数据文件】

由于此处给出的是频数表(大部分资料都以这种形式给出),因此在建立数据集时可以直接输入三个变量:

行变量(分组变量):变量名取“R”,变量值为1=“呋喃硝胺组”,2=“甲氰咪胍组”

列变量(疗效变量):变量名取“C”,变量值为1=“愈合”,2=“未愈合”

指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。

所建立的数据集如下表。

然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。

【操作过程】

Data==>Weight Cases (对数据按频数进行加权)

Weight Cases by单选框:选中

Freqency Variable:选入F

单击OK钮

Analyze==>Descriptive Statistics==>Crosstabs

Rows框:选入R

Columns框:C

Statistics按钮:选中Chi-square复选框,单击Continue钮

Cells...按钮:选中Row 复选框,单击Continue钮

单击OK钮

【结果解释】

上题分析结果如下:

首先是有效记录数和处理记录缺失值情况报告,可见126例均为有效值。

上表为列出的四格表,其中加入变量值和变量值标签,看起来很清楚。

上表给出了一堆检验结果,从左到右为:检验统计量值(Value)、自由度(df)、双侧近似概率(Asymp.Sig.2-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.1-sided);从上到下为:Pearson卡方(Pearson Chi-Square即常用的卡方检验)、连续性校正的卡方值(Continuity Correction)、对数似然比方法计算的卡方(Likelihood Ratio)、Fisher's确切概率法(Fisher's Exact Test)、线性相关的卡方值(Linear by Linear Association)、有效记录数(N of Valid Cases)。另外,Continuity Correction和Pearson卡方值处分别标注有a和b,表格下方为相应的注解:a.只为2*2表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无须校正,直接采用第一行的检验结果,即X2=6.133,P=0.013。

因P=0.013,可以认为两种药物疗效有差异,结合样本率,可以认为呋喃硝胺有效率高于甲氰米胍。

如何选用上面众多的统计结果令许多初学者头痛,实际上我们只需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可,其余的对我们而言用处不大,可以视而不见。

二、配对计数资料X2检验

例6.2 有28份痰液标本,每份分别接种在甲、乙两种培养基中,观察结核杆菌生长情况,结果如下表,试检验甲、乙培养基生长率有无差别。

甲乙两种结核杆菌培养基的培养结果

乙培养基

甲培养基+ —合计

+ 11 9 20

— 1 7 8

合计12 16 28

【建立数据文件】

输入三个变量:

行变量(代表甲培养基):变量名取“R”,变量值为1=“生长”,2=“未生长”

列变量(代表甲培养基):变量名取“C”,变量值为1=“生长”,2=“未生长”

指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。

所建立的数据集如下表。

然后用Weight Cases对话框指定频数变量进行加权,最后调用Crosstabs过程进行X2检验。

【操作过程】

1. Data==>Weight Cases (对数据按频数进行加权) Weight Cases by 单选框:选中 Freqency Variable :选入F 单击

2. Analyze==>Descriptive Statistics==>Crosstabs Rows 框:选入R Columns 框:C

选中Chi-square 复选框(做成组

X2检验,分析甲乙两培养基分析结果有无相

关)

选中McNemanr 复选框:(做配对X2检验,分析甲乙培养基阳性率有无差异) 单击

Cells...按钮: 选中Row 复选框,单击Continue

钮 单击

【结果解释】

上表为有效例数, 缺失例数和总例数的情况, 28例均有效.

上表输出配对四格表数据。

上表为X2检验的结果。首先是成组X2检验,X2=4.21,P=0.040,可以认为甲乙两培养基的结果有相关性(即甲阳性,乙可能也阳性)。下面做了配对X2检验(McNemar Test),用精确概率法计算,P=0.021(双侧),可以认为甲乙两培养基阳性率差异有统计学意义。

三、R×C表X2检验

例6.3 某市三个地区出生婴儿的畸形发生情况如下表,试比较这三个地区出生婴儿畸形率有无差异。

地区畸形数无畸形数合计发生率(‰)

重污染区114 3278 3392 33.61

一般市区444 40103 40547 10.95

农村67 8275 8342 8.03

合计625 5165 52281 11.95

这是3×2表资料,要进行3个样本率的比较。

【建立数据文件】

直接输入三个变量:

行变量(分组变量):变量名取“R”,变量值为1=“重污染区”,2=“一般市区”,“农村”。

列变量(疗效变量):变量名取“C”,变量值为

1=“畸形”,2=“非畸形”

指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。所建立的数据集如下表。

【操作过程】

1. Data==>Weight Cases (对数据按频数进行加权) Weight Cases by单选框:选中

Freqency Variable:选入F

单击

2. Analyze==>Descriptive Statistics==>Crosstabs Rows框:选入R

Columns框:C

Statistics按钮:选中Chi-square复选框

Row 复选框

单击Continue钮

单击

【结果解释】

上表为有效例数, 缺失例数和总例数的情况, 52281例均有效。

上表输出原始数据,并计算行百分数,重污染区畸形率为3.4%,一般市区为1.1%,农村为0.8%。

上上表为X2检验的结果,X2=148.984,自由度=2 ,P=0.000,

可以认为这三个区新生儿畸形率差异有统计学意义,畸形率不同或不全相同。至于哪些地区有差别,那些地区没有差别,或都有差别,可进行X2分割。

四、R×C列联表资料X2检验

列联表是指每个观察对象按两种属性交叉分组归类,而且每种属性的分类都是有序的,这样整理出的资料称双向有序列联表。配对计数资料就是一个2×2列联表。

例6.4 下表资料是492名不同期次矽肺患者其肺门密度级别的资料,试分析矽肺期次和肺门密度级别有无关系。

不同期次矽肺患者肺门密度级别分布

━━━━━━━━━━━━━━━━━━━━━━━

肺门密度级别

矽肺期次──────────合计

+ ++ +++

───────────────────────

Ⅰ43 188 14 245

Ⅱ 1 96 72 169

Ⅲ 6 17 55 78

───────────────────

合计50 301 141 492

━━━━━━━━━━━━━━━━━━━━━━━

该资料是一个3×3列联表。每个矽肺病人按矽肺的期次和胸片肺门密度的级别进行交叉分类归组。使用x2检验可以分析这两个属性之间有无相关性。

【建立数据文件】

直接输入三个变量:

行变量(分组变量):变量名取“R”,代表矽肺期次,变量值为1=“Ⅰ期”,2=“Ⅱ期”,3=“Ⅲ期”。

列变量(疗效变量):变量名取“C”,代表肺门密度,变量值为1=“+”,2=“++”,3=“+++”。指示每个格子中频数的变量:变量名取“F”,直接输入各个格子的频数。

所建立的数据集如下表。

【操作过程】

1. Data==>Weight Cases (对数据按频数进行加权)

Weight Cases by单选框:选中

Freqency Variable:选入F

单击

2. Analyze==>Descriptive Statistics==>Crosstabs

Rows框:选入R

Columns框:C

选中Chi-square复选框(做X2检验)

选种Kendall’s tau-b 复选框(计算列联系数)

选种Kappa 复选框(计算Kappa值,分析一致性)

Row 复选框(计算行百分数)单击Continue钮

单击

【结果解释】

上表为有效例数, 缺失例数和总例数的情况, 492例均有效。

上表输出原始数据,并计算行百分数。

上表结果为X2检验的结果,X2=163.007,自由度=4,P=0.000,可以认为矽肺期次和肺门密度有关,结合下表的列联系数(Kendall’s tau-b)为0.498,两者呈正相关的关系,即矽肺期别越高,肺门密度级别也越高。

上表输出Kendall’s tau-b列联系数,其值为0.498,标准误为0.034,对列联系数检验的统计量为13.680,P=0.000。Kappa=0.127,其标准误=0.028,对Kappa值检验的统计量为5.070,P=0.000,可认为两者有一致性。根据经验Kappa≥0.75,表明两者一致性好;0.75>Kappa ≥0.4,表明一致性一般;Kappa<0.4 表明一致性差。矽肺期次和肺门密度有一致性,但一致性差。

习题

1、某卫生防疫站对屠宰场及肉食零售点的猪肉,检查其表层沙门氏菌带菌情况,如下表,问两者带菌率有无差别?

采样地点检查例数阳性例数带菌率(%)

屠宰场28 2 7.14

零售点14 5 35.71

合计42 7 16.67

2.以眼为单位观察20岁以上居民眼睛的晶状体点状混浊程度与年龄间的关系得资料如下,分析两者之间有无关系。

──────────────────────

晶状体混浊程度

年龄(岁)───────────合计

+ ++ +++

──────────────────────

20-2256744336

30-141 101 63 305

40-158 128 132 418

──────────────────────

合计524 296 239 1059

──────────────────────

3、某医院比较急性黄疸型肝炎与正常人在超声波肝波波型上的表现,结果如下。问两组病人肝波波型的密度构成有无差别?

波型密度

组别正常较密很密合计

黄疸型肝炎组12 43 232 287

正常人组277 39 11 327

合计289 82 243 614

4、为研究血型与胃溃疡、胃癌的关系,得下表资料,因AB型例数少而省略,问各组血型构成有无差别?

血型

──────────合计

O A B

────────────────────

胃溃疡993679134 1806

胃癌393 416 84 893

对照2902 2652 570 6097

────────────────────

4288 3720 788 8796

────────────────────

5、有21例急性心肌梗塞并发休克患者,分别采用西药和中西药结合的方法,疗效如下。问两组疗效有无差别?

两种疗法对心肌梗塞的疗效比较

治疗组康复死亡合计

西药组 6 5 11

中西药组9 1 10

合计15 5 21

6、现有170例已确诊的乳癌患者,用两种方法对其进行诊断,问:这两种诊断方法的诊断结果是否有关系?两种方法何者为优?两者的一致性如何?

────────────────

临床诊断

X线诊断─────────

乳癌非乳癌

────────────────

乳癌24 30

非乳癌70 46

────────────────

7、比较某市三个地区出生婴儿的畸形率有无差异。

某市三个地区出生婴儿的畸形率

地区畸形数无畸形数合计畸形率(‰)

重污染区114 3278 3392 33.61

一般市区444 40103 40547 10.95

农村67 8275 8342 8.03

合计625 51656 52281 11.95

数据正态性检验及正态转化在spss中的实现

数据正态性检验及正态转换在spss中的实现 1数据正态性检验 观察分布,预先判断 主要观察直方图,以及根据峰度和偏度粗略估计研究变量的分布。采用spss中描述统计中的频率分析来实现,具体操作如下: (1)在spss中打开数据资料文件,依次点击“分析—描述统计—频率”,如下图: (2)在弹出的对话框中,选择左边方框中要研究的变量,点击中间的箭头,将其选入右边的对话框,本文选择“胫围”作示例分析,如下图:

(3)之后,选择最右边五个选项卡中的“统计”选项卡,在弹出的对话框中的右下角勾选“偏度”和“峰度”选项,点击“继续”,如下图: (4)再点击“图表”选项卡,在弹出的对话框中勾选“直方图”和“在直方图中显示正态曲线”选项,点击“继续”,如下图: (5)然后点击“确定”选项,得出如下结果:统计一栏中包括有偏度及其标准误差、峰度及其标准误差。由结果可知:(偏度)>*(偏度标准误差);(峰度)>*(峰度标 准误差),推测该胫围数据不符合正态分布。

正态分布显著性检验 采用spss中非参数分析方法对数据资料进行正态性检验,具体步骤如下: (1)在spss中打开数据资料文件,依次点击“分析—非参数检验—单样本k-s”,如下图:

(2)在弹出的对话框中,选择左边方框中要研究的变量,点击中间的箭头,将其选入右边的对话框,本文选择“胫围”作示例分析,如下图: (3)之后,点击最右边的“精确”选项卡,在弹出的对话框中有三个选项,1、“仅渐进法”:是基于渐进分布的显著性水平的检验指标,适用于大样本,如果样本 过小或者分布不好,就会影响检验的效力;2、“蒙特卡洛法”:适用于精确显著 性水平的无偏估计,如果样本过大,数据处理过程太长,就应该使用这个选项; 3、“精确”:精确计算概率值,可以设定数据处理的时间,如果数据处理时间超

spss实践题分析及答案

SPSS实践题 习题1 分析此班级不同性别的学生的物理和数学成绩的均值、最高分和最低分。

Std. Deviation Minimum Maximum 结论:男生数学成绩最高分: 95 最低分: 72 平均分: 物理成绩最高分: 87 最低分: 69 平均分: 女生数学成绩最高分: 99 最低分: 70 平均分: 物理成绩最高分: 91 最低分: 65 平均分: 习题2 分析此班级的数学成绩是否和全国平均成绩85存在显著差异。 One-Sample Statistics N Mean Std. Deviation Std. Error Mean 数学26 结论:由分析可知相伴概率为,小于显著性水平,因此拒绝零假设,即此班级数学成绩和全国平均水平85分有显著性差异 习题3 分析兰州市2月份的平均气温在90年代前后有无明显变化。

Group Statistics 分组N Mean Std. Deviation Std. Error Mean 二月份气温011.3628400 118.3065729 结论:由分析可知, 方差相同检验相伴概率为,大于显著性水平,因此接受零假设,90年代前后2月份温度方差相同。双侧检验相伴概率为, 小于显著性水平,拒绝零假设,即2月份平均气温在90年代前后有显著性差异 习题4 分析15个居民进行体育锻炼3个月后的体质变化。 Paired Samples Statistics Mean N Std. Deviation Std. Error Mean

Paired Samples Correlations N Correlation Sig. Pair 1锻炼前 & 锻炼后15.277 结论:由分析可知,锻炼前后差值与零比较,相伴概率小于显著性水平, 拒绝零假设,即锻炼前后有显著性差异 习题5 为了农民增收,某地区推广豌豆番茄青菜的套种生产方式。为了寻找该 种方式下最优豌豆品种,进行如下试验:选取5种不同的豌豆品种,每 一品种在4块条件完全相同的田地上试种,其它施肥等田间管理措施完 全一样。根据表中数据分析不同豌豆品种对平均亩产的影响是否显著。 ANOVA 产量 Sum of Squares df Mean Square F Sig.

spss进行正态性检验方法

用SPSS进行正态性分布检验全过程 (2008-06-21 13:26:12) 转载 标签: 杂谈 1、先做直方图看看是否大概符合正态分布,这个不用说了吧,Graph-->legacy dialogs-->histogram-->选入变量--》OK.如果距离正态分布的样子太远了,你就不要做下面的工作啦。 2、Analyze-->descriptive statistic-->explore--》选入变量--》选右上角的plots-->打开后,选中间的normally plots with tests -->OK。结果就出来啦。 3、它会用两种方法来检验正态分布,当sig>0.05时服从正态分布,如果不服从正态分布,就要看峰度和偏度啦: 偏度主要是研究分布形状是否对称。约=0 则可以认为分布是对称的; >0则可以认为右偏态,此时在均值右边的数据更为分散; <0则可以认为左偏态,同理。 峰度它是以正态分布为标准,比较两侧极端数据分布情况的指标。 正态的=0 >0 此时分布有一个沉重的尾巴, <0正好相反。 附加检验: (Ⅱ)附加检验之一,观察正态概率图,如果数据来自正态分布,图形的散点应该呈现一条直线。用Plot绘制正态分布的概率图,里面的“+”构成一条直线(正态分布数据概率图散点应该成一条直线),“*”代表样本数据散点。根据“*”覆盖“+”的程度,说明样本数据是否来自正态分布数据。 (Ⅲ)附加检验之二,绘制数据的条形图,如果数据来自正态分布,条形图呈现“钟形”分

布。用histogram绘制直方图/normal在直方图中拟合正态分布的密度曲线,可以看到,曲线几乎是个标准钟形,可以认为数据是正态分布。 (Ⅳ)附加检验之三,观察描述性统计量中偏度系数(Skewness)g1和峰度系数(Kurtosis)g2,如果数据来自正态分布,则两者都应该是0。用g1,g2,бg1,бg2来计算U值,用U检验法。U1=同理计算U2,要两个都小于1.96,即p大于0.05才可以

SPSS—单样本T检验

一、被调查学生对“云窗的打分值”总体平均值的推断: 1、以71个被调查学生为样本做T 检验 由表a 可知,71个观测的平均值为71.21,标准差为15,120,均值标准误为1.794。 表b 中,第二列是t 统计量的观测值为0.675,第三列是自由度n-1=70,第四列是t 统计量观测值的双尾概率p 值,第五列是样本均值与检验值的差(1.211),即t 统计量的分子部分,他除以表a 的均值标准误(1.794)后得到t 统计量的观测值0.675,第六列和第七列是总体均值与检验值差的95%的置信区间,为(67.63,74.79)。 对于研究的问题应采用双尾检验,因此比较 2α和2 p ,即比较α和p 。由于p 大于α(0.05),因此不能拒绝零假设,认为被调查学生对“云窗的打分值”总体平均值没有显著差异。有95%的把握认为总体均值在 67.63~74.79 分之间。70分包含在置信区间内,也证实了上述推断。

2、被调查学生对“云窗的打分值”的重抽样自举 表c Bootstrap 指定 采样方法简单箱图 样本数1000 置信区间度95.0% 置信区间类型百分位 由表c可知,自举过程执行1000次,随机数种子指定为默认值2000000,采样方法为简单箱图。 中均值的重抽样自举均值与实际样本均值的差为-0.12,1000个均值的标准差为1.82,由此得到的均值95%的置信区间为(67.18,74.46) 表e中没有给出双尾检验的概率p值,但是从检验的结果可知有95%的把握认为总体均值在 67.184~74.463之间。70包含在置信区间内。用更大的样本量再一次说明了被调查学生对“云窗的打分值”总体平均值没有显著差异。

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析 2011-09-19 15:09 最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验( Kruskal-Wallis检验)。 还是以SPSS教程为例: 假设:HO: 不同地区的儿童,身高分布是相同的 H1:不同地区的儿童,身高分布是不同的 不同地区儿童身高样本数据如下所示: 提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个 即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的分布,

(即指:卡方检验) 点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面: 将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。 在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定 运行结果如下所示:

对结果进行分析如下: 1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900 自由度为:3=k-1=4-1 下面来看看“秩和统计量”的计算过程,如下所示: 假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数) 最后得到的公式为: 北京地区的“秩和”为:秩平均*观察数(N) = 14.4*5=72 上海地区的“秩和”为:8.2*5=41 成都地区的“秩和”为:15.8*5=79 广州地区的“秩和”为:3.6*5=18

假设检验spss操作例题

单样本T检验 按规定苗木平均高达1.60m以上可以出圃,今在苗圃中随机抽取10株苗木,测定的苗木高度如下: 1.75 1.58 1.71 1.64 1.55 1.72 1.62 1.83 1.63 1.65 假设苗高服从正态分布,试问苗木平均高是否达到出圃要求?(要求α=0.05) 解:1)根据题意,提出: 虚无假设H0:苗木的平均苗高为H0=1.6m; 备择假设H1:苗木的平均苗高H1>1.6m; 2)定义变量:在spss软件中的“变量视图”中定义苗木苗高, 之后在“数据视图”中输入苗高数据; 3)分析过程 在spss软件上操作分析,输出如下:

表1.1:单个样本统计量 表1.2:单个样本检验 由图1.1和表1.1数据分析可知,变量苗木苗高成正态分布,平均值为1.6680m,标准差为0.0843,说明样本的离散程度较小,标准误为0.0267,说明抽样误差较小。 由表1.3数据分析可知,T检验值为2.55,样本自由度为9,t检

验的p值为0.031<0.05,说明差异性显著,因此,否定无效假设H0,取备择假设H1。 由以上分析知:在显著水平为0.05的水平上检验,苗木的平均苗高大于1.6m,符合出圃的要求。 独立样本T检验 从两个不同抚育措施育苗的苗圃中各以重复抽样的方式抽得样本如下: 样本1苗高(CM):52 58 71 48 57 62 73 68 65 56 样本2苗高(CM):56 75 69 82 74 63 58 64 78 77 66 73 设苗高服从正态分布且两个总体苗高方差相等(齐性),试以显著水平α=0.05检验两种抚育措施对苗高生长有无显著性影响。 解:1)根据题意提出: 虚无假设H0:两种抚育措施对苗木生长没有显著的影响; 备择假设H1:两种抚育措施对苗高生长影响显著; 2)在spss中的“变量视图”中定义变量“苗高1”,“抚育措施”,之后在“数据视图”中输入题中的苗高数据,及抚育措施,其中措施一定义为“1”措施二定义为“2”; 3)分析过程 在spss软件上操作分析输出分析数据如下;

SPSS统计分析1:正态分布检验.

正态分布检验 一、正态检验的必要性[1] 当对样本是否服从正态分布存在疑虑时,应先进行正态检验;如果有充分的理论依据或根据以往积累的信息可以确认总体服从正态分布时,不必进行正态检验。 当然,在正态分布存疑的情况下,也就不能采用基于正态分布前提的参数检验方 法,而应采用非参数检验。 二、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 Q-Q图为佳,效率较高。 以上两种方法以 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 三、计算法 1、峰度(Kurtosis)和偏度(Skewness) (1)概念解释 峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比

较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异 程度越大。 峰度的具体计算公式为: 注:SD就是标准差σ。峰度原始定义不减3,在SPSS中为分析方便减3后与0作比较。 偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。 偏度的具体计算公式为: 各种正态分布,尽管μ和σ可以分别取不同的值,但偏度都等于0,峰度都等于3,它们的密度函数曲线的形状都是一样的[1]。(SPSS中峰度减3与0比较 (2)适用条件 样本含量应大于200。 (3)检验方法 计算得到的峰度、偏度根据正态分布的值3、0(SPSS中为0、0)来直观判断是 否接近。 应对二者分别进行U检验来定量描述显著性,方法如下[2]:峰度U检验:|峰度-3| / 峰度标准差 <= U0.05 = 1.96(SPSS中将3替换为0)偏度U检验:|偏度-0| / 偏度标准差 <= U0.05 = 1.96 如果上述都成立,则可认为在0.05显著水平符合正态分布(下例偏度可判断不符合。

SPSS单个样本T检验实验报告(一)

《统计学》实验分析报告 实验完成者 班级 2013级班 学号 实验时间 2015年6月5日 一、实验名称 假设检验——单个样本T检验 二、实验目的 掌握单样本t检验的基本原理和spss实现方法。 三、实验步骤 1、打开SPSS,选择输入数据; 2、由于已经有建好的数据,因此打开“电子元件抽验”; 3、在分析中选择比较均值,单样本t检验,将阻值添加到检验变量。 4、检验值为0.14,置信区间默认为95%,点击确定。 四、实验结果及分析 附件一:单个样本统计量表,给出了各个样本的均值,标准差和均值的标准误; 附件二:单个样本检验表,给出了各个样本的t值(t)、自由度(df)、P值(Sig.双尾)、均值差值、差值的95%可信区间 1、附件二——单个样本检验表中,第一批元件样本双尾T检验的显著性概率(Sig.(双侧)), Sig.=0.012<0.05,说明第一批元件的平均电阻与额定电阻值0.140有显著的差异。

2、由附件二同样可以看出,对于第二批和第三批元件,显著性概率分别为0.130与0.265均大于0.05,所以接受原假设,认为这两批元件的电阻与额定值无显著差异,即认为产品合乎质量要求; 3、综上,第一批元件不符合质量要求,第二、三批元件符合质量要求。 五、自评及问题 掌握了单样本t检验的基本原理和spss实现方法,熟悉SPSS软件操作和方法。通过检验得出结论的真否,能够更快更简单的检验数据,对数据的检验让我很快的了解该数据的代表性。 六、成绩 七、指导教师 田劲松 附件一、 单个样本统计量 N 均值 标准差 均值的标准误 第一批元件样本电阻值 15 .14200 .002673

第5章spss的参数检验(课后练习参考)

SPSS的参数检验 1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。 步骤:依题目录入数据,采用单样本T检验(原假设H0:u=u0,总体均值与检验值之间不存在显著差异.);菜单选项:分析——比较均值——单样本T检验;指定检验值:在“检验值”后的框中输入检验值(填75),最后“确定”!分析:N=11人的平均值(mean)为,标准差()为,均值标准误差(std error mean)为统计量观测值为,t统计量观测值的双尾概率p-值(sig.(2-tailed))为,六七列是总体均值与原假设值差的95%的置信区间,为,,由此采用双尾检验比较a和p。T统计量观测值的双尾概率p-值(sig.(2-tailed))为>a=所以不能拒绝原假设;且总体均值的95%的置信区间为,,所以均值在~内,75包括在置信区间内,所以经理的话是可信的。 2、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。然而心理学家则倾向于认为提出事实的方式是有关系的。为验证哪种观点更站得住脚,调查者分别以下面两种不同的方式随机访问了足球球迷。 l 方式一:假设你已经买了100元一张的足球票,当你来到足球场门口时,发现票丢了且再也找不到了。球场还有票出售。你会再掏出100元买一张球票吗(1.买 0.不买)。随机访问了200人,其中:92人回答买; l 方式二:你想看足球赛,100元一张票。当你来到足球场买票时,发现丢了100元钱。你口袋中还有钱,此时你还会付100元买一张球票吗(1.买 0.不买)。随机访问了183人,其中:161人回答买; 请恰当建立SPSS数据文件,并利用本章所学习的参数检验方法,说明你更倾向于那种观点,为什么 步骤:菜单选项:分析——比较均值——独立样本T检验;选择若干变量作为检验变量到“检验变量”框(填TD态度);选择代表不同总体的变量(FS方式)作为分组变量到“分组变量”框;定义分组变量的分组情况“定义组”……:(填1,2)。分析:从分析结果上可以

SPSS检验正态分布

下面我们来看一组数据,并检验“期初平均分” 数据是否呈正态分布(此数据已在SPSS里输入好) 在SPSS里执行“分析—>描述统计—>频数统计表”(菜单见下图,英文版的可以找到相应位置),然后弹出左边的对话框,变量选择左边的“期初平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”

设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图, 上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:

检验方法一:看偏度系数和峰度系数 我们把SPSS结果最上面的一个表格拿出来看看(见下图): 偏度系数Skewness=-0.333;峰度系数Kurtosis=0.886;两个系数都小于1,可认为近似于正态分布。 检验方法二:单个样本K-S检验 在SPSS里执行“分析—>非参数检验—>单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。 检验结果为:

从结果可以看出,K-S检验中,Z值为0.493,P值(sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布 检验方法三:Q-Q图检验 在SPSS里执行“图表—>Q-Q图”,弹出对话框,见下图: 变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”,最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见下图。

SPSS的参数检验

第7章 SPSS 的参数检验 7-1 统计推断的基本方法 一、统计推断的概念 1、定义:根据已经收集到的样本数据,推断样本来自的总体的分布或总体均值、方差等总体参数。 2、统计推断的原因 (1)总体数据无法全部收集到 如:企业里面的质量检验 (2)收集总体数据的成本很高 3、两种类型(对于小样本而言) (1)假设总体分布已知——参数检验 (2)总体分布未知——非参数检验 二、统计推断的基本方法 1、步骤 (1)根据推断检验的目标,对待推断的总体参数或分不做一个基本假设H 0 (2)利用收集到的数据和基本假设计算某检验统计量,该统计量服从或近似服从某种统计分布。 (3)根据该统计量得到的相伴概率值,该值是该统计量在某个特定的极端区域取值在H 0 成立时的概率。 (4)做出判断。 2、注意 (1)显著性水平使弃真的概率 (2)比较相伴概率与显著性水平 三、统计推断的基本内容 1、单样本 (1)大样本n ≧50 2 ~(,)X N n σμ, 其中:μ为总体均值,2σ为总体方差,n 为样本容量 当2σ未知时,用样本方差s 2代替2σ 标准化: ~(0,1)X Z N = 同理,μ2~(,)P P N P σ P 为总体成数,n 为样本容量 2(1)p pq p p n n σ-= = 标准化: μ μ~(0,1)p P p Z N σ-== (2)小样本 2σ 已知:~(0,1)Z N = 2σ 未知:0 ~(1)X X t t n μσ-==- 2、两个独立样本 (1)大样本

22~(, )A B A B A B A B X X N n n σσμμ--+ 标准化统计量: ~(0,1)Z N = 如果22,A B σσ未知,则用S 2A ,S 2B 代替 (2)小样本 如果22,A B σσ已知 22~(, )A B A B A B A B X X N n n σσμμ--+ 标准化统计量: (~(0,1)X X Z N = 如果22,A B σσ未知,但要求22A B σσ= ()~(2)A B X X t n n -- S 为S A ,S B 的加权平均 ☆方差比检验 22~(1,1)A A B B S F F n n S =-- 3、配对样本 X A , X B 满足正态分布,但并不要求22,A B σσ相等。 当A B μμ= 配对数据可以看作来自均值为0的总体D: 2~(0,)D N σ 所以,2 ~(0,)d N n σ i i i A B d X X =- 若2 σ未知,则用 221 1()1n d i i S d d n ==--∑代替 0~(1)d t t n S -=- n 为配对数.

spss_数据正态分布检验方法及意义

spss 数据正态分布检验方法及意义判读 要观察某一属性的一组数据是否符合正态分布,可以有两种方法(目前我知道这两种,并且这两种方法只是直观观察,不是定量的正态分布检验): 1:在spss里的基本统计分析功能里的频数统计功能里有对某个变量各个观测值的频数直方图中可以选择绘制正态曲线。具体如下:Analyze-----Descriptive S tatistics-----Frequencies,打开频数统计对话框,在Statistics里可以选择获得各种描述性的统计量,如:均值、方差、分位数、峰度、标准差等各种描述性统计量。在Charts里可以选择显示的图形类型,其中Histograms选项为柱状图也就是我们说的直方图,同时可以选择是否绘制该组数据的正态曲线(With nor ma curve),这样我们可以直观观察该组数据是否大致符合正态分布。如下图: 从上图中可以看出,该组数据基本符合正态分布。 2:正态分布的Q-Q图:在spss里的基本统计分析功能里的探索性分析里面可以通过观察数据的q-q图来判断数据是否服从正态分布。 具体步骤如下:Analyze-----Descriptive Statistics-----Explore打开对话框,选择Plots选项,选择Normality plots with tests选项,可以绘制该组数据的q-q 图。图的横坐标为改变量的观测值,纵坐标为分位数。若该组数据服从正态分布,则图中的点应该靠近图中直线。 纵坐标为分位数,是根据分布函数公式F(x)=i/n+1得出的.i为把一组数从小到大排序后第i个数据的位置,n为样本容量。若该数组服从正态分布则其q-q图应该与理论的q-q图(也就是图中的直线)基本符合。对于理论的标准正态分布,其q-q图为y=x直线。非标准正态分布的斜率为样本标准差,截距为样本均值。 如下图:

假设检验-例题讲解

假设检验 一、单样本总体均值的假设检验 .................................................... 1 二、独立样本两总体均值差的检验 ................................................ 2 三、两匹配样本均值差的检验 ........................................................ 4 四、单一总体比率的检验 ................................................................ 5 五、两总体比率差的假设检验 .. (7) 一、单样本总体均值的假设检验 例题: 某公司生产化妆品,需要严格控制装瓶重量。标准规格为每瓶250 克,标准差为1 克,企业的质检部门每日对此进行抽样检验。某日从生产线上随机抽取16 瓶测重,以95%的保证程度进行总体均值的假设检验。 x t μ-= data6_01 样本化妆品重量 SPSS 操作: (1)打开数据文件,依次选择Analyze (分析)→Compare Means (比较均值)→One Sample T Test (单样本t 检验),将要检验的变量置入Test Variable(s)(检验变量); (2)在Test Value (检验值)框中输入250;点击Options (选项)按钮,在

Confidence Interval(置信区间百分比)后面的框中,输入置信度(系统默认为95%,对应的显著性水平设定为5%,即0.05,若需要改变显著性水平如改为0.01,则在框中输入99 即可); (3)点击Continue(继续)→OK(确定),即可得到如图所示的输出结果。 图中的第2~5 列分别为:计算的检验统计量t 、自由度、双尾检验p-值和样本均值与待检验总体均值的差值。使用SPSS 软件做假设检验的判断规则是:p-值小于设定的显著性水平?时,要拒绝原假设(与教材不同,教材的判断标准是p

spss数据正态分布检验

s p s s数据正态分布检验Newly compiled on November 23, 2020

spss数据正态分布检验

一、Z检验 第一步:录入数据。 1.命名“变量视图”; 2.“数据视图”中输入数据; 第二步:进行分析。 第三步:设置变量; 第四步:得到结果:

二、相关系数检验 在一项研究中,一个学生想检查生活意义和心理健康是否相关。同意参与这项研究的30个学生测量了生活意义和心理健康。生活意义的得分范围是10-70分(更高的得分表示更强的生活意义),心理健康的得分范围是5-35分(更高的得分表示更健康的心理状态)。 在研究中基本的兴趣问题也可以用研究问题的方式表示,例如 例题:生活意义和心理健康相关吗 相关系数数据的例子 ParticipantMeaninginLifeWell-being ParticipantMeaninginLifeWell-being 13519 26527 31419 43535 56534 63334 75435 82028 92512 105821 113018 123725 135119 145025 153029 167031 172512 185520 196131 205325 216032 223512 233528 245020 253924 266834 275628 281912 295635 306035 说明:变量participant包含在数据中,但不用输入SPSS。 在spss中输入数据及分析 步骤1:生成变量 1.打开spss。 2.点击“变量视图”标签。 在spss中将生成两个变量,一个是生活意义,另一个是心理健康。变量分别被命名为meaning和wellbeing。 3.在“变量视图”窗口前两行分别输入变量名称meaning和wellbeing。 步骤2:输入数据 1.点击“数据视图”,变量meaning和wellbeing出现在数据视图前两列。

SPSS 正态性检验方法

正态性检验方法的比较 理论部分 正态分布是许多检验的基础,比如F检验,t检验,卡方检验等在总体不是正太分布是没有任何意义。因此,对一个样本是否来自正态总体的检验是至关重要的。当然,我们无法证明某个数据的确来自正态总体,但如果使用效率高的检验还无法否认总体是正太的检验,我们就没有理由否认那些和正太分布有关的检验有意义,下面我就对正态性检验方法进行简单的归纳和比较。 一、图示法 1. P-P图 以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,以样本值表现为直角坐标系的散点。如果数据服从正态分布,则样本点应围绕第一象限的对角线分布。 2. Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布,则样本点应围绕第一象限的对角线分布。 以上两种方法以Q-Q图为佳,效率较高。 3. 直方图(频率直方图) 判断方法:是否以钟型分布,同时可以选择输出正态性曲线。 4. 箱线图 判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布。 5. 茎叶图 判断方法:观察图形的分布状态,是否是对称分布。

二、偏度、峰度检验法(冒牌K-S 检验法): 1. S ,K 的极限分布 样本偏度系数() 3 32 2B S B =;该系数用于检验对称性,S>0时,分布呈正偏态,S<0时, 分布呈负偏态。 样本峰度系数() 4 2 23B K B = -;该系数用于检验峰态,K>0时为尖峰分布,S<0时为 扁平分布;当S=0,K=0时分布呈正态分布。 0H :F(x)服从正态分布 1H :F(x)不服从正态分布 当原假设为真时,检验统计量 ~N(0,1) ~N (0,1) 对于给定的α, R ||={| >λ?| >λ} 其中14 u α - λ= 2. Jarque-Bera 检验(偏度和峰度的联合分布检验法) 检验统计量为 JB 22164n k S K -??= + ??? ()2 2χ~,JB 过大或过小时,拒绝原假设。 三、非参数检验方法 1. Kolmogorov-Smirnov 正态性检验(基于经验分布函数(ECDF )的检验) ()()0max ||n D F x F x =- ()n F x 表示一组随机样本的累计概率函数,()0F x 表示分布的分布函数。 当原假设为真时,D 的值应较小,若过大,则怀疑原假设,从而,拒绝域为 {}R D d =>。对于给定的α,{}p P D d α=>=,又?{}n n p P D D =≥ 2. Lilliefor 正态性检验 该检验是对Kolmogorov-Smirnov 检验的修正,参数未知 时,由22??,X S μσ==可计算得检验统计量?n D 的值。 3. Shapiro-Wilk(W 检验) 检验统计量:

SPSS中正态分布的检验

一、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 二、计算法 1、偏度系数(Skewness)和峰度系数(Kurtosis) 计算公式: g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U 检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0……可以认为……近似服从正态分布”并不严谨。 2、非参数检验方法 非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk(W 检验)。 SAS中规定:当样本含量n≤2000时,结果以Shapiro – Wilk(W检验)为准,当样本含量n >2000时,结果以Kolmogorov – Smirnov(D检验)为准。 SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3和5000之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro – Wilk适用于样本量3-50之间的数据”的说法是在是理解片面,误人子弟。(2)单样本Kolmogorov-Smirnov检验可用于检验变量(例如income)是否为正态分布。 对于此两种检验,如果P值大于0.05,表明资料服从正态分布。 三、SPSS操作示例 SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作: 1、工具栏--分析—描述性统计—探索性

spss 单样本t检验操作步骤

spss单样本t检验Analyze----compare Means----one sample T test 输入方式 实验数据 12 12 1 2 1 2 3 4 5 6 4 9 5 直接输入数据

Sig=0.000 差异显著

独立样本t检验(两组数据) Analyze-----compare Means----Independent-samples T test 输入方式 试验分组实验数据 1 12 1 13 1 12 1 12 1 1 1 1 2 2 2 2 2 2 2 2 2 两组数据个数可以不同

成组数据t检验 Analyze----compare Means-----paired-samples T test

单因素方差分析 Analyze---compare means----one-way ANOV A(analyze of variance)

Factor (因素)1 1 1 1 1 2 2 2 2 2 2 3 3 3 3(分组) Dependent List 试验数据 polynomial lines contrast---polynomial---Degree---linear post Hoc Multiple comparisons-----LSD(Duncan 邓肯检验) 先选方差齐性在结果中判断Sig 值?<0.05(差异显著)若不齐则进行数据转化。 数据输入 分组试验数据 1 12 1 13 1 13 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 双因素方差分析 Analyze-----General linear Model-----univariate Dependent Variable(因变因素)因别的数字变化而变化 Fixed Factor (固定因素) Random Factors(随机因素) Model-----custom-----Build Term---Interaction(交互作用)----Main effects(主因素) Contrast--- simple---first----change Plot Hoc----LSD (Duncan)

北科SPSS软件应用练习题全新

Spss第 3 次作业 方差分析练习题: 第1题 (1)【实验目的】 学会单因素方差分析 (2)【实验内容】 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从尚无推销经验的应聘人员中随机挑选一部分,并随机将他们分为五个组,每种用一种推销方 第一组20 16.8 17.9 21.2 23.9 26.8 22.4 第二组24.9 21.3 22.6 30.2 29.9 22.5 20.7 第三组16.0 20.1 17.3 20.9 22.0 26.8 20.8 第四组17.5 18.2 20.2 17.7 19.1 18.4 16.5 第五组25.2 26.2 26.9 29.3 30.4 29.7 28.2 (2)绘制各组的均值比对图,并利用LSD方法进行剁成比较检验。 (3)【操作步骤】 在数据编辑窗口输入组别和推销额→分析→比较平均值→单因素ANOVA检验→将“推销额”转入“因变量列表”→将“组别”转入“因子”→确定 分析→一般线性模型→单变量→将“推销额”转入“因变量”→将“组别”转入“固定因子”→事后比较→将“组别”转入“下列各项的事后检验”→选中“LSD”→继续→确定

(4)【输出结果】 ANOVA VAR00002 平方和自由度均方 F 显著性 组间405.534 4 101.384 11.276 .000 组内269.737 30 8.991 总计675.271 34 主体间因子 个案数 VAR00001 1.00 7 2.00 7 3.00 7 4.00 7 5.00 7

主体间效应检验因变量: VAR00002 源III 类平方 和自由度均方 F 显著性 修正模型405.534a 4 101.384 11.276 .000 截距17763.779 1 17763.779 1975.677 .000 VAR00001 405.534 4 101.384 11.276 .000 误差269.737 30 8.991 总计18439.050 35 修正后总计675.271 34 a. R 方 = .601(调整后 R 方 = .547)

spss统计学正态性检验教程

正态分布的检验 数据的正态分布是通过Analyze -> Descriptive Statistics -> Explore来实现的,同时该命令也可以检查异常值和极值,和进行方差齐性检验(方差齐性,本节不介绍)。 打开文件data0201-protein.sav,如下图,50种树叶中粗蛋白占干重的比例, 如果检验变量protein的正态性,按Analyze -> Descriptive Statistics -> Explore打开如下对话框, 把要检验的变量送入Dependent List框(可同时检验多个变量),Factor List框是分组变量(本例中无分组变量),Label Cases by框指定一个变量作为标识变量(可忽略),Display栏指定要输出的是统计量或统计图,或同时输出。 点击Statistics按钮,打开如下左对话框,选择要输出的统计量,选项Descriptives:描述统计量,选项M-estimators:集中趋势最大似然比(可忽略),选项outliers:5个最大值和最小值,选项Percentiles:第5、10、25、50、75、90、95百分位数,点击continue回到Explore对话框, 点击Plots,打开如上右对话框,Boxplots框选择箱状图的格式,选项None:不输出箱状图,选项Factor levels together:变量按分组生成箱状图,并列输出(本

例未分组),选项Dependents together:在一个图形中生成所有变量箱状图(本例只有一个变量),Descriptive框选择输出图形的类型;选项stem-and-leaf:茎叶图,选项Histogram:直方图;Normality plots with tests栏,输出正态概率和无趋势概率图,以及统计检验结果;Spread vs Level with Levene Test栏各选项与方差齐性检验有关,本节不介绍(只有选择分组变量时,才被激活)。点击Continue,回到Explore对话框, 点击Options打开如下对话框,选择缺失值(或无效值)的处理方式(本例无缺失值),选项Exclude cases listwise:剔除所有缺失值;选项Exclude cases pairwise:成对剔除缺失值;选项Report values:将缺失值单独分为一组,放在频数表中,点击Continue, 回到Explore对话框,点击OK,输出结果,类似如下几个图, 输出有效值和缺失值, 输出平均数等各统计量,也包括数据分布的偏度和峰度, 输出5个最大值和最小值,

相关主题
文本预览
相关文档 最新文档