SPSS实验报告
一.实验目的
1. 掌握SPSS 的基本操作,能够熟练应用SPSS 进行基本的统计分析。
2. 在用SPSS 对具体实例进行分析的基础上能对结果进行正确的解释。
3. 在对SPSS 基本操作熟练的情况下,进一步自学SPSS 更强大的分析能。二.实验要求
1. 掌握如何通过 SPSS 进行数据的获取和管理,包括数据的录入,保存,读取,转化,增加,删除;数据集的合并,拆分,排序。
2. 了解描述性统计的作用,并掌握其 SPSS 的实现(频数,均值,标准差,中位数,众数,极差)。
3. 应用 SPSS 生成表格和图形,并对表格和图形进行简单的编辑和分析。
4. 应用 SPSS 做一些探索性分析(如方差分析,相关分析)
三.实验内容
(一).问题的提出
对不同广告方式和不同地区对某商品销售额影响进行分析。
在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的销售额数据,分析广告形式和地区是否影响商品销售额。
自变量为广告方式(X1)和地区(X2),因变量为销售额(Y)。
涉及地区18个,每个地区抽取样本8个,共有案例144个。
具体数据如下:
X1 X2 Y
1.00 1.00 75.00
2.00 1.00 69.00
4.00 1.00 63.00
3.00 1.00 52.00
1.00
2.00 57.00
2.00 2.00 51.00
4.00 2.00 67.00
3.00 2.00 61.00
1.00 3.00 76.00
2.00
3.00 100.00
4.00 3.00 8
5.00
3.00 3.00 61.00
1.00 4.00 77.00
2.00 4.00 90.00
4.00 4.00 80.00
3.00
4.00 76.00
1.00 5.00 75.00
2.00 5.00 77.00
4.00
5.00 87.00
3.00 5.00 57.00
2.00 6.00 60.00 4.00 6.00 62.00
3.00 6.00 52.00
1.00 7.00 76.00
2.00 7.00 3
3.00
4.00 7.00 70.00 3.00 7.00 33.00
1.00 8.00 81.00
2.00 8.00 79.00 4.00 8.00 75.00
3.00 8.00 69.00
1.00 9.00 63.00
2.00 9.00 7
3.00
4.00 9.00 40.00 3.00 9.00 60.00
1.00 10.00 94.00
2.00 10.00 100.00 4.00 10.00 64.00
3.00 10.00 61.00
1.00 11.00 54.00
2.00 11.00 61.00 4.00 11.00 40.00
1.00 1
2.00 70.00
2.00 12.00 68.00 4.00 12.00 67.00
3.00 12.00 66.00
1.00 13.00 87.00
2.00 1
3.00 68.00
4.00 13.00 51.00 3.00 11.00 41.00 3.00 13.00 6
5.00
1.00 14.00 65.00
2.00 14.00 6
3.00
4.00 14.00 61.00 3.00 14.00 58.00
1.00 15.00 65.00
2.00 15.00 8
3.00
4.00 1
5.00 75.00 3.00 15.00 50.00
1.00 16.00 79.00
2.00 16.00 76.00 4.00 16.00 64.00
3.00 16.00 4
4.00
2.00 17.00 7
3.00
4.00 17.00 50.00 3.00 17.00 4
5.00
1.00 18.00 75.00
2.00 18.00 74.00 4.00 18.00 62.00
3.00 18.00 58.00
1.00 1.00 68.00
2.00 1.00 54.00 4.00 1.00 58.00
3.00 1.00 41.00
1.00
2.00 75.00
2.00 2.00 78.00 4.00 2.00 82.00
3.00 2.00 4
4.00
1.00 3.00 83.00
2.00
3.00 79.00
4.00 3.00 78.00 3.00 3.00 86.00
1.00 4.00 66.00
2.00 4.00 8
3.00
4.00 4.00 87.00 3.00 4.00 7
5.00
1.00 5.00 66.00
2.00 5.00 74.00 4.00 5.00 70.00
3.00 5.00 75.00
1.00 6.00 76.00
2.00 6.00 69.00 4.00 6.00 77.00
3.00 6.00 63.00
1.00 7.00 70.00
2.00 7.00 68.00 4.00 7.00 68.00
3.00 7.00 52.00
1.00 8.00 86.00
2.00 8.00 75.00 4.00 8.00 61.00
3.00 8.00 61.00
1.00 9.00 6
2.00
2.00 9.00 65.00 4.00 9.00 55.00
3.00 9.00 43.00
2.00 10.00 70.00
4.00 10.00 76.00
3.00 10.00 69.00
1.00 11.00 56.00
2.00 11.00 5
3.00
4.00 11.00 70.00
3.00 11.00 43.00
1.00 1
2.00 86.00
2.00 12.00 7
3.00
4.00 12.00 77.00
3.00 12.00 51.00
1.00 13.00 84.00
2.00 1
3.00 79.00
4.00 13.00 42.00
3.00 13.00 60.00
1.00 14.00 77.00
2.00 14.00 66.00
4.00 14.00 71.00
3.00 1
4.00 52.00
1.00 15.00 78.00
2.00 15.00 65.00
4.00 1
5.00 65.00
3.00 15.00 55.00
1.00 16.00 80.00
2.00 16.00 81.00
4.00 16.00 78.00
3.00 16.00 52.00
1.00 17.00 6
2.00
2.00 17.00 57.00
4.00 17.00 37.00
3.00 17.00 45.00
1.00 18.00 70.00
2.00 18.00 65.00
4.00 18.00 83.00
3.00 18.00 60.00
X1一列中,1表示报纸,2表示广播,3表示宣传品,4表示体验。X2一列中1—18表示不同地区。
(二).数据的整理
1.建立数据文件
当启动SPSS后,系统首先显示一个提示窗口,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。
2.定义变量
在数据编辑窗口左下角激活(Variable View)变量定义窗口,在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。
定义好变量如下图:
3.输入数据
变量定义完成后,在编辑区选择栏里单击“Data View”,编辑显示区显示为数据编辑。在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。
4.对数据进行预处理
按照X1对数据进行排序,排序方式为升序,具体操作如下:
(1)选择菜单:【data】→【sort cases】
(2)指定排序变量“广告形式”到【sort by】框中,并选择【sort order】中的Ascending,即升序排列。
从排序后的数据可以看出,广告形式为1的商品平均销售额高于其他三种广告形式,但是销售额最大值都出现在广告形式为2的时候。如图。
(三).商品销售额的频数分析
1.频数分析 (Descriptive Statistics - Frequencies)
频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。现在我们对商品销售额进行频数分析
在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项。从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。
在这里我们选“销售额”变量进入“Variable(s):”框。
Display frequency tables,选中显示。
单击“Statistics”按钮,打开下图所示的对话框,该对话框用于选择统计量:
① 选择百分位显示“Percentiles Values”栏:
Cut points for 10 equal groups:将数据平分为输入的10个等份。
② 选择变异程度的统计量“Dispersion”:(离散趋势)
Std.deviation 标准差
③ 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)
Mean 均值
点击continue 。单击“Charts”按钮:
选择Histograms:输出柱状图。
选中“√With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。
点击continue 。单击“Format”按钮,设置频数表格式:
选择Ascending values:按变量值的升序排列。Compare variables 选项,所有变量在一个图形中输出,以便进行比较。设置在频数表中显示的组数,默认为10组。
点击continue 。再点击ok。在Output中得到以下分析结果。
由以上分析结果可以知道销售额均值为66.82,标准差为13.528.
由正态分布图可以看出销售额在60到80之间的较多。
2. 列联表分析(Crosstabs)
在菜单选中“Analyze-Descriptive- Crosstabs”命令,在弹出的对话框中,将广告形式(X1)、地区(X2)选作行变量,销售额(Y)选作列变量。如下图:
点击“Statistics”按钮,出现下图:
选中Chi-Square: 卡方检验,及Correlations: 选中输出皮尔森(Pearson)和Spearman 相关系数,用以说明行变量和列变量的相关程度。
单击“Cells”按钮,选择Observed: 观测频数、Expected: 期望频数、Round cell counts: 临近列计算。
单击Format按钮,选择Ascending: 行变量从小到大升序排列。
单击“Exact”按钮,选择Asymptotic only 近似的,系统设置。
设置完成后,在列联表分析对话框中,点击OK 按钮。输出内容如下:
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 186.940a144 .009 Likelihood Ratio 197.467 144 .002 Linear-by-Linear Association 11.482 1 .001 N of Valid Cases 144
a. 196 cells (100.0%) have expected count less than 5. The minimum expected count is .25.
Symmetric Measures
Value Asymp. Std.
Error a Approx. T b Approx. Sig.
Interval by Interval Pearson's R -.283 .070 -3.521 .001c Ordinal by Ordinal Spearman Correlation -.277 .079 -3.431 .001c N of Valid Cases 144
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation.
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 822.114a816 .434 Likelihood Ratio 495.271 816 1.000 Linear-by-Linear Association 2.972 1 .085 N of Valid Cases 144
a. 882 cells (100.0%) have expected count less than 5. The minimum expected count is .06.
Symmetric Measures
Value Asymp. Std.
Error a Approx. T b Approx. Sig.
Interval by Interval Pearson's R -.144 .079 -1.736 .085c Ordinal by Ordinal Spearman Correlation -.150 .083 -1.810 .072c N of Valid Cases 144
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation.
下面用方差分析更好的来说明广告形式、地区对销售额的影响,
(四).单因素方差分析
以商品销售额为观测变量,广告形式和地区为控制变量,通过单因素方差分析
方法分别对广告形式、地区对销售额的影响进行分析。
两个单因素方差分析的原假设分别设为:
不同广告形式没有对销售额产生显著影响(即不同广告形式对销售额的效应同
时为0);
不同地区的销售额没有显著差异(即不同地区对销售额的效应同时为0)
操作步骤如下:
1.选择菜单【analyze】→【compare means】→【one-way ANOVA】.
2.选择观测变量“销售额”到【dependent list】框,选择“广告形式”到【factor】
框中,于是出现如图所示的窗口。
SPSS计算出组间方差、组内方差、F统计量以及对应的概率P值,完成单因素方差分析的相关计算,并将计算结果输出到SPSS输出窗口中。分析结果如下图所示。
广告形式对销售额的单因素方差分析结果
从广告形式对销售额的单因素方差分析结果可以看到:观测变量销售额的离差平方和为26169.306;如果仅考虑广告形式单个因素的影响,则销售额总变差中,不同广告形式可解释的变差为5866.083,抽样误差引起的变差为20303.222,它们的方差分别为1955.361和145.023;所得到的F统计量的观测值为13.483,对应的概率P值近似为0.由于概率值P小于显著性水平0.05,则应该拒绝原假设,认为不同广告形式对销售额产生了显著影响。
地区对销售额的单因素方差分析结果
从地区对销售额的单因素方差分析结果可以看到,如果仅考虑地区单个因素的影响,则销售额总变差(26169.306)中不同地区可解释的变差为9265.306,抽样误差引起的变差为16904.,它们的方差分别为545.018和134.159,所得到的F统计量为4.062,对应的概率P值近似为0.由于概率P值小于显著性水平0.05,所以应该拒绝原假设,认为不同地区对销售额产生了显著影响。
同时对比这两个图容易发现:如果从单因素的角度考虑,广告形式对销售额的影响较地区来讲更明显。
(五).多重比较检验
在上述单因素方差分析中,发现不同广告形式对产品销售额有显著影响,不同地区的产品销售额存在显著差异,为了进一步研究哪种广告形式的作用比较明显,哪种不明显,对变量进行多重比较检验。
具体操作步骤如下:
1.选择菜单【analyze】→【compare means】→【one-way ANOV A】.
在上面这个窗口选择。出现下面窗口:
点击continue。回到原窗口,在点击OK。在Output1中出现一下分析结果:广告形式中的1,2,3,4分别代表报纸,广播,宣传品,体验。
Multiple Comparisons
Dependent Variable:销售额
(I) 广告形式(J) 广告
形式
Mean Difference
(I-J) Std. Error Sig.
95% Confidence Interval
Lower Bound Upper Bound