当前位置：文档之家› 应用统计学(贾俊平版)综合复习提纲

应用统计学(贾俊平版)综合复习提纲

应用统计学复习提纲梦翔儿https://www.doczj.com/doc/5814099174.html,

1. 统计学：收集处理分析解释数据并从数据中得出结论的科学。

2. 描述统计：研究数据收集处理汇总图表描述概括与分析等统计方

法。

3. 推断统计：研究如何利用样本数据来推断总体特征的统计方法。

4. 分类数据：只能归于某一类别的非数字型数据。

5. 顺序数据：只能归于某一有序类别的非数字型数据。

6. 数值型数据：按数字尺度测量的观察值。

7. 观测数据：通过调查或观测而收集到的数据。

8. 实验数据：在实验中控制实验对象而收集到的数据。

9. 截面数据：在相同或近似相同的时间点上收集的数据。

10. 时间序列数据：在不同时间上收集到的数据，这类数据按时间顺序

收集到的。

11. 抽样调查：从总体中随机抽取一部分单位作为样本进行调查，根据

样本调查结果来推断总体特征的数据收集方法。

12. 普查：为特定目的而专门组织的全面调查。

13. 总体：包含所研究的全部个体（数据）的集合。

14. 样本：从总体中抽取的一部分元素的集合。

15. 样本容量：也称样本量，是构成样本的元素数目。

16. 参数：用来描述总体特征的概括性数字度量。

17. 统计量：用来描述样本特征的概括性数字度量。

18. 变量：说明现象某种特征的概念。

19. 分类变量：说明事物类别的一个名称。

20. 顺序变量：说明事物有序类别的一个名称。

21. 数值型变量：说明事物数字特征的一个名称。

22. 离散型变量：只能取可数值的变量。

25. 实验数据：通过实验方法获得的数据

26. 概率抽样：随机抽样，遵循随机原则进行的抽样，总体中每个单位

都有一定的机会被选入样本。

27. 非概率抽样：不随机，根据研究目的对数据的要求，采用某种方式

从总体中抽出部分单位对其实施调查。

28. 简单随机抽样：从包括总体的N个单位的抽样框中随机，一个个抽

取n个单位作为样本，每单位等概论。

29. 抽样框：用于抽选样本的总体单位信息，是概率抽样中所不可缺

30. 分层抽样：将抽样单位按某种特征或某种规则划分为不同的层，然

后从不同层中独立、随机地抽取样本。

31. 整群抽样：总体中若干单位合并为组，群，抽样时直接抽取群，然

后对中选群中的所有单位全部实施调查。

32. 系统抽样：总体中所有单位按顺序排列，在规定范围内随机抽取一

单位作为初始单位，然后按事先规则确定其它样本单位。

33. 多阶段抽样：首先抽取群，再进一步抽样，从选中的群中抽取出若

干个单位进行计查，二阶段抽样。

34. 方便抽样：依据方便原则，自行确定入抽样本的单位。

35. 判段抽样：研究人员根据经验，判断研究对象的了解，有目的选择

一些单位作为样本。

36. 自愿样本：被调查者自愿参加，成为样本中一分子，向调查人员提

供有关信息

37. 滚雪球抽样：对稀少群体调查中，首选选择一组调查单位，调查后，

请他们提供另外属于研究总体的调查对象，调查人员根据所提供的线索，进行此后调查。

38. 配额抽样：将总体中所有单位按一定的标志分若干类，然后每类采

用方便抽样或判断抽样的方案选取样本单位。

39. 自填式：没有调查员协助，被调查者自已填写，完成调查问卷。

40. 面访式：面对面，调查员提问，被调查者回答。

41. 电话式：打电话方式调查。

42. 抽样误差：由于抽样的随机性引起的样本结果与总体真值之的误

差。

43. 非抽样误差：相对抽样误差而言，除抽样误差之外的，由于其它原

因引起的样本观察结果与总体真值之间的差异。

44. 抽样框误差：统计推论的错误是由于抽样框不完善造成的45. 频数：落在某一特定类别或组中的数据个数。

46. 频数分布：各个类别及其相应的频数形成的分布。

47. 比例：一个样本（或总体）中各个部分的数据占全部数据比值。

48. 比率：一个样本（或总体）中各不同类别数据之间的比值。

49. 累积频数：将各有序类别或组的频数逐级累加起来得到的频数。

50. 累积频率或累积百分比：将有序类别或组百分比逐级累加起来。

51. 数据分组：根据统计研究需要，将原始数据按某种标准化分成不同

的组别，。

52. 组距是一个组的上限与下限的差

53. 组距分组是将全部变量依次划分为若干个区间，将这一区间的变量

值作为一组。

54. 等距分组，在组距分组时，如果各组的组距相等。

55. 组中值＝下限值+上限值/2 上下限的中间值

56. 直方图：用矩形的宽度和高度（即面积）来表示频数分布的图形。

57. 茎叶图：由茎和叶两部分组成的、反应原始数据分布的图形。

58. 箱线图：由一组数据的最大值、最小值、中位数和两个四分位数5

个特征值绘制而成的、反应原始数据分布图形。

心点的位置所在。

60. 众数：一组数据中出现频数最多的数值

61. 中位数：一组数据排序后处于中间位置上的数值。

62. 四分位数：一组数据排序后处在25%和75%位置上的数值。

63. 平均数：又称均值，是全部数据的算术平均值

64. 简单平均数：未经分组数据计算的平均数称为简单平均数。根据分

组。。。加权平均数。

65. 几何平均数：是n个变量值乘积的n次方根。常用于比例数据的平

均。

66. 异众比率：指非众数组的频数占总频数的比例.

67. 四分位差：75%位置上的四分位数与25%位置上的四分位数之差。顺

序数据。

68. 极差：也称全距，一组数据的最大值与最小值之差。

69. 平均差：也称平均绝对离差，它是各变量值与其平均数离差的绝对

值的平均数。

70. 方差：各数据与其平均数离差平方的平均数。

71. 标准差：方差的平方根。

72. 标准分数：也称标准化值或 z 分数，某个数据与其平均数的离差

除以标准差后的值。

73. 离散系数：一组数据的标准差与其相应的平均数之比。

74. 偏态：对数据分布对称性的测度。测度偏态的统计量偏态系数。

75. 偏态系数：对数据分布不对称性的度量值。

76. 峰态：对数据分布平峰或尖峰程度的测度，测度峰态的统计量则是

峰态系数。

件，也叫偶然事件

79. 必然事件：在同一组条件下，每次试验一定出现的事件。

80. 不可能事件：在同一组条件下，每次试验一定不出现的事件。

81. 基本事件：如果一个事件不能分解成两个或更多个事件，则这个事

件称为基本事件。

82. 概率：对事件发生的可能性大小的度量值。

83. 主观概率：对一些无法重复的试验，确定其结果的概率只能根据经

验，人为确定这个事件的概率。

84. 条件概率：当某事件B已发生，求事件A发生的概率，称为事件B

发生条件下事件A发生的条件概率。

85. 独立事件：两个事件中不论哪一个事件发生与否并不影响另一个事

件发生的概率。

86. 随机变量：事先不能确定其取值的变量。

87. 离散型随机变量：只能取有限个值的随机变量。

88. 连续型随机变量：可以取一个或多个区间中任何值的随机变量。

89. 期望值、数学期望：随机变量的平均取值，各可能值与对应概率乘

积之和。

90. 方差：随机变量的每一取值与期望值的离差平方的期望值。 91. 泊松分布：用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的个数的分布。 92. 概率密度函数：对连续型随机变量用函数f(x)来表示。大于等于0全积分为1 94. 充分统计量：统计量加工过程中一点信息都不损失的统计量通常称

为充分统计量。

95. 抽样分布：样本统计量的概率分布，是由样本统计量的所有可能取

值形成相对频数分布。

96. 渐近分布：当n 比较大时，用极限分布作为抽样分布的一种近似，

这种极限分布常称为

99. 估计值：估计总体参数时计算出来的估计量的具体数值

100. 点估计：用样本估计量的取值直接作为总体参数θ的估计值

101. 区间估计：在点估计的基础上，给出总体参数估计的一个估计区间，该区间通常由样本统计量加减估计误差组成

102. 置信区间：由样本统计量构造出的总体参数在一定置信水平下的估计区间。

103. 置信水平：也称为置信度或置信系数，在重复构造的总体参数的多个置信区间中包含总体参数真值的次数所占的比例。

104. 无偏性：估计量抽样分布的期望值等于被估计的总体参数

105. 有效性：对同一总体参数的两个无偏估计量，有更小标准差的估计量更有效。

106. 一致性：随着样本量的增大，估计量的值越来越接近总体参数。 107. 独立样本：一个样本中的元素与另一个样本中的元素相互独立。

108. 匹配样本：又称配对数据，一个样本中的数据与另一个样本中的数据相对应。

设是否成立的过程。

110. 原假设：也称零假设，是研究者想收集证据予以反对的假设，用0

H 表示。 111. 备择假设：也称研究假设，是研究者想收集证据予以支持的假设，用1H 或a H 表示。

112. 第Ⅰ类错误：原假设正确时拒绝原假设，犯第Ⅰ类错误概率记α。 113. 第Ⅱ类错误：当原假设为错误时没有拒绝原假设，犯第Ⅱ类错误的概率通常记为β。

114. 显著性水平：假设检验中发生第Ⅰ类错误的概率，记为α。 115. 小概率原理：进行假设检验利用，指发生概率很小的随机事件在一次试验中是几乎不可能发生的。

116. 检验统计量：根据样本观测结果计算得到的，并据以对原假设和备择假设做出决策的某个样本统计量 117. 拒绝域：能够拒绝原假设的检验统计量的所有可能取值的集合。

118. 临界值：根据给定的显著性水平确定的拒绝域的边界值。

119. P 值：也称观察到的显著性水平，如果原假设0

H 是正确的，那么所得的样本结果出现实际观测结果或更极端结果出现的概率。P 值很小说明发生概率很小，拒绝原假设，P 越小，拒绝原假设的理由就越充分。双侧P<0.025 单侧p<0.05 拒绝原假设。

120. 单侧检验：也称单尾检验，是指备择假设具有特定的方向性，并含有符号“>”或“<”的假设检验。 121. 双侧检验：也称双尾检验，是指备择假设没有特定的方向性，并含有符号“≠”的假设检验。 123. 条件分布、频数：列联表中的观察值分布称为条件分布，每个具体

观察值就是条件频数。

124. 拟合优度检验：如果样本是从总体的不同类别中分别抽取，研究目的是对不同类别的目标量之间是否存在显著性差异进行检验，我们就把它称为拟合优度检验或一致性检验。

125. 独立性检验：判断两个分类变量之间是否存在联系的问题，两组或

多组的资料是否相互关联，如果不关联，就称为独立。这类问题的值型因变量是否有显著影响。

127. 因素：也称因子，是方差分析中所要检验的对象。 128. 处理：因素的不同表现称为水平或处理 129. 组内误差：来自水平内部的数据误差。

130. 组间误差：来自不同水平之间的数据误差。

131. 总平方和：反映全部数据误差大小的平方和，记为SST 。自变量效

应加残差效应。n-1

132. 组内平方和：反映组内误差大小的平方和，记为SSE 。残差变量，

残差效应;n-k 133. 组间平方和：反映组间误差大小的平方和，记为SSA 。自变量效应或因子效应;k-1 134. 单因素方差分析：只涉及一个分类型自变量的方差分析。

135. 组内方差：组内平方和除以相应的自由度。 136. 组间方差：组间平方和除以相应的自由度。

137. 双因素方差分析：方差分析中涉及两个分类型自变量时，称为~ 138. 试验：收集样本数据的过程

139. 试验设计：收集样本数据的计划 140. 完全随机化设计：将k 种处理随机地指派给试验单元的设计。 141. 处理指可控制的因素的各个水平

142. 试验单元：接受处理的对象或实体称为试验单元或抽样单元。 143. 随机化区组设计：先按一定规则将试验单元划分为若干同质组，区

组，然后再将各种处理随机地指派给各个区组。当变量x 取某数值时，y 依确定关系取相应的值，则称y 是x 的函数，记为y=f(x). 146. 相关关系：变量之间存在的不确定的数量关系。

147. 相关分析：分析变量之间是否存在相关关系，明确其相关关系的类

型，计算其相关关系的密切程度的统计分析方法

148. 相关系数：是根据样本数据计算的度量两个变量之间线性关系强度

的统计量。 149. 回归模型：描述因变量y 如何依赖于自变量x 和误差项ε的方程。

150. 回归方程：描述因变量y 的期望值如何依赖于自变量x 的方程。

151. 估计的回归方程：用样本统计量代替回归方程中的未知参数，根据

样本数据求出的回归方程的估计。

152. 因变量、自变量：被预测或被解释的变量称为因变量，用来预测或用来解释因变量的一个或多个变量称为自变量。

153. 最小二乘法：也称最小平方法，使因变量的观察值i y 与估计值i

?之间的离差平方和达到最小来求得0?β和1?

β的方法。 154. 回归平方和：y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分，它是可以由回归直线来解释的yi 变差部分。 155. 残差平方和：除了x 对y 的线性影响之外的其它因素对y 变差的作用，是不能由回归直线解释的yi 的变差部分。 156. 判定系数：回归平方和占总平方和的比例，记为2

R 157. 估计量的标准误差：均方残差（MSE ）的平方根，用e s 来表示。实

际意义反映了用估计的回归方程预测因变量y 时的预测误差的大小。越小，各观测点的代表性就越好，预测越准确，从另一个角度

说明了回归直线的拟合优度。

158. 平均值的点估计：利用估计的回归方程，对于x 的一个特定值0x ，求出y 的平均值的一个估计值)(0y E 。 159. 个别值的估计值：利用估计的回归方程，对于x 的一个特定值0

x ，

求出y 的一个个别值的估计值0

。 160. 平均值的置信区间估计：对x 的一个给定值0x ，求出y 的平均值

的区间估计。 161. 个别值的预测区间估计：对x 的一个给定值0x ，求出y 的一个个别值的区间估计。

162. 残差：因变量的观测值yi 与根据估计的回归方程求出的预测值yi^之差，用e 表示。

163. 标准化残差：残差除以它的标准差后得到的数值用Ze 表示。

164. 异常值：在散点图中，如果某一个点与其它点所呈现的趋势不相吻

合

165. 有影响的观测值：如果某一个点或某一些观测值对回归的结果有强烈的影响，那么该观测值或这些观测值就是~

166. 多元线性回归模型：描述因变量y 如何依赖于自变量k x x x ，，， 21和误差项的方程。 167. 多元线性回归方程：描述y 的期望值如何依赖于k

x x x ，，， 21的方程。 168. 估计的多元线性回归方程：根据样本数据得到的多元线性回归方程的估计。 169. 多重判定系数：在多元回归中，回归平方和占总平方和的比例。 170. 修正的多重判定系数：用模型中自变量的个数和样本量进行调整的多重判定系数，记为2a R 。

171. 多重共线性：当回归模型中两个或两个以上的变量彼此相关时，则

称回归模型中存在~

172. 虚拟变量：变量的取值本身用文字来描述，要把它们放进回归模型，

必须先将其文字型数据用数字代码来表示，这种代码化的定性自变

174. 平稳序列：基本上不存在趋势的序列。 175. 非平稳序列：包含趋势性、季节性或周期性的序列。 176. 趋势：也称长期趋势，指时间序列在长时期内呈现出某种持续向上或持续下降的变动。 177. 季节性：季节变动，是指时间序列在一年内重复出现的周期性波动。 178. 周期性：循环波动，是指时间序列中呈现出的围绕长期趋势的一种波浪形或振荡式变动。 179. 随机性：不规则波动，是指时间序列中除去趋势、周期性和季节性之后的偶然性波动。 180. 增长率：也称增长速度，是指时间序列中报告期观察值与基期观察值之比减1后的结果，用%表示。 181. 环比增长率：报告期观察值与前一时期观察值之比减1，说明现象逐期增长变化的程度。 182. 定基增长率：报告期观察值与某一固定时期观察值之比减1，说明现象在整个观察期内总的增长变化程度。 183. 平均增长率：也称平均发展速度，是指时间序列中各逐期环比值（也称环比发展速度）的几何平均数减1后结果。 184. 增长1%绝对值：增长率每增长一个百分点而增加的绝对数量。 185. 简单平均法预测：根据过去已有的t 期观察值通过简单平均来预测下一期的数值。

186. 移动平均法预测：通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。

187. 指数平滑法预测：对过去的观察值加权平均进行预测的一种方法，该方法使得第t ＋1期的预测值等于t 期的实际观察值与第t 期指数预测值的加权平均值。

188. 线性趋势：指现象随着时间的推移而呈现稳定增长或下降的线性变化规律。

189. 指数曲线：描述以几何级数递增或递减的现象即时间序列的观察值按指数规律变化或说时间序列逐期观察值按一定增长率增长衰减。 190. 在一般指数曲线的基础上增加一个常数K,初期增长迅速，随后增长率逐渐降低，最终以K 为增长极限。 192. 加权综合指数：通过加权来测定一组商品价格的综合变动状况的指

数。

193. 拉氏价格指数：

计算综合指数时，把作为权数的销售量固定在基期。单纯反映价格的变动水平，不能反映出消费结构的变化。 194. 帕氏价格指数：把作为权数的销售量固定在报告期，不同时期的指

数缺乏可比性，可以同时反映出价格和消费结构的变化。 195. 加权平均指数：以某一时期的价值总量为权数对个体指数加权平均计算的指数。 196. 零售价格指数：反映城乡商品零售价格变动趋势的一种经济指数。 197. 消费价格指数：反映一定时期内城乡居民所购买的生活消费品价格

和服务项目价格的变动趋势和程度一种相对数。 198. 股票价格指数：是反映某一股票市场上多种股票价格变动趋势的一

种相对数。

199. 间接来源：统计数据的间接来源：如果与研究内容有关的原信息已

存在，我们只是对这些原信息重新加工整理，使之成为我们进行统

计分析可以使用的数据，则我们把它们称为间接来源的数据。

二手数据的特点：搜集比较容易，采集数据成本低，能很快得到。局限性不是为特定研究问题产生有欠缺，需要评估。、

二手数据的评估：谁收集，目的，怎么搜集，什么时侯收集？

概率抽样与非概率抽样比较：性质不同，非概不依据随机原则选样本，样本统计量分布不确切，无法使用样本的结果对总体相应参数进行推断。

操作简便，时效快，成本低，专业要求不很高。概率抽样依据随机原则抽选样本，理论分布存在，对总体有关参数可进行估计，计算估计误差，

得到总体参数的置信区间。提出精度要求。

数据收集方法的选择：抽样框中有关信息，目标总体特征，调查问题的

内容，有形辅助物的使用，实施调查的资源，管理与控制，质量要求

实验中的若干问题：人的意愿，心理问题，道德问题

回答误差：理解误差，记忆误差，有意识误差

误差的控制：抽样误差是抽样随机性带来的，不可避免可以计算，改大样本量。选择合适改进的抽样框，设计好的调查问卷，调查过程的质量控制。

抽样误差因素：样本量大小，总体变异性大大抽样方式选组织形式

数据审核的目的：检查数据是否有错误，原始数据完整性准确性，二手适用性时效性。

数据筛选的目的：根据需要找出符合特定条件的某类数据。

数据排序是按一定的顺序将数据排列，以便研究者通过浏览数据发现一些明显的特征或趋势，找到解决问题的线索。

数据透视表作用：可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图，形成一个符合需要的交叉表

数据分布表的制作步骤：确定组数，确定组距，根据分组整理成频数分布表，上组限不在内不重不漏

直方图与条形图的差别：首先条形图是用条形的长度表示各类别频数的多少，宽度是固定的；直方图用面积表示各组频数的多少，矩形的高度

表示每一组的频数或频率，宽度则表示各组的组距，高宽均有意义。其次由于分组数据具有连续性，直方图的各矩形通常是连续排列，而条形

图则是分开排列。最后条形图主要用于展示分类数据，直方图主要用于展示数值型数据。

茎叶图与直方图的区别：茎叶图既能给出数据的分布情况，又能保留原

始数据的信息。直方图通常适用于批量数据，茎叶图小批量数据。饼图与环形图差别：环形图中空洞，样本或总体中每一部分用环中的一

段表示。饼图只能显示一个样本或总体各部分所占的比例，环形图可以同时绘制多个，有利比较研究。

好图形具备特征：显示数据，读者注意集中图形内容，避免歪曲，强调

数据之间比较，服务明确目的，对图形统计描述与文字说明。图形优劣准则：好图应当使复杂的观点简明、确切、高效阐述，最短时

间内以最少的笔墨给读者提大信息，多维，表述数据真实情况。制作统计表设计注意：合理安排表结构，包括表号总标题单位，上下两

横线粗，中间细，必要注释、来源。

众数的特点：不受极端值影响，分布角度上看是具有明显集中趋势点的数值，众数可能不存在也可能有多个。

众数、中位数和平均数的关系：从分布角度看，众数M0是最高峰值，中位数Me是数据中间位置上值，平均数是全部数据的算术平均。左偏X

众数、中位数和平均数的特点与应用场合：众数是一组数据的峰值，不受极端值影响，缺点是不唯一，在数据量较多时才有意义，数据量少时不宜，主要作分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值，不受极端影响，数据分布偏斜程度较大时，中位数好，主要适合作顺序数据的集中趋势测度值。平均数是对数值型数据计算的，利用了全部数据信息，应用广泛，数据呈对称或接近对称分布时3个代表值接近相等，此时选择平均数作为集中趋势代表值，其主要缺点是易受数据极端值的影响。对于偏态分布的数据，平均数的代表性较差。偏态程度较大数据用中位数或众数比平均好。

异众比率的应用场合：主要用于衡量众数对一组数据的代表程度，大，代表性差。主要适合分类数据的离散程度。顺序数据和数值型也可。

标准分数的性质：平均数为0，标准差为1

经验法则：一组数据对称分布时，约有68%的数据在平均数1个标准差范围内。 95% 99%

切比雪夫不等式：不对称 75% 2个标准差 89% 3个 94 4个 1-1/k2

离散程度的测量值应用场合：分类数据用异众，顺序数据四分位，数值数据方差标准差，不同样本数据离散系数。

偏态系数的用途：0对称，>1 <-1高偏 0.5-1 -1—0.5中偏，接近0，

能性相等，则某一事件A发生概率为该事件所包含的基本事件数m与样本空间中所包含的基本事件数n的比值。

概率的统计定义：在相同条件下随机试验n次，某事件A出现m次（m

概率的性质：非负，规范，可加

概率的加法法则：两个互斥事件和概率，等于两事件概率和。两任意随机事件和概率为

两事件分别概率减相交概率。

贝努力试验与二项分布：试验有两个结果，这种随机变量所服从的概率分布为二项分布。试验包含了n个相同的试验；每试验只有两个可能结果成或败；出现成或败的概率对每一次试验相同，且成败和为1；试验相互独立；成败可以计数，即试验结果对应一个离散型随机变量，具有上述特征的n次重复独立试验为n重贝努力试验。

正态分布曲线的性质：(1)f(x)>=0整个概率密度曲线都在x轴上方(2)曲线相对x=μ对称，在x=μ处最大值f(μ)=1/

2σ（3）曲线陡缓程度由σ决定，越大，越缓；（4）x趋于无穷时，曲线以x轴为渐近线。3σ准则：P(|x-μ|<=σ)=0.6836,2σ=0.9545,3σ=0.9973

独立性和互斥性的关系：互斥事件一定是相互依赖（不独立）的，但相互依赖的事件不一定是互斥的。不互斥事件可能是独立的，也可能是不

中心极限定理：设从均值为μ,方差为σ2(有限)的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值X的抽样分布近似服从均2

的真值，5%不包括，用该方法构造的区间称为置信水平为95%的置信区间2.总体参数真值固定未知，而样本构造区间不固定，置信区间是随机区间因样本不同而不同不都包含总体参数真值。3.实际中只抽一个样本，可包可不包，真正意义是如果做了100次抽样，大概有95次找到的区间包含真值，有5次找到的区间不包真值。

评价估计量的标准：无偏有效一致性

在对两总体均值之差小样本估计对两总体和样本的假定：1.两总体服从正态分布2两随机样本独立地分别抽自两总体。假设检验的步骤：1提出原假设H0和备择假设H12确定适当的检验统计量3确定显著性水平α和临界值及拒绝域4根据样本数据计算检验统计量的值P5将检验统计量值与临界值比较，作出拒绝或接受原假设的决策假设检验和参数估计有什么相同点和不同点？参数估计和假设检验是统学推断的两个组成部分，都是利用样本对总体进行某种推断，然而推断的角度不同。参数估计讨论的是样本统计量估计总体参数的方法，总体参数μ在估计前是未知的。而在参数假设检验中，则是先对μ的值提出一个假设，然后利用样本信息去检验这个假设是否成立。

两类错误控制：首先控制犯α错误原则，原因：统一原则，原假设常明确。

两类错误的关系：一定样本量n，减小α错误，增大β错误，同时减少可以增大样本量。

单侧检验中原、备择假设方向如何确定？原有的传统的放在原假设。

方;3.将平方(f0-fe)2结果除以fe;4将3的结果加总。

一致性检验和独立性检验的区别：首先，两种检验抽取样本的方法或对观察值进行测定的方法有所不同，如果在各类别中分别进行，属于拟合优度检验，如果事先未分类，抽取样本后根据研究内容分类形成列联表就是独立性检验。其次，两者检验假设的内容有差异，似~通常假设各类别总体比例等于某个期望概率，而独立性检验中，原假设则假设两个变量之间相互独立。最后，计算期望频数时，在拟合优度检验中利用原假设中的期望概率，用观察频数乘以期望概率，直接得到期望频数，如果独立性检验，则假设两个变量的分类是独立的，因而两个水平的联合概率是两个单独的概率的乘积。

简述φcV相关系数各自的特点：φ2X2列联表，0-1范围，0完全相关｜φ｜＝1完全相关，绝对值越大，相关程度越高, φ无上限；c大于2X2列联表，相互独立时 c=0，不可能大于1，最大值依赖于列联表的行数

方差分析中的三个基本假定：每个总体都应该服从正态分布，各个总体的方差σ2必须相同，观测值是独立的。

方差分析中假设的提法：H0:u1=u2=…自变量对因变量没有显著影响H1:u1,u2…不全相等

多重比较前提、作用：对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。

要检验多个总体均值是否相等时，为什么不两两比而用方差分析？两两比烦销，增大犯I类错误的概率，降低置信水平。方差分析是同时考虑所有样本，排除了错误累积的概率，从而避免拒绝一个真实的原假设。方差分析的基本思想：1.图形描述，散点图 2.误差分解 3.误差分析，显著性

方差分析的基本步骤：1.提出假设 2.构造检验的统计量：1）计算各样本均值2）计算全部观测值的总均值3）计算各误差平方和总平方和组间平方和组内平方和4）计算统计量3.统计决策 4.方差分析表 5.方差分析

关系强度R2的含义和作用：组间平方和占总平方和的比例大小2

x取某个值时，变量y的取值可能有几个，这种关系不确定的变量显然不能用函数关系进行描述，但变量之间存在一定的规律。相关与回归分析正是描述探索这类变量关系及其统计规律的方法。

相关分析的内容：变量之间是否存在关系，存在什么样的关系，关系强度如何，样本所反映的变量之间关系能否代表总体~？

相关分析总体的两个假定：两变量之间线性关系，两变量都是随机变量。相关系数的性质：（1）取值范围在-1~+1 0-1正线性相关，反负相关，1完全正线性相关｜r｜=1 y取值完全依赖于x，两者函数关系，r=0，y 取值与x无关，两者不存在线性相关关系

（2）对称性 rxy=ryx（3）r大小与xy原点及尺度无关(4)仅是线性关系度量(5)xy线性关系的度量但非因果关系高0.8中0.5低0.3不相关

相关系数检验的目的：能否根据样本相关系数说明总体的相关程度，考察样本相关系数的可靠性，就是显著性检验。ρ较大正值r左偏，ρ接

近0，样本量n 很大，才能认为r 接近正态分布的随机变量。相关系数检验的程序：1.提出假设H0: ρ=0;H1: ρ<>0 2计算检验统计量：)2(~12

---=n t r n r t 3进行决策 |t|>ta/2(n-2)，拒绝回归分析的内容：（1）从一组样本数据出发，确定出变量之间的数学关系式；（2）对这些关系式的可信程度进行各种统计检验，并从影响某一特定变量的诸多变量中找出哪些变量的影响显著不显著。（3）利用所求的关系式，根据一个或几个变量的取值来估计或预测另一个待定变量的取值，并给出这种估计或预测的可靠程度。

理论回归模型的假定：（1）因变量y 与自变量x 之间有线性关系。（2）重复抽样中，x 取值固定非随机的。（3）误差项ε是期望0的随机变量E(ε)=0,假定模型为直线。（4）对所有x 值，ε的方差σ2

都相同。（5）误差项ε服从正态分布随机变量且独立，即ε~N(0, σ2

)

最小二乘法的原理：距离各观测点最近的一条直线，用它来代表x 与y 之间的关系与实际数据的误差比其他任何直线都小。

最小二乘法拟合直线的性质：（1）使离差平方和达到最小（2）可以知β0, β1估计量的抽样分布（3）在某些条件下β0, β1的最小二乘估计量同其它相比，抽样分布具有较小的标准差。总平方和（SST ）＝回归平方和(SSR)+残差平方和(SSE) 判定系数R 2=SSR/SST:计算A 对B 回归的判定系数R 2

，在A 的变差中，有R 2

%可以由A 与B 之间的线性差系来解释。线性相关检验的目的：检验自变量x 与因变量y 之间的线性关系是否显著，或说它们之间能否用一个线性模型y=β0+β1x+ε来表示。线性相关检验的程序：（1）提出假设H0: β1=0 两个变量之间的关系不显著（2）计算统计量F=MSR/MSE(3)作出决策 F>Fa 拒绝。说明线性关系是显著的。回归系数检验的目的：检验自变量对因变量的影响是否显著。β1＝0,表明y 不依量x 没有线性关系。回归系数检验的程序：（1）提出检验 H0: β1=0 H1:β1<>0 （2）计算检验统量量t (3)决策拒绝说明是显著因素。回归分析结果的评价：（1）所估计的回归系数1?

β的符号是否与理论或事先预期的相一致（2）如果理论上认为y 与x 之间关系不仅正，而且统计上显著，所建立的回归方程也应该如此。（3）回归模型在多大程度上解释了因变量y 取值的差异？用判定系数来回答。（4）考察关于误差项ε的正态性假定是否成立。

中不等价，线性关系检验主要是检验因变量同多个自变量的线性关系是否显著，k 个自变量只要有一个线性关系显著，F 检验就能通过。但并不代表每个关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验，主要用于检验每个自变量对因变量的影响是否都显著，如果某个自变量没有通过检验就说明这处自对因影响不显著，没有必要将自放进回归模型中。

多重共线性对回归模型的影响：（1）变量之间高相关，使回归结果混乱（2）对参数估计值的正负号产生影响多重共线性的判别：（1）模型中各对自变量之间显著相关（2）线性关系检验显著时，几乎所有的回归系数检验却不显著（3）回归系数的正负号与预期的相反。

多重共线性的处理方法：（1）将一个或多个相关自变量从模型中剔除，保留的尽可能不相关（2）如果要保留所有就应该避免根据t 统计量对单个参数B 进行检验，对因变量y 值的推断限定在自变量样本值范围内。增长率分析中应注意的问题：（1）当时间序列中的观察值出现0或负数时，不宜计算（2）有些情况下，不能单纯就增长率论增长率，要注意增长率与绝对水平的结合分析。

时间序列预测的程序：第1步，确定时间序列所包含的成分，也就是确定时间序列的类型。第2步，找出适合此类时间序列的预测方法第3步，对可能的预测方法进行评估，以确定最佳预测方案。第4步，利用最佳预测方案进行预测。龚铂茨曲线的特点：初期增长缓慢，以后逐渐加快，当达到一定程度后，增长率又逐渐下降，最后接近一条水平线。

复合型时间序列的预测步骤：1.确定并分离季节成分。计算季节指数，

确定季节成分，分离出去，即用每个时间序列的观测值除以相应的季节指数，以消除季节性。2.建立预测模型并进行预测。3.计算出最后的预

测值。用预测值乘以相应的季节指数，得到最终的预测值。计算季节指数的步骤：平均趋势剔除法 1.计算移动平均值，并将其结果

中心化处理，

得出中心化移动平均值 2.计算移动平均的比值，季节比率，即将序列的各观察值除以相应的中心化移动平均值，再计算出各比值的

季度或月份平均值。3.季节指数调整。将2计算的每个季节比率的平均值除以它们的总平均值。价格和服务项目价格两个部分。货币购买倒数实际工资＝名义/消费

消费价格指数的作用：1.用于反映通货膨胀状况 2.用于反映货币购买力变动 3.用于反映对职工实际工资的影响 4.用于缩减经济序列

多指标综合评价指数构建的基本问题：理论研究，统计指标（及体系）理论；建立科学的评价指标体系；评价方法研究

综合评价指数首先要解决的问题： 1.指标的转换，无量纲化处理 2.权数的构造。通货膨胀率＝居民消费价格指数－100％依据统计数据的收集方法不同，可将其分为观测数据和实验数据相关分析与回归分析：（1）先进行相关分析再进行回归分析，只有在确定两变量存在着相关分析后，才能分析两变量的回归分析。两变量间的相关程度越大，研究回归才更有意义。（2）通过相关分析，可以大致判断现象与现象之间配合什么数学模型建立回归方程。区别：分析的目的不同，相关分析主要分析变量之间有无关系，使什么样的关系，有多大程度的关系；回归分析用于构建有联系的变量间的回归模型，用于推理变量之间的因果关系。相关分析的两个或两个以上的变量是随机变量。回归分析中的自变量是确定性的变量。统计调查的方法有：抽样调查，统计报表重点调查和典型调查分散程度统计量：极差方差标准差变异系数标准分数

应用统计学期末复习

应用统计学期末复习重点（按题型整理）一、填空题（10分） 1.统计学的三种含义：统计工作；统计数据或统计信息；统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同，可将统计学分为描述统计学和推断统计学，根据统计方法研究和应用的侧重不同，可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法：大量观察法，实验设计法，统计描述法和统计推断法 5.标志是说明总体单位特征的，而指标是说明总体特征的， 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志，可变标志称为变量。 7.统计总体具有三个基本特征，即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标，按所反映总体的内容不同，可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标，其表现形式为绝对数。 10.总量指标按其反映时间状况不同，可以分为时点指标和时期指标，按指标数值采用的计量单位不同可以分为实物指标，价值指标，劳动量指标。总量指标按其说明总体内容不同，可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势，变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度，定序尺度，定距尺度，定比尺度，根据四种计量尺度计量结果，可将统计数据分为三种类型：名义级数据，顺序级数据，刻度级数据。 13.对名义级数据通常是计算众数，对顺序级数据，通常可以计算众数、中位数；对刻度级数据，同样可以计算众数和中位数，还可以计算平均数。 14.全面调查方式有统计报表制度，普查；非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样，类型随机抽样，机械随机抽样，整群随机抽样，阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少，统计分组可以分为简单分组和复合分组；按分组标志性质不同，统计分组可以分为品质分组和数量分组；按分组作用和任务不同，有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组，连续变量只能做组距式分组。 19.从统计表的内容看：统计表由主词和宾词两部分构成，从统计表的形式看：统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类：计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系，次数分布可以分为对称分布，左偏分布，右偏分布。

统计学知识点梳理

型;有下划线的重点记忆！当然整理的知识点都就是重点！都要背与理解！Fighting！) 第一章绪论一．统计的含义即统计工作、统计资料与统计学统计工作:统计实践活动,搜集,整理,分析与提供关于社会现象数字资料工作总称统计资料:统计实践活动过程中所取得的各项资料,包括原始资料与加工整理资料统计学:关于认识客观现象总体数量特征与数量关系的科学二．统计工作过程就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理与统计分析三个阶段。统计调查:第一阶段,就是认识客观经济现象的起点,就是统计整理与统计分析的基础。统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。

统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,就是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。总体由总体单位构成,要认识总体必须从总体单位开始,总体就是统计认识的对象。例如:所有的工业企业就就是一个总体,其中的每一个工业企业就就是一个总体单位。四.标志与指标标志就是用来说明总体单位特征的名称。指标,亦称统计指标,就是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称与指标数值两部分。(以上内容理解即可) 1、指标与标志的区别与联系(简答) 指标与标志的区别:(1)指标就是说明总体特征的,而标志就是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,就是用属性表示的;(3)指标数值就是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。指标与标志的联系:(1)有许多统计指标的数值就是从总体单位的数量标志值汇总而来的; (2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2、标志与标志值(会区分) 标志分为品质标志与数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3、变异与变量(会什么就是变异,什么就是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄就是42岁,月工资2200元。 4、统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标。数量指标指说明总体规模与水平的各种总量指标。质量指标指反应现象总体的社会经济效益与工作质量的各种相对指标与平均指标。 (2)统计指标按其作用与表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。第二章统计调查与整理一、统计调查的含义统计调查就是统计工作过程的第一阶段。它就是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查就是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。二、统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要与可能确定 ⒉确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体调查单位——调查标志的承担者(总体单位)

应用统计学试题及答案解析

北京工业大学经济与管理学院2007－2008年度第一学期期末应用统计学主考教师专业：学号：姓名：成绩： 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一．单选题（每题2分，共20分） 1．在对工业企业的生产设备进行普查时，调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2．一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3．某连续变量数列，其末组为“500以上”。又知其邻组的组中值为480，则末组的组中值为 A 520 B 510 C 530 D 540 4．已知一个数列的各环比增长速度依次为5%、7％、9％，则最后一期的定基增长速度为 A ．5％×7％×9％ B. 105%×107％×109％ C ．（105％×107％×109％）－1 D. 1%109%107%1053 5．某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6．对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= －1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7．某乡播种早稻5000亩，其中20％使用改良品种，亩产为600 公斤，其余亩产为500 公斤，则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件乙车间: x =90件, σ=6.3件哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

应用统计学概念整理

并根据样本调查结果来推断总体特征自下而上地逐级提供基本数据的调查方应用统计学概念整理第一章：导论 1. 只能归类于某一类别的非数字型数据称为分类数据 2. 只能归于某一有序类别的非数字型数据称为顺序数据 3. 按数字尺度测量的观测值称为数值型数据 4. 包含所研究的全部个体的集合称为总体 5. 从总体中抽取的一部分的元素的集合称为样本 6. 用来描述总体特征的的概括性数字度量称为参数 7. 用来描述样本特征的概括性数字度量称为统计量 8. 说明事物类别的一个名称称为分类变量 9. 说明事物有序类别的一个名称称为顺序变量 10. 说明事物数字特征的一个名称称为数值型变量 11. 只能取可数值的变量称为离散型变量 12. 可以在一个或多个区间中取任何值的变量称为连续型变量第二章：数据收集 1. 从总体中随机抽取一部分单位作为样本进行调查，的数据收集方法，称为抽样调查。 2. 为特定目的而专门组织的全面调查称为普查 3. 按照国家有关法律规定，自上而下地统一布置，式称为统计报表第三章：数据的图表展示 1. 落在某一特定类别或组中的数据个数，称为频数 2. 把各个类别及其落在其中的相应频数全部列出，并用表格形式表示出来，称为频数分布 3. 一个样本或总体中各个部分的数据与全部数据之比，称为比例 4. 将比例乘以 100 得到的数值，称为百分比或百分数，用 %表示 5. 样本或总体中各不同类别数值之间的比值，称为比率 6. 分类数据的图示：条形图， pareto 图，对比条形图，饼图 7. 将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8. 将各有序类别或组的百分比逐级累加起来称为累计频率 9. 顺序数据的图示：累计频数分布图，环形图 10. 根据统计研究的需要，将原始数据按照某种标准划分成不同的组别称为数据分组 11. 分组后的数据称为分组数据 12. 把变量值作为一组称为单变量值分组 13. 将全部变量值一次划分为若干个区间，并将这一区间的变量值作为一组，称为组距分组 14. 在组距分组中，一个组的最小值称为下限，最大值称为上限 15. 一个组的上限与下限的差称为组距 16. 各组组距相等的组距分组称为等距分组 17. 各组组距不相等的组距分组称为不等距分组 18. 每一组的下限和上限之间的重点值称为组中值 19. 用矩形的宽度和高度即面积来表示频数分布的图形称为直方图

统计学课程知识点总结

1. 统计的研究对象的特点：数量性，总体性，变异性。 2. 统计研究的基本环节：统计设计，收集数据，整理与分析，统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点：同质性、大量性。总体可分为有限总体和无限总体。标志：总体各单位普遍具有的属性或特征。标志分为品质标志（表明单位属性，用文字、语言描述）和数量标志（表明单位数量，用数值表现）。不变指标：一个总体中各单位有关标志的具体表现都相同。变异指标：在一个总体中，当一个标志在各单位的具体表现有可能都相同。第二章 1. 统计调查方式：普查，抽样调查，重点调查，定期报表制度。调查方式按调查的范围划分，可分为全面调查和非全面调查。按时间标志可分为连续性（经常性）调查和不连续性（一次性）调查（一）普查是专门组织的一种全面调查。特点：非经常性调查、最全面调查。（二）抽样调查是一种非全面性调查，可分为概率调查和非概率调查。（三）重点调查是指在调查对象中，只选择一部分重点单位进行的非全面调查，它是一种不连续的调查。（四）定期报表制度又称统计报表制度，它是依照国家有关法规，自上而下地统一布置，按照统一的表式、统一的指标项目、统一的报送时间和报送程序，自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系：以必要的周期性普查为基础，经常性的抽样调查为主体，同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位，它是进行调查登记的标志的承担者。 4. 统计分组的原则：穷尽原则和互斥原则。（先分后组）间断型分组和连续型分组，等距和异距注意事项第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质： 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差（注意与样本方差的区别）P102: 10,11题第四章 1. 事件的关系和运算：包含，相等，和，差，积，逆，不相容。 2. 概率的计算：古典概型，几何概型加法法则，乘法公式条件概率，全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题（每题1分，共10分） 1．重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2．根据分组数据计算均值时，利用各组数据的组中值做为代表值，使用这一代表值的假定条件是（）。 A．各组的权数必须相等 B．各组的组中值必须相等 C．各组数据在各组中均匀分布 D．各组的组中值都能取整数值 3．已知甲、乙两班学生统计学考试成绩：甲班平均分为70分，标准差为分；乙班平均分为75分，标准差为分。由此可知两个班考试成绩的离散程度（） A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4．某乡播种早稻5000亩，其中20%使用改良品种，亩产为600公斤，其余亩产为500公斤，则该乡全部早稻平均亩产为（）公斤公斤公斤公斤 5．时间序列若无季节变动，则其各月（季）季节指数应为（） A.100% % % % 6．用最小平方法给时间数列配合直线趋势方程y=a+bt，当b＜0时，说明现象的发展趋势是（） A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7．某地区今年和去年相比商品零售价格提高12%，则用同样多的货币今年比去年少购买（）的商品。 8．置信概率表达了区间估计的（） A.精确性 B.可靠性 C.显着性 D.规范性 9．H 0:μ=μ ，选用Z统计量进行检验，接受原假设H 的标准是（） A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下，你认为哪个回归方程可能是正确的（） A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题（每题2分，共10分） 1．抽样调查的特点有（）。 A．抽选调查单位时必须遵循随机原则 B．抽选出的单位有典型意义 C．抽选出的是重点单位 D．使用部分单位的指标数值去推断和估计总体的指标数值 E．通常会产生偶然的代表性误差，但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%，实际降低了4%，则下列说法正确的是（） A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3．数据离散程度的测度值中，不受极端数值影响的是（） A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

应用统计学

应用统计学课程编码：202136 课程英文译名：Practical Statistics 课程类别：学科基础选修课开课对象：工业工程专业开课学期：5 学分： 2学分；总学时： 32学时；理论课学时： 32 学时；实验学时： 0学时；上机学时： 0 学时先修课程：概率论教材：应用统计，朱洪文，高等教育出版社，2001.2 参考书：【1】应用统计学，倪加勋，中国人民大学出版社，1994 一、课程的性质、目的和任务应用统计学是一门认识方法论的科学，通过对社会经济现象的数量方面资料的搜索、整理、分析和推断，阐明社会经济现象本质及其内在的规律性，以达到对社会经济现象整体的具体的认识。该课程作为经济、管理类专业的专业基础课开设。通过本课程的教育需达到以下目的：1、为经济管理提供统计调查，资料整理汇总和统计分析的一般原则和方法；2、为进一步学习有关专业知识，奠定理论和方法基础；3、为学习其他经济管理课程和从事经济研究工作提供数量分析的方法。学习中要正确理解课程中的各个基本概念，了解统计工作的各个阶段，掌握统计的基础理论和基本方法，并能综合运用所学的理论知识分析应用经济统计信息，以满足工作的需要。二、课程的基本要求 1．明确统计的对象及其特点，了解统计的性质与作用以及统计工作的基本环节。透彻理解统计学中的基本范畴，初步建立统计思想。 2．理解统计调查的概念，了解统计调查方法的种类，掌握统计报表制度和各种专门调查的概念、特点以及各种调查方法的结合运用。 3．了解统计调查方案的基本内容，理解统计整理的概念，统计分组的概念和作用，了解次数分布的类型，统计表的结构，掌握制表的一

应用统计学期末试卷

南京邮电大学 2010 /2011 学年第一学期《应用统计》期末试卷（A ）院(系) 班级学号姓名一、单项选择题（每题2分，共10题，合计20分）（1）一个旅游景点的管理员根据以往的经验，有80%游客照相留念，则接下来的两名游客都照相留念的概率是（）。 A.0.65 B.0.36 C.0.5 D.0.4 （2）从一个装有3个红球2个白球的盒子摸球（不放回），则连续两次摸到红球的概率为（）。 A.0.6 B.0.3 C.0.5 D.0.4 （3）下面属于时期指标的是（）。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数（4）平均发展速度是（）。 A. 定基发展速度的算术平均数 B. 环比发展速度的算术平均数 C. 环比发展速度的几何平均数 D. 增长速度加上100% （5）在回归直线Y ＝a ＋bx 中，回归系数b 的意义为（）。 A ．x ＝0时，Y 的期望值 B ．X 每变动一个单位引起的Y 的平均变动量 C ．Y 每变动一个单位引起的X 的平均变动量 D ．X 每变动一个单位时Y 的变动总量（6）设随机变量2~(3,)X N σ，且(36)0.4P X <<=，则( )0P X <=( )。 A ．0.1 B ．0.4 C ．0.6 D ．1 （7）某企业生产某种产品，其产量每年增加5万吨，则该产品的产量环比增长速度（）。 A . 年年下降 B . 年年增长 C . 年年保持不变 D . 无法做结论（8）设()~X P λ，已知()()12P X P X ===，则()3P X =的数值为（）。装订线内不要答题自觉遵守考试规则，诚信考试，绝不作弊

统计学知识点梳理

复习提纲：（计算部分全用红色标注了！其他红色的是我的推断，可能出什么题型；有下划线的重点记忆！当然整理的知识点都是重点！都要背和理解！Fighting！）第一章绪论一．统计的含义即统计工作、统计资料和统计学统计工作：统计实践活动，搜集，整理，分析和提供关于社会现象数字资料工作总称统计资料：统计实践活动过程中所取得的各项资料，包括原始资料和加工整理资料统计学：关于认识客观现象总体数量特征和数量关系的科学二．统计工作过程就一次统计活动来讲，一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查：第一阶段，是认识客观经济现象的起点，是统计整理和统计分析的基础。统计整理：第二阶段，处于统计工作的中间环节，起着承前启后的作用。统计分析：第三阶段，通过第三阶段，事物由感性认识上升到理性认识。三．总体与总体单位（会辨析总体与总体单位即可）总体，亦称统计总体，是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体；构成总体的这些个别单位称为总体单位。总体由总体单位构成，要认识总体必须从总体单位开始，总体是统计认识的对象。例如：所有的工业企业就是一个总体，其中的每一个工业企业就是一个总体单位。四．标志和指标标志是用来说明总体单位特征的名称。指标，亦称统计指标，是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。（以上内容理解即可） 1.指标和标志的区别和联系（简答）指标与标志的区别：（1）指标是说明总体特征的，而标志是说明总体单位特征的；（2）指标都能用数值表示，而标志中的品质标志不能用数值表示，是用属性表示的；（3）指标数值是经过一定的汇总取得的，而标志中的数量标志不一定经过汇总，可直接取得；（4）一个完整的统计指标，一定要讲时间、地点、范围，而标志一般不具备时间、地点等条件。指标与标志的联系：（1）有许多统计指标的数值是从总体单位的数量标志值汇总而来的；（2）两者存在着一定的变换关系，即由于研究目的不同，原来的统计总体如果变成总体单位了，则相应的统计指标也就变成数量标志了。 2.标志与标志值（会区分）标志分为品质标志和数量标志，数量标志用来说明总体单位量的特征，可以用数值表示，即为标志值（如：年龄、工资额、身高） 3.变异与变量（会什么是变异，什么是变量）变异：品质标志在总体单位之间的不同具体表现。如：性别表现为男、女，民族表现为汉、满、蒙等。变量：数量标志抽象化即为变量，而数量标志的不同具体表现则称为变量值（或标志值）。如：某职工的年龄是42岁，月工资2200元。 4.统计指标的划分（1）统计指标按其所反映的总体内容的不同，可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。（2）统计指标按其作用和表现形式的不同，有总量指标（绝对数）、相对指标（绝对数）、平均指标（平均数）三种。第二章统计调查与整理一.统计调查的含义统计调查是统计工作过程的第一阶段。它是按照统计任务的要求，运用科学的调查方法，有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础，决定着统计认识过程及其结果的成败。二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的；（为什么调查）根据实际需要和可能确定

应用统计学试题和答案

《统计学》模拟试卷(一) 一、填空题（每空1分，共10分） 1、依据统计数据的收集方法不同，可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为数据。 3、设总体X 的方差为1，从总体中随机取容量为100的样本，得样本均值x =5，则总体均值的置信水平为99%的置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元，2005年3季度完成的GDP =55亿元，则GDP 年度化增长率为。 5、在某城市随机抽取13个家庭，调查得到每个家庭的人均月收入数据如下：1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660，则其众数为，中位数为。 6、判定系数的取值围是。 7、设总体X ～) ,(2 σμN ，x 为样本均值，S 为样本标准差。当σ未知，且为小样本时，则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据，采用5年移动平均，修匀后的时间序列中剩下的数据有个。二、单项选择题（在每小题的3个备选答案中选出正确答案，并将其代号填在题干后面的括号。每小题1分，共14分） 1、．研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍，而频数都减少为原来的1/3，则平均数（） ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中，得到下列最大速度值：27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为（） ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度：1998～2000年三年平均为1.03，2001～2002年两年平均为1.05，试确定1998～2002五年的年平均发展速度（） 5、若两个变量的平均水平接近，平均差越大的变量，其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时，其它条件不变，置信水平α-1越小，则置信上限与置信下限的差（） ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布，则成立的有（） ①、x > e M >o M ②、x o M >e M

应用统计学概念整理

应用统计学概念整理第一章：导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量第二章：数据收集 1.从总体中随机抽取一部分单位作为样本进行调查，并根据样本调查结果来推断总体特征的数据收集方法，称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定，自上而下地统一布置，自下而上地逐级提供基本数据的调查方式称为统计报表第三章：数据的图表展示 1.落在某一特定类别或组中的数据个数，称为频数 2.把各个类别及其落在其中的相应频数全部列出，并用表格形式表示出来，称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比，称为比例 4.将比例乘以100得到的数值，称为百分比或百分数，用%表示 5.样本或总体中各不同类别数值之间的比值，称为比率 6.分类数据的图示：条形图，pareto图，对比条形图，饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示：累计频数分布图，环形图 10.根据统计研究的需要，将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间，并将这一区间的变量值作为一组，称为组距分组 14.在组距分组中，一个组的最小值称为下限，最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

《应用统计学》期末考试试题++a+)+卷

一、单项选择题（每题 2分，共30分） △ 1．在编制等距数列时，如果全距等于56，组数为6，为统计运算方便，组距取（ B ）。 A 、9.3 B 、9 C 、6 D 、10 2．某商业局对其所属商店的销售计划完成百分比采用如下分组，请指出哪项是正确的（ C ）。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3．以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为（ C ）。 A. 5 B. 45 C. 56.5 D. 7.5 4．按使用寿命分组的产品损坏率一般表现为（ D ）分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5．某11位举重运动员体重分别为：101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤，据此计算平均数，结果满足（ D ）。 A 、算术平均数＝中位数＝众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6．甲数列的标准差为7.07，平均数为70，乙数列的标准差为3.41，平均数为7，则（ D ）。 A 、甲数列平均数代表性高； B 、乙数列平均数代表性高； C 、两数列的平均数代表性相同； D 、甲数列离散程度大； 7．某银行想知道平均每户活期存款余额和估计其总量，根据存折账号的顺序，每50本存折抽出一本登记其余额。这样的抽样组织形式是（ C ） A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8．在方差分析中，检验统计量F 是（ B ）。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中，若回归系数为正，则（ A ）。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10．已知某工厂甲产品产量和生产成本有直线关系，在这条直线上，当产量为1000时，其生产成本为30000元，其中不随产量变化的成本为6000元，则成本总额对产量的回归方程是（ A ） A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是（ A ）。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

统计学原理考试知识点整理

第1章绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析，是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性具体性综合性 3、统计学的若干基本概念总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体，构成总体的个别事物叫总体单位；总体的特征：同质性，大量性，差异性；总体的分类：有限总体与无限总体；标志、变异与变量P10：标志，是指说明总体单位特征的名称。变异：总体单位之间品质和数量上的差异，即可变标志在总体各单位之间所表现出的差异。变量：可变的数量标志。连续型变量与离散型变量联系和区别：连续型：变量值可作无限分割的变量离散型：变量值只能以整数出现的变量指标与标志P11 （指标，说明总体数量特征的概念）区别：第一，指标说明总体的特征，而标志则说明总体单位的特征。第二，指标只反映总体的数量特征，所有指标都要用数字来回答问题，没有用文字回答问题的指标。而标志既有反映数量也有反映品质。第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义：根据统计研究的目的，有组织、有计划地搜集统计资料的过程地位：是统计工作的第一阶段，是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是，如实反映情况二、要及时反映，及时预报三、要数字与情况相结合 3、统计调查的组织形式：普查P14：含义：为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点：，适用场合：主要用于一些重要项目呢的调查，如人口普查、耕地普查、基本单位普查、工业普查和库存普查等；随机抽样调查P14：含义（按随机原则（机会均等原则）从总体中抽取部分单位进行调查，并借以推断和认识总体的一种统计方法）以及具体的抽样方法【第七章】系统抽样、多阶简单随机、分层抽样、整群抽样、段抽样）及适用场合；非随机抽样：含义（调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法）以及具体的抽样方法P15 （重点抽样：只对总体中为数不多但影响颇大的重点单位进行研究的一种非

应用统计学试题

2009年天津大学工程硕士应用统计学试卷姓名学号班级一、简答题（30分，每题5分） 1．统计学表示变异（分散）程度的特征数有哪些？ 2．服从两点分布设总体X ),1(p b ，其中p 是未知参数，521,,X X X 是来自X 的简单随机样本。是指出21X X +，i i X 5 1min ≤≤，p X 25+之中哪些是统计量，哪些不是统计量，为什么？ 3. 若)9,4(~F F ，则F /1服从什么分布？ 4. 假设检验的基本依据是什么？ 5. 假设检验中的两类错误是指哪两类错误？ 6. 回归分析适合研究哪类问题？二、（15分）.,,5)4,12(51X X N 的样本中随机抽一容量为在总体的概率；值之差的绝对值大于）求样本均值与总体均（11 {}.15),,,,max(254321>X X X X X P ）求概率（三、（15分）一种新型减肥方法自称其参加者在第一个星期平均能减去至少8斤体重。由40名使用了该种方法的个人组成一个随机样本，其减去体重的样本均值为7斤，样本标准差为3.2。 a ．α=0.05时，拒绝规则是什么？ b ．你对该减肥说明方法的结论是什么？ c ．p 值为多少？四、（15分）正态总体),(2σμN 的密度函数为 2 2 2) (21),;(σ μσ πσμ--= x e x f 从该总体抽取随机样本n X X X ,,21 。（1）求σμ,的极大似然估计量σμ ?,?；（2）证明所求的μ ?是总体均值的最佳无偏估计量。五、（15分）为了检验三家工厂生产的机器加工一批原料所需的平均时间是否相同，某化学公司得到了关于加工原料所需时间的数据如下表所示。利用这些数据检验三家工厂加工一批原料所需平均时间是否相同。（α＝0.05，26.4)9,2(05.0=F ）

统计学重点整理-CH11

.H reject not do , F If . H reject , > F If o c o c F F ≤ others the from different is means the of one least At ::321a k o H H μ μμμ==== Chapter 11: Analysis of Variance Experimental Design a plan and a structure to test hypotheses in which the researcher controls or manipulates one or more variables. Independent Variable Treatment variable 實驗變數 - one that the experimenter controls or modifies in the experiment. Classification variable - a characteristic of the experimental subjects that was present prior to the experiment, and is not a resu lt of the experimenter’s manipulations or control. Levels or Classifications - the subcategories of the independent variable used by the researcher in the experimental design. Independent variables are also referred to as factors. Analysis of Variance (ANOVA)變異數分析 – a group of statistical techniques used to analyze experimental designs . ANOVA begins with notion that individual items being studied are all the same One-Way ANOVA 單因素變異數分析: Procedural Overview The null hypothesis states that the population means for all treatment levels are equal Even if one of the population means is different from the other, the null hypothesis is rejected Testing the hypothesis is done by portioning the total variance of data int6o the following two variances Variance resulting from the treatment (columns) Error variance or that portion of the total variance unexplained by the treatment One-Way ANOVA: Sums of Squares Definitions One-Way ANOVA: Computational Formulas Assumptions underlie ANOVA

应用统计学

应用统计学课程教学大纲课程代码：（与教学计划课程代码一致）课程类型：适用专业：总课时数：学分：（注：课程类型是指通识教育、专业必修、专业选修、教师教育、实践课程、其它课程）一、课程教学的目的和任务 1．统计学是各大专院校经济管理类专业不可或缺的一门专业基础课程。学习的任务和目的是人们要从事经济研究和各种社会经济管理活动，都应该学会运用统计工具，掌握基本的统计理论和方法，才能做好工作。 2．应用统计学可以从实际出发，运用案例讲故事式地阐明统计理论和方法。在内容上包括描述统计方法、推断统计方法以及社会经济、管理中常用的一些统计方法；在写法上与计算机紧密结合，大部分统计方法都给出了Excel的具体操作方法与数据分析结果的解析；在编排上把Excel在统计学中的应用集中在第11章阐述，保证了应用统计学理论学习的连贯性。 3．应用统计学的基本要求是使考生掌握如何应用统计学的概念与方法来解决社会经济中的各种问题。二、教学内容纲要 1教学内容及学时分配. 应用统计学的基本要求是使考生掌握如何应用统计学的概念与方法来解决社会经济中的各种问题。

2. 教学内容的基本要求，教学的重点、难点一绪论基本要求：要求学生学习统计的含义，统计学的研究对象及其特点，统计学的应用——在经济研究和管理中的应用，统计学的基本范畴，描述统计与推断统计，计算机在统计中的应用。重点：1统计学的应用 2统计学的的基本范畴 3描述统计与推断统计

4计算机在统计中的应用。难点：1统计学的的基本范畴 2计算机在统计中的应用二数据与数据收集基本要求：要求学生学习数据，数据的收集，原始数据的收集，次级数据的收集重点：1数据的测量尺度 2数据的收集 3次级数据的收集难点：1数据的测量长度 2次级数据的收集三数据整理基本要求：要求学生学习数据的整理，数据整理结果的描述统计指标，数据整理结果的描述：统计表和统计图重点：1数据汇总 2统计指标 3数据整理结果的描述统计表和统计图难点：1统计指标 2数据整理结果的描述统计表和统计图四数据分布特征的度量

应用统计学期末考试试题A卷

一、单项选择题（每题2分，共30分） △1．在编制等距数列时，如果全距等于56，组数为6，为统计运算方便，组距取（ B ）。 A 、 B 、9 C 、6 D 、10 2．某商业局对其所属商店的销售计划完成百分比采用如下分组，请指出哪项是正确的（ C ）。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3．以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为（ C ）。 A. 5 B. 45 C. D. 4．按使用寿命分组的产品损坏率一般表现为（ D ）分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5．某11位举重运动员体重分别为：101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤，据此计算平均数，结果满足（ D ）。 A 、算术平均数＝中位数＝众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6．甲数列的标准差为，平均数为70，乙数列的标准差为，平均数为7，则（ D ）。 A 、甲数列平均数代表性高； B 、乙数列平均数代表性高； C 、两数列的平均数代表性相同； D 、甲数列离散程度大； 7．某银行想知道平均每户活期存款余额和估计其总量，根据存折账号的顺序，每50本存折抽出一本登记其余额。这样的抽样组织形式是（ C ） A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8．在方差分析中，检验统计量F 是（ B ）。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中，若回归系数为正，则（ A ）。 A 、表明现象正相关 B 、表明现象负相关

统计学重点整理及复习资料

统计学重点整理及复习资料第一章统计有三个含义，即：统计工作、统计资料、统计学。统计学的研究对象：社会经济现象数量的总体数量特征及数量关系。（学科性质：方法论）统计学的特点：数量性、总体性、具体性、社会性、广泛性。统计工作的过程：设计、调查、整理、分析。统计的研究方法：统计分组法、大量观察法、综合指标法、统计模型法、统计推断法。统计总体：客观性、同质性、差异性。组成统计总体的个别单位称为总体单位。标志：统计学中总体单位所具有的属性或者特征；分为数量标志和品质标志（不可量性）. 指标：反应总体某一综合数量特征的名称或范畴；可分数量指标和质量指标（率、平均）。变异：指可变的品质标志；变量：指可变化的数量标志，变量的树枝也叫做变量值（标志值）。第二章统计调查：指根据统计研究的目的和要求，运用科学的调查方法有计划的、有组织的向社会实际搜集各项统计资料的过程。统计调查的意义：是人们认识社会的基本方式、是统计的重要环节、在统计学中占有重要地位。统计调查的基本要求：准确、及时、系统、和完整性。统计调查的种类：1、按组织方式可分为统计报表制和专门调查。2、按调查对象可分为全面调查和非全面调查。3、按登记事物的连续性可以分为经常性调查和一次性调查（时点状态）。4、按搜集资料的不同可分为直接观察法、报告法、采访法、问卷调查法。统计方案的设计：一、确认调查任务和目的，二、确定调查对象和单位，三、确定调查项目和设计调查表，四、确定调查时间地点，五、制定调查的组织实施计划。专门调查可分为：普查、重点调查、典型调查和抽样调查。普查：为了特定的研究目的而专门组织的一次性全面调查；特点：1、一次性调查2、主要调查一定时点的情况3、普查的数据一般比较准确，规范化程度较高；原则：1、必须统一规定普查的时点2、正确选择普查的时期3、在普查范围内各调查单位或调查点应尽可能的同时进行4、同类普查的内容在各次普查中应尽可能的保持一致。