当前位置:文档之家› 统计学导论知识点归纳总计期末

统计学导论知识点归纳总计期末

统计学导论知识点归纳总计期末
统计学导论知识点归纳总计期末

第一章

1、统计学的定义:

统计学是一门关于数据的科学,是一门关于数据的收集、整理、分析、解释和推断的科学。

2、统计的三种含义:

a.统计工作(又称统计实践)是搜集、整理、分析和提供关于社会经济现象

的数字资料工作的总称。

b.统计数据是统计实践活动的成果

如:经济增长速度、价格指数等。

对统计数据要求:客观性、准确性和及时性。

c.统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量

的数据,以便给出正确认识的方法论科学

3.理论统计学与应用统计学的区别于联系

现代统计学分为两大类:

理论统计学以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法。

应用统计学以各个不同领域的具体数量为研究对象。

区别:

理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。

理论统计学的特点是计量不计质,它具有通用方法论的理学性质。

应用统计学是有具体对象的方法论。所谓应用既包括一般统计方法的应用,更包括各自领域实质性科学理论的应用。应用统计学从所研究的领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,解决所需研究的问题。应用统计学不仅要进行定量分析,还需要进行定性分析。所以应用统计学通常具有边缘交叉和复合型学科的性质。

联系:总是互相促进,共同提高的。理论统计的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,又常常会对理论统计学提出新的问题,开拓理论统计学的研究领域。

4.统计总体:是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。

a.统计总体的性质:同质性(标准)大量性

b.总体的分类:

有限总体由有限量的单位构成的总体。

无限总体当总体单位数难以确定,其数量可能是

无限时,便构成无限总体

C.总体单位:(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以

是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。

注:总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一个研究对象,在一种情况下为总体,但在另一种情况下又可能变成单位

5.标志总体各单位普遍具有的属性或特征称为标志。

例如:每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等属性和特征,这些就是工人作为总体单位的标志。

a标志的分类:

品质标志表明单位属性方面的特征,品质标志的表现

只能用文字、语言来描述,如工人的性别。

数量标志表明单位数量方面的特征,可以用数值来表

现,如年龄。

6.统计指标:是反映统计总体数量特征的概念和数值,

a. 两项基本要素

指标的概念是对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性

指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。

b.指标与标志的关系:

标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。

由于总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。例如:如果所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志;而如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别、年龄等就成为标志。

习题:

一、判断题(把“√”或“×”填在题后的括号里)

1、统计一词包含统计工作、统计资料、统计学等三种涵义。(√)

2、社会经济统计的研究对象是社会经济现象总体的各个方面。(×)

3、总体单位是标志的承担者。标志是依附于单位的。(√)

4、离散变量的数值包括整数和小数。(×)

5、三个同学的成绩不同,因此存在三个变量。(×)

6、总体单位总量和总体标志总量是固定不变的,不能互相变换。(×)

7、如果改变研究目的,原来的统计总体成为统计单位后,则相对应的统计指标也就变成了数量标志了。(√)

8、张明同学的期末考试总成绩为476分是统计指标。(×)

9、对某地区银行职工基本情况进行调查时,银行的每个职工是调查对象。(×)

二、单项选择题

1、某城市进行工业企业未安装设备普查,总体单位是(B )

A、工业企业全部未安装设备

B、工业企业每一台未安装设备

C、每个工业企业的未安装设备

D、每一个工业企业

2工业企业的设备台数、产品产值是(D )

A、连续变量

B、离散变量

C、前者是连续变量

D、前者是离散变量

3、对某地区工业企业职工情况进行研究,统计总体是( D )

A、每个工业企业

B、该地区全部工业企业

C、每个工业企业的全部职工

D、该地区全部工业企业的全部职工

4、在全国人口普查中( B )

A、男性是品质标志

B、人的年龄是变量

C、人口的平均寿命是数量标志

D、某家庭的人口数是统计指标

5、指标是说明总体特征的,标志是说明总体单位特征的,所以(B )

A、标志和指标之间的关系是固定不变的

B、标志和指标之间的关系是可以变化的

C、标志和指标都是可以用数值表示的

D、只有指标才可以用数值表示

6、统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是( A )

A、绝对数

B、相对数

C、平均数

D、小数

7、社会经济统计是(D)的有力工具。

A、解决问题

B、克服困难

C、进行交流

D、认识社会

8、总体有三个人,其工资分别为645元、655元和665元。其平均工资655元是( A )

A、指标值

B、标志值

C、变异度

D、变量

9、记帐员的记帐差错率是( B )

A、数量指标

B、质量指标

C、数量标志

D、品质标志

10、属于数量指标的是( A )。

A、粮食总产量

B、粮食平均亩产量

C、人均粮食生产量

D、人均粮食消费量

三、多项选择题(在备选答案中有二个以上是正确的)

1、要了解某地区全部成年人口的就业情况,那么(ABD )

A、全部成年人口是研究的总体

B、成年人口总数是统计指标

C、成年人口就业率是统计标志

D、某人职业是教师是标志表现

E、反映每个人特征的职业是数量指标

2、下面研究问题中所确定的总体单位有(ABCDE )

A、研究某地区国有企业的规模时,总体单位是每个国有企业

B、研究某地区粮食收获率时,总体单位是每一亩播种面积

C、研究某种农产品价格,总体单位可以是每一吨农产品

D、研究货币购买力(一定单位的货币购买商品的能力),总体单位应是每元货币

E、确定某商店的销售额,总体单位是每一次销售行为。

3、在全国人口普查中,(BCE )

A、全国人口总数是统计总数

B、男性是品质标志表现

C、人的年龄是变量

D、每一户是总体单位

E、人口的平均年龄是统计指标

4、下列变量中属于离散变量的有(ABE )

A、机床台数

B、学生人数

C、耕地面积

D、粮食产量

E、汽车产量

5、下列各项中,哪些属于统计指标(ACDE )

A、我国1995年国民生产总值

B、某同学该学期平均成绩

C、某地区出生人口总数

D、某市工业劳动生产率

E、某企业全部工人生产某种产品的人均产量

6、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业进行普查,则每个乡镇工业企业是(BC )

A、调查总体

B、调查单位

C、报告单位

D、调查对象

E、既是调查总体又是调查单位

四、简答题

1、品质标志和数量标志有什么不同?品质标志可否加总?

品质标志是表明总体单位属性方面的特征,其标志表现不是数量的,只能用文字表现。质量指标是统计基本指标之一,它反映社会经济现象的相对水平或工作质量。它反映的是统计总体的综合

数量特征,可用数值表示,具体表现为相对数和平均数。品质标志本身不能直接汇总为统计指标,只有对其的标志表现所对应的单位进行总计时才形成统计指标,也并非就是质量指标,而是数量指标。

2、统计指标和标志有何区别与联系?

统计指标是反映社会经济现象总体某一综合数量特征的社会经济范畴。也可以说统计指标是指反映实际存在的一定社会总体现象的数量概念和具体数值。

我们按一定统计方法对总体各单位标志的标志表现进行登记、核算、汇总、综合,就形成各种说明总体数量特征的统计指标。例如,对某地区国有企业(总体)的每一工厂(总体单位)的总产值(标志)的不同数量(标志值)进行登记核算,最后汇总为全地区的工业总产值(指标)。

统计指标和标志的区别表现为:

首先,指标和标志的概念明显不同,标志是说明单位属性的,一般不具有综合的特征。指标是说明总体的综合数量特征的。具有综合的性质。

其次,统计指标分为数量指标和质量指标,它们都是可以用数量来表示的。标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。

统计指标和标志的联系表现为:

统计指标数值是由各单位的标志值汇总成或计算得来的。数量标志可以综合为数量指标和质量指标,品质标志只有对它的标志表现所对应的单位加以总计才能形成统计指标。总体单位的某一标志往往是总体某一统计指标的名称;

随研究目的不同,指标与标志之间可以互相转化。二者体现这样的关系:指标在标志的基础上形成,指标又是确定标志的依据。

第二章统计数据的收集、整理、显示

1、统计调查方式:普查、抽样调查、重点调查、统计报表制度

2、普查的特点:

〈一〉是一种非经常性的调查;

〈二〉是一种全面调查,

普查的组织形式1):经过组织的普查机构,配备一定数量的普查人员,对调查单位直接进行登

记。如:全国人口普查

2)利用调查单位的原始记录和核算资料,结合清库盘点,有调查单位自行填写调查报表。如:我国物资库存普查。

3、抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。概率抽样的特点:

〈一〉样本单位按随机原则抽取,排除了主观因素对选样的影响。

〈二〉根据部分调查的实际资料对调查对象总体的数量特征作出估计。

〈三〉抽样误差可以事先计算并加以控制

4、重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查

5、统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,

按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。

特点:〈一〉报表资料的来源是建立在各个基层单位的原始记录的基础上;

〈二〉由于统计报表是逐级上报和汇总的,各级领导部门能获得管辖范围内的报表资料;

〈三〉是一种经常性的(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。

6、统计调查方案设计:明确调查目的,确定调查对象和调查单位,设计调查项目,设计调

查表格和问卷,确定调查时间,组织实施调查,调查报告的撰写

7、确定调查对象和调查单位:

调查对象,是指需要调查的现象总体。

调查单位,是指所要调查的具体单位。报告单位亦称填报单位,它是负责向上报告查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。 调查单位与报告单位有时一致,有时不一致

如:进行工厂企业普查,每个工厂企业既是调查单位有时报告单位

进行工业企业设备的基本使用状况,调查单位是工业企业的每一台设备,报告单位

为每个工业企业

8、设计调查项目:调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,由

一系列品质标志和数量标志所构成

9、统计分组的概念

根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。

统计分组标志:品质标志或数量标志。

分组的性质:兼有分和合双重含义,对于现象总体,是“分”,对于单位,是“合”。 统计分组的原则:穷尽原则,互斥原则

统计分组的方法:a.

品质分组的方法 按品质标志分组。如:男或女,经济部门划

分为第一产业(农业、林业、畜牧业和渔业等)、第二产业、第三产业。

b.

数量分组的方法 按数量标志分组。

注意:(1)各组数量界限的确定能反应事物质的差别。

(2)根据被研究现象总体的数量特征,采用适当的分组形式,

确定组距、组限。

组距: 连续组距分组的组距=本组上限–本组下限

间断式组距且等距分组的条件下:

组距=本组上限–前组上限 =后组下限–本组下限 =本组上限–本组下限+1

组数:斯特杰斯经验公式:组数=1+3.3 Log N

组距=(最大变量值-最小变量值)/(1+3.3Log N ) 组中值 (上限+下限)/2 开口组的组距与组中值:

2

-2

相邻组距

上限缺下限开口组组中值=相邻组距

下限缺上限开口组组中值=

习题:

一、判断题(把“√”或“×”填在题后的括号里)

1、全面调查和非全面调查是根据调查结果所取得的资料是否全面来划分的 (×)

2、调查单位和填报单位在任何情况下都不可能一致 (×)

3、重点调查中的重点单位是标志值较大的单位。 (√)

4、调查方案的首要问题是确定调查对象 (×)

5、能够对统计总体进行分组,是由统计总体中的各个单位所具有的“同质性”特点决定的 (×)

6、按数量标志分组,各组的变量值能准确地反映社会经济现象性质上的区别。(√)

7、按数量标志分组所形成的变量数列就是次数分布数列。 (×)

8、由于离散型变量不能用小数表示,因此只能以单项数列来表现资料。 (×)

9、所谓组距是指每个组变量值中的最大值与最小值之差,也就是组的上限与下限之差。(×)

二、单项选择题

1、抽样调查与重点调查的主要区别是(D )

A、作同不同

B、组织方式不同

C、灵活程度不同

D、选取调查单位的方法不同

2、调查时限是指( B )

A、调查资料所属的时间

B、进行调查工作的期限

C、调查工作登记的时间

D、调查资料的报送时间

3、下列调查中,调查单位与填报单位一致的是( D )

A、企业设备调查

B、人口普查

C、农村耕畜调查

D、工业企业现状调查

4、调查项目(A )

A、是依附于调查单位的基本标志

B、与填报单位是一致的

C、与调查单位是一致的

D、是依附于调查对象的基本指标

5、统计整理阶段最关键的问题是( B )

A、对调查资料的审核

B、统计分组

C、统计汇总

D、编制统计表

6、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( B )

A、80—89% 90—99% 100—109% 110%以上

B、80以下80.1—90% 90.1—100% 100.1—110%

C、90以下90—99% 100—110% 110%以上

D、85%以上85—95% 95—105% 105—115%

7、划分离散变量的组限时,相邻两组的组限( C )

A、必须是间断的

B、必须是重叠的

C、既可以是不重合的,也可以是重叠的

D、应当是相近的

8、次数分配数列是( C )

A、按数量标志分组形成的数列

B、按品质标志分组形成的数列

C、按数量标志或品质标志分组形成的数列

D、按总体单位数分组形成的数列

9、分组标志一经确定就( B )

A、掩盖了总体单位在此标志下的性质差异

B、突出了总体单位在此标志下的性质差异

C、突出了总体单位在其他标志下的性质差异

D、使得总体内部的差异消失了

10、为了反映商品价格与需求之间的关系,在统计中应采用(C )

A、划分经济类型的分组

B、说明现象结构的分组

C、分析现象间依存关系的分组

D、上述都不正确

11、统计表的形式应该是( B )

A、上下不封顶,左右不开口C、上下要封顶,左右要开口

B、上下要封顶,左右不开口D、上下不封顶,左右要开口

三、多项选择题(在备选答案中有二个以上是正确的)

1、人口普查时,每户填写一份调查表,其中包括该户每个人若干项目的答案,判断下述哪种说法是对的(AE)

A、人是总体单位

B、户是总体单位

C、人是填报单位

D、普查登记小组是调查单位

E、户是填报单位

2、普查是一种(ACD )

A、专门组织的调查

B、连续性调查

C、一次性调查

D、全面调查

E、非全面调查

3、我国第四次人口普查的标准时间是1990年7月1日零时,下列情况应统计人口数的有(BDE )

A、90年7月2日出生的婴儿

B、90年6月29日出生的婴儿

C、90年6月29日晚死亡的人

D、90年7月1日1时死亡的人

E、90年6月29日出生,7月1日6时死亡的婴儿

4、统计分组的作用是(ACE )

A、划分社会经济类型

B、说明总体的基本情况

C、研究同类总体的结构

D、说明总体单位的特征

E、分析被研究现象总体诸标志之间的联系和依存关系

5、下列哪些分组是按数量标志分组(BCD )

A、学生按健康状况分组

B、工人按出勤率状况分组

C、企业按固定资产原值分组

D、家庭按收入水平分组

E、人口按地区分组

6、下面哪些是连续型数量标志(ABDE )

A、住房面积

B、商店的商品销售额

C、高校的大学生人数

D、人口的出生率

E、工业增长速度

7、下面哪些是变量分配数列(BCDE )

A、大学生按所学专业分配

B、大学生按年龄的分配

C、商店按商品销售额大小的分配

D、工人按生产每一零件时间消耗的分配

E、1991年某工厂每个月工人劳动生产率

8、非全面调查包括(ABD )

A、重点调查

B、抽样调查

C、快速普查

D、典型调查

E、统计年报

四、简答题1、抽样调查、重点调查和典型调查这三种非全面调查的区别是什么?

(1)选取调查单位的方式不同。重点调查中重点单位的选取是根据重点单位的标

志总量是否占全部单位标志总量的绝大比重这一标准来确定的,这一标准是客观存在的,所以易于确定。抽样调查中的调查单位是按随机原则从全部总体单位中抽选出来的,不受人的主观因素所影响。典型调查中的典型单位是在对总体情况分析的基础上有意识的抽选出来的。

(2)调查目的的不同。重点调查的目的是通过对重点单位的调查,掌握总体的基

本情况;抽样调查的目的则是通过对部分单位的调查结果来推算总体的数量特征;作为统计意义的典型调查,其目的类似于抽样调查。

(3)推算总体指法标的准确性和可靠程度不同。抽样调查和典型调查都要以部分

单位调查的结果推算总体指法标,由于二者调查单位选择的方法不同,其推算结果的准确性、可靠性也不同。抽样调查按随机原则抽选调查单位,因而在给定概率和误差范围条件下,可保证推断的准确性和可靠性;而典型调查单位的选择完全由人们有意识的选择,因而难以保证推断结果的准确性和可靠性,推断误差既不知道也不能控制。

五、计算题

1、某班40名学生统计学考试成绩分别为:

66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72

61 70 81

学校规定:60分以下为不及格,60—70为及格,70—80分为中,80—90分为良,90—100分为优

要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制一张次数分配表。(2)指出分组标志及类型;分组方法的类型;分析本班学生考试情况

.解:(1)“学生考试成绩”为连续变量,需采组距式分组,同时学生考试成绩变

学不及格人数和优秀生的人数都较少,分别为7.5%和10%。大部分同学成绩集中在70—90分之间,说明该班同学成绩总体良好。

考试成绩一般用正整数表示时,可视为离散变量也可用单项式分组,但本班学生成绩波动幅度大,单项式分组只能反映成绩分布的一般情况,而组距分组分配数列可以明显看出成绩分配比较集中的趋势,便于对学生成绩分配规律性的掌握。

2

上表变量数列属于哪一种变量数列;

上表中的变量、变量值、上限、下限、次数;

计算组距、组中值、频率。

(1)该数列是等距式变量数列

(2)变量是日产量,变量值是50-100,下限是50、60、70、80、90,上限是60、70、80、90、100,次数是6、12、18、10、7;

(3)组距是10,组中值分别是55、65、75、85、95,频率分别是11.32%、22.64%、33.96%、18.87%、13.21%。

3、某百货公司连续40天的商品销售额如下:单位:万元

41 25 29 47 38 34 30 38 43 40

46 36 45 37 37 36 45 43 33 44

35 28 46 34 30 37 44 26 38 44

42 36 37 37 49 39 42 32 36 35

要求:根据数据分组,编制频数分布表,并绘制直方图和折线图。

解:关于某百货公司连续40天的商品销售额频数分布表

销售额频数频率累积频数累积频率组中值万元(天)(%)以下以上以下以上万元25—30 4 10 4 40 10 100 27.5 30—35 6 15 10 36 25 90 32.5 35—40 15 37.5 25 30 62.5 75 37.5 40—45 9 22.5 34 15 85 37.5 42.5 45—50 6 15 40 6 100 15 47.5 合计 40 100.0 —————

16

14

12

10

8

6

4

2

第三章数据分布特征的描述

1、测定集中趋势的指标及作用

a.集中趋势:较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附

近,使得全部数据呈现出向中心聚集或靠拢的态势

b.测度集中趋势的指标有两大类:

1)数值平均数——是根据全部数据计算得到的代表值,主要有算术平均数、调和平均

数及几何平均数;

2)位置代表值——根据数据所处位置直接观察、或根据与特定位置有关的部分数据来

确定的代表值,主要有众数和中位数

c.测定集中趋势指标的作用::

1)反映变量分布的集中趋势和一般水平。

如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2)可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响,

在一定程度上使偶然因素的影响相互抵消。如在比较不同地区或不同时期的收入水平高低时,应用平均收入而不是总收入或个别人收入。 3)可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系

4)平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。 2.算术平均数(均值)

a 简单算术平均数: 适用于总体资料未经分组整理、尚为原始资料的情况

n

x

n

x

n

x x x x n

i i

n ∑=

=

+++=∑=1

21...

b .加权算术平均数:适用于总体资料经过分组整理形成变量数列的情况

∑∑===

++++++=m i i

m

i i

i m

m

m f

f

X

f f f f X f X f X X 1

1212211

权数可以是绝对数形式,也可以是比重形式(如频率)来表示。

f

f

x

x ∑∑= 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。 c.由组距数列计算算术平均数:各组变量值用组中值来代表。

d 对相对数求算术平均数: 由于各个相对数的对比基础不同,采用简单算术平均通常不合

理,需要加权。

3.调和平均数:调和平均数也称为倒数平均数。

各变量值的倒数(1/xi )的算术平均数的倒数.

H x ∑∑===++++++=n

i i

i n

i i

n

n n

x m m

x m x m x m m m m 11

22

1121

...... = n

n n

H m m m m x m x m x x ++++++=

...1

(111)

212211

社会经济统计中所应用的调和平均数通常是加权算术平均数的变形。

已知各组变量值 xi 和(xi fi )而缺乏 fi 时,加权算术平均数通常可变形为调和平均数形式

来计算。∑

∑∑∑=====

=

n

i i

i i n

i i

i n

i i

n

i i

i x f x f x f

f

x x 1

11

1)()

(

4.

几何平均数— n 个变量值连乘积的n 次方根。

n

n

i i

n n G x

x x x x ∏==???=1

21... 加权:∑=

???=

=∏=+++n

i i

i

k k

f n

i f i

f f f f k

f f G x

x x x x 1

212!1

)

...(21...

适用于各个变量值之间存在连乘积关系的场合。 主要用于计算现象的平均发展速度,

也适用于对某些具有环比性质的比率求平均.

5. 众数是一组数据中出现频数最多、频率最高的变量值,常用 M0 表示。 a.众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有M0=“白色” 可以度量定量变量的集中趋势。

从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。 b.组距数列中众数的确定:先确定众数组,再通过一定的公式计算众数的近似值。 1) 先找到众数组:

在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 2)根据众数组与其相邻两组的次数差来推算: 下限公式: O O M M O d L M ??+??+

=2

11

下限公式:O O M M O d U M ??+??-=212

其中O M L 、O M U 、O M d 分别为总数组的下限、上限、组距,1?为总数组的次数与前一组次数之差,2?为总数组次数与后一组次数之差。 6.中位数是将数据由小到大排列后位置居中的数值e M a.

由未分组数据计算中位数:

若数据项数是奇数,则正好位于中间的数值就是中位数 若数据项数是偶数,则取居中两个数值的平均数为中位数

b. 由组距数据计算中位数:

先确定中位数组,即中间位置(用Σf/2来计算)所在的组。

上限公式Me Me Me Me e d f S f

L M ?-∑+

=-1

2下限公式Me Me

Me Me e d f S f U M ?-∑-=+12 Me L Me U Me d Me f 分别为下限,上限、组距、次数,1-Me S 变量值小于中位数组下限的

各组次数的累计数,1+Me S 变量值大于中位数组下限的各组次数的累计数

7.众数、中位数和算术平均数的比较

1.算术平均数综合反映了全部数据的信息,众数和中位数由数据分布的特定位置所确定。

2.算术平均数和中位数在任何一组数据中都存在而且具有惟一性,但计算和应用众数有两个前提条件:(1)数据项数众多;(2)数据具有明显的集中趋势。

3.算术平均数只能用于定量(数值型)数据,中位数适用于定序数据和定量数据,众数适用

于所有形式(类型、计量层次)的数据

4.算术平均数要受数据中极端值的影响。而众数和中位数都不受极端值的影响。

5. 算术平均数可以推算总体的有关总量指标,而中位数和众数则不宜用作此类推算。

8、测定离散程度的指标称变异指标

a作用1.说明数据的分散程度,反映变量的稳定性、均衡性

2衡量平均数的代表性

3统计推断的重要依据

b两类变异指标:

用绝对数或平均数表示:极差、四分位差、平均差、标准差等。

用相对数表示:离散系数、异众比率等。

9

10

11.方差的主要数学性质

方差或标准差是从平均的意义上反映每个数据与其均值的差异大小,方差和标准差越大,说明变异的程度越大,反之,越小,说明变量的变异程度越小,数据越集中,

方差或标准差都是根据全部数据计算的,因此他们能够充分利用全部数据的差异信息,全面反映数据的离散成度,由于对离差取平方计算,标准差对较大偏差的反映更为灵敏,一边情况下,根据同一组数据计算的标准差要比平均差大些。 12标准化值

12离散系数 (变

异系数)是极差、四分位差、平均差或标准差等变异指标与算术平均数的比 率,以相对数的形式表示变异程度。最常用的离散系数是就标准差来计算的,称之为标准差系数

x

V σ

σ=

离散系数大,说明数据的离散程度大,其平均数的代表性就差;反之亦然

13.

异众比率

∑i

i

f

为总次数O m f 为众数值的次数

习题填空题

1、数据分布集中趋势的测度值(指标)主要有 众数 、 中位数 和 均值 。其中 众数 和 中位数 用于测度品质数据集中趋势的分布特征, 均值 用于测度数值型数据集中趋势的分布特征。

2、标准差是反映 数据离散程度 的最主要指标(测度值)。

3、几何平均数是计算 平均比率 和 平均速度 的比较适用的一种方法。

4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算 标准系数 。

5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈 对称 分布。

6、当一组工人的月平均工资悬殊较大时,用他们工资的 众数(中位数) 比其算术平均数更能代表全部工人工资的总体水平。 二、单选题:

反映的时间状况不同,总量指标可分为( (2) )

(1)总量指标和时点总量指标 (2)时点总量指标和时期总量指标 (3)时期总量指标和时间指标 (4)实物量指标和价值量指标

2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( (2) )

(1)5.5% (2)5% (3)115.5% (4) 15.5%

3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( (2) )

接近标志值小的一方 (2)接近标志值大的一方 (3)接近次数少的一方 (4)接近哪一方无法判断

4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( (1) ) (1)可变的 (2)总是各组单位数 总是各组标志总量 (4)总是各组标志值

5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( (3) )

(1)提高 (2)不变 (3)降低 (4)不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( (2) ) (1)说明变量值越分散,平均数代表性越低 (2)说明变量值越集中,平均数代表性越高 (3)说明变量值越分散,平均数代表性越高 (4)说明变量值越集中,平均数代表性越低 7、有甲、乙两数列,已知甲数列:07.7,70==甲甲

σX ;乙数列:

41.3,7==乙乙σX 根据以上资料可直接判断( (4) )

(1)甲数列的平均数代表性大 (2)乙数列的平均数代表性大 (3)两数列的平均数代表性相同 (4)不能直接判别 三、多选题:

某企业计划2000年成本降低率为8%,实际降低了10%。则以下说法正确的是 ( (3)、(5) )

(1)该企业的计划完成程度为10%/8%=125%

(2)该企业的计划完成程度为110%/108%=101.85%

(3)该企业的计划完成程度为90%/92%=97.83%

(4)该企业未完成计划任务

(5)该企业超额完成了计划任务

2、下列那些指标属于结构相对指标((1)、(2)、(4))

(1)废品率(2)平常函件差错率

(3)电话机普及率(4)生产工人占全部职工的比重

(5)产值利税率

3、应采用算术平均数计算的有((1)(3))

(1)已知工资总额及工人数求平均工资

(2)已知计划完成百分比和实际产值,求平均计划完成百分比

(3)已知计划完成百分比和计划产值,求平均计划完成百分比

(4)已知某厂1990到1995年的产值,求平均发展速度

4、标志变异指标(离散程度测度值)的主要作用((1)(3))

(1)衡量平均数代表性的大小

(2)可以反映总体单位的均匀性和稳定性

(3)可以反映社会经济活动过程的节奏性和均衡性

(4)科学地确定必要抽样单位的因素

(5)分析社会经济现象某总体的变动趋势

5、加权平均数的大小受下列那些因素的影响((1)(2)(3) )

(1)受各组频数或频率的影响(2)受各组值大小的影响

(3)受各组变量值和频数的共同影响(4)只受各组变量值的影响

一、简答题

1、在考察数据分布特征时,如何正确的选择集中趋势的测度值。

答:首先要根据数类型选择集中趋势的测度值,定类数据选择众数,定序数据选择

中位数数或分位数,数值型数据则一般选用均值;此外,对于数值型数据,还需要进一步根

据数据的分布特征进一步选择不同的集中趋势测度值。当数据成对称分布或接近对称分布时,应选择均值作为集中趋势的测度值;当数据为偏态分布,特别是偏斜的程度较大时,应选择众数或中位数作为集中趋势的代表值。

2、述平均指标(集中趋势测度值)与变异指标(离散程度测度值)之间的关系。

答:平均指标和变异指标都是说明数据分布特征的测度值,其中平均指标说明数据分布的集中趋势,而变异指标则说明数据分布特征的离中趋势,两者从不同的方面反映数据的分布特征。两者既有区别也有联系,联系主要表现为变异指标可以衡量平均指标的代表性大小,根据一组数据计算的变异指标大,其平均数的代表性就差;变异指标小,其平均数的代表性就大。

3、什么是标准差系数?为什么要计算标准差系数?

答:标准差系数又称为离散系数,它是一组数据的标准差与其相应的均值之比,是测度离散程度的相对指标。计算离散系数主要是为了消除变量值高低和计量单位不同对离散程度测度值的影响。离散系数主要用于变量值高低和计量单位不同的数据之间离散程度的对比。

二、计算题

1、某地电信局每月固定收取每部电话16元,用户每拨一次电话安使用时间每分钟0.1元

收费。以下是6个用户的时间,计算6个用户本月使用电话的平均时间,使用电话的时间标准差。本月平均每户电话费的标准差。

解:

(1) 平均时间=

分钟)(806

120

40100805090=+++++

(2) 时间标准差=6

80-12080-408010080-8080-5080-902

22222)

()()()()()(++-++

=27.69(分钟)

(3) 平均电话费=

元)(246

28

2026242125=+++++

(4) 电话费标准差=

6

)2428()2420()2424()2421()2425(2

222

2-+-+-+-+-

=2.77(元)

2、 企业60名工人包装某产品的数量资料如下:

试计算4、5月份的劳动生产率,并指出4、5月劳动生产率高低不等的原因。

解:

435054501355018650157507850234200

57051318157260

X ?+?+?+?+?+?=

==+++++(件/人)

57060

342005

==X (件/人)

原因:五月份劳动生产率高的工人人数比重较大

3、 某管理局所属企业按职工劳动生率高低分组如下:

计算:工人平均劳动生产率。

人)元/(6.657366

240700

95015200

8502550075052500650650005508250015200

25500525006500082500==

++++++++=

=

∑∑X M M X

4、甲、乙两局二月份打往美国(单价:15元/分)方向的去话业务收入资料如下:

试问哪个局的平均单价高?并说明原因。 解:(元)甲11.5%401516200

%801524000151500016200

2400015000=?+?+++=

X

(元)乙11.7%

401518000

%801518000152250018000

1800022500=?+

?+++=

X

原因:乙局7-21点之间的业务量相对较多。

5、有甲、乙两单位,甲单位的平均工资为950元,标准差为140元。乙单位工资资料如下

用尽可能简便的方法比较甲、乙两单位工人平均工资的代表性大小。 解:9501000

100

11502001050400950200850100750=?+?+?+?+?=

乙X (元)

5.1091000

100

115020010504000200100100200222=?+?+?+?+?=乙σ(元)

因甲乙两单位的平均工资相等,且甲单位的标准差较大。因此乙单位平均工资的代表性较大。

第九章

1.绝对数时间序列

2.时期序列时点序列的区别特点

①时期序列的各个数据为时期指标(流量),表示现象在各段时期内的总量。时点序列的各

个数据为时点指标(存量),反映现象在各个时点上所处的状态和所达到的水平.

②时期序列中各期数据具有可加性,通过加总即可得到更长一段时间内的总量。时点序列

中不同时点上的数据不能相加,即它们相加的结果没有意义。

③时期序列中数值大小与所属时期长短有直接的关系,时点序列中各时点数值大小与时点

间隔长短没有直接的联系。

④时期序列中各期数据是对每段时间内发生的数量连续登记的结果,时点序列中数据通常

不可能也不必要连续登记。

3时间序列的编制原则a时间一致b总体范围一致c经济内容,计算方法,计算口径一致。

4、绝对数时间序列的平均发展水平

(2)连续时点序列——用简单算术平均法

不连续时点序列

5增长量与平均增长量

6发展速度与平均发展速度

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

统计学知识点全归纳__全面、准确

一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 (1)政治算术学派 最早的统计学源于17世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 (2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名,无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。 (4)数理统计学派 创始人是比利时统计学家凯特勒,他所著的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。 (4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析 描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

统计学原理知识点公式

统计学原理知识点及公式 第一章统计总论 ?1.统计一词的三种含义 ?2.统计学的研究对象及特点 ?3.统计学的研究方法 ?4.统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。 ?5.国家统计兼有的职能 第二章统计调查 ?1.统计调查的概念和基本要求 ?2.统计调查的种类 ?3.统计调查方案的构成内容 ?4.统计调查方法:普查、抽样调查、重点调查、典型调查 ?5.调查误差的种类 第三章统计整理 ?1.统计整理的概念和方法 ?2.统计分组的概念、种类 ?3.统计分组的关键 ?4.统计分组的方法:品质分组方法、变量分组的方法 ?5.分配数列的概念、构成及编制方法 变量数列的编制基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,组距可计算得到:组距= 全距÷组数全距= 最大变量值-最小变量值。 第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。) 第五步:汇总出各组的单位数(注意:不同方法确定的组限在汇总单位数时的区别),计算频率,并编制统计表。 间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。

重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。 因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。 ?6.统计表的结构和种类 第四章综合指标 ?1.总量指标的概念、种类和计量单位 ?2.相对指标的概念、指标数值的表现形式、相对指标的种类。相对指标包括: 结构相对指标、比例相对指标 比较相对指标、强度相对指标 动态相对指标、计划完成程度相对指标 ●3.平均指标的概念、作用和种类。 算术平均数、调和平均数、众数、中位数

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学知识点全归纳全面准确

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 二、统计学的产生与发展 (1)政治算术学派 最早的统计学源于17世纪英国。其代表人物是威廉·配第,代表作《政治算术》。政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。其被称为“无统计学之名,有统计学之实”。 (2)记述学派 亦称国势学派,创始人和代表人物是德国康令和阿亨瓦尔,主要使用文字记述方法对国情国力进行研究,其学科内容与现代统计学有较大差别。因此被称为“有统计学之名,无统计学之实”。 (3)社会统计学派 创始人和代表人物,德国恩格尔和梅尔。该学派主张统计是实质性的研究社会现象的社会科学,认为统计学的研究对象是社会现象,目的在于明确社会现象内部的联系联系和相互关系。 (4)数理统计学派 创始人是比利时统计学家凯特勒,他所着的代表作《社会物理学》等将概率论和统计方法引入社会经济方面的研究,其认为统计学是一门通用的方法论科学。 从19世纪中叶到20世纪中叶,数理统计学得到迅速发展。到20世纪中期,数理统计学的基本框架已经形成,数理统计学派成为英美等国统计学界的主流。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。 (4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。(2)收集数据

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

2018年【统计学原理】考试必备知识点复习考点归纳总结(计算题)(新)1

统计学原理复习(计算题) 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)计算本单位职工业务考核平均成绩 (4)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限; (3)本单位职工业务考核平均成绩 (4)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态,说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下: 试问哪一个市场农产品的平均价格较高?并说明原因。 解:

解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.14 5 .5/==∑∑= x m m X (元/斤) 乙市场平均价格325.14 3.5==∑∑=f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为9.6件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1) 50.291001345343538251515=?+?+?+?== ∑∑f xf X (件) 986.8) (2 =-= ∑∑f f X x σ(件) (2)利用标准差系数进行判断: 267.0366.9===X V σ甲 305.05 .29986.8===X V σ乙 因为0.305 >0.267 故甲组工人的平均日产量更有代表性。 4.某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其月平均产量水平,得每人平均产量560件,标准差32.45 要求:(1)计算抽样平均误差(重复与不重复);

统计学重点、难点问题总结

1、品质标志和数量标志有什么区别 答:品质标志表明总体单位属性方面的特征,其标志表现只能用文字来表现;数量标志表明总体单位数量方面的特征,其标志表现可以用数值表示,即标志值。 2、什么是统计指标统计指标和标志有什么区别和联系 答:统计指标是反映社会经济现象总体综合数量特征的科学概念或范畴。统计指标反映现象总体的数量特征;一个完整的统计指标应该由总体范围、时间、地点、指标数量和数值单位等内容构成。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 标志和指标的主要联系表现在:指标值往往由数量标志值汇总而来;在一定条件下,数量标志和指标存在着变换关系。 统计指标和统计标志是一对既有明显区别又有密切联系的概念。二者的主要区别是:指标是说明总体特征的,标志是说明总体单位特征的;指标具有可量性,无论是数量指标还是质量指标,都能用数值表示,而标志不一定。数量标志具有可量性,品质标志不具有可量性。 3、统计普查有哪些主要特点和应用意义 答:普查是专门组织的、一般用来调查属性一定时点上社会经济现象数量的全面调查。普查的特点:(1)普查是一种不连续调查。因为普查的对象是时点现象,时点现象的数量在短期内往往变动不大,不需做连续登记。 (2)普查是全面调查。它比任何其它调查方法都更能掌握全面、系统的反映国情国力方面的基本统计资料。 (3)普查能解决全面统计报表不能解决的问题。因为普查所包括的单位、分组目录、指标内容比定期统计报表更广泛、更详细,所以能取得更详尽的全面资料。 (4)普查要耗费较大的人力、物力和时间,因而不能经常进行。 4、抽样调查有哪些特点有哪些优越性 答:(1)抽样调查是一种非全面调查,但其目的是要通过对部分单位的调查结果推断总体的数量特征。 (2)抽样调查是按照随机原则从全部总体单位中来抽选调查单位。所谓随机原则就是总体中调查单位的确定完全由随机因素来决定,单位中选与不中选不受主观因素的影响,保证总体中每一个单位都有同等的中选可能性。抽样调查方式的优越性现在经济性、实效性。准确性和灵活性等方面。 抽样调查的作用:能够解决全面调查无法解决或解决困难的问题;可以补充和订正全面调查的结果;可以应用于生产过程中产品质量的检查和控制;可以用于对总体的某种假设进行检验。 5、统计分组可以进行哪些分类 答:根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志化分为若干性质不同而又有联系的几个部分,称为统计分组。 统计分组可以按分组的任务和作用、分组标志的多少以及分组标志的性质等方面来进行分类。 统计分组可以按其任务和作用的不同,分为类型分组、结果分组和分析分组。进行这些分组的目的,分别是化分社会经济类型、研究同类总体的结构和分析被研究现象总体诸标志之间的联系和依存关系。类型分组和结构分组的界限比较难区分,一般认为,现象总体按主要的品质标志分组,多属于类型分组,如社会产品按经济类型、按部门、按轻重工业分组;按数量标志分组多是结构分组。进行结构分组的现象总体相对来说同类较强。如全民所有制企业按产量计划完成程度、劳动生产率水平、职工人数、利税来分组。分析分组是为研究现象总体诸标志依存关系的分组。分析分组的分组标志称为原因标志,与原因标志对应的标志称为结果标志。原因标志多是数量标志,也运用品质标志;结果标志一定是数量标志,而且要求计算为相对数或平均数。 统计分组按分组标志的多少分为简单分组和复和分组。简单分组实际上就是各个组按一个标志形成的。而复制分组则是各个组按两个以上的标志形成的。

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

统计学贾俊平考研知识点总结

统计学重点笔记 第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显示,进而通过综合、概括与分析,得出反映所研究现象的一般性特征。 (2)推断统计学:是研究如何利用样本数据对总体的数量特征进行推断的统计学分支。研究者所关心的是总体的某些特征,但许多总体太大,无法对每个个体进行测量,有时我们得到的数据往往需要破坏性试验,这就需要抽取部分个体即样本进行测量,然后根据样本数据对所研究的总体特征进行推断,这就是推断统计所要解决的问题。其内容包括抽样分布理论,参数估计,假设检验,方差分析,回归分析,时间序列分析等等。 (3)两者的关系:描述统计是基础,推断统计是主体 二、比较分类数据、顺序数据和数值型数据: 根据所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 (1)分类数据是只能归于某一类别的非数字型数据。它是对事物进行分类的结果,数据表现为类别,是用文字来表达的,它是由分类尺度计量形成的。 (2)顺序数量是只能归于某一有序类别的非数字型数据。也是对事物进行分类的结果,但这些类别是有顺序的,它是由顺序尺度计量形成的。 (3)数值型数据是按数字尺度测量的观察值。其结果表现为具体的数值,现实中我们所处理的大多数都是数值型数据。 总之,分类数据和顺序数据说明的是事物的本质特征,通常是用文字来表达的,其结果均表现为类别,因而也统称为定型数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此可称为定量数据或数量数据。 三、比较总体、样本、参数、统计量和变量: (1)总体是包含所研究的全部个体的集合。通常是我们所关心的一些个体组成,如由多个企业所构成的集合,多个居民户所构成的集合。总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。有限总体是指总体的范围能够明确确定,而且元素的数目是有限可数的,需要注意的是,统计意义上的总体,通常不是一群人或一些物品的集合,而是一组观测数据。 (2)样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。例如我们从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。

相关主题
相关文档 最新文档