当前位置:文档之家› 应用统计学复习思考题参考答案

应用统计学复习思考题参考答案

应用统计学复习思考题参考答案
应用统计学复习思考题参考答案

应用统计学复习思考题参考答案

第一章绪论 (1)

第二章统计数据的收集与整理 (10)

第三章抽样分布 (21)

第四章统计推断 (23)

第五章方差分析 (27)

第六章回归分析 (30)

第七章时间序列分析 (37)

第八章复习思考题 (43)

第九章统计决策 (46)

第十章产品质量的统计管理 (55)

第一章绪论

1.如何理解“统计”一词的含义?

答:统计是指根据研究目的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。

从字面上直观理解,“统计”是指对大量事物进行汇总计数,因此可以简单地说统计就是总起来计量,即统而计之。例如计算全国的总人口数、国内生产总值,计算某个企业的职工人数、产品产量,甚至是计算某个家庭每月的收入和支出等等都是统计。

随着社会经济的发展,“统计”的涵义也不断地拓展和延伸。从不同角度看,对“统计”一词可以有不同的理解:

1.统计活动

统计活动也称为统计实践、统计工作,是指根据统计目的及要求,运用科学的方法,对客观事物或人类实践活动的数据资料进行调查、整理、分析的过程。

2.统计资料

统计资料是统计实践活动的成果或产品,既包括调查得到的原始资料,也包括整理和分析而成的系统的统计资料,通常以调查表、统计表、统计图的形式提供。统计资料反映了事物的数量特征及其变动规律。

3.统计学

统计学是关于统计理论和方法的科学,是研究如何对社会总体的数量特征和规律进行描述、推断、认识的一门学科。

上述三种不同的理解又是相互联系,不可分割的。一方面,统计实践活动为我们描述、推断、认识事物的统计规律提供必不可少的统计资料;另一方面,统计实践活动又需要正确的统计理论和方法作指导。

2.简述统计活动的过程。

答:统计调查、统计整理和统计分析是基本的统计活动,所提供的统计资料包括原始统计资料、整理结果和分析结论。进行这些基本活动之前的统计设计,以及之后的资料保存、利用等也是必要的统计活动。

统计活动一般按照统计设计、统计调查、统计整理、统计分析和统计资料的开发利用这几个阶段依次进行。如图1.1.1所示。

图1.1.1 统计活动过程示意图

统计设计是统计活动的第一个阶段,根据统计目的及要求,统计设计是对统计调查、统计整理、统计分析和统计资料的保存、利用、发布等统计活动进行通盘考虑和安排。统计设计的结果表现为各种标准、规定、制度、方案和办法,如统计分类标准、统计目录、统计指标体系、统计报表制度、统计调查方案、普查办法、统计整理或汇总方案。

统计调查是具体实施的第一个环节,是根据事先拟定的统计调查方案具体收集原始统计

资料的过程。

统计整理是对调查所收集的原始统计资料进行分组、汇总的过程。

统计分析是运用各种统计分析方法,对整理的统计资料进行深入分析,并联系历史资料和其他有关资料进行纵向和横向、静态和动态的分析,以揭示客观现象和人类实践活动的规律性。

最后要进行统计资料的开发利用、发挥统计的作用,包括提供统计信息、统计咨询和统计监督三个方面的作用,这也是统计的目的及要求。

3.人类统计活动产生与发展的大致时期和过程如何?

人类的统计活动历史悠久,在原始社会时期,人类最初利用手指、石子、贝壳、小木棍以及绳索等工具进行的一般计数活动就蕴藏着统计萌芽。据历史资料记载,“结绳记事”始于我国伏羲时代,西汉时曾经出现伏羲与女娲结绳的画像,在东汉武梁祠的浮雕上还刻有“伏羲仓精,初造王业,画卦结绳,以理海内”的铭文。“为约,事大,大结其绳;事小,小结其绳。结之多少,随物众寡。”随着社会生产力的发展,人们在生产实践中,逐渐感到“结绳记事”已不能适应生产发展的需要,于是便开始向“书契记数”的时代迈进。“书”指文字,刻字在竹、木或龟甲、兽骨上以记数、记事,称为“书契”。

进入奴隶社会,统治者为了满足国家管理的需要,开始进行较系统的人口、土地等统计活动。例如据历史资料记载,早在公元前27世纪,埃及为了建造金字塔和大型农业灌溉系统,曾进行过全国人口和财产统计。我国在公元前21世纪的夏禹时期,全国国土划分为翼、兖、青、徐、扬、荆、豫、梁、雍等九州,有人口约1335万人,土地约2438万顷。有的统计学者认为这些统计数字是“我国最早的统计数字资料”。到了商代,由于国家机构的完整,以及甲骨文的应用,开始建立了附属于官僚机构的统计组织,并形成了政府统计的萌芽,统计工作在军事、祭祀、田猎等方面已较广泛地开展。

在封建社会,统计已经具有一定规模,并开始建立人口、土地登记调查制度。早期的统计多数是涉及人口、财产和军事等方面的国情国力。

到了资本主义社会,社会生产活动日益复杂,生产要素的流动性大幅度增加,以简单汇总计数为主的静态统计已经不能适应资本主义国家管理的需要。统计工作逐步由人口、财产等领域扩展到工业、贸易、运输业、保险业等领域。随着统计领域的迅速扩大,统计的内容和方法也不断发展。20世纪40年代,伴随着资本主义经济大萧条而产生的凯恩斯主义,对宏观统计实践提出了新的重大需求,逐步建立国民经济统计核算体系。此后,宏观统计活动又进一步从经济统计扩展到科学技术统计。统计实践活动不断丰富和迅速发展为统计学说的创立奠定了深厚的基础。

在现代社会,统计作为政府管理的重要手段和工具,日益受到各国政府的重视。世界各国和重要国际组织都成立了专门的统计机构,制定、颁布了统计法规,统计工作逐步实现经常化、规范化、专门化。统计活动的规模、范围越来越大,从国家、行业、企业范围内统计,到世界范围内统计,从农业、商业、工业、外贸等各个领域统计,到社会经济综合统计,从一般的数据记录、汇总,到数据的综合分析,从静态的统计到动态的统计,从政府统计到民间统计等等。统计活动渗透到人类社会生活、生产经营活动、科学研究等各个方面。统计机构和人员定期或不定期地开展各项统计调研活动,召开统计工作会议,出版统计年鉴、统计论著和学术刊物。统计已经成为社会分工中的一个独立部门和专业。

4.统计学产生与发展的大致时期和过程如何?

统计活动源远流长。但统计学作为一门独立的学科至今却只有300多年的历史。在统计活动不断发展的过程中,基于对统计实践的总结、提炼,统计学应运而生。虽然我国统计活动历史悠久,并且许多古代思想家很早就提出了统计思想和统计方法,进行了一些统计研究,但是一般认为统计学科产生于西方国家。按照统计学的发展历程,我们可以把统计学划分为

古典统计学、近代统计学和现代统计学三个时期,如图1.1.2所示。

17

图1.1.2 统计学的发展历程示意图

5.统计学发展过程中有哪些主要学派?其学术观点是什么?主要代表人物及其对统计学的贡献有哪些?

从17世纪中叶到18世纪末,是统计学的萌芽期,亦称古典统计学时期。这一时期出现了政治算术学派和国势学派两个统计学派。

1.政治算术学派

政治算术学派的创始人是英国的威廉·配第(Willian Patty,1623~1676)和约翰·格朗特(John Graunt,1620~1674)。格朗特在1662年发表了一篇《关于死亡表的自然和政治观测》一文,被认为是政治算术学派的第一篇研究论文。这篇论文以人口问题为研究对象,通过大量观测,运用数量对比分析的方法对当时伦敦人口的出生率、死亡率、性别比例等人口数据进行统计分析,揭示其中规律性,例如男性的死亡率高于女性,新生男女婴儿的性别比例大概为14:13。威廉·配第的代表作是1690年出版的《政治算术》一书,书中运用大量的实际统计资料,对英国、法国和荷兰三个国家的经济实力从数量上进行对比分析。政治算术学派强调用数字、重量和尺度来说话,所提出的数量对比分析法为统计学的建立奠定了方法论基础。政治算术是统计学的真正开端,威廉·配第被认为是统计学的创始人。由于未使用“统计学”这一学科命名,所以政治算术被称为有实无名的统计学。

2.国势学派

国势学派,也叫记述学派。国势学派与政治算术学派产生于同一时期,创始人是德国的康令(H.Conring,1606~1681)和阿亨瓦尔(G.Achenwall,1719~1772)。康令第一个在德国的大学讲授《欧洲最近国势学》。阿亨瓦尔在1749年出版《近代欧洲各国国势学论》,首先提出统计学学科的名词,德文词汇是“Statistik”,来源于拉丁语“Status”,原意是指“国家显著事项的比较和记述”或“国势学”,认为统计是关于国家应注意事项的学问。此后,各国相继沿用“统计”这个词,并把这个词译成各国的文字,法国译为Statistique,意大利译为Statistica,英国译为Statistics,日本最初译为“政表”、“政算”、“国势”、“形势”等,直到1880年才正式确定采用汉字“统计学”。因此,“统计”一词就成了记述国家和社会状况的数量关系的总称。国势学派强调用文字记述的形式,把国家的显著事项系统地整理并罗列出来,例如“人口稠密”、“土地广阔”等等,为政治家提供治国必需的国情知识。由于“国势”与“统计”在德文中词源相通,因此,国势学派一直以统计学命名。国势学的缺陷是缺乏数量分析的方法和结论,与现代统计学相去甚远,所以人们将其称为有名无实的统计学。国势学派与政治算术学派共存近两百年,两派长期争论不休,但两派却有一个共同特点,即都是以宏观社会经济问题为研究对象,故通称为社会经济统计学派。

从18世纪末到19世纪末属于统计学的发育成长期,亦称近代统计学时期。这一时期产生了数理统计学派和社会统计学派。

3.数理统计学派

数理统计学派产生于19世纪中叶,创始人是比利时的凯特勒(Adolphe Quetelet,1796~1874)。进入19世纪,数学中的一个分支概率论得到发展,凯特勒首先将概率论原理引入了统计学,出版了一系列关于统计学问题研究的著作,主要有《概率论书简》、《统计学的研究》、《社会物理学》、《论人类》等。他将自然科学的研究方法引入社会现象的研究中,

大大丰富了统计学的内容,后经过多人的发展逐渐形成一门独立的应用数学分支,即数理统计学。凯特勒还倡导建立国家统计机构,并担任领导人;倡议并积极推动召开国际统计会议,第一次国际统计会议于1853年在比利时的布鲁塞尔召开,到1885年发展成为国际统计学会,并于1887年在罗马召开国际统计学会第一届会议,以后每两年召开一次。凯特勒对统计学的发展做出了巨大的贡献,被人们称为“近代统计学之父”。数理统计学派强调统计学是一门基础性的或通用的方法论科学。

凯特勒作为数理统计学派的奠基人,其主要贡献是把概率论引入社会现象的研究之中。凯特勒认为,社会现象与自然现象一样,存在其自身的规律性。他强调统计学应当表现或研究这些规律,并运用统计手段去揭示它。凯特勒比政治算术学派的数量分析方法前进了一步。但他侧重于定量分析方法的运用,却忽视了社会经济现象自身的内容和特点。有人说凯特勒在“算术”上进步了,在“政治”上却倒退了。数理统计学以概率论作为理论基础,抽象掉统计学的社会经济现象内涵,变成了抽象的数学分析和推断技术,成为一门方法论学科。

4.社会统计学派

社会统计学派产生于19世纪后半叶,由德国的克尼斯(K.G.A.Knies)、恩格尔(C.L.E.Engel1821~1896)以及梅尔(G.V.Mayer)等人创立。社会统计学在这里也称为社会经济统计学,包括政治统计、经济统计、人口统计、犯罪统计等多方面内容。恩格尔在他的研究中提出了著名的“恩格尔定律”:一个家庭收入越少,家庭收入中(或总支出中)用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中(或总支出中)用来购买食物的支出则会下降。推而广之,一个国家越穷,每个国民的平均收入中(或平均支出中)用于购买食物的支出所占比例就越大,随着国家经济发展水平的逐步提高,这个比例呈下降趋势。根据恩格尔定律计算的恩格尔系数(=食物支出金额/总支出金额)一直作为衡量生活水平高低的一个指标沿用至今。社会统计学派强调统计学是一门研究社会经济现象变动规律的实质性科学。

6.统计学有哪些分科?他们之间的关系是什么?

进入20世纪后,随着数学、社会学、经济学等各个学科的发展,统计学无论是在理论方法上还是在应用上都得到迅速发展。统计学学科体系日趋完善,进入现代统计学时期。现代统计学已发展成一门多分支的科学,并且仍处于不断发展的过程中。根据研究的侧重点不同,人们通常将统计学划分为理论统计学和应用统计学两个大类。

理论统计学是指统计学的数学原理,它根植于纯数学的一个领域—概率论。从广义来说,统计理论可以认为是包括概率论的,此外还包括一些并不属于传统概率论的内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理,这些原理可以看成是概率论公理的扩增。

与理论统计学相对应的是应用统计学。在统计实践中常常会遇到一些新问题,使原有的统计方法不适应,需要统计学家针对新问题去建立一个与实际情况相适合的统计模型,创造新的统计方法去分析。将统计学的基本原理应用于各个领域就形成各种各样的应用统计学。它包括一整套统计分析方法,有的是适用于各个领域的一般性的统计方法,如数据收集与整理、参数估计、假设检验、方差分析、相关与回归等。有的则是某一专业领域中特有的分析方法,例如经济统计学中的指数分析法、统计决策及产品质量统计管理等。近几十年来,由于统计研究的范围越来越广,一些科学实验也日趋复杂,统计方法也相应地复杂化和专门化,在应用统计方法中必须对因模型和实际情况的不一致而引起的各种误差的性质和大小作出判断,或提出改进的措施。由于统计的工具更加专门化了,它们就缺少通用性,要求一个统计学家熟悉所有的专门工具已不可能。为了适应这种发展的需要,既熟悉统计知识又熟悉某一领域业务的应用统计学家就应运而生,同时也产生了相应的应用统计学。这类统计学的特点是不着重于统计数学原理的推导,而是侧重于阐明统计的思想,并将理论统计学的结论作

为工具应用于各个具体领域。本书属于通用性的应用统计学,并侧重于统计学在经济与管理领域的应用。现代统计学的另一个显着特点是计算机技术、网络技术以及信息技术在统计中的广泛应用,使得统计学科的内容更加丰富。通用和专业统计软件的开发和应用成为统计学工作者的一项重要任务。统计学学科体系如图1.1.3所示。

图1.1.3 统计学的学科体系简图

数理统计学是应用数学的一个分支,在这里作为统计学的一个分支,它以概率论等数学理论为基础,研究随机现象的数量规律,是一门纯方法论的科学,为其它学科提供数学分析和推断的方法与技术。该学科从19世纪中叶创立以后发展迅速,先后由许多统计学家建立了参数估计与假设检验理论、非参数统计理论、相关与回归分析理论、统计决策理论、实验设计理论等数理统计学的新分支。数理统计学又可以分为理论数理统计学和应用数理统计学,前者研究统计理论和方法的数理依据,后者研究量化分析的方法技术。

统计学原理是在统计实践的基础上,对统计理论方法的最一般概括,内容包括统计的对象和任务,统计的理论基础和方法论基础,以及关于统计活动各个环节的理论和方法。统计学原理中结合了数学、概率论和数理统计学的知识,又是统计实践经验的高度总结,是指导统计实践活动的科学依据。一般所说的统计学就是指统计学原理。

社会经济统计学是将理论统计学应用于社会经济领域,以社会、经济、人口、科技和文化等人类自身及其活动为对象的统计方法论,为对社会经济现象数量特征进行的调查研究提供原理、原则和方式方法。人口统计学、教育统计学、司法统计学、社会保障统计学、医药与卫生统计学等等属于社会统计学的重要分支,国民经济统计学、工业统计学、农业统计学、贸易统计学等等属于经济统计学的重要分支。社会经济统计学是应用最广泛的应用统计学。

自然统计学是将理论统计学应用于自然现象领域,是探索地理、地质、气候、天文、生物等非人类现象的数量关系和数量规律的统计方法论。其中较为重要的分支有生物统计学、气象统计学、天文统计学等。

以上多门统计学也不是完全互相割裂的,相互之间存在一定的联系。理论统计学和应用统计学之间是一种相互促进、共同发展的关系。

7.统计学与其他学科之间有些什么联系?

统计学与数学、哲学、社会学、经济学等其它学科也有着不同程度的联系,统计学中广泛应用了数学方法,进行统计研究要遵循哲学的基本原理,对社会经济问题的数量特征进行统计分析必须以社会学、经济学理论为基础,统计研究的结果也丰富了社会学、经济学的内

容。统计学与上述相关学科互相促进,共同发展。马克思和列宁对政治经济学与统计学的关系有着精辟的论述:“利润率趋向下降,和剩余价值率趋向提高,从而和劳动剥削程度提高是结合在一起的。因此最荒谬的莫过于用工资率的提高来说明利润率的降低了,虽然这种情况在例外的场合也是存在的。只有理解了形成利润率的各种关系,才有可能根据统计对不同时期、不同国家的工资率进行实际的分析。”“研究政治经济学不能随随便便,不能没有任何基础知识,不能不了解很多极重要的历史问题、统计学问题及其它问题。”

1.统计学和数学的关系

统计学着重于研究客观现象的数量特征。统计学中具有方法论性质的数理统计学是应用数学的一个分支,因此统计学与数学的关系十分密切,且与其他的应用数学有一定的共性。如和数学中的有关定理一样,统计中的一些分布也是客观现象数量特征的一种抽象。统计学中也要使用很多数学方法,学好统计学,尤其是理论统计学需要有坚实的数学基础。但另一方面,统计学与其他的数学分支相比又有其特殊性。

(1)处理的数据不同。统计方法处理的数据必须是受到偶然性的影响而产生差异的数据。偶然现象在统计学中常称为随机现象,因此统计学及其理论基础概率论不同于其他数学分支的一个特点在于它是研究随机现象的一门学科。

(2)处理的方法不同。数学常常是用演绎的方法,即数学中研究结论,通常从若干假设命题或已知的事实出发,按一定的规则通过逻辑推理得到。而统计学在本质上是用归纳的方法,它是根据观察到的大量个别情况,“归纳”起来去推断总体的情况,这一点与概率论的方法也有区别。因此目前国际上也有一种趋势,把统计学看成是与数学独立的学科。

2.统计学与其他专门学科的关系

统计方法有着广泛的实用性,其一般的数据分析方法适用于其他任何科学中的偶然现象,因此它与很多专门学科都有关系。但是统计方法只是从事物的外在数量表现去推断该事物可能的规律性,它本身不能说明何以会有这个规律性,这是各专门学科的任务。例如,用统计方法分析一些资料得出,吸烟与某些消化道疾病有关,这是通过对比吸烟者和不吸烟者的发病率数据得出的结论,它不能解释吸烟何以会增加患这类疾病的危险性,这是医学这一专门学科的任务。所以统计方法只是一种工具,应用它进行定量分析时必须和定性分析结合起来。尤其是将统计方法应用于社会经济领域更应如此,因为社会经济现象比自然现象更为错综复杂,而又不可能象自然科学那样在实验室内排除其他因素进行试验。

8.统计研究的对象是什么?

统计学是一门研究客观现象数量特征和规律性的方法论科学。统计学的研究对象不同于统计对象。统计学的研究对象是客观事物的数量特征和规律性,而统计对象是客观事物本身。例如人口统计的统计对象是人,人口统计学则以人口数量特征为研究对象,是探索人口数量特征和规律性的方法,包括如何收集人口原始数据、如何计算人口总规模、如何描述人口增长规律、如何分析人口与其它社会经济现象的关系等等。

9.统计研究的特点有哪些?

统计研究的特点可以概括为以下几点:

1.数量性

“数字是统计的语言”,数量性是统计研究的基本特点。如图1.2.1所示的统计研究系统,输入的是数据,即客观事物个别的或者局部的原始数据;输出的是客观事物综合的数量特征,包括数量大小和数量的规律性。统计研究系统是一个数据获取和加工处理系统。

图1.2.1 统计研究的数量性示意图

2.总体性

“统”就是总起来、综合起来。统计研究就是总的、综合的数量研究。一般理解的总体是指统计总体,是由同类个体组成的集合体,如人口总体、企业总体、商品总体等等,这时统计研究的目的不是计量个体的特征表现,而是对个体的特征表现进行统计整理和统计分析,得到总体的综合的数量特征。

3.具体性

具体性即客观性。统计对象是具体的,是客观存在的事物或现象。统计数据包括原始数据和计算结果,都是客观现象在一定时间、地点、条件下的数量表现,是具体的数据。这是统计和数学的一个重要区别,数学所研究的数量可以是脱离了具体对象的抽象的数量。社会经济统计的统计对象是具体的社会经济现象,包括人类自身、人类从事的活动以及活动的成果等等,社会经济统计研究得到社会经济现象的数量以及对数量的规律性的认识。

10.统计研究的方法有哪些类别?

统计学是一门方法论科学。人们在无数统计实践经验的基础上,经过逐步概括和总结,形成了一系列专门的统计方法,构成一个统计方法体系。常用的统计方法及其应用如图1.2.2所示。

图1.2.2

11.如何理解大量观测法?

所谓大量观测法就是对所研究的客观现象总体中的全部或者足够多的个体进行观测以达到正确认识总体的目的。大量观测法不是一种具体的应用方法,而是研究客观现象总体数量特征的重要思想方法和原则,是统计研究的指导原则。大量观测法要求在通过实验法或者调查法收集原始资料时遵循大量实验和大量调查的原则。对于规模小、个体集中等简单总体进行统计研究,有可能做到对所有个体全部进行观测。比如对一个班组的职工或一个班级的学生这样的总体,就有可能逐个观测。但是对于规模大、个体分散等复杂的总体进行统计研

究时,通常不可能做到对所有个体全部进行观测。有时虽然能全部观测,但需要付出很高的代价,而且在大多数情况下往往不需要对所有个体全部进行观测。比如对于在一个大城市里居住的全体居民或全国人口这样的总体,就不必对所有个体逐个进行观测。取而代之的是选择足够多的个体进行非全面观测。观测的个体越多,对总体的认识就越准确,选择多少取决于统计和统计研究对象的特点、统计要求以及客观条件等多方面因素。采用大量观测法是由于统计研究对象具有复杂多变的特点,如果只选择个别或者少数个体进行观测,甚或挑选个体时带有某种倾向性,就难以得到关于事物总体数量特征的正确结论。

再进一步延伸,在研究某个现象发展变化规律时,也需要收集足够多的时间点上的资料,在进行综合评价时,也要全面考虑影响评价值的因素,这也是体现了大量观测法的思想和原则。

12.统计描述法和统计推断法的区别和联系是什么

统计描述法和统计推断法是统计分析的两类方法。描述包括个别描述和综合描述。统计描述法是综合描述的方法,是通过对所收集的数据进行加工处理,计算综合性的统计指标,描述所研究现象总体数量特征和数量关系的方法。根据所描述问题的特点,可以具体使用综合指标法和数学模型法。综合指标法是指运用各种统计综合指标来反映和研究社会经济现象总体的一般特征和数量关系的研究方法。数学模型法是根据一定的经济理论和假定条件,用数学方程去模拟现实经济现象相互关系的一种研究方法。统计推断法是在对已知事物进行描述的基础上,对未知事物进行推断的方法。根据推断的内容不同可分为抽样估计法以及假设检验法等。抽样估计是用已知的样本信息推断未知的总体信息,假设检验是根据样本的信息验证对总体信息所作的假设是否成立。

统计描述法是统计推断法的基础。从描述方法到推断方法反映了统计学的发展,传统统计学以统计描述方法为主,现代统计学以统计推断方法为主。

统计分析方法是统计方法的核心,其特点是运用数学、概率论与数理统计学等理论与方法对客观现象进行数量分析。现代统计学研究的重点就是统计分析方法。

13.统计的作用有哪些?

统计具有以下三个方面的作用:

1.提供信息服务

提供统计信息是统计的信息职能,是统计的首要职能。信息是有价值的数据,从收集的原始数据到经过加工整理后的中间数据到最后分析得到的综合指标分别是反映客观现象个别、部分以及全部的统计信息,是统计工作的成果。经过整理、分析得到的综合信息更有价值。统计应该提供最有价值的信息,而且要达到准确、及时、全面的要求。没有统计信息,我们就不能全面认识客观现象,做任何事情就缺少了重要的依据。

提供国民经济和社会发展状况的信息是社会经济统计的首要职能,是政府统计系统的首要任务。政府要管理好整个国家,必须掌握准确、及时、全面的社会经济信息。各个基层企事业单位为了自身发展的需要,既要依靠政府统计所提供的各种信息,自己也要做好统计工作,获取自身发展所需的各种信息,包括本身的信息、竞争对手信息、顾客信息、社会信息以及国际信息等等。

二十一世纪人类社会步入了信息时代,计算机技术、网络技术、信息技术的发展为收集、加工处理信息以及进行综合分析提供了有效的手段,统计信息对人们的日常工作和生活、对管理企业以及管理国家的作用越来越重要。

2.提供咨询服务

提供咨询服务是统计的咨询职能。统计工作的任务不仅要完成提供信息的基本任务,还要进一步利用已经掌握的各种统计信息资料,为政府、企业以及个人等提供各种咨询建议和对策方案。对于政府统计部门,其基本任务首先是为政府制定有关政策、制定国家发展战略

等国家宏观经济决策提供咨询意见,也要为各个基层单位的运作、人民群众的日常工作和生活提供咨询意见,既为政府服务也为公众服务,为政府服务的最终目的也是为公众服务,政府统计要树立以为公众服务为根本的思想观念。近年来,我国各种民营的咨询服务企业如雨后春笋茁壮成长,咨询业的竞争日益激烈。

3.提供监督服务

提供监督服务是统计的监督职能。监督职能是指根据长期的大量的统计信息,按照标准监督客观现象发展变化状况,确定其是否正常,有无警情。对社会经济的一些重要方面都要进行监督,例如经济发展情况、产品质量、物价、环境、廉政建设、安全生产以及重要资源的开发利用等。有关统计部门在定期发布各种统计信息报告的同时,也应对各种现象进行主动监督。例如质量监督部门及时收集产品的质量信息,判断是否超出质量控制标准,对市场产品进行质量监督,以杜绝伪劣产品在市场流通。企业质量管理部门通过对生产中的质量数据进行分析处理,可以及时掌握当前生产质量状况。一旦发现生产过程处于不稳定状态(超出控制界限的观测数据增多),立即寻找原因排除异常因素,使生产过程回到质量稳定的工艺状态。从而达到对生产过程的监督和控制。

统计监督和其它监督手段相比有数量性和综合性两个显著特点。数量性是指对监督对象的运行是否正常提出数量界限,进行数量监督;综合性是指对监督对象进行综合性的、全局性的统计监督。

综上分析,统计具有信息、咨询、监督三大职能,统计的三大职能是相互联系、相辅相成的。信息职能是最基本的职能,是保证咨询和监督职能有效发挥的基础,咨询和监督职能是信息职能的延伸和拓展,是统计信息开发和利用的结果。

第二章统计数据的收集与整理

1.统计调查有哪些分类?它们有什么特点?运用于什么样的社会经济现象?

答:统计调查的方式主要有:普查、抽样调查、重点调查、统计报表制度。

1.普查。普查是专门组织的一次性的全面调查,用来调查属于—定时点上或时期内的社会经济现象的总量。普查可以取得被研究事物总体的全面情况。通过普查,从宏观上看,可以摸清—个国家的国情和国力,了解到一个国家的人力资源和物质资源的现状及利用情况。这对于国家制定政策和计划,以及制定经济与社会发展的长远规划都是不可缺少的。例如,我国为了全面掌握全国人口的实际情况,于2000年7月1日零时这个时点上展开了第五次人口普查。从微观上看,普查也可用于某些小范围的市场调查。例如,对市场上某种产品的供应、销售及库存的全面调查。普查具有资料全面、详尽、标准化等优点,但同时也存在因工作量大、耗资多所带来的时效性不强、成本大以及登记性误差较大等缺点,因而一般不宜经常进行。

普查的组织形式有两种:一种是组织专门的普查机构,派专门调查人员对被调查单位直接进行登记,例如人口普查就是这种形式;另一种是利用一定的组织系统,由被调查单位根据本单位的原始记录和实际情况,填写调查表,然后上报。

快速普查是一种特殊的普查,其调查项目少,调查时间短,目的是快速满足经济管理的需要。例如对全国钢材库存的调查。快速普查采用普查的第二种组织方式,其方式就是在布置调查任务与资料报送等环节中越过一切中间环节,直接将普查资料报送到最高一级普查机构进行汇总。

普查项目与指标一经正式确定,就不准任意改变或增减,否则就可能影响资料的汇总与分析,影响统计资料的质量。对同一种普查而言,每次的项目与指标应保持一致,尽量按照一定的周期进行,以便获得社会现象的发展变化规律。

普查涉及的对象与范围很广,需要统一的集中领导与组织安排,必须注意以下事项:规定统一的标准时点与确定统一的普查期限。

2.抽样调查。抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。例如,从一批产品中随机抽取若干件进行质量检验,并计算合格率,然后以此推断全部产品的合格率。又如,从某银行储户中随机抽取部分储户的存款额进行登记,计算每户平均存款额,并用这—指标推算全市居民平均每户的存款额。在统计调查方法体系中,抽样调查由于具备一般非全面调查的长处,同时又可以通过科学的推算达到对统计总体的认识,因而是一种最常用、最重要的获取统计资料的手段。抽样调查与其他调查方式比较,既能节省人力、物力、财力,提高资料的时效性,又能推断出比较准确的全面资料,还因其原理和方法以数学理论为依据,有较高的科学性,所以这种调查方式在产品质量检验、产品质量控制以及市场调查等方面,应用非常广泛。

抽样调查的重要特征是:第一,按照随机性原则确定观测单位。在抽样调查中,究竟要对哪些单位进行调查,不取决于调查者与被调查者的主观愿望,完全随机而定。理论上一般要求总体中的每一个单位都应有同等的可能性被抽到。随机性原则是抽样调查的基本原则,遵守这个原则可以避免统计估计的系统性误差,另一方面只有符合抽样随机性原则,才能计算出抽样估计误差。第二,根据部分单位的调查结果,对总体进行科学推断。抽样调查既是搜集资料的方法,同时也是对统计总体进行认识的方法。就这一点来说,抽样调查和普查的作用是一样的,只不过采用的具体途径有所不同而已。用抽样资料对总体进行认识.需要依

据统计估计和归纳推断。第三,抽样误差可以计算。用样本资料推断总体必然会产生误差,但抽样估计误差的大小可以计算出来,并且还能进行控制,这是抽样调查又一非常重要的特点。

抽样调查组织实施起来非常灵活和方便,具有普查等全面调查不可比拟的优势,所以它是现代统计活动中搜集资料广泛使用的手段之一。以社会经济管理领域为例,经常要用抽样调查搜集资料的就有:居民消费调查、民意测验、物价统计、市场行情预测、产品质量抽样检验、工序控制与能力分析、人口调查、工农业生产调查、犯罪调查、库存调查、抽样审计等。

3.重点调查。重点调查是在调查对象中选择一部分重点单位进行的一种非全面调查。这部分重点单位虽然数目不多,但就调查的标志总量来说,在总体中占有很大的比重,调查这一部分单位的情况,能够大致反映被调查现象的基本情况。因此,当调查的任务只要求掌握总体的基本状况与基本的发展趋势,而不要求掌握全面的准确资料,而且在总体中确实存在着重点单位时,比较适合采用重点调查的方法。例如,某批发商业企业,对下属百家商业企业提供某种货源,其中10家大型商业企业的需求量占总需求量的80%,只要调查了这10家重点商业企业的需要,就足以掌握货物需求量的基本情况。在这种情况下,可采用重点调查方式。一般情况下,重点调查的目的主要是为了掌握调查对象的基本情况,不需要利用重点调查的综合指标来推断总体的数量。但在某些特殊情况下,也可以利用重点调查所得的数据资料,对总体的数据作出大致的估计。例如,上例中的l0家商业企业今年对某品牌食用油的需求量为160万桶,根据这个调查数据,大体可估计出本年食用油总需求量为200万桶左右。

重点调查的组织方式有两种:一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。例如,重点工业企业主要经济指标电讯月报,重点工业企业产品价格统计月报,重点工业交通运输企业能源消耗季报等。

与全面调查相比,重点调查的优点是花费较少的人力、物力、财力以及时间获得总体的基本情况,具有更好的时效性与经济性;重点单位具有较好的统计条件,其结果一般具有更好的精确效果,而且,由于所选取的重点单位数目相对较少,就可以集中投入更多的人力、物力去调查更多的内容,获得更为详细的统计资料。

进行重点调查的关键是如何确定重点单位。一般而言,重点单位的多少,要依据调查点目的与任务而定。总的原则是,所选的单位应尽量少些,但它的标志值在总体标志值中所占的比重则要尽量大些。

4.统计报表制度。统计报表制度是根据国家有关统计法的规定,依据自上而下统一规定的表格形式、项目及其指标、报送时间与程序布置调查要求和任务,自下而上逐级汇总上报的统计报表制度。国家利用统计报表制度定期获得国民经济与社会发展情况的基本统计资料,是国家取得调查资料的主要方法之一。同时,统计报表也是一份调查表,报表中的指标项目就是调查项目。我国大多数统计报表要求调查对象全部单位填报,从这个角度上说,应属于全面调查的范畴,所以也称全面统计报表。统计报表制度具有如下的特点:统计报表制度是为满足国民经济和社会发展的宏观管理需要而精心设计的信息系统,其基本依据是基层单位日常业务活动的原始记录与统计台帐及基层的内部报表,包括了一系列登记项目与指标。为了保证逐级汇总的资料具有可靠的真实基础,统计报表必须符合完整性、规范性与准确性的基本要求。此外,由于整个过程涉及的组织系统相对庞大,所以要求各基层单位建立相对完善的原始记录与统计台帐以及基层企业内部报表制度,建立一支业务熟悉的统计人员队伍,这是保证统计报表资料质量的重要基础。

统计报表所涉及的项目及其指标有着相对固定的格式,一般都是直接由上级部门设计,具有明显的强制性。凡是报表中规定的指标、计算口径、计算方法、报送程序及时间等都必

须严格遵守,未经批准不得擅自改变。

统计报表依据至上而下的行政手段保证统计报表制度的实施,采取的是层层上报、逐级汇总的报表呈递路线,具有很强的时效性。

根据不同的标准,统计报表可以分为不同的种类:

按不同的内容与实施范围可分为国家统计报表、部门统计报表与地方统计报表。国家统计报表也称国民经济基本统计报表,是由国家统计部门统一制定并反映全国性的经济和社会发展基本状况的统计资料汇总表,它基本涉及了各产业活动、财政与税收、投资与收益等方面最基本的经济活动资料。部门统计报表是针对本部门业务管理需要而制定的专业统计报表,适用的范围就是本系统内部,目的是为了获得相关部门的业务活动资料。地方统计报表是根据各地方经济与社会发展特色而进行的补充性统计报表。三者之间互有区别,互有联系,其中,国家统计报表是统计报表体系的基本部分。

按报送周期的长短可分为短周期报表和长周期报表。报告的周期长短不同,不仅是时间上的差别,而且更反映其内容与作用不同。在一般情况下,报送的周期越长,所包含的指标项目越多、越详细,反之则越少、越简单。短周期报表包括日报、旬报、月报,填报的项目较少,要求资料上报迅速与及时;长周期报表包括季报、半年报、年报,填报的项目较多,要求统计资料全面、完整与准确。此外,除年报外,上述各种统计报表可称为定期报表,日报与旬报可称为进度报表。

按不同的填报单位可分为基层统计报表与综合统计报表。基层统计报表是由基层企事业单位填报的报表,综合统计报表是由统计部门或主管部门依据基层部门逐级汇总填报的报表。调查单位将随着综合层次的不断提高而不断扩大,相应为县、市或省。

按不同的报送方式可分为电讯报表与邮寄报表。电讯报表采用电报、电话、传真、电视及网络报送,一般以日报、旬报为主;邮寄报表采用的是邮局邮寄或其他方式的人工报送,一般以月报、季报、半年报与年报为主。

2.统计调查方案包括哪几个方面的内容?请针对调查某产品销售情况,设计一个调查方案。

答:一个完整的统计调查方案通常包括:明确调查目的和任务,确定调查对象和调查单位,制定调查项目和设计调查表或问卷,确定调查时间、调查地点、调查方式方法和制定调查的组织实施计划等。

明确调查目的和任务是设计统计调查方案最根本的问题,它决定着调查工作的内容、范围、方法和组织。任何社会经济现象和过程都可以根据不同任务,由不同的目的来收集资料进行研究。衡量一个调查方案是否科学的标准,主要看方案的设计是否体现调查目的要求,是否符合客观实际。

调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。确定调查对象,需要认真分析所要研究的社会现象,把握其主要特征,明确规定调查对象的具体含义,在此基础上,确定总体的界限,划清调查的范围,以防在调查工作中产生重复或遗漏。调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。

调查项目是指对调查单位所要调查的具体内容属性,这些属性在统计上又称标志。它是由调查对象的性质、调查目的和任务所决定的,包括一系列品质属性和数量属性。在确定调查项目时,需要注意以下问题:

(1)调查项目涵义必须明确、具体,使人一目了然。否则,会使被调查者产生不同的理解而做出不同的答案,造成汇总时的困难。

(2)在设计调查项目时,既要考虑调查任务的需要,又要考虑是否能够取得实际资料。必要的内容不能遗漏,不必要的或不可能得到明确答案以及无法获得答案的项目不要列入

调查项目。

调查项目一般采用调查表或调查问卷的形式。将调查项目科学地分类、排列,就构成调查表或调查问卷。

调查时间是指调查资料所属的时点或时期。从资料的性质来看,有的资料反映现象在某一时点上的状态,统计调查必须规定统—的时点。调查时间包括三方面内容:调查资料所属的时间、调查期限和调查工作进行的时间。

调查地点是指调查单位的空间位置。确定调查地点,就是规定在什么地方进行调查。

调查方式方法是指调查工作的组织方式方法,这主要取决于调查的目的、内容和调查的对象。

调查的组织计划,是指为确保实施调查的具体工作计划。严密细致的组织工作,是使统计调查顺利进行的保证。在实施计划中要明确采用什么方式方法获得统计资料,如由被调查者自填或派人直接采访等;还需明确资料采取什么方法汇总,如采取超级汇总,或者逐级汇总等。调查的组织实施计划应包括以下内容:

(1) 建立调查工作的组织领导机构,做好人员的配备与分工;

(2) 做好调查前的准备工作。如宣传教育、人员培训、文件资料的印发、方案的传达布置、经费的筹措等;

(3) 制定调查工作的检查、监督方法;

(4) 调查成果的公布及工作后的总结等。

较大规模的调查还应进行试点调查。通过试点,检验调查方案是否切实可行,以便修改和补充,并积累实施调查方案的经验,提高调查人员的业务技能,更好地完成调查任务。

3.统计分组的方法有哪些?区分简单分组、复合分组、单项式分组、组距式分组、等距分组和异距分组等分组方法,结合实际加以运用。

答:统计分组是根据统计研究目的,将总体按一定标志区分为不同类型或不同性质的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。

如何统计分组取决于选择的分组标志的特征、分组标志的数量以及各组的分组标志取值,由此产生不同的分组方法。

1.按标志的特征分组

总体单位的各个标志按分组标志的特征分组区分为品质标志和数量标志。按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变动范围内划定各组的界限,将总体划分为性质不同的若干组成部分。例如人口按年龄,企业按职工人数、商品销售额等分组。按数量标志分组的目的并不是单纯确定各组的数量差异,而是要通过数量变化来区分各组不同的类型和性质。按品质标志分组是研究品质标志的分布特点,例如人口总体按照性别分组,研究不同性别组的区别,按照民族分组则可以研究不同民族组的特点。

2.按分组标志数量分组

统计分组按分组标志多少不同,可分为简单分组和复合分组。简单分组是对研究对象按照一个标志进行的分组。复合分组是对研究对象按两个或两个以上的标志层叠起来进行的分组。即先按一个标志进行分组,然后再按另一个标志在已分好的各个组内划分成若干个小组。

变量数列按照用以分组的变量的表现形式,可分为单项数列和组距数列两种。单项数列就是指以一个变量值代表一组而编制的变量数列。单项数列的组数与数量标志所包含的变量值数目是相等的。处理变量值不多的变量资料时,宜选用此方法编制变量数列。在不同的变量值既多且变动范围较大时,用单项数列分组会使组数太多,不便分析,这时就应编制组距数列。组距数列就是用一定范围的变量值或一定的数值距离代表一组编制而成的变量数列,如下表所示。

某企业职工人数统计表

组距数列可分为等距分组和异距分组。等距分组即各组组距相等的分组。异距分组即各组组距不相等的分组。在标志值变动比较均匀的条件下,可采用等距分组。当标志值变动很不均匀,如急剧的增大、下降,变动幅度大时,可采用异距分组。选用等距分组还是异距分组,应视资科特点而定。其基本原则仍然是将不同质的单位分开。如果等距分组能符合这个要求,则尽量采用等距分组,以便于计算和分析,否则采用异距分组方法。

4. 调查对象、调查单位和报告单位相互之间有什么关系?

答:调查对象是指根据调查目的、任务确定的由那些性质上相同的众多调查单位所组成的总体。即统计总体。调查单位就是构成调查总体的每一个单位,调查总体中的个体,也就是在调查过程中应该登记其标志的那些具体单位。调查单位的确定,取决于调查目的与调查对象。例如,若调查目的是要了解企业职工的情况时,调查对象就是企业职工这一总体,而调查单位就是每一个职工;如果调查目的是了解所有企业的经营情况时,调查对象就是所有企业这一总体,每一个企业就是一个调查单位。在确定调查单位时,要明确调查单位与报告单位(也称为填报单位)的区别,调查单位是调查登记的项目的承担者。报告单位则是指负责向上级提供调查资料的单位。调查单位与报告单位有时一致。有时不一致。例如,工业企业普查时,每个工业企业既是调查单位又是报告单位。两者是一致的,而在工业企业职工普查时,调查单位是每—工业企业职工,而报告单位则是每个工业企业,两者是不一致的。

5.反映总体集中趋势的指标有哪几种?离散趋势的指标有哪几种?各有什么特点和作用?

答:反映总体集中趋势的指标有算术平均数、众数和中位数,这三者的关系与总体分布的特征有关。

算术平均数是最常用的一种平均指标。算术平均数适合用代数方法运算,因此,在实践中应用很广。但有以下不足:算术平均数易受极端变量值影响,使x的代表性变小;当组距数列为开口组时,由于组中值不易确定,使x的代表性变得不可靠。

众数是指总体中出现次数最多的标志值,它能够直观地说明客观现象分配中的集中趋势。在实际工作中,有时要利用众数代替算术平均数来说明社会经济现象的一般水平。例如,在大批量生产的男式衬衫中,有多种尺码,其中40码是销售量最多的尺码,则40码也就是众数,可代表男式衬衫尺码的一般水平,宜大量生产,而其余尺码的生产量就要相应少一些,这样才能满足市场上大部分消费者的需要。众数适用于总体的单位数较多,各标志值的次数分配又有明显的集中趋势的的情况,如果总体单位数很少,尽管次数分配较集中,那么计算

出来的众数意义不大。若总体单位数较多,但次数分配不集中,即各单位的标志值在总体中出现的比重较均匀,那么也无所谓众数

中位数是将总体中各单位标志值按大小顺序排列,居于中间位置的那个标志值就是中位数。中位数属于位置平均数,它与众数一样,都是从数据位置的角度来反映数据的代表水平,中位数不受极端值的影响,各个变量值相对其中位数的绝对离差之和为最小。所以当一项变量数列中含有极大值或极小值时,较适宜采用中位数;按品质标志定位的事物求其代表水平时可用中位数。中位数的局限性为:计算复杂,不适宜作进一步数学运算;由于是位置平均数,虽不受两端数值的影响,但与众数一样,代表性较差。

变异指标则能综合反映总体的差异性,它们反映总体中各单位标志值差别大小的程度。标志变异指标是评价平均数代表性的依据,标志变异指标愈大,平均数代表性愈小;标志变异指标愈小,则平均数代表性愈大。常用的标志变异指标有极差、平均差、标准差以及离散系数等。极差也称全距,是指总体分布中最大标志值与最小标志值之差,用以说明标志值变动范围的大小。标准差是总体各单位标志值与平均数离差平方平均数的平方根,标准差的平方即为方差。极差、方差及标准差都是反映标志变异程度有计量单位的绝对数指标。总体分布的标志变异程度不仅取决于标志值的差异状态,还受到总体平均数的影响。若对两个总体分布进行变异性比较,当它们的平均数不等,计量单位不同时,则应消除平均数不同和计量单位不可比的影响。离散系数是消除平均数影响后的标志变异指标,用来对两组数据的差异程度进行相对比较,其形式为相对数,因此,也称为标志变异相对数指标。常见的离散系数

V)。

是标准差系数(

6.某班45名学生“统计学”考试成绩从低分到高分排列如下:

50 5l 52 56 58 59 5l 62 63

64 65 66 67 68 69 70 71 72

72 72 73 74 74 74 75 75 76

76 77 78 79 80 81 83 84 84

86 86 87 88 90 91 93 97 99

试将上述资料编成等距数列,计算组距、组中值,编制统计表。

解:根据上述资料编成的等距数列统计表及计算的组距、组中值如下表所示。

7.根据下表资料,计算强度相对数的正指标和逆指标,并根据正指标数值分析该地区

解:1999年该地区医院密度情况:

)万人个万人

医院密度正指标/(53.05.11260==

)个万人个

万人

医院密度逆指标/(88.1605.112==

2005年该地区医院密度情况:

)万人个万人

医院密度正指标/(67.03.13289==

)个万人个

万人

医院密度逆指标/(49.1893.132==

根据该地区医院密度正指标值的变化情况可以看出,该地区2005年医疗卫生设施较1999年有了明显地提高。

8.甲乙两班同时进行数学考试,有关成绩分布如下表所示,哪一个班级考试成绩好些?

解:根据表2.5.7的数据资料计算得

f

f x

x i i

i i

i

分甲(8.755

13181335

9513851875136535551

5

1=++++?+?+?+?+?=

=

∑∑==,

)f

f x

x i i

i i

i

分乙(5.314

36391114

53643931120155

1=+++?+?+?+?+?=

=

∑∑=

=

64.101

52)8.75(1

)(5

1

2

5

1

5

1

2

=--=

--=

∑∑∑===i i

i i i

i i

i x

f f

x x

f s 甲

87.01

100)5.3(1

)

(5

1

25

1

5

1

2

=--=

--=

∑∑

===i i i i i

i i i x f f

x x f s 乙

52.151

9)3.80(1

)

(9

1

2

1

2

9402=--=

--=

∑∑==i i

n

i i

x

n x x

s

%148

.7564

.10%100==

?=

x

s V s 甲甲 %2553.387.0%100==?=x

s V s 乙乙

或%100?=

x

s

V s 由计算所得甲班和乙班平均分所在的分数段可以所出,甲、乙两班的平均成绩相差不大,由于甲班的离散系数小于乙班的离散系数,说明乙班成绩的分布变异性较大,其平均数代表性比甲班差,甲班的成绩较为稳定。

9.某市奶粉厂有甲、乙两车间生产某种品牌豆奶粉,每包标准重量定为400±5克。从甲车间随机抽得100包、有关资料如下表所示。又已知乙车间奶粉平均重量为400.6g /包,标准差为5.2g 。

试求:

(1) 甲车间豆奶粉的平均重量;

(2) 甲车间豆奶粉重量的全距(近似值); (3) 甲车间豆奶粉的不合格率;

(4) 甲、乙两车间豆奶粉的平均重量哪一个更接近标准中心值?哪个车间的平均重量更具有代表性?

(5) 甲车间豆奶粉重量的众数和中位数; (6) 甲车间奶粉重量属何种分布状态? 解:(1) 甲车间豆奶粉的平均重量

f

f x

x i i

i i

i

包克甲/(2.4004

9183919924

41294081840439400193969392239871

7

1=++++++?+?+?+?+?+?+?=

=

∑∑== (2) 甲车间豆奶粉重量的全距(近似值)

)/(24388412min max 包克甲=-=-=x x R (3) 甲车间豆奶粉的不合格率

%24100

4

992=+++=

不合格率

(4) 甲、乙两车间豆奶粉的平均重量哪一个更接近标准中心值?哪个车间的平均重量更具有代表性?

37.21

100)2.400(1

)

(7

1

2

7

1

7

1

2

=--=

--=

∑∑

∑===i i

i i i i i

i x

f f x x

f s 甲

由于甲车间生产豆奶粉的标准差比乙车间生产豆奶粉的标准差小,所以甲车间豆奶粉的平均重量更接近标准中心值,甲车间的平均重量更具有代表性。

(5)甲车间豆奶粉重量的众数和中位数 甲车间豆奶粉重量的众数

从表中的数据得次数最多的一组为第四组,因而第四组为众数所在的组,将相应数据代入下限公式可得:

)(5.3984)

1839()1939(19

393982110克=?-+--+=??+??+

=d L M

甲车间豆奶粉重量的中位数

表中的豆奶粉数为100包人,其中位数位次为502

==

∑f L m

,根据累计次数可以看

出中位数在第四组,即在398-402这一组中。

按下限公式计算:

)(05.40005.2398439

30

503982/)(1

克=+=?-+

=?-+

=-∑d f S f L M m

m e (6) 甲车间奶粉重量属何种分布状态? 甲车间奶粉重量分布状态的偏度为

5632.3205

.1331328

.4743)(1

3

31

-=-=

-=

∑∑==k

i i

i

k

i i

k f

f x x

S σ

甲车间奶粉重量分布如下图所示。

由计算所得的平均重量、标准差、偏度及分布图可以得出,甲车间奶粉重量总体呈正态分布,且稍呈负偏斜。

10

(1 (2) 绘制劳动力年龄直方图与饼分图

解:劳动力平均年龄、方差、偏度及峰度计算如下表所示。

)f

f

x x i i

i i

i 周岁甲(9.358

20422198

5520454235215.2795.225

1

5

1=++++?+?+?+?+?=

=

∑∑==

84.771

100)9.35(1

)(5

1

2

1

1

2

2=--=

--=

∑∑

∑===i i

k

i i k

i i

i

x

f f x x

s

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

应用统计学期末复习

应用统计学期末复习重点(按题型整理) 一、填空题(10分) 1.统计学的三种含义:统计工作;统计数据或统计信息;统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法 5.标志是说明总体单位特征的,而指标是说明总体特征的, 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志,可变标志称为变量。 7.统计总体具有三个基本特征,即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。 10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。 13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数。 14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。 19.从统计表的内容看:统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类:计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是 () A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3.数据离散程度的测度值中,不受极端数值影响的是() A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

应用统计学试题和答案

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值围是 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x > e M >o M ②、x o M >e M

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

《应用统计学》练习试题和答案解析

《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )

2018统计学-18总复习资料

《统计学》综合复习资料 一、单项选择题 1.统计一词的三种涵义是()。 A.统计工作.统计资料.统计学B.统计调查.统计整理.统计分析 C.统计设计.统计分组.统计预测D.统计方法.统计分析.统计预测 2.要研究某地区570家工业企业的产品生产情况,总体是()。 A.每个工业企业 B.570家工业企业 C.570家工业企业每一件产品 D.570家工业企业全部工业产品 3.为了解全国钢铁生产的基本情况,对鞍钢、武钢、宝钢等特大型钢铁企业的产量进行调查,属于 ()。 A.重点调查 B.典型调查 C.简单随机抽样调查 D.整群抽样调查 4.某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。 A.102% B.110% C.98% D.100% 5.某厂2009年完成产值2千万,2010年计划增长10%,实际完成2310万元,则计划完成程度为()。 A.105% B.5% C.115.5% D.15.5% 6.统计调查按其组织形式分类,可分为()。 A.普查和典型调查 B.重点调查和抽样调查 C.统计报表和专门调查 D.经常性调查和一次性调查 7.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()。 A.算术平均数 B.调和平均数 C.几何平均数 D.众数 8.第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为()。 A.8年 B.7.55年 C.32.5年 D.7.8年 9.直接反映总体规模大小的指标是()。 A.总量指标 B.相对指标 C.平均指标 D.变异指标 10.某商品价格比原先降低5%,销售量增长了5%,则销售额()。 A.上升 B.下降 C.不变 D.无法确定

应用统计学试题

2009年天津大学工程硕士应用统计学试卷 姓名 学号 班级 一、简答题(30分,每题5分) 1.统计学表示变异(分散)程度的特征数有哪些? 2.服从两点分布设总体X ),1(p b ,其中p 是未知参数,521,,X X X 是来自X 的简单随机样本。是指出21X X +,i i X 5 1min ≤≤,p X 25+之中哪些是统计量,哪些不是统计量,为什么? 3. 若)9,4(~F F ,则F /1服从什么分布? 4. 假设检验的基本依据是什么? 5. 假设检验中的两类错误是指哪两类错误? 6. 回归分析适合研究哪类问题? 二、(15分).,,5)4,12(51X X N 的样本中随机抽一容量为 在总体 的概率;值之差的绝对值大于 )求样本均值与总体均 (11 {}.15),,,,max(254321>X X X X X P )求概率( 三、(15分)一种新型减肥方法自称其参加者在第一个星期平均能减去至少8斤体重。由40名使用了该种方法的个人组成一个随机样本,其减去体重的样本均值为7斤,样本标准差为3.2。 a .α=0.05时,拒绝规则是什么? b .你对该减肥说明方法的结论是什么? c .p 值为多少? 四、(15分)正态总体),(2σμN 的密度函数为 2 2 2) (21),;(σ μσ πσμ--= x e x f 从该总体抽取随机样本n X X X ,,21 。 (1)求σμ,的极大似然估计量σμ ?,?; (2)证明所求的μ ?是总体均值的最佳无偏估计量。 五、(15分)为了检验三家工厂生产的机器加工一批原料所需的平均时间是否相同,某化学公司得到了关于加工原料所需时间的数据如下表所示。利用这些数据检验三家工厂加工一批原料所需平均时间是否相同。(α=0.05,26.4)9,2(05.0=F )

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

《应用统计学》复习题库48832

第一章思考题及练习题 (一)填空题 1.统计工作与统计资料的关系是和的关系。 2.统计工作与统计学的关系是和的关系。 3.统计活动具有. . .和的职能。 4.统计指标反映的是的数量特征,数量标志反映的是的数量特征。5.在人口总体中,个体是“”,“文化程度”是标志。 6.统计研究过程的各个阶段,运用着各种专门的方法,如大量观察法. .综合指标法.和统计推断法等。 7.统计标志是总体中各个体所共同具有的属性或特征的名称。它分为和两种。 8.要了解一个企业的产品质量情况,总体是.个体是。9.性别是标志,标志表现则具体为或两种结果。 10.一件商品的价格在标志分类上属于。 11.一项完整的统计指标应该由. .. . 和等构成。 12.统计指标按所反映的数量特点不同,可以分为和。 13.反映社会经济现象相对水平或工作质量的指标称为指标。 14.统计活动过程通常被划分为. 和三个阶段。 15.经过余年的发展,形成了今天的统计学。 16.古典统计学时期有两大学派,它们分别是和。 17.《关于死之表的自然和政治观察》一书的作者是,他第一次编制了“生命表”。 18. 提出了著名的误差理论和“平均人”思想。 19.统计研究的数量性是指通过数来反映事物的量的.量的.量的和量的。 20.统计学包括和两部分内容。 21.总体中所包含的个体数量的多少称为;样本中所包含的个体数量的多少称为。 22.总体中的一个组或类,可被称为一个研究域或。 23.从总体中随机抽取的一部分个体所组成的集合称为。 24.统计理论与方法,事实上就是关于的理论和方法。 25.总体的三大特征是. 和。 26.总体的差异性要求体现在至少具有一个用以说明个体特征的。 27.企业性质标志适用的测定尺度是,产品质量等级标志适用的测定尺度是,企业利润标志适用的测定尺度是,企业产量标志适用的测定尺度是。 28.可变的数量标志的抽象化称为。它按其所受影响因素不同,可分为和两种,按其数值的变化是否连续出现,可分为和两种。 29.个体是的承担者。 30.统计指标按其反映现象的时间状态不同,可以分为和两种。 31.若干互有联系的统计指标组成的有机整体称为,其中一个很重要的反映国民经济和社会发展状况的基本统计指标体系是。 32. 统计研究的一大任务就是要用的样本指标值去推断 的总体指标值。 (二)单项选择题 1.社会经济统计的研究对象是()。 A.抽象的数量关系 B.社会经济现象的规律性 C.社会经济现象的数量方面 D.社会经济统计认识过程的规律和方法 2.某城市进行工业企业未安装设备普查,个体是()。

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

应用统计学试题和答案汇编

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的 置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

应用统计学试题及答案193765讲课讲稿

应用统计学试题及答案193765

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位

B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是 A. 均值 B. 众数 C. 中位数 D. 几何平均数 E. 调和平均数

应用统计学复习试题

应用统计学复习题 一简述 1.统计调查的方法有那几种 答:三种主要调查方式:普查,抽样调查,统计报表。实际中有时也用到重点调查和典型调查。 2.表示数据分散程度的特征数有那几种 答:全距(又称极差),方差和标准差,交替标志的平均数和标准差,变异系数,标准分数3为什么对总体均值进行估计时,样本容量越大,估计越精确 答:因为总体是所要认识的研究对象的全体,它是具有某种共同性质或特征的许多单位的集合体.总体的单位数通常用N来表示,N总是很大的数.样本是总体的一部分,它是从总体中随机抽取出来、代表总体的那部分单位的集合体.样本的单位数称为样本容量,通常用n表示。样本容量n越大,就越接近总体单位数N,样本均值就越接近总体均值,对总体均值进行估计时,估计越精确。 4.区间估计与点估计的结果有何不同 答:点估计是使用估计量的单一值作为总体参数的估计值;区间估计是指定估计量的一个取值范围都为总体参数的估计。 5.在统计假设检验中,如果轻易拒绝了原假设会造成严重后果时,应取显著性水平较大还是较小,为什么 答:取显著性水平较小,因为如果轻易拒绝了原假设会造成严重后果,那就说明在统计假设检验中,拒绝原假设的概率要小,而假设检验中拒绝原假设的概率正是事先选定的显著性水平α 6.简述算术平均数、几何平均数、调和平均数的适用范围。 答:几何平均数主要适用于比率的平均。一般地说,如果待平均的变量x与另外两个变量f 和m 有fx=m 的关系时,若取f为权数,应当采用算术平均方法;若取m 为权数,应当采用调和平均方法。 7.对总体均值的假设检验中,如何通过确定样本容量大小以控制两类错误 答:要控制两类错误就要减小误差,也就是提高精确性,决定样本大小的影响因素主要有:(1)总体方差σ2的大小.总体方差大,抽样误差大,则应多抽一些样本容量.问题是实际工作中我们往往不知道总体方差,因而必须作试验性调查,或以过去的历史资料作参考.(2)可靠性程度的高低.要求可靠性越高,所必需的样本容量就越大.(3)允许误差的范围.这主要由研究目的而定.若要求推断比较精确,允许误差范围应该小一些,随之抽取的样本单位数就要多一些. 可用最大允许抽样误差e 来表示区间估计的准确程度,其中 /2 e Z α = 对于无限总体, 22 /2 2 Z n e α σ = ;对于有限总体, 2 22 2 /2 n e Z N α σ σ = + ,

相关主题
相关文档 最新文档