当前位置:文档之家› 信息计量学复习资料整理(临时)

信息计量学复习资料整理(临时)

信息计量学复习资料整理(临时)
信息计量学复习资料整理(临时)

第一章绪论

1、信息计量学的由来(P3)

(1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的

文献激增——产生矛盾——促使对文献的管理和使用

缓解矛盾——产生情报学——产生情报(信息)计量学

(2)信息计量学是情报学发展的需要和必然产物

定量化研究一直是情报学发展的重要方向和必然趋势之一:从学科发展来看,情报学必然要从定性化阶段向定量化阶段发展;只有加强情报学的定量化研究,才能不断提供其科学性和精确性,从而有助于确立和提供它在整个科学体系中的学科地位。

(3)一大批杰出的学科带头人和骨干力量推动了信息计量学的发展

1926 洛特卡定律1934 布拉德福定律

普赖斯1961《巴比伦以来的科学》1963《大科学,小科学》

1969 加菲尔德

2、信息计量学定义及其内容体系(P17)

定义:广义信息计量学——主要探讨以广义信息论为基础的广义信息的计量问题狭义信息计量学——主要研究情报信息(或文献情报)的计量问题内容:(1)信息计量学若干基本问题的探讨

(2)信息的基本测度

(3)几个基本定律的研究

(4)信息流模型的研究

(5)信息及量化方法的探讨

(6)信息计量方法和工具的自动化实现方面的研究

(7)在图书情报工作、信息资源管理、信息检索、信息分析与预测、科学学与科学评价等领域的应用

3、信息计量学与文献计量学的关系(P31)

从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此交叉渗透,既有着许多共同的研究内容,又有着不尽相同的地方。

(1)信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为计量对象(有时也涉及文献情报);

(2)信息计量学较之文献计量学来说,其研究范围更广泛一些;文献信息之外的领域(3)从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方法及途径。涉及人类的认识和判断过程,主观性、模糊性

科学情报对许多人来说是文献的同义语;而且从信息计量学目前的研究内容和成果来看,很大一部分仍然可用“文献计量学”这个术语来概括。

4、信息计量学与科学计量学的关系(P32)

科学计量学——用定量分析的方法来研究科学本身发展规律的一门新兴的分支学科。

信息计量学与科学计量学既有联系又有区别:

联系:(1)从研究目的来看,两者都是要探讨科学活动之间的内在联系,都把科学发展的特性和规律作为自己研究的基本任务之一。

科学计量学主要是从定量的角度来探讨科学发展的内在规律,最终促进科学技术的进步;而信息计量学的研究目的也在于:一是探讨科学文献本身的规律,以提高信息管理的科学性,二是通过信息规律的探讨,进而揭示科学技术的规律性。

(2)从研究对象和方法来看,两者极为类似。

科学计量学研究的科学文献及其数量,也是信息计量学的研究对象之一。在方法上,

两者都有运用数学和统计学的定量方法,对科学文献等信息进行定量的分析研究。在研究的内容上,信息计量学和科学计量学在一个相当大的范围内是彼此交叉的。

区别:(1)信息计量学的范围要比科学计量学的范围广很多

科学计量学仍然局限在科学文献及其数量和非正式科学交流的信息、事件、事实、实物等。而“狭义信息计量学”除了科学计量学的内容外还包括正式交流的事物信息,“广义信息计量学”则还包括作为过程的信息和作为知识的信息。

(2)信息计量学和科学计量学的研究目的不一样

信息计量学研究的目的是“服务信息科学的研究需求”,而科学计量学研究的目的是“研究并验证科学的产生、传播和利用的量的规律性”,前者目的广泛,后者目的比较单一。

(3)信息计量学和科学计量学的应用的领域也不同

信息计量学在文献、人才、科学、单位、数据评价方面发挥了很大的作用,可以涉及的面非常广泛;而科学计量学在科学机制和科技政策的制定方面发挥了非常重要和独特的作用。

从以上分析可以看出:科学计量学必然向信息计量学方向发展(信息计量学的研究目的和内容包含了科学计量学的研究目的和内容)。

5、文献计量学取得的7个方面进展(教材上未找到)

(1)每年发表的有关文献数量增长较快,并逐渐形成了本学科的核心情报源

(2)提高了认识,成立了学术组织,受到有关领导和管理部门的重视

(3)确立了文献计量学的学科地位

(4)研究范围拓宽,几个主要领域的研究取得进展

(5)文献计量工具和手段现代化的研究有了良好开端

(6)文献计量学教育起步很快,并获得了迅速发展

(7)形成了一支研究队伍

(8)国际学术交流与合作正在展开,发展势头较好

(来源:邱均平:我国文献计量学的进展与发展方向)

第二章文献信息增长规律

1、文献信息流的特性(P36)

主要有两个方面:文献信息流的静态特性和动态特性

(1)静态特性——在一定时间内科学文献在空间的分布性质,如集中----离散分布、文献按著者分布、词汇在文献中的分布、引文分布、主题相关分布等的规律性。

(2)动态特性——指科学文献随时间的延续而增长和老化的性质。科学文献既增长又老化,在增长中不断老化,在老化之中又不断增长;增长是文献信息流的主要趋势。

2、文献信息的指数增长规律(P45)

(1)文献计量的指标:

绝对值指标——表示文献数量的多少,图书数量、期刊数量、论文数量

相对值指标——表示不同部分文献的数量比例,某一部分文献占全部文献的比例、各类型文献的比例、各语种文献的比例

在文献增长规律研究中,一般都是以累积数据为依据,非累积数据为每一年所出版的文献数量。

衡量科学文献增长的两种方法:

一种是以每年所出版的文献的累积总量为依据的,着眼于可以利用的文献总量的增长;

另一种是以每年新出版的文献数量为依据的,着眼于从新文献的多少研究每一年文献的增长或减少。

(2)普赖斯指数增长模型(P47)

普赖斯综合、分析了大量统计资料,以科学文献量为纵轴,以历史年代为横轴,把各个不同年代的科学文献了在坐标图上逐点描绘出来,然后以一光滑曲线连结各点,十分近似表征了科学文献岁时间增长的规律——普赖斯曲线。

通常用文献增加一倍所需的时间d作为评价文献增长速度的定量指标。

(3)文献指数增长规律的局限性

①科学文献并不总是按指数函数关系增长还与统计开始时间有关有平缓趋势

②指数规律不能预测文献的未来增长趋势

科学文献按指数增长的规律,一方面正确地反映了过去历史年代科学文献的增长情况,另一方面又暴露出不能据以预测未来科学增长趋势的局限。

原因分析:①对科学文献增长的机理研究不够,难以对影响文献增长的各种因素通盘考虑、全面衡量,给出前如其分的分析和定量描述;

②在确定科学文献的指数增长规律时,普赖斯没有考虑、也难以考虑日益严重的老化因素;③在统计某年的科学期刊累积总数时,普赖斯没有排除已停刊的期刊。

第三章文献信息老化规律

1、老化与文献老化的概念(P69)

一般而言,“老化”问题包括文献老化和情报(信息)老化。情报的老化是相对于情报对象而言,而文献的老化则是相对于情报用户而言的。

科学文献老化——指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全丧失其利用价值。既是一种客观的社会现象,又是一个复杂的动态过程。

2、文献老化的量度指标(P71)

(1)半衰期——指某学科(专业)现实尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期)。这与该学科一半文献时效所经历的时间(历时半衰期)大体相当。

半衰期适用性:共时半衰期通常是评价某一学科领域或专业文献的老化趋势,而不是指个别文献;而历时半衰期,可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇文献老化的半衰期。

半衰期的计算:

①作图法将统计数据制成引文分布表,以引文累积量或引文百分累积量为纵坐标,以被引文出版的年龄为横坐标作图,在图中找出与纵坐标上引文累积量或百分累积量一半处的对应点的横坐标,即为所求结果。

②定量模型计算法对统计数据建立文献老化模型,再根据定义找出半衰期的计算公式,将相应数据代入求得结果。

(2)普赖斯指数——在几个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当作指数,用以量度文献的老化速度和程度。计算公式为:

出版年限不超过5年的被引文献数量

普赖斯指数= *100%

被引文献总量

普赖斯指数和半衰期比较:

一般说来,某一学科或领域文献的“普赖斯指数”越大,半衰期就越短,说明文献的老化速度就越快。

它们都是从文献被利用的角度出发,但是以不同的方式来反映文献老化的情况。

文献的半衰期只能笼统地衡量某一学科领域全部文献的老化情况,而“普赖斯指数”既可用于某一学科领域的全部文献,也可用于评价某种期刊、某一机构,甚至某一作者或某篇文章的老化特点。半衰期概念可以适用于一般的情报老化,而普赖斯指数只适用于文献情报。

(3)剩余有益性指标

期刊有益性——某一年份某一期刊被用户所利用的文献数。

剩余有益性——经过若干年后,期刊还保留的有益性。

只是对与满足一定类型和内容的情报需求的几种期刊来说,才是有用的。

第四章文献信息集中与离散分布规律——布拉德福定律

1、布氏定律的基本阐述(P105)

一般认为,布拉德福定律的基本原理是由其区域描述和图像描述两个部分组成的。

(1)区域描述

如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的三分之一,便可发现:第一区(核心区)所涉及的文章来自数量不多但效率很高的n1中期刊;第二区(相关区)包括数量较大、效率中等的n2中期刊;第三区(外围区)包括数量最大而效率很低的n3中期刊。

那么这三个区中的期刊数量成下列关系:n1:n2:n3 = 1:a:a2(a>0)(1)式中:a即布拉德福常数,或称比例系数。就布拉德福所分析过的数据而言,a值大约为5.0。上式即为布拉德福定量的区域表述形式,经过维克利的研究,可以把三个区讨论的文献离散规律推广到任意多个区的情况。

各区的期刊的载文量是逐区下降,而各区期刊数量则是逐区上升的。核心区情报密度最高,相关区次之,外围区情报密度最低。

(2)图像描述

如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数R(n)为纵坐标进行图像描述,便可得到一条曲线——布拉德福分散曲线。

分散曲线AB由两部分组成:对应核心区的上升的一段曲线AC和对于相继各区的直线CB,后来研究表明,拐点C点为核心区的分界点。

布拉德福在研究时发现,从图像出发还可以得到另一个结论,即:

n1:(n1+n2):(n1+n2+n3)=1:b:b2

记n1-2=n1+n2,n1-3=n1+n2+n3,则可将上式改为:

n1:n1-2:n1-3=1:b:b2 (2)其中,n1——核心区的期刊数量n1-2——核心区和第二区的期刊累积数n1-3——全部三个区中的期刊累积数,即期刊总数N b——分散系数(3)区域描述和图像描述的关系

区域描述方法是根据实际统计的具体数据,取近似值而概略地归纳出的,是一种近似的经验方法。从许多统计数据中都可以发现,几乎每一组统计数据都近似地满足(1)式,而

且每一组数据也只能近似地满足(1)式。

图像描述方法所依据的是与区域描述完全相同的统计数据,只是图像描述将统计的期刊数取对数,并利用了三个区中相关论文量相等这一近似条件而得到(2)式的结论的。因此,从数学观点来看,图像描述的可行的,从实际应用看来,图像描述也非常接近于反映文献的实际分布情况,甚至其近似程度比(1)式更为精确。

按布拉德福区域描述公式所产生的理论曲线与图像描述的经验曲线基本上是一致的,两种表现形式之间没有歧异性,而具有一致性。

2、布氏定律理论原理与实际的一致性

(1)布氏定律的理论解释:从科学的统一性规律出发总结出文献的分散定律。

(2)格鲁斯下垂:格鲁斯通过对基南-阿瑟顿数据的分析指出,布拉德福曲线在进入直线部分后,并非无休止地直伸下去,后来总要弯曲下垂,因而使得布拉德福定律的图形变为明显的三个部分:上升的曲线部分——直线部分——弯曲的下垂部分(格鲁斯下垂)。

(3)理论与实际存在差异的原因:一是理论本身的缺陷;二是对客观实际的反映的失真问题。

第五章文献信息词频分布规律——齐普夫定律

1、齐普夫定律的文字表述(P139)

在任何一篇文章中,词的出现频率都服从如下规律:

如果把一篇较长文章(约5000字)中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D(或L)、若用Fr表示频次,r表示等级序号,则有:Fr*r = C (3)称为齐普夫定律的绝对频数表示法或频次表示法式中C为常数。但这里的常数并不是绝对不变的恒量,而是围绕一个中心数值上下波动。

齐普夫定律不仅可以用词的绝对频数(频次)表示,而且也可以用此的相对频数(频率)表示:令N为文章所包含的词汇总数(词容量),fr为第r级词的相对频率,则有

fr = cr-1 (4)称为齐普夫定律的相对频数表示法或频率表示法其中,c仍为常量,且c=C/N,而fr=Fr/N

齐普夫运用其“最省力法则”解释了这个定律。认为,在任何语言中,凡是使用频率高的词,功能总是不会太大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就不大,所以,此的出现频率与等级序号的乘积基本上稳定于一个常数。

2、齐普夫定律的图像描述——齐普夫分布曲线

根据文献中出现的词频与等级序号的统计数据,建立Fr与r的直角坐标系,用横坐标表示词的等级序号r,纵坐标表示相应的频次Fr,就可以得到一条双曲线,即齐普夫分布曲线(a)。如果等级序号r与频次Fr都取对数坐标,则图像就变成一条直线了,即齐普夫分布对数曲线(b)。

3、齐普夫定律的一般数学形式

(2)中的曲线若用等价的数学式表示,则为:lgr+lgFr=lgC

一般的,由解析几何知,斜率为b的任一直线可表示为:blgr+lgFr=lgC

如果将这一方程改写成类似(1)式的形式,则得:Fr*rb=C (5)

若b=1,则(3)式和(5)式相同,这与后来朱斯提出的齐普夫定律的修正式的一致的。

4、齐普夫定律的适用性

一般来说,齐普夫定律较符合西文文献中词频分布的实际情况,定量揭示了文献信息的词频分布规律。

第六章文献信息作者分布规律——洛特卡定律

1、文字表述(P167)

检验发现,生产2篇文章的作者大约是生产1篇文章作者数的1/4,生产3篇文章的作者数是生产1篇文章作者的1/9……,写n篇文章的作者数是生产1篇文章作者数的1/n2;且生产1篇文章的作者数的全体作者的60%左右。可表述为:

y(x) = y(1)/x2 (6)

y(1)为写1篇文章的作者数,y(x)为写x篇文章的作者数。

2、图像描述

3、洛特卡定律的特点

洛特卡定律实际上是科学论文在作者上集中与分散的分布现象,具有两个特点:

(1)洛特卡采用频次排序的方法,即按某类作者出现的频次大小排位,而非按照作者所写的论文多少来对作者进行等级排序;

(2)论文在作者上的集中与分散程度只限于平方反比关系,即只给出了这种集中与分散程度的单一描述。

第八章文献信息统计分析法

1、文献信息统计的原则要求(P259)

(1)针对性对不同的具体统计项目不同的要求

(2)准确性核心要求

(3)代表性抽样统计的代表性较强的样本

(4)可比性设置文献指标和统计数据时

(5)累积性利用文献的累积数来说明问题

2、文献信息统计的基本步骤(P165)

(1)统计调查

a.确定具体方法

b.选准统计工具

c.明确指标项目

d.统计原始数据

(2)统计整理

a.计算

b.排序

c.表示

(3)统计分析

a.理论指导下的分析

b.数值分析

c.图像分析

第十章引文分析法

1、引文分析的基本概念(P316)

引文分析——利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。

2、引文分析的基本步骤(P320)

(1)选取统计对象即可提供引文资料的文献源

(2)统计引文数据关键、前提

(3)引文分析

(4)作出结论

3、引文分析的主要工具

(1)美国《科学引文索引》(Science Citation Index,SCI)(P321)

A、美国SCI印刷版的结构简介:

①概括性的总体介绍(序言部分)

(组成、使用、功能、规则和特点等基本情况及一个统计概括对比表)

②引文索引(正文部分)反映历年文献被来源文献印证的情况

作者引文索引、团体作者引文索引、匿名引文索引、专利引文索引

③团体索引根据来源索引中作者单位的所在地及名称编制的一种索引,分成地区和机构两部分

④来源索引根据原文献(引证文献)作者姓名字顺编排而成,反映来源文献的详细情况按作者情况不同,又分为匿名来源索引和来源索引两种情况

⑤轮排主题索引相当于传统的主题索引

B、美国SCI网络版的检索:

①简易检索提供三种检索途径——主题、人名和地名

②全面检索——可以根据需要设定不同的限制条件,使用户可以查到最新、最全、最准确的信息,是比较专业的检索方法。

a.一般检索主题、著者、来源期刊名、著者地址四个检索途径

b.被引文献检索被引著者、被引著作、引文年代检索

c.结构检索用于检索化学反应和化合物的化学结构

d.高级检索允许使用检索项标记进行更复杂的检索,并能进行检索系列组合

e.查看历史记录

C、美国SCI网络版的特点

和其他版本一样,SCI网络版主要也是用以检索论文被收录和被引证的情况。

①特色链接

内部链接——被引次数、参考文献和相关记录的链接

外部链接——与ISI Chemistry Server(SM)、Derwent Innovations Index、Web of Science Proceedings、BIOSIS Previews的链接

②充分利用WWW网罗天下的强大威力,SCI网络版彻底改变了传统的文献检索方式:通用的浏览器界面,无需安装任何其他软件;全新的超文本格式,所有的信息都相互关联。

③SCI网络版每周更新,并且每次更新即更新整个系统中的所有链接,包括被引次数、参考文献、相关文献的链接。

④SCI网络版允许检索整个数据库或指定检索年份,目前数据可回溯到1945年,并且可检索所有被引证的著者,而非仅仅是第一著者。

⑤SCI网络版可以直接收录纯电子期刊,便于及时反映相关研究成果。

(2)美国《基本科学指标》(Essential Science Indicators,ESI)(P337)

A、美国ESI结构

ESI的主要内容包括引文排位、高被引论文以及引文分析三大主要模块。

①引文排位模块科学家排名、机构排名、国家排名、期刊排名

②高被引论文模块高被引论文、热门论文

③引文分析模块基线、研究前言

引文排位页面和高被引论文页面还提供了与顶尖论文页面、时间序列图的链接。

B、美国ESI的功能

a.美国ESI的检索功能:①引文排序 by field和by name检索(学科、名称)

②高被引论文的检索 by field和by searching两种方式

b.美国ESI的评价功能:

①分析某个公司、研究机构、国家以及期刊的科学研究绩效;

②跟踪自然科学和社会科学领域内的研究发展趋势;

③分析评价员工、合作者、评论家以及竞争对手的能力;

④测定某一专业研究领域内科学研究成果的产量和影响力。

c.进行学科结构、学科关系以及学科发展史的研究;为科学评价提供重要的数据源。

C、美国ESI的特点

①基本的分析工具

②服务对象的广泛深入

③综合全面的数据、论文和课题

④与其他信息资源的链接和整合

4、影响因子(P379)

加菲尔德在1972年提出的一个评价期刊的重要指标。根据:普赖斯曾提出,科学论文一般在其发表1~2年后,被人们了解接受,并达到被引证的峰值阶段。

是一个相对数指标,主要用以调整和修正大刊、老刊凭借发表论文绝对数量而在期刊被引上所占的优势,同时选择期刊被引数量达到高峰时来计算其平均被引率,所以更能反映期刊被使用的真实情况。

通常影响因子越大,可认为该刊在科学发展和文献交流过程中的作业和影响力较大,亦可认为其质量较高。

5计量因子

6、引文耦合与同被引(P397)

(1)引文耦合——指引证文献通过其参考文献(被引证文献)建立的耦合关系。

具体来说,如果A和B两篇文献共同引证了一篇或多篇参考文献,或者说它们共同具有某一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。

(2)同被引——指两篇(或多篇)论文同时被后来的一篇或多篇论文所引证,则称这两篇论文(被引证论文)具有“同被引“关系。

(3)引文耦合与同被引的异同

相同:①都是指两篇论文通过另外一篇或多篇论文建立起来的关系,所以都可以反映出文献之间的联系程度和结构关系,在引文分析中属于同一种类型:即以文献之间的联系程度作为计量单位的网络结构分析,从引文角度揭示论文的主题相似性,以及相互之间作用和联系。

②这两种分析方法都可用于研究文献关系,进行文献检索和揭示学科结构等。

区别:观察处理问题的方法及主客体不同

①引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。前者由两篇文献的作者共同建立的,后者是由引证它们的作者各自建立的。

②引文耦合强度是固定不变的(因为对于任意两篇已发表的论文来说,其后的参考文献是固定不变的),同被引强度则随时有可能发生变化(处于被动地位,等着其它文献来建立)。

③引文耦合反映的文献间的关系是一种固定的长久的关系,而同被引反映的则是变化的

或暂时的关系。因此,引文耦合形成的模型的静态结构模型,而同被引则是动态结构模型。

④引文耦合是回溯的,属于“回向引证”,而同被引则是展望性的,属于“前向引证”。

⑤对于研究和解释科学文献的内在联系与规律,描绘科学发展的动态结构来说,同被引比引文耦合更具有优越性,更适合当代情报科学研究的对象是不断变化和发展的特点。

7、引文分析法的局限性(P426)

著者引证文献是一个人为控制的思维和判断过程,而作为其表现形式的引证文献,仅仅是宏观的、表面的测度。

(1)文献被引证并不完全等于重要

(2)著者选用引文受到可获得性的影响

文献地理分布、著者语言能力、文献本身年龄和流通状况等影响

(3)引文关系上假联系的影响

引证文献的原因多种多样,两篇论文可能出于完全不同的原因或从不同的角度引证同一篇早期文献,一篇可能是引证其方法,另一篇可能是引证其结果,这样这两篇文献在内容上的联系就可能是虚假的;引文有些是发生在前言和篇名中,有些是在正文中,有些发生在结论或讨论中。

(4)马太效应的影响人们往往以“名著”、“权威”作为选择引文的标注,有的确是出于需要,有的则是为了装饰门面、太高自己论文的身价,从而掩盖和影响着文献引证的真实性。

第十二章信息计量学在信息资源管理与研究中的应用

1、核心期刊定义及形成机理(P458)

核心期刊——指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就成为该学科(专业)的核心期刊。

各种期刊的情报价值有大有小,在情报信息交流中所发挥的作用各不相同。这种情报价值交流作用的大小往往取决于相关论文在期刊中的分布状况。对于某一特定期刊而言,少数期刊的相关学科或专业来说,少数期刊所含的相关情报量很大,而多数期刊的相关情报量却很少。

从文献分布的集中与离散规律出发,对核心期刊的形成机理至少和作两个方面的理论解释:(1)受科学发展观客观规律的制约。因为科学期刊的产生和发展是由学科发展客观需要所决定的,而且每一种期刊都有自己的学科和专业性质,使得该学科论文高度集中于少数期刊上,形成文献分布的“堆加效应”。

(2)某些人为控制的主观因素也会影响文献的分布和核心期刊的产生及发展。例如“马太效应”的影响,使大量的文献“堆加”在少数期刊上,形成文献分布的集中现象,同时在文献生产和交流过程中,许多现象要受到人为选择因素的影响,而人的选择要受“最省力法则”的支配。

2、核心期刊的测定意义(P460)

(1)图书情报管理单位科学管理上的需要

期刊发行量很大而任何一个单位把这些期刊定全,没有必要也没有可能,只能有选择地订购少数核心期刊,就能满足读者的大部分的信息要求。因此,研究和评价期刊的质量、科学地确定核心期刊,不断提高订刊的合理性和准确性,是图情领域的重要研究课题,也是提高图情单位科学管理水平的一个重要环节。

(2)科技工作者重点阅读的需要

据不完全统计,目前科技期刊6万种,每年发表的论文400万篇以上,一个科学家或工程技术人员,面对数量如此庞大的文献,想要将本学科范围内的文献全部浏览或是阅读一遍几乎不可能,毫无疑问,科研人员只能有选择性的重点阅读本专业的核心文献。

(3)提高信息检索和文献信息服务效率的需要

只有了解各种期刊的特点和优缺点,掌握重要论文的出现规律与搜集途径,把握一批高质量的核心期刊,才能有针对性的做好信息检索和文献情报服务公司。在解决咨询和定题服务时,也必须充分利用各专业的核心期刊,提高文献情报服务的工作效率。

3、举例说明核心期刊的测定步骤(P461)

(一)测定方法的两种基本类型:

(1)利用信息计量学工具和指标直接选定各学科的核心期刊,如SCI及其副产品《期刊引证报告》JCR提供的期刊被引量、影响因子等;

(2)利用文献计量学方法,按一定基本步骤测定。

(二)文献信息计量方法体系之一——文摘法的测定步骤:

(1)选准统计的文摘杂志。必须选择该学科领域内国际著名的带有权威性的文摘杂志、题录或索引作为统计分析的依据,一般以选用中等文摘杂志为宜,并采用一年的统计时限。

(2)统计期刊的被摘录量并排序(一年内)。

(3)计算累积文摘率。由高位向低位计算,排在全面的累积文摘量占期刊总摘录量的比例达到70%(一般取此指标),则相应的期刊可确定为该学科的核心期刊。

(4)进行交叉对比。如果某学科有多种著名文摘杂志时,取其一种作为主体,采用上述方法作统计,并作出该文摘杂志的核心期刊表,同时取另一种著名文摘杂志做辅助,以同样方法作出它自己的核心期刊表(副表)。然后,用副表和正表进行对比,加以验证。

其他方法详见(462—470)

第十三章信息计量学在科技管理与预测中的应用

1、信息计量学与科学学研究的基本原理与基本内容(P502)

科学学——一门研究科学本身发展规律和组织结构的学科。

科学学的发展规律,在很大程度上是有人才、经费、成果的消长演变、增长速度、学科构成及其比例关系来体现,而这方面的变化又反映在科学文献的各种变化上。这是因为科学文献是科技知识和成果的客观记录,是科学存在的表现形式。科学文献的数量和质量是对科学技术水平的一种度量。根据科学文献的内容构成和数量的变化规律,可以归纳总结、分析或评价科学技术的历史和现状,以及预测整个科学系统发展趋势和发展规律。

基本内容:

(1)科学发展特点①科学发展速度加快②具有继承性③阶段性④交叉渗透性⑤科学发展重点的转移⑥科学劳动的集中性

(2)科学结构

①利用书目分析法a.书目结构反映学科结构b.书目数量变化反映学科发展的动态特性

②利用引文分析法a.静态研究,如引文聚类形成的网络图b.动态比较研究c.超结构的微观研究,利用二维空间来描绘跨学科的宏观聚类

③利用词频分析法研究学科发展结构

(3)科技史

(4)科技政策

2、信息计量学评价人才的原理与方法(P513)

原理:(1)科技人员的成就与学术造诣与其发表的文献数量有关。一般而言,科学人员的发明越多,成就越大,他的文献,特别是专利文献以及在重要刊物上发表的文献就越多。

(2)科技人员的成就和学术造诣与其发表文献的被引次数有关。文献的被引次数的多少,在一定程度上反映了文献的质量和价值,从总体上反映了该文作者在学术界的影响和地位以及对社会的贡献,从客观和使用的角度证明发表论文的价值和作用。

方法:(1)书目分析法。即统计某一时期各位科技人员在公开出版物发表的文章的篇数,并

作为篇目,然后将各篇目比较,发表文章多的一般被认为成果较多。简单但不充分。

(2)引文分析法。一般采用4个指标:论文总数,被引证总数,每篇论文的被引次数,高被引论文数。具体方法是直接统计或者利用《科学引文索引》数据库统计出在一定时期内科学家所写论文的总被引次数,谁的被引次数高,谁就中选,比较客观可靠,因而在评选人才中得到了广泛应用。

3、科技预测的概念和内容(P538)

科技预测是根据预测学的基本原理以及科技发展的历史和现状,对科技的发展前景及其对社会进步的影响程度进行分析和预测,从而得出预见性的结论。

五方面的内容:

(1)科学预测——关于科学发展前景的预测。预测整个科学体系的发展趋势,分析各学科的分化、交叉、渗透、综合的演变方向;预测现有学科的发展前景、可能出现的新学科特别是边缘学科和综合学科;预测某些科学理论的实用价值、科学技术化的发展趋势和周期演变规律。

(2)技术预测——关于技术的发展前景的预测。预测某些重大技术领域的发展前景、可能出现的技术发明、新材料、新工艺、新设备和新方法,预测新技术的应用领域。

(3)产品预测——利用信息计量方法可以预测产品开发和应用前景。

(4)科技事业预测——关于科学技术事业未来前景的预测。预测科研体制、科技队伍、科技图书、情报资料、科技交流、技术引进、技术转移等的发展前景。

(5)科技对经济、社会影响的预测预测科学技术对社会、经济发展等各方面的影响。

第十四章信息计量学的新发展——网络信息计量学(P561)

1、网络信息计量学——是采用数学、统计学等定量分析方法,对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以揭示其数量特征和内在规律的一门新兴分支学科。

2、网络信息计量学的主要研究内容(P564)

(1)网络信息计量学的基本问题研究网络信息的类型和特点;网络信息计量的基本原理、基本方式、意义和作用以及发展趋势等。

(2)网络信息计量学的理论问题研究网络信息分布、增长、老化、关联和离散等规律研究

(3)网络信息计量学的方法问题研究基本测度指标,网络信息内容、结构的测度,网页的链接、影响因子分析,网络信息使用规律的测度,统计分析方法,数据挖掘方法等(4)网络信息计量的技术问题研究网络信息计量系统的机理与设计,文本、多媒体、多语言信息计量技术,智能代理计量技术,网络信息的计量评价系统,XML等环境下的计量问题等

(5)网络信息计量的应用问题研究网上电子期刊、电子图书馆等信息的计量分析,网络站点的增长、分布、联系等计量分析等

(6)网络信息资源计量管理对策问题研究资源配置计量问题,价值的定量评价,过滤的定量分析,共享效率的计量等

3、网络信息计量学的主要特征(P571)

①计量方便

②统计全面

③结果准确

④学科新颖

⑤方法精致

⑥应用广泛

⑦更新较快

4、网络信息计量学的主要研究方法(P580)

(1)网络链接分析法

(2)相关分析法

(3)内容分析法

(4)统计分析法

(5)可视化方法

(6)数据挖掘法

《信息计量学复习预测参考》

一.名词解释

信息论:采用数理统计方法来研究信息的度量,传输和变换规律的一门学科。

信息计量学:采用定量方法来描述和研究情报(信息)的现象,过程和规律的一门学科。

期刊载文量:在给定时间内,期刊发表的全部论文数量。

期刊引证率:在给定时间内,期刊引证的全部参考文献数量。

期刊被引率:在给定时间内,期刊被引证的全部次数。

平均引文率:反映期刊平均引文水平的统计量,以修正由于载文量大小不同带来的偏差。

知识发现:对数据中隐含的,以前不知道的,潜在的有用的信息的有价值的提取。

聚类:利用论文间的同被引关系把本来无外部联系的论文“聚”在一起而形成“类”的过程。

引文聚类:引文之间都具有一定程度的学科专业相关性,根据专业属性,引文可聚集成为一个个聚类群体。

引文耦合:引证文献通过其参考文献(被引证文献)建立的耦合关系。

文献同被引:指两篇(或多篇)文献同时被后来的一篇或多篇论文所引证,则称这两篇论文具有“同被引“关系。

期刊同被引:以期刊为基本单元而建立的同被引关系。

普赖斯定律:撰写全部论文一半的高产作者的数量,等于全部科学作者总数的平方根,这就是普赖斯定律.

普赖斯指数:普赖斯指数等于(出版年限不超过5年的被引文献数量/ 被引文献总量)X100%

文献信息流:在信息计量学中,通常把文献所含信息的汇流称为文献信息流。由于文献是信息的最基本的载体形式,文献信息流是具有一系列主题特征的科学文献的集合,所以有时将文献信息流简称为文献流。

文献信息老化:科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完全s丧失其利用价值。过程观认为文献老化是一种过程,状态观认为文献老化是一种状态,过程状态辩证观认为文献老化既是一种过程又是一种状态。

半衰期:某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期);该学科一半文献失效所经历的时间(历时半衰期)。

引文分析法:就是利用各种数学及统计学的方法和比较,归纳,抽象,概括等逻辑方法,对科学期刊,论文,著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。

核心期刊:指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊。

影响因子:评价和比较一种期刊相对于同学科中其他期刊影响力和重要性的指标。影响

因子等于某刊前两年发表论文在该年的被引证次数除以该刊前两年发表论文总数。

即年指标:评价期刊中的论文被引证的速度,或者在同一年内期刊中的论文被引证的频率。即年指标等于该刊某年发表的论文在当年的被引次数除以当年发表论文的篇数。

科技预测:根据预测学的基本原理以及科技发展的历史和现状,对科学技术的发展前景及其对社会进步的影响程度进行分析和推测,从而得出预见性的结论。

网络信息计量学:是综合采用文献计量,信息计量,统计学方法,计算机技术和网络技术等对网络信息规律进行计量分析的一门科学。

格鲁斯下垂:布拉德福曲线在进入直线部分后,并非无休止的直伸下去,后来总要弯曲下垂,因而使得布拉德福的图形变为明显的三个部分:上升的曲线部分—直线部分—弯曲下垂部分。

剩余有益性指标:某一年份某一期刊被用户所利用的文献数被称为期刊有益性,经过若干年后,期刊还保留的有益性即剩余有益性,是期刊老化程度的一种量度。

二.填空题

1. 信息计量学研究的基本目的,就是要引进量的概念,和定量分析方法,进一步揭示信息单元的体系结构和数量变化规律,从理论上提高情报学及信息管理学科的科学性和精确性,促使这些学科向定量阶段发展。

2. 信息的三种含义:过程信息,知识信息和事物信息。

3. 信息计量基本定律:洛特卡定律,布拉德福定律和齐普夫定律。

4. 信息流模型:文献增长模型,文献老化模型,文献离散分布模型和引文分布模型。

5. 引文分析的三种基本类型:引文数量分析,引文间的网状或链状关系分析以及引文反映出的主题相关性分析。

6. 文献计量的指标:绝对值指标和相对值指标。

7. 引文分析法的历时法符合过程观,共时法符合状态观。

8. 引文测度的主要指标:引文年代,引文语种,引文文献类型,引文国别和引文按作者。

9. 网络信息计量学研究对象是网络的信息。

10.网络信息计量方法包括:网络信息统计方法,数学模型分析方法,引文分析法,书目分析法,系统分析法等方法。

三.简答题

1.文献计量学的主要进展(7个方面)

①每年发表的文献量增长较快,并逐步形成了本学科的核心情报源;

②确立并提高了学科的地位;

③主要分支领域的研究取得重要成果;

④文献计量工具和手段的现代化取得重要进展;

⑤专业教育起步快,发展迅速;

⑥形成了一支骨干队伍(核心研究队伍已基本形成);

⑦国际交流与合作发展势头良好。

2.信息计量学的内容体系

①信息计量学若干基本问题的探讨,包括信息概念的数学描述,学科研究的对象,内容,范围和相关学科的关系以及学科的形成和发展等。

②信息的基本测度,建立“信息量”等一整套测度指标,确定信息计量的准绳;关于比特,知识单元,信息熵,信息场,信息势等计量概念的讨论。

③几个基本定律的研究,包括布拉德福定律,齐普夫定律和洛特卡定律等。

④信息流模型的研究,如文献增长,老化,离散,引文分布等模型的建立与评价

⑤信息计量化方法的讨论,如等级排序方法,对数透视原理及方法和模糊数学,信息论,集合论等的应用,情报利用和效益的定量评价等。

⑥信息计量方法和工具的自动化实现方面的研究,如聚类,相关分析,引文数据库,计量信息管理系统以及词频统计等的计算机实现问题。

⑦在图书情报工作,信息资源管理,信息检索,信息分析与预测,科学学与科学评价等领域的应用。

3.信息计量的数据来源

信息计量的数据来源包括传统的“十大信息(情报)源和近年来发展起来的光盘数据和网络数据等新型数据。

十大数据:科技图书,科技期刊,科技情报,会议文献,专利文献,标准文献,学位论文,产品资料,技术档案和科技报纸。

光盘数据:《中国科学引文索引》(CSCI),《中国科技论文与引文数据库》(CSTPC)和《中文社会科学引文索引》(CSSCI)。

网络数据:Alta,Vista,Google,Vip,万方数据期刊网,中国学术期刊网,CSSCI,CSTPC,SCI 等。

4.信息计量工具和应用软件

工具:①SCI(Science Citation Index),即科学引文索引。

②SSCI(Social Sciences CitationIndex),即社会科学引文索引。

③A&HCI(Arts &Humanities Citation Index),即艺术与人文引文索引。

④ESI(Essential Science Indicators),即基本科学指标数据库。

⑤EI(Engineering Index),即工程索引。

⑥ISTP(Index to Scientific&Technical Proceedings),即科技会议录索引。

⑦CCSI(China Science Citation Index),即中国科学引文索引。

⑧CSTPC(Chinese Science and Technology Paper and Citation Index),中科论文与引文数据库。

⑨CSSCI(Chinese Social Science Citation Index),即中文社会科学引文索引数据库。

⑩中国期刊全文数据库及其引证报告。

应用软件:①MATLAB(Matrix Laboratory)

②SAS(Statistical Analysis System),即统计分析系统。

③SPSS(Statistical Package for the Social Science),即社会科学应用软件包。

5.信息计量的方法体系

①统计分析法:一是信息计量的一些专业统计术语;二是指数理统计。

②数学模型分析法:解析式和图像模型,方程组模型,图表模型。

③引文分析法:利用各种数学及统计学的方法和比较,归纳,抽象,概括等逻辑方法,对科学期刊,论文,著者等各种分析对象的引证与被引证现象进行分析,以揭示其数量特征和内在规律的一种文献计量分析方法。

6.信息计量学与相关学科的关系。

①从其学科性质来看,信息计量学是介于文献学,情报学和图书馆学之间的一个新兴的边缘学科。

②从影响信息计量过程的因素来看,既有科学技术等客观因素,也有社会的,心理的等许多人为控制的主观因素,因此信息计量学本身既联系着自然科学又涉及到社会科学。

7.文献信息流的特性

①静态特征:在一定时间内科学文献在空间的分布性质,如集中-离散分布,文献按著者分布,词汇在文献中分布,引文分布,主题相关分布等的规律性。

②科学文献随时间的延续而增长和老化的性质。科学文献既增长又老化,在增长之中不断老化,在老化之中不断增长;增长是文献信息流的主要趋势。

8.文献信息增长规律的研究意义

①确定文献信息数量随时间变化的关系,可以大致的揭示科学发展的某些特点和规律;

②根据有关文献数量的变化进行科学预测,这是情报分析研究中广泛采用的“情报模型法”。

③通过文献信息增长规律的研究,预测文献增长的趋势,为科学情报工作未来的发展提供决策依据。

9.文献信息量度指标和方法

指标:①绝对值指标:表示文献数量多少的,有图书数量,期刊数量,论文数量等;

②相对值指标:表示不同部分文献的数量比例的,有某一部分文献占全部文献的比例,各类型文献的比例,各语种文献的比例等。

方法:①以每年所出版的文献的累积总量为依据的;②以每年新出版的文献数量为依据的。

10.文献信息指数增长规律的分析

(1)文献指数增长规律的正确性

(2)文献指数增长规律的局限性:①科学文献并不总是按指数函数关系增长②指数规律不能预测文献的未来增长趋势。

(3)文献指数增长规律存在局限性的原因:①对科学文献增长的机理研究不够,因而难以对影响文献增长的各种因素通盘考虑,全面权衡,给出恰如其分的分析和定量描述②在确立科学文献的指数增长律时,普赖斯没有考虑,也难以考虑文献日益严重的老化因素。

③在统计某年的科学期刊累积总数时,普赖斯没有排除已停刊的期刊。

11.文献老化的主要量度指标

①半衰期指标②普赖斯指数指标③剩余有益性指标

12.布拉德福定律的基本内容。

基本内容:①区域描述(4-2公式)。②图像描述(4-2分散曲线)。

13.齐普夫定律的理论基础和基本内容。

理论基础:最省力法则(在各种人为选择中,人们都自觉或不自觉地共同遵守着这一基本的行为选择法则,即最省力法则)。

基本内容:①文字表述(5-3)②图像描述(5-2)

14.文献信息统计的原则和指标。

原则:①针对性原则:有的文献信息统计是图书情报单位的业务统计,有的则是为了某一目的的专题研究的统计。

②准确性原则:数据和结果的准确性是文献信息统计的核心要求。

③代表性原则:在文献信息统计中,有的是全面统计,但严格来说,一般都是抽样统计。

④可比性原则:文献信息统计数据是分析判断的基础,而分析时常用比较方法。

⑤累积性原则:累积数据可以是绝对数也可以是相对数。

指标:(1)描述对象分:藏书指标,引文指标,著者指标,流通指标,读者指标。

(2)数据形式分:绝对数指标和相对数指标。

(3)管理用途分:工作评价指标和工作控制指标。

15.引文分析法的局限性

①为阿谀某人而引证。②为互相吹捧而带有偏见的引证。③以自诩为目的的引证。④为

支持某一学术研究派别利益的不正当引证。⑤迫于权威压力的引证。

16.引文分布规律的基本指标

①期刊载文量②期刊引证率③期刊被引率④平均引文率(平均引证率和平均被引率)。

17.引文分析法的应用领域,应用举例和局限性。

应用领域:①测定学科的影响和重要性②研究学科结构

③研究学科情报源分布④确定核心期刊⑤研究科学交流和情报传递规律

⑥研究文献老化和情报利用规律⑦研究情报用户的需求特点⑧科学水平和人才的评价

应用举例:农业科学研究的例子—①选取分析对象②统计引文数据③引文分析④作出结论

局限性:①文献被引证并不完全等于重要②著者选用引文受到可获得性的影响③引文关系上假联系的影响④马太效应的影响

18.核心期刊的测定方法和步骤及意义

测定方法和主要步骤:

(1)布氏定律法及百分比补偿:①区域分析法②图像分析法③布氏定律法及百分比补偿

(2)累积百分比法(80%法)

(3)文摘法:①选准统计的文摘杂志②统计期刊的被摘录量并排序③计算累积文摘率④进行交叉对比。

(4)引文法:①分析多种杂志的引文法②分析单一杂志的引文法③利用引文工具的引文法

(5)流通率法

(6)综合评价法

意义:①图书情报单位科学管理上的需要②科技工作者重点阅读的需要③提高信息检索和文献信息服务效率的需要。

19.信息计量学评价人才的原理和方法。

原理:①科技人员的成就和学术造诣与其发表的文献数量有关。

②科技人员的成就和学术造诣与其发表文献的被引次数有关。

方法:①书目(篇目)分析方法:统计某一时期内各位科技人员在公开出版物上发表的文章的篇数,并作为篇目,然后将各种篇目进行比较,发表文章多的一般被认为成果较多。

②引文分析法:应用引文分析方法评价科研人员及其成果,现在一般采用4项指标(论文总数,被引证总数,.每篇论文的被引次数和高被引论文数)。

20.科技预测的基本内容

①科学预测—关于科学发展前景的预测。

②技术预测—关于技术的发展前景的预测。

③产品预测—利用信息计量方法可以预测产品开发和应用前景。

④科技事业预测—关于科学技术事业未来前景的预测。

⑤科技对经济,社会影响的预测。主要预测科学技术对社会,经济发展等各方面的影响。

21.网络信息计量学的基本内容,研究重点,主要特征,研究方法和分析方法。

基本内容:①网络信息计量学的基本问题研究②网络信息计量学的理论问题研究③网络信息计量学的方法问题研究④网络信息计量的技术问题研究⑤网络信息计量的应用问题研究⑥网络信息资源计量管理对策问题研究

研究重点:①网络媒体信息本身的计量分析②网络站点结构的计量分析③网上文献信

息的计量分析网页影响因子分析⑤网络数据库中的知识发现

主要特征:①计量方便②统计全面③结果准确④学科新颖⑤方法精致⑥应用广泛⑦更新较快

研究方法:①网络链接分析法②相关分析法③内容分析法④统计分析法⑤可视化方法⑥数据挖掘法

分析方法:①网络信息统计方法②数学模型分析方法③引文分析法④书目分析法⑤系统分析法

四.论述题

1.信息计量学与文献计量学和科学计量学的关系

1.信息计量学与文献计量学的关系:

①首先,信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为计量对象(有时也涉及文献情报)。

②其次,信息计量学较之文献计量学来说,其研究范围更广泛一些。

③再次,从任务和方法上来看,信息计量学研究的任务更为艰巨,更难找到恰当的定量方法和途径。

2.信息计量学与科学计量学的关系:

①从研究目的来看,科学计量学主要是从定量的角度来探讨科学发展的内在规律,最终促进科学技术的进步;而信息计量学的目的也在于:一是探明科学文献本身的规律,以提高信息管理的科学性;二是通过信息规律的探讨,进而揭示科学技术的规律性。

②从研究对象和方法来看,两者极为类似。科学计量学研究的科学文献及其数量也是信息计量学的研究对象之一。在方法上,两者都要运用数学和统计学的定量方法,对科学文献等信息进行定量的分析研究;在研究内容上,信息计量学与科学计量学在一个相当大的范围内是彼此交叉的。

③但是,应当明确指出:信息计量学与科学计量学有着很大的区别。首先,信息计量学的范围要比科学计量学的范围广很多;其次,它们的研究目的是不一样的;最后,它们应用的领域也有所不同,信息计量学在文献,人才,学科,单位,数据评价方面发挥了很大作用,可以涉及的面非常广泛。而科学计量学在科学机制和科学政策的制定方面发挥了非常重要和独特的作用。

综述:信息计量学是文献计量学的发展;科学计量学是文献计量学与科学计量学相结合的重要发展;网络信息计量学是信息计量学的发展。

2.文献信息统计分析法的基本类型和基本步骤(三步且举例)

基本类型:

(1)出版物统计:①按国别对书刊等文献量的统计。②对各出版社(商)的出版发行量的统计。③按学科对书刊等文献量的统计④按语种对书刊等文献量的统计⑤对科学期刊中登载某学科的文献量的统计。⑥对某学术团体或科研机构发表的专著,论文,专利等文献量的统计。⑦对某著者发表的专著,论文,专利等文献量的统计。⑧对某地区或某一时期的出版物数量的统计。

(2)著者统计:①杰出著者量的统计。②对各学科或专业的文献的著者数比例的统计。

③对不同国家中各学科文献的著者数进行统计。

(3)科技用语统计。

(4)引文统计。

(5)其他有关文献信息利用的统计。

基本步骤:

(7)统计调查:①确定具体方法。②选准统计工具。③明确指标项目。④统计原始数据。

(8)统计整理: ①计算。②排序。③表示。

(9)统计分析:①理论指导下的分析。②数值分析。③图像分析。

3.引文分析法的基本类型和基本步骤。

基本类型:①从引文数量上进行研究,主要用于评价期刊和论文等。

②从引文间的网状关系或链状关系进行研究。

③从引文反映出的主题相关性方面进行研究。

基本步骤:①选取统计对象:根据所要研究的学科的具体情况,选择该学科中有代表性的较权威的杂志,确定若干期或若干篇相关论文作为统计的对象。

②统计引文数据:在所选的若干篇论文中,分项统计每篇论文后面引文的数量,引文的出版年代,语种,类型,论文作者的自引量等。

③引文分析:在获取的引文数据的基础上,根据研究的目的,从引文的各种指标或其他不同的角度进行分析。

④作出结论:根据引文分析原理和其他一般原则进行判断和预测,从而作出相应的分析结论。

4.引文分析的主要工具(SCI和ESI)及工具的结构,特点和主要功能。

主要工具:①SCI(Science Citation Index)《科学引文索引》和②ESI(Essential Science Indicators)《基本科学指标》。

1.SCI结构:(1)概括性的总体介绍

(2)引文索引:①作者引文索引②团体作者引文索引③匿名引文索引④专利引文索引

(3)团体索引:①地区部分②机构部分

(4)来源索引

(5)轮排主题索引

SCI(网络版)特点:①特色链接(内部和外部)②充分利用www网罗天下的强大威力③SCI网络版每周更新,并且每次更新即更新整个系统中的所有链接。④SCI网络版允许检索整个数据库或指定检索年份⑤SCI网络版可以直接收录纯电子期刊便于及时反映相关研究成果。

SCI功能:(1)两种网络路径检索:Web版的ISI Web of Science和联机版的SCI Search

(2)数据库检索方式:简易检索和全面检索(一般检索和被引文献检索)。

2.ESI结构:(1)引文排位:科学家排名,机构排名,国家排名,期刊排名,顶尖论文链接。

(2)高被引论文:高被引论文,热门论文,时间序列图链接。

(3)引文分析:基线(篇均被引频次和百分点),研究前沿。

ESI特点:①基本的分析工具②服务对象的广泛深入③综合全面的数据,论文和课题④与其他信息资源的连接与整合。

ESI功能:(1)检索功能:①引文排序②高被引论文的检索③研究前沿④检索规则(2)评价功能:①分析某个公司,研究机构,国家以及期刊的科学研究绩效②跟踪自然科学和社会科学领域内的研究发展趋势③分析评价员工,合作者,评论家以及竞争对手的能力④测定某一专业研究领域内科学研究成果的产量和影响力。(评价功能具体体现在:

对科研成果的评价,对科技人才的评价,对科研机构的评价,对科学出版物的评价,对科学学科本身的评价)

6.引文耦合和同被引的异同。

相同:①都是指两篇论文通过另外一篇或多篇论文建立起来的关系,所以都可以反映出文献之间的联系程度和结构关系,在引文分析中属于同一种类型。

②这两种研究方法都可以用于研究文献关系,进行文献检索和揭示学科结构等。

不同:①引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。

②引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。

③引文耦合反映的文献间的关系是一种固定的长久的关系,而同被引反映的则是变化的或暂时的关系。

④引文耦合是回溯的,属于“回向引证”,而同被引则是展望性的,属于“前向引证”。

⑤对于研究和解释科学文献的内在联系与规律,描绘科学发展的动态结构来说,“同被引”比“引文耦合”更具有优越性,更适应当代情报科学研究的对象是不断变化和发展的特点。

7.信息计量学的基本原理和基本内容有哪些?

基本原理:

(1)科学文献量可以反映科学或技术发展的程度和阶段。

(2)科学文献量的国家分布或语种分布,反映不同国家某项科学技术的研究力量和技术优势。

(3)科学文献量的增减变化速度反映科技发展的速度,文献量的翻倍周期一般可作为衡量科学发展的尺度;

(4)文献量的突变反映了科技发展的转折性变化:由增长趋势向平缓趋势,衰落的趋势转变,或从发展过程向衰退过程转变等;

(5)科研机构发表的文献量可以反映该机构的技术实力和研究成果,等等。

基本内容:

(1)研究科学发展特点:①科学发展速度加快②科学发展具有继承性③科学发展具有阶段性④学科间具有交叉渗透性⑤科学发展重点的转移⑥科学劳动的集体性(2)研究科学结构:①利用书目(篇目)分析法研究科学结构(1.书目结构往往反映学科结构。2书目的数量变化往往反映学科发展的动态特征。)②利用引文分析法研究科学结构(1.科学引文与被引文之间有着一定的内在联系。2论文被利用的频次是其学术水平和价值的一种客观测度。③利用词频分析法研究学科发展结构。

(3)研究科技史。(4)研究科技政策。

信息管理学教程期末复习资料

名词解释 1、管理:管理是通过计划、组织、指挥、协调、控制等基本管理功能,有效地利用人力、财力、设备、技术、信息诸种因素,促使它们密切配合,发挥它们最高的效率,以达到预期的目标。 2、信息管理:是在管理科学的一般原理指导下,对信息活动中的各种要素,包括信息、人员、资金、设备、技术等,进行科学地规划、组织、协调和控制,以充分开发和有效利用信息资源,从而最大限度地满足社会的信息需求。 3、MIS:管理信息系统。 4、IRM:信息资源管理。 5、SCM:供应链管理。 6、BPR:企业过程再工程。 7、ERP:企业资源计划。 8、CRM:客户关系管理。 9、信息:是事物的状态、特征及其变化的客观反映,是客观事物通过一定的物质载体传递。 10、信息资源:是信息与资源两个概念整合衍生出来的新概念,只有满足一定条件的信息才能称之为信息资源,作为资源的信息,也就是所谓“有用的信息”或“可以利用的信息”。也就是可以利用的信息的集合。 11、狭义的信息资源:是指信息本身或信息内容,即是经过加工处理的,对决策者有用数据。 12、广义的信息资源:信息资源是信息活动中各种要素的总称(包括信息、技术、设备、资金和人等要素),是将信息资源作为系统概念看待。 13.信源:发出信息的来源

信道:信息传递的通道 信宿:信息接收者 14、信息资源管理:狭义的信息资源管理是指对信息本身即信息内容实施管理的过程。广义的信息资源管理是指对信息内容及与信息内容相关的资源如设备、设施、技术、投资、信息人员等进行管理的过程。 15、信息高速公路:从技术上的角度看,实际上是软件、硬件、通信网络技术和信息处理技术不断发展与集成的结果。 16、信息系统:输入数据,经过加工处理后,输出信息的系统。 17、EDPS:电子数据处理系统 18、DSS:决策支持系统 19、ES:专家系统 20、EIS:主管信息系统 21、OAS:办公自动化系统 22、SIS:战略信息系统 23、信息采集:是信息资源能够得以充分开发和有效利用的基础。 24、信息组织:是对所采集的信息实施有序化的过程,是信息管理过程的核心内容之一。 25、内源信息流:是指来源于经营系统内部的或经营企业内部的信息流动。27、外源信息流:是指来自经营部门之外,但与经营部门的经营活动有着密切联系的,外部社会环境和经营内部的信息流。 28、信息流:人类管理和控制下的信息的有序流动。 29、信息处理:一切为更好地利用信息而对信息所实施的处理工作过程。

信息计量学考试知识点整理-精选.

信息计量学 一、信息计量学概述 1. 信息计量学的由来和发展 1.1 信息计量学的由来 ※信息计量学来自于德文Informetrie,由德国学者昂托.纳克(Otto Nache)在1979年最早提出,其后很快出现了与之对应的英文术语informetrics; ※由于1987年以来的有关学术会议论文集上都有informetrics标题,因此,很多情报学家都将1987年看成是informetrics被国际情报学界正式承认的一年; ※我国将informetrics译为情报计量学,将其作为对应于“情报学”的三级分支学科,1992年,我国有关部门将information从情报改译为信息,informetrics也改译为信息计量学。 1.2 信息计量学的产生背景 (1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的;(文献计量学主要服务于图书馆学,情报数量>文献数量,情报计量方法>文献计量方法,情报学需要开辟与情报学对应的定量化研究领域); (2)信息计量学是情报学发展的需要和必然产物。 布鲁克斯提到:情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。情报学定量化研究不可或缺。 (3)一批杰出的学科带头人和骨干力量推动了信息计量学发展。 1.3 信息计量学的形成与发展 (1)信息量化研究的前期实践 (2)信息计量规律的探索和发现 (3)信息计量学的形成 Statistical bibliography(1923)——Bibliometrics(1969) ——Scientometrics(1969)——Informetrics(1979) (4)信息计量学的发展 1988年,英国布鲁克斯提出informetrics代替bibliometrics; 1990年,比利时埃格赫和鲁索在Introduction to informetrics:quantitative metiods in

(完整word版)计量经济学知识点总结

第一章:1计量经济学研究方法:模型设定,估计参数,模型检验,模型应用 2.计量经济模型检验方式:①经济意义:模型与经济理论是否相符②统计推断:参数估计值是否抽样的偶然结果③计量经济学:是否复合基本假定④预测:模型结果与实际杜比 3.计量经济学中应用的数据类型:①时间序列数据(同空不同时)②截面数据(同时不同空)③混合数据(面板数据)④虚拟变量数据(学历,季节,气候,性别) 第二章:1.相关关系的类型:①变量数量:简单相关/多重相关(复相关)②表现形式:线性相关(散布图接近一条直线)/非线性相关(散布图接近一条直线)③变化的方向:正相关(变量同方向变化,同增同减)/负相关(变量反方向变化,一增一减不相关) 2.引入随机扰动项的原因:①未知影响因素的代表(理论的模糊性)②无法取得数据的已知影响因素的代表(数据欠缺)③众多细小影响因素综合代表(非系统性影响)④模型可能存在设定误差(变量,函数形式设定)⑤模型中变量可能存在观测误差(变量数据不符合实际)⑥变量可能有内在随机性(人类经济行为的内在随机性) 3.OLS回归线数学性质:①剩余项的均值为零②OLS回归线通过样本均值③估计值的均值等于实际观测值的均值④被解释变量估计值与剩余项不相关⑤解释变量与剩余项不相关 4.OLS估计量”尽可能接近”原则:无偏性,有效性,一致性 5.OLS估计式的统计性质/优秀品质:线性特征,无偏性特征,最小方差性特征 第三章:1.偏回归系数:控制其他解释变量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,即对Y平均值直接或净的影响 2.多元线性回归中的基本假定:①零均值②同方差③无自相关④随机扰动项与解释变量不相关⑤无多重共线性⑥正态性…一元中有12346 3. OLS回归线数学性质:同第二章3 4. OLS估计式的统计性质:线性特征,无偏性特征,最小方差性特征 5.为什么用修正可决系数不用可决系数?可决系数只涉及变差没有考虑自由度,如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难 第四章:1.多重共线性背景:①经济变量之间具有共同变化趋势②模型中包含滞后变量③利用截面数据建立模型可出现..④样本数据自身原因 2.后果:A完全①参数估计值不确定②csgj值方差无限大B不完全①csgj量方差随贡献程度的增加而增加②对cs区间估计时,置信区间区域变大③假设检验用以出现错误判断④可造成可决系数较高,但对各cs估计的回归系数符号相反,得出错误结论 3.检验:A简单相关系数检验法:COR 解释变量.大于0.8,就严重B方差膨胀因子法:因子越大越严重;≥10,严重C直观判断法:增加或剔除一个解释变量x,估计值y发生较大变化,则存在;定性分析,重要x标准误差较大并没通过显著性检验时,则存在;x回归系数所带正负号与定性分析结果违背,则存在;x相关矩阵中,x之间相关系数较大,则存在D逐步回归检验法:将变量逐个引入模型,每引入一个x,都进行F检验,t检验,当原来引入的x由于后面引入的x不显著是,将其剔除.以确保每次引入新的解释变量之前方程种植包含显著变量. 4.补救措施:①剔除变量法②增大样本容量③变换模型形式:自相关④利用非样本先验信息⑤截面数据与时序数据并用:异方差⑥变量变换 第五章:1.异方差产生原因:①模型中省略了某些重要的解释变量②模型设定误差③数据测量误差④截面数据中总体各单位的差异 2.后果:A参数估计统计特性:参数估计的无偏性仍然成立;参数估计方差不再是最小B参数显著性检验:t统计量进行参数检验失去意义C预测影响:将无效 3检验:A图示①相关图形分析data x y,看散点图,quick→graph→x,y→OK→scatter diagram→

计量经济学简答题及答案

计量经济学简答题及答案 1、比较普通最小二乘法、加权最小二乘法和广义最小二乘法的异同。 答:普通最小二乘法的思想是使样本回归函数尽可能好的拟合样本数据,反映在 图上就是是样本点偏离样本回归线的距离总体上最小,即残差平方和最小 ∑=n i i e 12min 。 只有在满足了线性回归模型的古典假设时候,采用OLS 才能保证参数估计结果的可靠性。 在不满足基本假设时,如出现异方差,就不能采用OLS 。加权最小二乘法是对原 模型加权,对较小残差平方和2i e 赋予较大的权重,对较大2i e 赋予较小的权重,消除异方差,然后在采用OLS 估计其参数。 在出现序列相关时,可以采用广义最小二乘法,这是最具有普遍意义的最小二乘 法。 最小二乘法是加权最小二乘法的特例,普通最小二乘法和加权最小二乘法是广义 最小二乘法的特列。 6、虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况? 答: 在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于 定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。 7、联立方程计量经济学模型中结构式方程的结构参数为什么不能直接应用OLS 估计? 答:主要的原因有三:第一,结构方程解释变量中的内生解释变量是随机解释变 量,不能直接用OLS 来估计;第二,在估计联立方程系统中某一个随机方程参数时,需要考虑没有包含在该方程中的变量的数据信息,而单方程的OLS 估计做不到这一点;第三,联立方程计量经济学模型系统中每个随机方程之间往往存在某种相关性,表现于不同方程随机干扰项之间,如果采用单方程方法估计某一个方程,是不可能考虑这种相关性的,造成信息的损失。 2、计量经济模型有哪些应用。 答:①结构分析,即是利用模型对经济变量之间的相互关系做出研究,分析当其 他条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。②经济预测,即是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算。③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程。④检验和发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律。 6、简述建立与应用计量经济模型的主要步骤。 答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集; ③估计参数;④模型的检验;⑤计量经济模型的应用。 7、对计量经济模型的检验应从几个方面入手。 答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检 验。

奥鹏东财网考2020年3月课程考试《信息管理学》复习资料参考答案

单选题 1.()与信息系统相结合,产生了专家系统。 A.信息技术 B.计算机技术 C.专家技术 D.人工智能 【参考答案】: D 2.信息管理活动的首要任务是()。 A.信息分类 B.信息分析 C.信息采集 D.信息存储 【参考答案】: C 3.信息调查的要求是准确性和()。 A.完整性 B.及时性 C.真实性 D.科学性 【参考答案】: B 4.按照控制来源划分,控制可以分为()、群体控制和自我控制三种类型。 A.正式组织控制 B.非组织控制 C.专家控制 D.自动控制 【参考答案】: A 5.按照信息源传播形式来划分,信息源分为口传信息源、()和实物信息源。

A.网络信息源 B.多媒体信息源 C.超文本信息源 D.文献信息源 【参考答案】: D 6.为开发网络上的电子商务提供了关键的安全环境的是()协议。 A.HTTP B.TCP/IP C.SET D.FTP 【参考答案】: C 7.1990年,美国麻省理工学院教授()提出了“企业再造理论”。 A.霍顿 B.哈默 C.马钱德 D.莫尔斯 【参考答案】: B 8.按时间性分类,信息可分为历史信息、()和预测信息。 A.自然信息 B.现实信息 C.社会信息 D.有用信息 【参考答案】: B 9.信息检索的概念最早是由()在1950年首次提出。 A.莫尔斯 B.霍顿 C.马钱德 D.香农 【参考答案】: A 10.按管理层次分类,信息管理分为宏观、()和微观信息管理。

A.战略 B.中观 C.战术 D.决策 【参考答案】: B 11.战略规划强调分析、选择和制定方案,而战略管理强调()。 A.战略方案选择 B.战略实施 C..战略规划 D.技术系统构建 【参考答案】: B 12.信息动机形成后可能会产生()和指向作用两种作用。 A.刺激作用 B.凝聚作用 C.激励作用 D.约束作用 【参考答案】: C 13.按社会性分类,信息可分为()和自然信息。 A.科学信息 B.现实信息 C.社会信息 D.有用信息 【参考答案】: C 14.我国目前最常用的文献信息分类标准是()。 A.《中国图书馆图书分类法》 B.《中国人民大学图书馆图书分类法》 C.《中国科学院图书馆图书分类法》 D.《国家图书馆图书分类法》 【参考答案】: A 15.软件维护包括系统软件和应用软件维护,重点是()的维护。

计量经济学重点知识整理

计量经济学重点知识整理 1一般性定义 计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。 研究的主体(出发点、归宿、核心): 经济现象及数量变化规律 研究的工具(手段): 模型数学和统计方法 必须明确: 方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务 2注意:计量经济研究的三个方面 理论:即说明所研究对象经济行为的经济理论——计量经济研究的基础 数据:对所研究对象经济行为观测所得到的信息——计量经济研究的原料或依据 方法:模型的方法与估计、检验、分析的方法——计量经济研究的工具与手段 三者缺一不可 3计量经济学的学科类型 ●理论计量经济学 研究经济计量的理论和方法 ●应用计量经济学:应用计量经济方法研究某些领域的具体经济问题 4区别: ●经济理论重在定性分析,并不对经济关系提供数量上的具体度量 ●计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容 5计量经济学与经济统计学的关系 联系: ●经济统计侧重于对社会经济现象的描述性计量 ●经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据 ●经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据 6计量经济学与数理统计学的关系 联系: ●数理统计学是计量经济学的方法论基础 区别: ●数理统计学是在标准假定条件下抽象地研究一 般的随机变量的统计规律性; ●计量经济学是从经济模型出发,研究模型参数 的估计和推断,参数有特定的经济意义,标准 假定条件经常不能满足,需要建立一些专门的 经济计量方法 3、计量经济学的特点:

计量经济学简答题整理版

1. 请问自回归模型的估计存在什么困难?如何来解决这些苦难? 答:主要存在两个问题: (1) 出现了随机解释变量Y ,而可能与随机扰动项相关; (2) 随机扰动项可能存在自相关,库伊克模型和自适应预期模型的随机扰动项都会导致自相关,只有局部调整模型的随机扰动项无自相关。 对于第一个问题的解决可以使用工具变量法;对于第二个问题的检验可以用德宾h 检验法,目前还没有很好的解决办法,唯一能做的就是模型尽可能的设定正确。 2. 为什么要进行广义差分变换?写出其过程。 答:进行广义差分变换是为了处理自相关,写出其过程如下: 以一元模型为例:Y t = b 0 + b 1 X t +u t 假设误差项服从AR(1)过程:u t =ρu t-1 +v t -1 ≤ρ≤1 其中,v 满足OLS 假定,并且是已知的。 为了弄清楚如何使变换后模型的误差项不具有自相关性,我们将回归方程中的变量滞后一期,写为: Y t-1 = b 0 + b 1 X t-1 +u t-1 方程的两边同时乘以ρ,得到:ρY t-1 = ρb 0 + ρb 1 X t-1 +ρu t-1 现在将两方程相减,得到:(Y t -ρY t-1 ) = b 0 ( 1 -ρ) + b 1 (X t -ρX t-1 ) + v t 由于方程中的误差项v t 满足标准OLS 假定,方程就是一种变换形式,使得变换后的模型无序列相关。如果我们将方程写成:Y t * = b 0* + b 1 X t * +v t ,其中,Y t * = (Y t -ρY t-1 ) ,X t * = (X t -ρX t-1 ) ,b 0* = b 0 ( 1 -ρ)。 3. 什么是递归模型? 答:递归模型是指在该模型中,第一个方程的内生变量Y 1仅由前定变量表示,而无其它内生变量;第二个方程内生变量Y 2表示成前定变量和一个内生变量Y 1的函数;第三个方程内生变量Y 3表示成前定变量和两个内生变量Y 1与Y 2的函数;按此规律下去,最后一个方程内生变量Y m 可表示成前定变量和m -1个Y 1,Y 2、,Y 3,…、Y m-1的函数。 4. 为什么要进行同方差变换?写出其过程,并证实之。 答:进行同方差变换是为了处理异方差,写出其过程如下: 我们考虑一元总体回归函数Y i = b 0 + b 1 X i + u i 假设误差σi 2 是已知的,也就是说,每个观察值的误差是已知的。对模型作如下“变换”: Y i /σi = b 0 /σi + b 1 X i /σi + u i /σi 这里将回归等式的两边都除以“已知”的σi 。σi 是方差σi 2 的平方根。 令 v i = u i /σi 我们将v i 称作是“变换”后的误差项。v i 满足同方差吗?如果是,则变换后的回归方程就不存在异方差问题了。假设古典线性回归模型中的其他假设均能满足,则方程中各参数的OLS 估计量将是最优线性无偏估计量,我们就可以按常规的方法进行统计分析了。 证明误差项v i 同方差性并不困难。根据方程有:E (v i 2 ) = E (u i 2 /σi 2 ) = E (u i 2 ) /σi 2 =σi 2 /σi 2 = 1 显然它是一个常量。简言之,变换后的误差项v i 是同方差的。因此,变换后的模型不存在异方差问题,我们可以用常规的OLS 方法加以估计。 5. 简述逐步回归法的基本步骤。 答:先用被解释变量对每一个解释变量做简单回归,然后以对被解释变量贡献最大的解释变量所对应的回归方程为基础,再逐个引入其余的解释变量。这个过程会出现3种情形:①若新变量的引入改进了R 2 和F 检验,且其它回归系数的t 检验在统计上仍是显著的,则可考

信息管理学期末复习资料

信息管理学期末复习资料 一、名词解释 信息:香农概念——信息是二次不定性之差,不定性就是对事物认识不清楚,不知道,信息就是消除人们认识上的不定性。 哲学概念——信息时客观世界中各种事物的特征或运动状态在人脑中的 反映,它体现出了人们对事物的认识和理解程度 管理:通过计划、组织、指挥、协调、控制等基本功能,有效地利用人力、财力、物力、设备、技术、信息诸种因素,促使它们密切配合,并发挥最高效率, 以达到预期的目标。 信息管理:狭义上认为信息管理师对信息本身的管理,即采用各种技术方法和手段对信息进行组织,控制,存储,检索和规划的等,并将其引向预定 目标。 广义上认为信息管理是对信息活动诸要素进行合理的组织和控制,以 实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。信息资源:信息是普遍存在的,但信息并非全部是资源,只有满足一定条件的信息才能称之为信息资源。 狭义的信息资源:指信息本身或信息内容,即经过加工处理的,对决策者有用的数据 广义的信息资源:是信息活动中各种要素的总称(包括信息、技术、设备、资金和人等要素) 信息资源管理:是为了确保信息资源的充分开发和有效利用,以现代信息技术等为手段,对信息资源实施计划、组织、指挥、协调、控制的一种 人类管理活动。 信息经济学:把信息和信息活动当做普遍存在的社会经济现象来加以研究的学科。信息源:信息的来源 内部信息:来自组织内部,一般比较可靠,容易掌握 外部信息:从其他地方收集或买来的,要注意其正确性,需要花大力气去搜集 一次信息源:由现场直接采集的信息 二次信息源:各种文件或数据库中存储的信息 静态信息:具有相对稳定性,在一定时期内不发生根本变化的信息 动态信息:反映生产经营活动中的实际进程和实际状态的信息。 信息采集:是信息资源能够得以充分开发和有效利用的基础。指一切信息工作的信息采集,不只是指信息服务部门为用户的需求所进行的信息采集。信息组织:是对所采集的信息实施有序化的过程,是信息管理过程的核心内容之一 信息流:具有动态含义,它是一种定向运动着的信息所形成的流 信息处理:一切为更好地利用信息而对信息所实施的处理工作过程,都称为信息处理。信息处理过程要经过几个环节:收集、加工、传递、存储、检 索、使用、反馈等 内源信息流:指来源于经营系统内部的或经营企业内部的信息流动 外源信息流:来自经营部门之外,但与经营部门的经营活动有着密切联系的,外部社会环境和经营环境流入经营内部的信息流。

计量经济学重点

第1章 绪论 计量经济学的含义:一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技术,通过建立计量经济模型,定量的分析经济变量之间的随即因果关系。 计量经济学研究的经济关系具有两个特征:一是随机关系,产出与生产要素投入、消费与收入、投资与收入和利率之间都不是精确的函数关系。二是因果关系,计量经济模型中的每一个(随机)方程都是反映某个经济变量与其影响因素之间的因果关系。 计量经济学的研究步骤:建立理论模型、估计模型中的参数、检验估计的模型和应用模型进行定量分析。 1. 建立理论模型 其任务是依据经济理论和对所研究经济系统的认识,将系统内各经济变量之间的相互关系用一组(或一个)数学方程表示出来。这一阶段的工作又称为模型设定。模型设定一般包括总体设定和个体设定。总体设定的目标是能正确反映经济系统的运行机制。个体设定的目标是能正确反映经济变量之间的因果关系。 ①确定模型中的变量 计量经济学中一般将方程中的变量分为两类,方程等号左端的变量称为被解释变量,有端的变量称为解释变量,即用这些变量来解释或说明被解释变量的变化情况(回归分析中称为因变量和自变量)。建立理论模型时,主要是确定模型中的解释变量,一般时根据经济理论和经验确定被解释变量的主要影响因素。 ②确定模型中的函数形式 确定模型中的函数形式一般有两种方式,一种方式是根据经济行为理论,运用数理经济学的研究方法推导出模型的具体数学形式。另一种方式是根据实际统计资料绘制被解释变量和解释变量的相关图,由相关图显示的变量之间的相关关系确定模型的数学形式,这也是目前经常采用的方式。 ③确定统计指标并搜集整理数据 需要根据模型中变量的含义和统计数据的可得性,模型的研究目的,以及统计数据的可比性和一致性等因素进行综合考虑,以确定适当的统计指标。 建立计量经济模型的统计数据主要有三种类型:时间序列数据,即按时间先后顺序排列的数据,时间频率可以是年、季、月、日等;横截面数据,即某一时点上的数据;合并数据,即时间序列与横截面数据的

计量经济学简答题 (2)

第一章 三、简答题 1、简述计量经济学与经济学、统计学、数理统计学学科间的关系。 答:计量经济学就是经济理论、统计学与数学的综合。经济学着重经济现象的定性研究,而计量经济学着重于定量方面的研究。统计学就是关于如何惧、整理与分析数据的科学,而计量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。数量统计各种数据的惧、整理与分析提供切实可靠的数学方法,就是计量经济学建立计量经济模型的主要工具,但它与经济理论、经济统计学结合而形成的计量经济学则仅限于经济领域。计量经济模型建立的过程,就是综合应用理论、统计与数学方法的过程。因此计量经济学就是经济理论、统计学与数学三者的统一。 2、计量经济模型有哪些应用。 答:①结构分析,即就是利用模型对经济变量之间的相互关系做出研究,分析当其她条件不变时,模型中的解释变量发生一定的变动对被解释变量的影响程度。②经济预测,即就是利用建立起来的计量经济模型对被解释变量的未来值做出预测估计或推算。③政策评价,对不同的政策方案可能产生的后果进行评价对比,从中做出选择的过程。④检验与发展经济理论,计量经济模型可用来检验经济理论的正确性,并揭示经济活动所遵循的经济规律。 3、简述建立与应用计量经济模型的主要步骤。 答:一般分为5个步骤:①根据经济理论建立计量经济模型;②样本数据的收集;③估计参数;④模型的检验;⑤计量经济模型的应用。 4、对计量经济模型的检验应从几个方面入手。 答:①经济意义检验;②统计准则检验;③计量经济学准则检验;④模型预测检验。

第二章 三、简答题 1、 简述用普通最小二乘法求解模型i i i X Y μββ++=10的参数估计量的过程。 答:一元线性回归模型i i i X Y μββ++=10,采用普通最小二乘法进行参数估计的基本准 则:2201 0111????min (,)()n n i i i i i Q e Y X ββββ====--∑∑ (1) 利用微积分多元函数极值原理,要使01??(,)Q ββ达到最小,(1)式对01 ??ββ、的一阶偏导数都等于零,即: 010011 ??(,)=0???(,)=0?Q Q ββββββ??????????? 201010100201010111??()??(,)??==2()????()??(,)??==2()??i i i i i i i i i Y X Q Y X Y X Q Y X X ββββββββββββββββ????--????---????????--????---?????∑∑∑∑ 0101 ??()0 ??()=0 i i i i i Y X Y X X ββββ?--=??--??∑∑(2)(3) 由(2)式可知,01011??0 1? ??()11== (4)i i i i i i Y n X Y X Y X n Y Y X X n n βββββ+-=?=-=-∑∑∑∑∑∑(令,) 并将式(4)代入(3),可得: 201112211122 1??? ?0()()??()0? ()i i i i i i i i i i i i i i i i i i i i i Y X X X Y Y X X X n n X Y X Y X n X n X Y X Y n X X βββββββ=--=---?-+?-=-=-∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑ 或0111112 ????0()()?()()()()()?=()()()(==) 0?i i i i i i i i i i i i i i i i i i i i i i i i i Y X X Y Y X X X Y Y X X X X X Y Y X X Y Y x y X X X X X X X x x X X y Y Y ββββββ=--=-+-?------==-----=?∑∑∑∑∑∑∑∑∑∑令, 因此,可得010111222 1????()()()??()()()i i i i i i i i i i i i i i i Y X Y X n n X Y X Y X X Y Y x y n X X X X X X x ββββββ=-=----===---∑∑∑∑∑∑∑∑∑∑∑或或

信息管理学复习提纲简要

信息管理学基础复习提纲 第一章信息与信息管理 1.1信息的含义 本体论层次:事物存在的方式和运动状态的表现形式。 认识论层次:主体所感知或表述的事物存在的方式和运动状态。 1.2数据、信息、知识及关系P10 1.3信息的特征(基本属性)P6(理解,选择题其中选择解释) 1.4信息管理的定义(广义)P19(基本管理对象:信息资源、信息活动) 第二章信息交流 2.1信息交流含义 信息交流的含义:信息交流是指不同时间或不同空间上的认知主体(人或由人组成的机构、组织)之间借助于相应的符号系统所进行的知识、消息、数据和事实等信息的传递与交流的过程。 ……信息交流分为共时信息交流和历时信息交流。(理解) 2.2信息交流的条件和要素 信息发送者、信息接收者、交流通道、符号体系、知识信息库、支持条件 2.3信息交流的模式(理解+重点理解个别第一模型里的含义)P48 2.4信息交流和传播中的栈 有信息栈参与的社会信息传播过程,我们可以称之为“栈交流”(间接交流,社会代理交流),而S与R的直接交流则可称为“零栈交流”(直接交流)。 2.5信息传递模式(四种) 2.6论述Web2.0环境下有哪些常用信息交流工具及其对你生活学习的影响。(论述) 第三章信息分布 3.1马太效应的表现和作用形式 在用户信息需求中的表现 3.2信息离散分布规律 1.布拉德福定律:“如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系”这就是布拉德福定律的区域表述形式。 2.齐夫定律:如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:fr = c (齐夫定律)式中c为常数。 3.3信息生产者的分布规律 1.洛特卡定律:在论文数X和作者数Y x之间,存在着下列一种关系:X n Y x = C (此式中,Y x是发表了论文X篇的作者数,n和c是对应于这一典型数据集合而估计出来的两个常数,n的数值在2上下波动。指数n近似为2。则上式可改为:Y x = C / X2 2.普赖斯定律:即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。“那些人”无疑是核心或高产作者。 3.4 信息对时间的分布规律 1.指数增长率:

信息管理学基础知识点(马费成、宋恩梅)说课材料

信息管理学基础知识点(马费成、宋恩梅)

一、信息与信息管理 1、信息 信息(本体论):信息是事物存在的方式和运动状态的表现形式。 信息(认识论):主体所感知或表述的事物存在的方式和运动状态。 全信息:我们把同时考虑到事物的存在方式和运动状态的外在形式、内在含义和效用价值的认识论层次上的信息称为“全信息”。 而把仅仅考虑其中形式因素的信息称为“语法信息”,把考虑其中内容(含义)因素的信息称为“语义信息”,把其中效用因素的信息称为“语用信息”。 2、信息的特征: (1)信息存在的普遍性和客观性 (2)信息产生的广延性和无限性 (3)信息在时间和空间上的传递性 (4)信息对物质载体的独立性 (5)信息对认识主体的相对性 (6)信息对利用者的共享性 (7)信息的不可变换性和不可组合性 (8)信息产生和利用的时效性 3、信息链、数据、信息与知识 由事实-数据-信息-知识-智能五个要素构成“信息链”。

“事实”是人类思想和社会活动的客观映射;“数据”是事实的数字化、编码化、序列化、结构化;“信息”是数据在信息媒介上的映射;“知识”是对信息的加工、吸收、提取和评价的结果;“智能”则是运用知识的能力。 4、信息流 当信息生产出来后(产生)之后,便要流向特定的利用者,于是在信息生产者和利用者之间形成源源不断的“流”,即信息流。 5、信息管理 信息管理的实质就是人类采用技术的、经济的、政策的、法律的、人文的方法和手段对信息流进行控制,以提高信息的利用效率,最大限度地实现信息效用价值为目的的一种活动。 6、信息管理的视角

(1)从技术视角,信息管理主要研究用手工方式和计算机方式对信息进行收集、加工、处理,使之有序化存储、便于快速检索并传递给特定的利用者。这一直是信息管理研究的重点和目标。(2)从经济视角,主要研究以信息的生产、流通和利用为基础的信息市场,包括信息产业、信息经济的形成、发展、特征和运行模式,信息资源和优化配置,信息技术的评价选择以及信息经济效益评价等方面的问题。信息经济学是该视角下信息管理与经济学相互交叉的研究领域。 (3)从行政和法律视角,立足于政府职能,运用行政手段(政策、计划、规划)和法律手段,对信息活动进行调节和控制,着眼于协调和解决社会信息化过程中出现的新矛盾、新冲突、新的利害关系,促进社会更充分地利用信息,更好地发挥信息的社会功能,为实现某种发展目标服务。信息政策与信息法律是该视角下的典型研究领域。 (4)从人文角度,立足于研究信息流控制中道德、伦理、文化因素的影响和建设。尤其是在网络环境下,人们的信息行为仅仅依靠行政和法律手段是难以有效约束的,必须通过人文精神的培养来规范人们的行为,对信息活动进行管理。在此视角下,信息伦理、网络伦理的研究正日益受到人们的关注。 7、信息生命周期管理

计量经济学重点知识归纳整理

1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值 {}n i Y X i i ,2,1:),(?=,普通最小二乘法要求样本回归函数尽可以好地拟合这组 值,即样本回归线上的点∧ i Y 与真实观测点Yt 的“总体误差”尽可能地小。普通 最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和 最小。 2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义, 或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。从此 意义看,加权最小二乘法也称为广义最小二乘法。 3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不 存在异方差性的模型,然后采用普通最小二乘法估计其参数。 4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种 参数估计方法。 5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适 用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。 6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程 采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关 系体系,计算得到结构式参数的估计量的一种方法。 7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数, 而是互不相同,则认为出现了异方差性。 8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机 干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设, 称为存在序列相关性。 9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++?+++=i k 22110i , 其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。如果某两个或多个解释

计量经济学名词解释和简答题

计量经济学 第一部分:名次解释 第一章 1、模型:对现实的描述和模拟。 2、广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 3、狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 第二章 1、总体回归函数:指在给定Xi 下Y 分布的总体均值与Xi 所形成的函数关系(或者说总体被解释变量的条件期望表示为解释变量的某种函数)。 2、样本回归函数:指从总体中抽出的关于Y ,X 的若干组值形成的样本所建立的回归函数。 3、随机的总体回归函数:含有随机干扰项的总体回归函数(是相对于条件期望形式而言的)。 4、线性回归模型:既指对变量是线性的,也指对参数β为线性的,即解释变量与参数β只以他们的1次方出现。 5、随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。 6、残差项:是一随机变量,是针对样本回归函数而言的。 7、条件期望:即条件均值,指X 取特定值Xi 时Y 的期望值。 8、回归系数:回归模型中βo ,β1等未知但却是固定的参数。 9、回归系数的估计量:指用?μ01 ,ββ等表示的用已知样本提供的信息所估计出来总体未知参数的结果。 10、最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。 11、最大似然法:又称最大或然法,指用生产该样本概率最大的原则去确定样本回归函数的方法。 12、估计量的标准差:度量一个变量变化大小的测量值。 13、总离差平方和:用TSS 表示,用以度量被解释变量的总变动。 14、回归平方和:用ESS 表示:度量由解释变量变化引起的被解释变量的变化部分。 15、残差平方和:用RSS 表示:度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的被解释变量变化的部分。 16、协方差:用Cov (X ,Y )表示,度量X,Y 两个变量关联程度的统计量。 17、拟合优度检验:检验模型对样本观测值的拟合程度,用2R 表示,该值越接近1,模型对样本观测值拟合得越好。 18、t 检验时针对每个解释变量进行的显著性检验,即构造一个t 统计量,如果该统计量的值落在置信区间外,就拒绝原假设。 19、相关分析:研究随机变量间的相关形式 20、回归分析:研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论。 第三章 1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量。

补完《信息管理学》复习大纲

《信息管理学》复习大纲 1.哈特莱、香农、维纳和钟义信对信息的定义。P2~3 哈特来:信息是他从通信符号表中选择符号的具体形式 香农:信息被看作是消除信宿对信源发出何种消息不确定性的东西。 维纳:信息是我们对外界进行调节并使我们的调节为外界所了解时而与外界叫唤来的东西。 钟义信:信息是食物存在的方式或运动的形态,以及这种方式或状态的直接或简介的表述。2.简述信息与物质、能量的关系。P3 信息与物质的关系:物质是信息存在的基础。 信息与能量的关系:能量是信息运动的动力。 3.按照信息的表现形式和主体的认识层次,信息如何分类?P4 按照信息的表现形式分类:消息,资料,知识。 按照信息的认识层次分类:语法信息,语义信息,语用信息 4.简述信息的层次如何划分?哲学层次、认识论层次和社会层次。 5.信息的特征。P5 6.普遍性。表征性。动态性。相对性。依存性。可传递性。可干扰性。可加工性。 7.简述信息的功能。(注意各要点的细节)P8~10 认知客体的中介。人类思维的材料。科学决策的依据。有效控制的灵魂。系统秩序的保证。 社会发展的资源。 8.广义与狭义信息管理概念。 9.信息管理发展各阶段的主要任务和特征。P28~29 古代信息管理时期:信息交流是自发的无组织的,信息记载材料是天然的,信息记录方法是手工的。信息活动几种在个体层次上,社会信息量不大,信息管理活动零星、片段,对信息载体进行封闭式的物理管理。 近代信息管理时期:以文献信息为中心,以图书馆为主要阵地,以解决文献资料的收集、整理、保存与传播报道问题为主要任务,管理手段基本上是以人力和手工为主并辅之以部分机械化作业,主要管理者是图书管理员。 现代信息管理时期:面向技术的信息管理阶段:以计算机技术为核心,以管理信息系统为主要阵地。以解决大数据量信息的处理和检索问题为主要任务,管理手段计算机化,主要管理者是mis经理。面向竞争的信息管理阶段:以信息资源为中心,以战略信息系统为主要真滴,以解决信息资源对竞争战略决策的支持问题为主要任务,管理手段网络化,主要管理者是信息主管(cio) 10.广义的信息资源包括哪几个方面?P30信息,信息技术,信息人员。 11.人类社会的信息活动都包括哪几个层次?P30个人的,组织的,社会的。 12.从微观、中观和宏观三个层次上分析信息管理包括哪些内容?信息管理学主要研究哪些内容?P31 微观:狭义信息资源管理。中观:广义信息资源管理。宏观:广义信息资源管理的基础上再加上信息产业管理。信息管理主要研究内容:信息管理的基础理论。信息产品管理。信息系统管理。信息产业管理。

计量经济学整理重点

一、名词解释(5*3分=15分)(斜体表明仅供参考) 计量经济学:以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。 最小二乘法:指在满足古典假设的条件下,用使估计的剩余平方和最小的原则确定样本回归函数的方法,简称OLS 随机扰动项:总体回归函数中,各个Y值与条件期望的Y值的偏差,又称随机误差项。是代表那些对Y有影响但又未纳入模型的诸多因素的影响。 总体回归函数:在给定解释变量X i条件下,总体被解释变量Y i的期望轨迹,函数式表示为E(Y i∣X i)=f(Xi)= β0+β1X i 样本回归函数:在总体中抽取若干个样本构成新的总体,然后在新的总体下,给定解释变量X i,被解释变量Y i的期望轨迹,函数式表示为E(Y i∣X i)=Y i^= β0^+β1^X i 系数显著性检验:(t检验)对回归系数对应的解释变量是否对被解释变量有显著影响的统计学检验方法 方程显著性检验:(F检验)对模型的被解释变量与所有解释变量之间的线性关系在整体上是否显著的统计学检验方法高斯-马尔可夫定理:在古典假设的条件下,OLS估计量是总体参数的最佳线性无偏估计量,即BULE。 拟合优度:为说明多元线性回归模型中对观测值的拟合情况,可以考察在Y的总变差中能由解释变量所解释的那部分变差的比重,即回归平方和与总体平方和的比值,R2=ESS/TSS=1-RSS/TSS. 调整的可决系数:是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,相对可决系数而言,克服了随解释变量的增加而变大的缺陷。表达式为R—2=1-(n-1)RSS/(n-k)TSS 多重共线性:指解释变量之间存在的完全或近似的线性关系 异方差:模型中随机误差项不再满足经典假设的同方差假定,其方差随观测个体的变化而变化,即D(εi)=σi2 加权最小二乘法:在拟合存在异方差的模型中,对不同的σi2区别对待(重小轻大原则),构造权数W i=1/σi2,根据最小二乘原理,使加权的残差平方和最小,从而估计参数,这种求解参数估计式的方法为加权最小二乘法。 自相关:又称序列相关,是指在总体回归模型的随机误差项u i之间存在相关关系就,即cov(u i, u j)≠0.(i≠j) 判断题(10*1分=10分) 1、随机误差项u i与残差项e i是一回事。(乂) 2、总体回归函数给出了对应于每一个自变量的因变量的值。(乂) 3、线性回归模型意味着因变量是自变量的线性函数。(乂) 4、在线性回归模型中,解释变量是原因,被解释变量是结果。(√) 5、在实际中,一元回归没什么用,因为因变量的行为不可能仅由一个解释变量来解释。(乂) 6、尽管有完全的多重共线性,OLS估计量仍然是最优线性无偏估计量。(乂) 7、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(乂) 8(√) 9、变量的两两高度相关并不表示高度多重共线性。(乂) 10、如果分析的目的仅仅是预测,则多重共线性是无害的。 ( √ ) 11、在多元回归中,根据通常的t ( 乂 ) 12、变量不存在两两高度相关表示不存在高度多重共线性。 ( 乂 ) 13、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性。(乂) 14、当异方差出现时,常用的t检验和F检验失效。(√) 15、在异方差情况下,通常OLS估计一定高估了估计量的标准差。(乂) 16、如果OLS回归的残差表现出系统性,则说明数据中有异方差性。(√) 17、如果回归模型遗漏一个重要的变量,则OLS残差必定表现出明显的趋势。(√) 18、在异方差情况下,通常预测失效。(√) 19、当模型存在高阶自相关时,可用D-W法进行自相关检验。(乂) 20、当模型的解释变量包括内生变量的滞后变量时,D-W检验就不适用了。(√)

相关主题
文本预览
相关文档 最新文档