当前位置:文档之家› 信息组织复习

信息组织复习

信息组织复习
信息组织复习

信息组织复习标准化管理部编码-[99968T-6889628-J68568-1689N]

第一章

1.信息组织的基本方法就可以概括为: 以信息外在特征和内容特征为基础的信息序化方

法和信息优化方法。

2.信息的序化:是按照一定的方法将无序的信息组织成有序信息的过程。经序化过的信

息会变得一目了然,便于管理和利用。

3.信息的优化:是在序化的基础上,按照结构功能优化的目的对信息进行再序化的过

程。

4.信息序化的基本方法:1.语法信息序化法 2. 语义信息序化法 3.语用信息序

化法

5.信息的优化主要包括: 信息的优选、浓缩、重新表述及三者的综合运用。

6.信息的重新表述 有改写、编译、翻译等方式。(了解)

7.信息的综合优化的主要形式是信息综述和信息述评。 8.信息综述:是对某一领域或课题一定时期的有关信息进行归纳、整理、分析、加工后所形成的信息产品

6.信息述评:是针对某一领域、研究课题或成果的水平、现状、发展动向及影响进行全

面而系统的分析评价或明确提出建议

9信息组织的一般过程包括:1.信息替代 2.信息序化

信息的替代过程(亦可成为信息揭示过程)实际上是对原始信息的外表特征(包括题

名、着者、出处等)和内容特征(包括分类号、主题词、摘要等)进行描述的过程,这

项工作通常称为着录。

10.信息序化是对替代信息给出信息标识(如分类号、主题词等)的过程,这项工作通常

称为标引。

11.衡量信息检索效率的指标:查全率R = 查准率P = 查全率R 与查准率P 呈负相关

12.信息浓缩的主要方式:1)文摘 2)题录 3)目录 4)词条

第二章

分类法:是以知识属性来描述和表达信息内容的一种信息处理方法。

分类语言:是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以

圆点(或其他符号)作为隔离的书写法,以基本类目作为基本词汇,以类目的从属关系

来表达复杂概念的一类检索语言。

分类法的类型:

1)体系型分类法:是传统的分类法,它的特点是:直线型的序列,层累制的结构,列举

式的类目,码号式的语言。《中国图书馆分类法》是典型的体系型分类法。

2)体系一组配分类法:在传统的分类法上,发展起来一种体系—组配型分类法,它的基

本特点仍然有体系型分类法的特点,但它增加了复分组配能力。

《国际十进分类法 》是典型的体系—组配型分类法。

比较中图法和UDC

中图法是体系型分类法,UDC 是体系—组配型分类法

中图法正表分为5个基本部类,22个基本大类,UDC 有十个基本大类

中图法的配号制度基本上采用层累制的原则,UDC 采用小数制

中图法采用拼音和数字结合的混合号码,UDC 采用纯数字作为标记符号

分类法通常由六个部分组成:类目、号码、正表、附表、说明、索引

总量

存储的某一课题的文献查出的有关文献量查出的文献总量查出的有关文献量

类目间关系(了解p14-p15)

号码的类型及其编制方式(了解 p16-p19)

层累制:又称等级制,它的组合和排列方法是利用号码的基数和次序将一个个的号码层层展开出来。

《中图法》分类思想:《中国图书馆分类法》是典型的体系型分类法,按照“五分法”,即分为:(1)马克思列宁主义、毛泽东思想;(2)哲学;(3)社会科学;

(4 )自然科学;(5)综合性图书。在此基础上又分为二十二个大类

复分表:即附表,就是将一组可适用于多个类别的子目结构,单独制表。

1)通用附表:(1)总论复分表 (2)地域区分表(3)时代区分表(4)民族区分表2)专类附表

国际常用分类法(了解)

1.《杜威十进分类法》(DDC)

2.《美国国会图书馆图书分类法》(LCC)

3.国际十进制分类法(UDC)

第三章

1、主题法:以主题语言为基础描述和表达信息内容的一种信息处理方法。

2、主题语言:是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。

3、主题法的种类:

标题法(标题词法)用经过规范化处理的自然语言语词及语组来逐一表达主题概念

元词法(单元词法)以经过规范化处理的自然语言语词的字面组配来表达主题概念

叙词法(主题词法)以经过规范化处理的自然语言语词的概念组配来表达主题概念

键词法(关键词法)直接以文献中的语词来表达主题概念

4、叙词性能

叙词的优异检索性能,是后组式检索语言,可以自由地进行广泛的组配,以及进行多维性、多途径检索。

(1)保留了单元词组配的基本原理:吸收了单元词法又吸收了组配分类法的概念。①概念组配,吸收自组配分类法;

(2)采用了标题法对语词进行严格规范化的方法,以保证词与概念的一一对应:具有直接标引文献内容的特征,以及利用标题词的参照系统显示叙词之间的概念逻辑关系等优点。②采用先组,吸收自标题法;⑥字顺表及范畴索引中的字顺排列,吸收自标题法(3)采用了体系分类法的基本原理,编制叙词分类索引(范畴索引)和等级索引(词族索引)。③参照系统,吸收自体系分类法④范畴索引以及词族索引,吸收自体系分类法;

⑤轮排索引,吸收自关键词法;⑥字顺表及范畴索引中的字顺排列,吸收自标题法

5、检索语言的核心是词表,包括分类表、标题表、叙词表等。(自己了解)

叙词表包括以下几个部分:①叙词字顺表,又称叙词表的主表。②分类索引,又称范畴索引。③等级索引,又称词族索引。④双语种对照索引。⑤附表。

范畴索引(分类索引)是将叙词按其概念所属学科或范畴分成若干大类,在大类之下再分小类,在小类之下则将叙词按字顺排列,形成一个类似体系分类表的概念分类系统。

等级索引(词族索引)是利用概念的属分关系,将具有属分关系的叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统。

6、《汉语主题词表》(了解中国编制的大型综合性中文叙词表。双位数字在前,双位字母在后的标记方法。该词表主要供电子计算机系统存储和检索文献用,亦可用来组织卡片式主题目录和书本式主题索引。

7、主题词款目着录各项含义(了解 p49-p51)

8、关键词:是从文献资料的正文、摘要或书名、篇名中抽出的并在表达文献内容主题方面具有实在意义起关键性作用的词汇。

9、关键词的性质

关键词属主题法系统的检索语言

关键词与主题词(叙词)比较:主题词是由标引员根据一定的词表选出的控制词汇,即经过规范化的词汇,它可以不同于文献作者在文献题目或正文中所用的词汇。同时,主题词表有一定专指度的限制,不是每一个概念都能找到相应的主题词,有时细小的概念需要上溯到较广的概念,才能找到相应的主题词。而关键词是文献中现成的词汇,这是文献作者所用的语言,是一种自然语言。因而,关键词能够达到任意的专指度和泛指度。

关键词与标题词、单元词、叙词比较:相同点:同属主题法系统的检索语言

不同点:1)标题词、单元词和叙词都对自然语言的语词加以严格的规范化处理,关键词法则基本上不作规范化处理,或仅作极少的规范化处理。

2)标题词、单元词和叙词都需要词表,关键词则不存在所谓的词表。

10、单元词(了解P67)

单元词法也称元词法,以单元词作为文献内容标识和查找的依据。所谓单元词,是指从自然语言中选取的,经过规范化处理的,具有独立概念的最基本的词汇单元,即在字面上不能再分的名词术语。也就是说,在概念上不能再分的词作为一个单元,以此来标识文献内容的方法。

11、参照系统:See 和See Also(了解)P67

12、叙词与叙词、非叙词间概念逻辑关系

1)同义关系(等同关系)

2)等级关系

3)相关关系

13、分类法和主题法的主要差异

主题法:以主题语言为基础描述和表达信息内容的一种信息处理方法。

分类法:是以知识属性来描述和表达信息内容的一种信息处理方法。

1)在主题概念标识上:分类法采用分类号,主题法采用受控词语

2)在文献集中方式上:分类法按学科和专业集中,主题法按事物集中

3)在概念关系显示上,分类法采用等级(层次)结构,主题法是参照系统和范畴词组4)在概念排列检索上,分类法按学科及逻辑体系,主题法按字顺序列

5)在词汇控制上,分类法严于等级关系控制和疏于词形控制,主题词法严于实施词形、词义、词间关系控制

分类法和主题法的兼容性

1)在术语上,分类法使用类名,主题法使用主题词

2)在标记上,分类法采用分类号,主题词法采用范畴号

3)在参照上,分类法使用分类参见,主题法使用参照系统

4)在索引上,分类法是字顺索引,主题法是反抽索引、词族、索引等

14、分类主题一体化词表可以分为以下三种类型:

(1)分面叙词表(2)分类主题词表(3)集成词表

第4章标引与着录

1.标引:是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程,即对主

题分析结果赋予检索标识的过程。

2.文献标引包括分类标引和主题标引

3.分类标引:分类标引,就是将文献主题的自然语言形态,转换成分类语言形态的一种

标引,也就是将文献主题转换成分类号的一种标引。

4.分类标引的依据:(了解)1)单个主题分类标引(1)依研究的学科性质归类(2)

依书本的主旨和用途归类(3)依据研究的事物,问题或生活现象的性质归类(4)依着者赞成的学科性质归类(5)按切和主体性质归类(6)按问题或学科性质归类

(7)除取主要分类号外,还可取互见分类号(8)一般依重点归类。2)两个主题分类标引:并列关系,从属关系,因果关系,影响关系,比较关系,应用关系。3)多个主题分类标引:直接归入他们的上位类;如果主题不能包括在它们的上位类里,就按内容重点归类;如果论述其中一个主体对其余各个主体的关系,就按发生关系的主题归类;如果论述的几个主题是互不相容,或者是比较其异同,优劣的,就依书中意旨和着者目的或所赞同的主题归类。4)地域。时代分类标引

5.主题标引:是对文献进行主题分析,并给予主题词标识的过程。它以文献篇名和文摘

为依据,必要时参考全文的内容,考虑检索途径的全面性和表达主题的专指性,充分利用词表提供的各种辅助选词手段,充分反映馆藏特点和各类用户的要求。

6.标引规则的要求:1)标引的准确性2)标引深度3)标引的一致性

7.标引方案次序选择:(了解)①专指性标引(记住):又称直接标引,是指在转换反

映文献主题的标引概念时,要用专指度最相符的主题词来标引。②组配标引③上位词标引④近义词标引⑤增词标引

8.适度标引:是指标引出的叙词与原文献主题概念基本一致,既不过度,也不过粗的标

引技术。

9.适度标引:是指标引出的叙词与原文献主题概念基本一致,既不过度,也不过粗的标

引技术。

10.组配规则:(了解114)所谓组配,就是把几个主题词按一定的组合方式合理地组合

在一起,用来表示达到更专指的主题

11.字面组配:(了解119)例子也看一下:指的是单纯字面组配。也就是指那些单纯从

字面的拼合出发,而不考虑概念之间的逻辑关系和语法关系的组配。

12.概念组配:所谓组配标引是指采用几个叙词的组合形式,对文献内容特征进行的标

引。但组配的叙词之间必须具有概念上的某种逻辑联系。

13.(1)概念交叉组配(2)概念限定组配(3)概念并列组配的区别(了解)

14.字面组配与概念组配的区别:(选择题)字面组配其实质是词的分析与组合(拆

词);概念组配实质是概念的分析和综合(拆义),二者的检索效果是有很大的差异的。

15.着录:在编制文献目录时,对文献信息的各种特征进行分析、选择和记录的过程

16.MARC(Machine Readable Catalog)是机读目录的简称:指以代码形式和特定结构记

录在计算机存储载体上的,用计算机识别与处理的目录

第五章

1、信息组织自动化技术:自动标引,自动分类,自动文摘。

2、自动标引分为:自动抽词标引,自动赋词标引。

3、自动抽词标引:绝对频率法(由计算机程序将文本与停用词表对照,除去介词、连词等虚词,然后统计出文本中词语出现的频率,按词语出现的频率排序)、相对频率法(当某个词或短语在某一文献资源中出现的频率高于它在整个数据库中出现的频率时,这个词或短语就可以被选作标引词,这就是相对频率抽词法)、位置法(即利用词语在文献中出现的位置来进行选择)。

4、自动赋词标引:基于关联词表的自动赋词标引、基于中介词典的自动赋词标引。

5、中文标引的特殊难点(了解):词的切分问题;难以进行比较全面的语法分析;汉语用词的灵活性;主题词选择和隐含标引问题。

6、自动分类包括:自动聚类、自动归类、类号的自动转换。

7、自动聚类是指从待分类对象中提出特征,再将提出的全部特征进行比较,并根据一定的原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。

8、自动归类是指先分析被分类对象中的特征,将其与各种类别中对象所具有的共同特征或一定的分类标准、分类参数进行比较,然后将被分类对象划分为特征相近的一类,并赋予相应的分类号。

9、自动分类的一般过程:建立类主题词;计算文献的归类属度;当文献类归属度超过某类规定的阀值时,即可考虑能否将它划归某类;根据一定的分类规则,赋予文献的分类号

10、自动文摘技术包括:自动摘录;基于文摘的自动文摘;基于信息抽取的自动文摘;基于结构的自动文献。

第六章

1、(了解)数字信息资源是用户可通过计算机本地或远程读取、使用,以数字形式存储在光、磁载体上的图像、文字、声音、视频等信息,如电子邮件、专题讨论小组和论坛、电子布告板新闻、电子期刊等。

2、(了解)数字信息资源的特征:数字信息资源对系统的依赖性;信息与实体的可分离性;数字信息资源的非直接可读性;数字信息结构的复杂性;数字信息资源的共享性;数字信息的易更改性;数字信息的质量参差不齐,缺乏必要的控制;数字信息的跨国界数据流动和传递;数字信息的不安全性。

3、元数据是:一种有效的信息资源组织和管理的工具,是一种编码体系,它可以帮助人们检索和确认所需要的信息资源,可以对数据单元进行详细、全面的着录描述,可以支持信息资源的存储和使用管理,支持对信息资源进行长期保存。

4、元数据功能:信息发现;信息描述;资源管理;资源保护与长期保存;使用;真实性保障。

5、(了解)根据元数据所支持的功能,可分为描述性元数据;管理性元数据;结构性元数据

6、Dublin core的15个核心元素:题名;作者或创造者;主题词和关键词;出版者;内容描述;其他责任者;日期;资源类型;资源格式;资源标识;关联;资源来源;语言;内容范围;权限管理。

7、RDF的三个部分构成:RDF DaTa MoDeL(RDF数据模型) RDF SCHEMA(大纲) RDF SYNTAX(语法机制)

8、RDF的数据模型包括三个对象类型:资源;属性;陈述

9、按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎;2.机器人搜索引擎;3.元搜索引擎

10、一个机器人搜索引擎由搜索器(搜索器的功能是在互联网中漫游,发现和搜集信息)、索引器(索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表)、检索器(检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制)和用户接口(用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。)四个部分组成。

11、机器人搜索引擎工作原理(见图6.2 p173)

12、元搜索引擎是:一种基于机器人搜索引擎的搜索引擎,用于查询与提供相关的信息线索或者全文。

13、元搜索引擎的工作原理:元搜索引擎通过自己定制的搜索界面,接受并处理用户的查询问题,在进行实际的调查时调用一个或者多个独立搜索引擎的数据库,搜索结果是来自独立搜索引擎的检索结果或者是这些结果集合的综合,结果呈现既可以是引用原始的独立搜索引擎的页面,也可以是由元搜索引擎重新制定后的形式。

第七章

数据库系统DBS出现了4种典型的系统结构:1)单用户数据库系统2)主从式数据库系统3)分布式数据库系统 4)C/S(Client/Server,客户机/服务器)数据库系统

数据库系统的信息组织方法,即上述4种数据库系统的信息组织方法(了解 p194-

p199)

多媒体数据库关键技术:1)数据模型2)数据的压缩和还原技术 3)存取管理和存取方法

4)用户界面 5)分布式技术 6)多媒体信息的检索与查询 7)多媒体数据的输入

多媒体数据库的主要实现方法:

1)从关系数据模型发展多媒体数据库 2)面向对象数据库 3)分布式超媒体数据库

基于内容检索(Content—based Retrieval):就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体进行查找,检索出具有相似特征的媒体数据。

第八章

1、(了解)数字图书馆的特征:①数字图书馆信息组织对象类型已大大扩展;②数字图书馆的信息组织是一种分布式模式,其信息对象可能并不存储在同一个地方,而可能分布在不同的数据服务器上。③数字图书馆的信息对象是一种以机读型信息形式存储与检索的数字化信息对象。④数字图书馆信息对象的格式化特征和多格式特征。

2、数字图书馆的设计系统的三层结构:外层;内层;虚拟网站层

3、数字图书馆与传统图书馆的比较:传统图书馆的主要职能是收藏,并在对所收藏的图书资料保存、组织的基础上为读者提供各种服务。数字图书馆的收藏对象是数字化信息,但数字化收藏加上各类信息处理工具并不能构成数字图书馆。数字图书馆是一个将收藏、服务和用户、管理员集成在一起的一个环境,它支持数字化数据、信息和知识的整个生命周期的相关操作和活动,包括生成、保存、发布、传播和利用。

4、数字图书馆信息资源与因特网信息资源的比较:资源内容的组织方式的不同,数字图书馆的资源内容是按照用户的需求挑选的经过加工的、是使受教育者易于接受的形式,因特网的资源内容主要是无序的、内容差别很大;资源内容标引方法不同,因特网的信息资源是以标引文献条目为主,大多数全文文献不经过标引,其查全率与查准率都有问题,数字图书馆的资源标引则深入到文献内容;检索效果不同,数字图书馆的用户往往能迅速的找到所需要的资源,而因特网的用户,查询结果不能得到很好的满足

第九章

1.(了解多看看)信息存储系统的结构P231

计算机存储系统主要是由两级存储器和存储管理软件构成。

两级存储器就是主存存储器和辅助存储器。

存储器合理有效地使用取决于操作系统中的存储管理模块和文件管理模块。

2.(掌握)存储器的类型

1)按照存取方式分类(特点要了解)P233

(1)RAM(Random Access Memory,随机存取存储器) (2)ROM(Read Only Memory,只读存储器) (3)顺序存储器SAM(SerialAccessMemory)。(4)直接存储器

DAM(DirectAccessMemory)。

2)按存储介质分类

(1)磁存储器(2)半导体存储器(3)铁电存储器(4)光存储器(5)其他介质存储器3)按功能分类(了解以下各种)

(1)寄存器型存储器2)高速缓冲存储器(Cache)

(3)主存储器MM(MainMemory)简称主存,又称内存储器(IntenalMemory),简称内存。

(4)外存储器(ExternalMemory)也称辅助存储器。

3.(了解)存储器的主要技术指标P235

1)存储器容量(存储容量=存储单元个数×存储字长)2)存储密度3)存取时间和存取速度4)存取周期与数据传送率5)误码率6)可靠性7)功耗8)性能价格比

第十章

光盘存储器的类型:

(1)按制造材料和记录信息的方式划分。只读光盘、一次性写入光盘、可擦写光盘。

(2)按所用驱动器结构划分。内置式光盘存储器和外置式光盘存储器。

(3)按转速划分。光盘存储器按转速可分为单倍速、双倍速、4倍速、……、52倍速光盘驱动器。

(4)按接口方式划分。光盘存储器按接口方式可分为3种类型:IDE接口、SCSI接口和专用接口。

光存储器的特点:(了解)

记录密度高,存储容量大;存储寿命长,易于保管;非接触式读/写信息,这是光盘存储器特有的性能;信息的载噪比高。载噪比是载波电平与噪声电平之比,以分贝dB表示;易于大量复制,信息位价格低;能自由地更换光盘。

磁存储器的类型:

(1)磁带存储器(2)硬磁盘存储器(3)软磁盘存储器(4)磁泡存储器(5)磁芯存储器(6)磁鼓存储器

磁存储器的特点:(了解)

记录密度大、存储容量大;信息的写入和输出速度快,可以立即重放和再现;记录的信息经过多次重放后仍保持原有的特性;可实现多通道记录,可将多个磁头配在一起,记录许多磁迹。记录和存储的信息稳定性高,不挥发;成本低、维护简单,适于大量生产。在计算机系统中作为辅助大容量存储器使用,存放系统软件、大型文件、数据库等大量程序与数据信息。

第十一章

1.(了解多看)直接连接存储DASP268

DAS( Direct Attached Storage)也称为SAS(Server Attached Storage,服务器附加存储)。DAS是直接连接在各种服务器或客户端扩展接口下的数据存储设备。

2.(了解)磁盘阵列RAIDP270

RAID(Redundant Array of Independent Disks)冗余磁盘阵列技术

3. (掌握)NAS和SAN的比较与融合P282

?NAS是一种以文件为传输协议,通过网络传输的技术;而SAN是以块为传输协议,主要通过Fibre Channel传输的技术。

?从目前的普遍应用来看,SAN占据的还是大型应用领域,NAS集中在中小型的应用领域。

?从系统的构建而言,NAS方案可以利用用户原有的网络,而SAN方案需重新建立存储网络。

?从对比SAN和NAS的实现方式来看,SAN解决了DAS的一些难题,比如实现存储集中、集中备份、容灾等。但其数据管理工作还是在服务器上进行,需在每一个存储服务器上安装存储服务。

?另外,SAN的设备结构复杂,各个厂商标准不一,产生兼容问题,而且需要复杂的软件才能使用,使得其成本很高。

?NAS最大的优点是简单,不要求服务器额外安装软件,数据集中管理,软硬件可以集成,在网络上即插即用。作为存储系统,NAS提供了比SAN更高的可实用性。4.(掌握)存储管理系统的任务包括5个部分:P287

1)操作管理:2)数据管理3)资源管理4)网络管理5)元件管理

5.(掌握)网络存储的分级管理P289

1)存储级管理2)网络级管理3)企业级管理

第十二章

1.(掌握)文献的类型

1)书写型文献(Hand Writing Document) 2)印刷型文献(Printed Document)

3)缩微型文献(MicroForm Document)4)电子型文献(Electronic Document)

5)视听型文献(Audio-visual Document)

12.3.2 按文献的加工程度划分(一次二次的概念要掌握)

零次文献(Raw Literature)

二次文献(Secondary Literature):将无序的一次文献进行收集、整理,着录其特征并以规定的格式编制成为便于管理和查找文献的工具,即检索工具。如目录、题录或索引、文摘等。三次文献(Tertiary Literature):是指在利用二次文献的基础上,对一次文献的内容经阅读研究,浓缩提炼而编写成的文献。如科技动态、专题综述、情报调研报告、决策参考、指南、进展等。

12.3.3 按文献信息公开程度划分

白色文献灰色文献黑色文献

12.3.4 (掌握)按文献出版形式划分(10类)(还要记住各种着录格式)

1).图书(Book、monography)ISBN号即国际标准书号(International Standard Book Number)

图书着录格式:着者.书名[M]. 出版地:出版社名称.出版时间

2).期刊(Periodicals,Journal,Magazine)国际标准连续出版物刊号ISSN 期刊着录格式:作者(多作者用逗号分开,超过3个者用“等或et al”). 文章题目[J].刊物名称,年代,卷数(期数):页数

3).报纸(Paper,Newspaper)

着录格式:析出责任者. 析出题名[N].报纸名,年-月-日(版次).

4).专利文献(Patent Document):

专利文献着录格式:专利申请者. 专利题名:专利国别(或地区),专利号[P].出版日期.

5).标准文献(Standards)

着录格式:标准颁布国家或组织. 标准名称[S]. 标准号.

6).会议文献(Conference Paper)

着录格式:析出责任者. 析出题名[C] //编着者. 文集名. 出版地:出版者,出版年:起止页码.

7).学位论文(Dissertation)

着录格式:责任者. 题名[D]. 学位授予地址:学位授予单位,年份.

8).科技报告(Technical Report)

着录格式:着者.题名[R].报告题名,编号,出版地:出版者,出版年:起止页码.

9).科技档案 10).产品样本

2.(掌握)参考数据库主要包括两类型:书目数据库文摘和索引数据库

3.(掌握)事实数据库三大类:数值数据库指南数据库术语数据库

4.(掌握概念)倒排文档:从数据库全部记录的基本字段中,按照着者、主题、分类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。

5.(掌握)分类指南:是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南是结合在一起的,例如:Yahoo,新浪,悠游等。

6.(掌握)信息检索步骤

1.分析检索课题,明确检索要求

2.选择检索工具,确定检索途径

3.确定检索标识,确定检索运算

4.构筑检索提问,获取初步结果

5.调整检索策略,获取所需信息

7.(掌握)如何扩大和缩小检索范围??

扩大检索范围的措施:

–降低检索词的专指度,可从词表或检出文献中选择泛指词。

–调节检索式的网罗度,如删除某个不重要的检索词。

–进行族性检索,可用分类号或用OR连接一组同义词和近义词。

–取消某些限制过严的限制符。

缩小检索范围的措施

–提高检索词的专指度。

–增加AND连接,进一步限定主题词。

–把检索词限定在主要字段,如标题字段、主题词字段等。

–缩短检索年限,或限定某些刊物。

8.(了解)在检索过程中用于表达词于词之间的逻辑关系的算符就称为布尔逻辑运算符。分为三种逻辑关系:逻辑与、逻辑或、逻辑非;分别用AND、 OR、 NOT表示。

第十六章

1.(掌握)专利的类型三类

(一)发明专利(二)实用新型专利(三)外观设计专利

2.(了解)中国专利号:为专利申请号前加ZL。申请号被批准后即为专利号。

3.(了解)中国专利文献编号组成形式,如:CN1030011A CN:国家代码;

1:专利类型 1----发明专利;2----实用新型专利;3----外观设计专利;

A: 文献种类代码 A----发明专利申请公开 B---发明专利审定公告C----发明专利授权公告;U---实用新型专利申请公告Y---实用新型专利授权公告 S--外观设计专利申请公告;

4.(掌握)什么是标准的分级和种类?

根据《中华人民共和国标准化法》的规定,我国的标准分为国家标准、行业标准、地方标准和企业标准四级。

?按约束力分,国家标准、行业标准可分为强制性标准、推荐性标准(/T)和指导性技术文件(/Z)三种;

?按标准化的对象分,标准可分为技术标准、管理标准和工作标准三大类。

5.(填空题)表谱与图录的分类:

表谱的类型:(1)年表(2)历表(3)专门性表谱

图录分为两种:地图和图谱

6.(了解知道)国内国外的数据库:

国内的:13.1 中国高等教育文献保障系统(CALIS)13.2 中国知识基础设施工程CNKI (中国学术期刊全文数据库(CJFD))13.3 中文科技期刊数据库(维普)13.4 万方数据资源系统(中国学位论文全文数据库中国会议论文数据库)

13.5 人大复印报刊资料全文数据库

国外的:14.1 IEEE Electronic Library (IEL) 14.2 Elsevier期刊全文数据库14.3 EBSCO

14.4 OCLC 14.5 ACM(美国计算机学会)全文数据库14.6Kluwer Online全文电子期刊14.7 Springer数据库检索

信息组织试题及参考答案

信息组织试题库一、名词解释 1.情报检索语言 2.信息揭示 3.仿分 4.倒排文档 5.八分法 6.信息描述 7.层累制 8.分类 9.UDC 10. 信息组织 11. 信息标引 12. XML 13. 关键词法 14. 词族索引 15. 等级体系分类法 16. 语法信息组织法 17. 模糊检索 18. 多元搜索引擎 19. EI Village 20. 超媒体存取 21. 虚拟图书馆 22. 文献分类 23.MARC 24. SGML 25. 文献标引 26. 主题词法 27. ISBDs 28. 顺排文档 29. 引证关系组织法 30. 双位制(百分法) 31. 信息存储 32. 双关索引 33. 范畴索引 34. 组配分类法 35. 语义信息组织法 36. 书次号 37. 文献检索 38. 超文本存取技术 39. 信息检索工具 40. 文献序号索引 41. 引文索引

42. 题内关键词索引 43. DIALOG 44. 基本索引字段 45. KWOC Index 46.PB报告 47.分析标引 48.类 49.概念组配 50.主题词款目 51.部分标引 52.词族 53.族首词 54.超级组配 55.款目主题词 56.词间相容关系 57.基本部类 58.类系 59.标识 60.专类附表 61.情报检索 62.二次文献 63.报导性文摘 64.图书分类 65.题录 66.PRECIS 67.多向成族 68.主题法 69.标引 70.类名 71.类目 72.类目表 73.类列 74.基本大类 75.基本序列 76.简表 77.详表 78.复分表 79.通用附表 80.上位类下位类 81.同位类 82.交替类目 83.参见类目 84.标记制度 85.单纯号码

信息组织自考试题汇总.pdf

1.什么是信息组织 信息组织指根据使用的需要,依据主题内容或特征,将信息资源组织为有序集合的过程。 2、信息组织与信息检索的关系 信息组织与信息检索是密切联系的,一方面,信息组织是信息检索的基础和前提,只有进行信息资源处理和有序化组织,才可以利用它有效地进行检索查找;另一方面,信息检索是信息组织的出发点和归宿,是信息组织的真正原因。两者既有区别,又是相互依存,相互作用,互为因果的。 3、信息组织活动的类型 (1)信息组织的操作,指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。 (2)信息资源组织规范,是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作 的的依据。包括:信息描述规范、检索语言。 4、根据对象与特点划分的检索工具的类型 文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具包括文献收藏目录和书目。 索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等。 机读数据库:是一种依托现代计算机技术、以机读形式建立的检索系统。一数据库通常由某种同类记录按照一定的方式组织 而成。 网络搜索引擎:以网络信息资源为对象的检索系统,是上述各种系统的。 5、两种基本检索途径及其特点(按照标识特征,检索工具可分的两类) 一类以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径,常见的这类标识包括:责任者名,题名,机 构名等。可以查找一种或数种文献。 另一类则以表达信息资源主题内容的标误用为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种。使用这类途径检索,不必预先了解文献特征,可直接从主题内容入手进行查找。 6、传统检索系统中对信息资源处理的基本方式(1)对信息资源进行描述,包括:着录或编写题录。(2)对信息资源的内容进行浓缩。包括:编写内容提要或文摘。(3)提供检索点。包括:着者名,标题名称,出版机构名等。 检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。 检索语言由词汇和语法两部分组成。词汇是检索语言的主体,是各种词表,包括分类表或标题表、叙词表等;语法,则是 分类标引和主题标引的规则系统,它们规定词汇集的使用方法。 1、信息资源分类的含义、特征、作用 信息资源分类含义:根据信息资源的内容属性和其他特征,将各种类型的信息资源分门别类地,系统地组织和揭示的方法。 信息资源分类特征: 是按照内容特征的相互关系加以组织的。 从一定的角度出发组织和揭示信息资源的。 以一定标记符号作为排序工具。 通过类目索引提供从字顺角度查找类目的途径。 分类法的作用: 进行资源组织。文献分类排架 建立分类检索工具。即将分类法用于信息资源的揭示 分类统计。是有效进行资源管理和利用的基本手段 兼容工具。 2、信息资源分类法及其类型 信息资源分类法——指根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具。 分类法类型:根据涉及学科领域:综合性分类法、专业分类法.根据适用的文献类型:图书分类法,文献分类法、期刊分类 法、标准文献分类法、专利分类法、网络资源分类法等.根据信息资源规模:大型分类法、中小型分类法等.根据类表的媒体形式:印刷型分类法、机读分类法.按照分类法编制方式:等级列举式,分面组配式、列举—组配式分类法 3、等级列举式、分面组配式分类法及其特点 等级列举式分类法,亦称列举式分类法、枚举式分类法,是一种将所有的类目组织成一个等级系统,并且采用尽量列 举的方式编制的分类法。 其特点:类目体系直观,易于把握,便于使用;类目展开比较系统;标记简明,适合分类排架和组织分类目录。 分面组配式分类法:一种按照分析—综合原则编制的分类表。 只在类表中按照范畴列出各种基本概念,并分别配予相应号码,使用时,先分析文献主题,根据主题分析的结果,通 过相应概念的组配表达文献主题,以各个概念标识的组合,表示该主题在分类体系中的次序,这种分类法称为分面组配式 分类法。 其特点:可通过概念组配,对复合主题进行专指标引; 标记具有较强的表达性,便于调整组配次序,进行多无检索; 可通过组配表达新出现的复杂主题,与科学的发展保持同步; 类表的篇幅较小,便于控制、管理、增补、修订等。 4、分类法的结构组成 分类法组成:类目体系,标记符号,说明与注释,类目索引四个方面 类目体系(表)的组成部分: 主表:基本部类、基本大类、简表、详表

信息组织学期末试题及参考答案范文

一、单项选择题【每小题1分, 共8分】 1. 信息组织的基本对象和管理依据是__D______。 A)外在特征 B) 内容特征 C)主题特征 D) 外在特征和内容特征 2. 信息组织的方法基础是____B____。 A) 语言学 B) 语言学、逻辑学和知识分类 C) 逻辑学 D) 语言学和逻辑学 3. 不属于布尔检索的是____B_______。 A)+ B)- C) ︳ D) () 4.大量信息的组织常采用数据库方法,ISO2709与GB2901是__B___的标准格式。 A)文献数据库B)数值数据库? C)事实数据库 D)多媒体数据库 5. 在元数据中,___A_____具有内容选择和过滤机制。 A)DC B)PICS C)CDF D)RDF 6. 根据信息资源的三级组织方法,Dublin Core被划分在_B________。 A) 一级 B) 二级 C) 三级 7.在HTML语言中, 实现外联图像的语句是_______A______。 A)< A HR EF=”文件名”>…… B)< IMG SRC=”文件名”>…… C)…….. D)…. 8.在多选按钮表单设计中, 相关的HTML语句为_____B_____________。 A)

B) C) D) 二、多项选择题【每小题2分,共12分】 1.信息组织的内容包括__________ _____________________________。 A) 信息搜集与选择 B) 信息分析与揭示 C) 信息描述与加工 D) 信息整理与存储 2.Yahoo分类目录对分面原理的具体应用表现在____________________。 A) 建立分类索引 B) 根据上下文进行信息内容组合 C) 利用冒号标记信息内容 D) 提供不同的路径入口 3.网络二次信息的组织方式是____________________________。 A)搜索引擎方法 B) 词表方法 C) 主题树方法 D) 国际十进分类法 4.在Web数据库中, 数据类型有__________________________。 A) 线性数据 B) 结构化数据 C) 无结构数据 D) 半结构化数据 5.标引语言的类型有_____________________。 A) 分类语言 B) 主题语言 C) 自然语言 D) 代码语言 6.电子商务系统设计步骤包括____________。 A) 商务分析与系统设计 B) 系统实现 C) 整合运行 D) 正常运行与维护 三、填空题【每小题3分,共24分】

网络信息资源组织方式

网络信息资源组织方式 网络信息资源组织方式分为一次网络信息资源组织方式、二次网络信息资源组织方式和三次网络信息资源组织方式。一次网络信息资源是指网上传输的原始信息资源是未经过加工处理的第一手信息资源;二次网络信息资源是指将一次网络信息资源进行描述、揭示、分析和存储后,形成了有序化、系统化的网络信息资源;三次网络信息资源是指对二次网络信息资源进行组织而形成的网络信息资源。 一次网络信息资源组织方式有:文件方式(以文件名标识信息内容,用文件夹组织信息资源)、数据库方式(将搜索引擎的巡视软件采集和标引的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询)、主题树方式(将信息资源按照某种概念体系分门别类地逐层加以组织,用户通过浏览的方式层层遍历)、超文本方式(以节点和链接在网上相关信息间建立关联,将众多的网络文本信息组织成某种网状结构,可从任一节点开始随机、自然地浏览查找自己所需信息)、超媒体方式(将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织)、自由文本方式(全文数据库的全文检索)。 二次网络信息资源组织方式有:机器人搜索引擎方式、指示数据库方式(贮存的是有关网上一次信息的网址以及相关信息的描述信息)、元数据库方式(对特定网络资源的总体管理和记录)、浏览器书签方式。

三次网络信息资源组织方式有:网络数字图书馆组织方式(对虚拟图书馆和数字图书馆中的二次网络信息资源进行的再组织)、网络信息资源评价网站组织方式、元搜索引擎目录组织方式。 未来网络信息资源组织方式的发展趋势主要是两方面: 1.主题指南与分类法的结合 利用主题指南和分类法对网络资源进行组织,有助于为网络资源构造基本结构和框架,从而使信 息分布有序化。虽然现在有些网站已经使用分类主题一体化方式来组织信息,但是现有的主题指南和分类法在涵盖网络信息的数量和规模上还是有限的,但它反映了网络信息组织的一个重要趋势,而且分类主题一体化方式在现有的基础上也将不断得到完善。 2 数据库方式与超媒体方式的结合 超媒体技术是超文本与多媒体技术的结合,它使人们可通过高度链接的网络结构在各种信息库中 自由航行,找到所需要的信息。但当超媒体网络过于庞大时,就不可避免会出现“迷航”现象。因此,现代网络信息资源组织的方式最好是数据库方式和超媒体方式的结合,这也是网络信息资源组织方式的发展趋势。

[第3章信息组织的原理与方法] 信息组织方法有哪些

[第3章信息组织的原理与方法] 信息组织方法 有哪些 第3 章信息组织的原理与方法 有了正确的理论,才有正确的实践 信息组织的原理 系统原理 信息组织是一个系统化的过程,其最终目的是将无序的零散的信息层次化、结构化,形成一种有序的体系或系统,因此,系统科学是信息组织的重要理论基础,对信息组织有极为重要的指导意义。 在信息组织系统中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联,那么信息系统的整体功能将大于各个信息单元的功能之总和。也就是说,这将能充分发挥信息资源的价值和作用。不仅如此,在信息组织活动中,类目体系的展开、主题词族的编制、信息的分析等都体现着系统的思想。基于这一原理,信息组织的目标是要建立一个有效的方便检索的信息系统。 语言学原理 具体而言,信息组织中的语言问题重要性在于:

信息组织的对象都是用语言描述的各种各样的具有语义性和准语义性的信息。没有语言就不可能有对事物的准确认识。 信息描述和信息揭示中需要运用大量的语言工具。对语言的理解和掌握是人类区别于动物的一个根本标志,某些动物虽然也能说人话,有时似乎也能“理解”人类语言,但这不是真正意义上的,它们对人类语言的使用仅仅是动物高级条件反射。只有人才能准确识别、记忆和领会语言。人对事物的认识几乎都要转化语言,只可意会不可言传的事物不能为其他人所了解。 在信息组织的现代技术手段的使用上,信息的编码、算法语言、程序语言、机器语言运用和自然语言理解和处理都充分体现了语言的重要作用。 逻辑学原理 信息组织是一种智力活动,离不开人的逻辑思维,信息组织本身是思维的一种表现形式,概念是思维的元素,逻辑则是思维的规则。所以信息组织自然包含相应的逻辑学问题。实践证明,逻辑思维越强的信息组织者其信息组织工作也越好。事实上,信息组织是对信息对象的各个元素,经过从事物到概念再到语言的层层递进的分析之后,运用科学思维使之序化的一个复杂的过程。 1、概念的关系 概念是事物本质属性的概括,其内涵是它所指事物的本质属性的总和。

信息组织试题库参考答案

信息组织题库参考答案 一.名词解释 1.仿分以某一类的子目作为复分依据的方法叫仿照复分,简称仿分。仿分是为大类普遍采用的复分 方法,使用范围一般不超出该大类。 2.倒排文档指将文档记录中的可检字段及其属性值,或称文献特征标识(即索引单元,如题名、著 者、叙词、自由词等)抽取出来,按照字段属性的某种顺序进行排序与存储,使之成为可以用作索引的文档,倒排文档也可称为索引文档。 3.八分法又叫八分制,是指同位类超过十个时,用1到8来标记同位类,到9时不用9,而用91… 99来标记与1到8相同级位的类。采用此法,突破了号码的级位代表类目级别的等级性。 4.信息描述是指根据一定的信息管理规则和技术标准,将存在于某一物理载体上的信息源的外在特 征和部分内容特征进行选择与记录的过程。 5.层累制也称层累制标记法,结构型标记法或表达性标记法,是一种与类目等级相适应的等级标 记制度,其特点是根据类目的不同等级,分别给予相应的不同位数号码,同位类再以符号的顺序依次相配,它的表达性强,能够显示类目纵向层层区分,横向并列的体系结构。 6.分类是根据事物的某种属性聚集相同事物、区分不同事物的活动。同类事物即指具有某些共同 属性的一组事物的集合。 7.UDC是《国际十进分类法》的简称。是在国际目录学会的主持下编成的。它是列举和组配相结合 分类法的代表,是唯一一部受到世界各国不同程度利用的,流行最广泛的图书资料分类法。 8.信息组织即信息的序化和优化。利用一定的科学规律和方法,通过对信息外在特征和内容特征的 描述和序化,实现无序信息流向有序信息流的转换,保证用户的有效获取。 9.信息标引采用语词或号码标识揭示与替代信息内容特征的活动。 10.XML 可扩展标记语言XML是SGML的一个重要分支,可提供描述结构化资料的格式,是用来自动描 述信息的一种新型的国际标准语言。 11.关键词法是一种以文献或题名中的自然语词作为描述和标引信息资源的标识,并提供字顺查检途 径的信息组织法。 12.词族索引是将主表和附表中具有属分等级语义关系(其中包括主题词之间的包含关系和整体关 系)的叙词,首先按照等级形式分别集合词族,然后依据每个词族中概念含义最广泛的族首词字顺编排而成的辅助索引。 13.等级体系分类法也叫体系分类法或列举式分类法,是一种以知识分类为基础,按照从总到分、 从一般到特殊、从低级到高级、从简单到复杂的逻辑次序,层层展开每门学科知识的类目排列表。 14.语法信息组织法是指以信息的形式特征为依据序化信息的方法。常见的语法信息组织法有字顺 组织法、代码组织法、地序组织法、时序组织法等。 15.模糊检索也叫概念检索,即系统不仅可根据输入的关键词进行检索,而且会自动地采用该关键 词的同义词和近义词进行查询以提高检索效率。 16.多元搜索引擎也被称为搜索引擎之上的搜索引擎。用户只需递交一次检索请求,由多元搜索引擎 负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以统一的格式呈现到用户面前。 17.超媒体存取超文本与多媒体技术的结合称为超媒体,超媒体存取的特点是将文字、表格、声音、 图像、图形等多媒体信息以超文本格式组织在一起,使用户可以通过高度联接的网络结构,在各种信息库中沿链接访问各类信息。 18.虚拟图书馆是针对某学科或专业领域的需要,将互联网上的有关领域的各类信息资源线索,包括

浅谈UGC的信息组织方式

终决定不再绕来绕去卖弄文笔,而是简单明了地阐明看法:怎样处理UGC信息列表。 这可是个大麻烦,因为成功的信息列表总是伴随着两个要素:类别筛选与品质控制。 论坛采用了最简单,最低效的产品设计方式来搞定难题。首先由高级管理员进行版面分类,指引用户去不同版面发表不同类型的帖子;随后再依靠普通管理员(版主)删除不合规范的帖子,奖励(置顶或加精)优秀的帖子。于是内容管理压力完全下放到了运营端,产品设计者不伤一文脑筋。 这么搞当然也是有背景的。密密麻麻的文字标题列表,使少数劣质主贴对整个版面的冲击不大;而用户习惯于快速拖动浏览回帖,也降低了劣质回帖对浏览的干扰。只要勤于管理,当类别与品质不合要求的内容在一定比例以下时,完全不影响整个论坛的正常运行。换成图片和视频产品,一屏掺进去一两张劣质图片就觉得惨不忍睹…… 比视觉污染更重要得多的优势,则是论坛容易激发平等、积极的讨论。由于互动活跃,话题性强,论坛可能是天底下最容易形成公共社区的产品,从而保障义务管理员的成就感与投入度,把高端用户驱动起来,靠他们消化掉巨大的运营管理成本。 换成其他类型产品,由于在公共社区的构建上先天不足,找不到肯卖力的好义工,在信息组织上只得寄希望于标签的使用,并依靠各种社会化推荐数据来鉴别品质。但除了tag在国内的不流行之外,这里还有个要命的悖论。当浏览者进入最新信息页,很容易被未经过滤的劣质内容气跑——真是个垃圾堆。既然没人愿意浏览最新信息页,谁又来帮你过滤和筛选最新内容呢? 他妈的,看上去进入了一个死循环。 解决思路之一,先对用户进行甄别,将靠谱的用户加入白名单,有免审特权。其他用户的内容先审再发,审核前仅在最新信息页显示,不进入精选信息页。 效果:不佳。在我这边,昆虫拍得好的用户,未必人像拍得好;风景拍得好的用户,未必lomo也拍得好。虽然采用了复杂的主题聚类白名单算法,还是没解决问题。关于用户的不确定因素太多,白名单内的用户未必放心,白名单外的用户又带来很大的审核压力。 解决思路之二,采用一些运营和算法手段提高最新信息页的品质,吸引用户浏览。 效果:不佳。虽然品质确有提高,但仍不足以作为用户进入的默认页,若不是默认页,新内容吸引到的用户只有10%左右,达不到社会化推荐有效的流量要求。 解决思路之三,学习Digg的内容推荐功能。 效果:极烂。脱离了Digg起家时极客社区的文化氛围,只有最无聊和最臭美的用户才乐意干这事儿。问问各大博客运营团队便知。 解决思路之四,让热心用户代替管理员来审核内容,多人投票决定结果。 效果:仅在糗事类网站有过成功应用,背景特殊,很难复制。

信息组织考试试题

1. 以节点为基本单位,节点之间以链路相连组织网络信息资源的方式称为_B___。 A. 主页方式 B. 超文本方式 C. 数据库方式 2. 当前对大量的结构化网络信息资源进行规范话组织与管理的有效方法是_B___。 A. 文件方式 B. 数据库方式 C. 主题树方式 3.__A___的基本大类有22个。 A. 《中图法》 B. 《科图法》 C. 《人大法》 4.将逻辑上相关的一组记录集合起来便构成了计算机存贮的__B____。 A. 字段 B. 文档 C. 载体 5.对一份信息实体进行整体标引之后,再选择其局部内容进行标引称为__C__。 A. 整体标引 B. 重点标引 C. 补充标引 6.对一份信息实体所涉及到的全部主题因素进行标引,称为___C_____。 A. 整体标引 B. 分析标引 C. 全面标引 7.用于信息分类组织的号码(分类号)标识称为___A_____。 A. 人工语言 B. 自然标识语言 8.在ISBDs模式上,充分利用计算机技术所形成的一种信息资源机器处理格式是__A___ A. MARC B. AACR2 C. ISBN 9.文献分类的主要依据是___B______。 A. 事务特征 B. 文献的本质属性 C. 文献的形式特征 10.于___C_年问世的DDC(杜威十进分类法)是现代登记分类体系分类法的先驱。 A. 1905 B. 1933 C. 1876 11.标准通用标记语言_B___是一种从结构和内容的层次来描述文献格式的计算机语言。 A. MARC B. SGML C. Metadata 12.以某类子目为细分标准进行的分类活动称为__B_______。 A. 通用复分 B. 专用复分 C. 仿照复分 13._B__的主要功能是描述internet数据内容和本质特征,存储相应的检索路径。 A. XML B. metadata C. UDC 14.用于网络信息资源组织的自编分类系统大多选用_B_____形式。

(完整word版)信息组织复习题及参考答案

信息组织复习题及参考答案 1-1 名词解释: 著录:亦即信息组员描述,它是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的过程。 标引:分析文献的内容属性及外表属性,并用特定语言表达分析出的属性或特征,从而赋予文献检索标识的过程。 ISBD:全称《国际标准书目著录》,即是一系列以丛书、乐谱、地图资料、非书资料等为对象的书目著录的国际标准,1971年开始发布。 AACR2:全称《英美编目条例第二版》,1978年,在第一版的基础上根据国际编目标准调整后出版,由“著录”及“标目、统一书名和参照”两部分组成。 自动聚类:从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。 自动归类:先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号,通常有基于词的自动分类(词典法)和基于专家系统的自动分类(知识法)两大类。 1-2 简述信息组织的诞生与发展。 信息组织是对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。在信息生产与消费的过程中,信息组织是核心。作为社会活动的重要组成部分,信息组织是与人类社会同时产生并同步发展的。 按职能划分信息组织发展阶段:清册职能时期,在古代信息管理时期,信息管理的着眼点不在于“用”而在于“管”;查检职能时期,此时,信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息;组织职能时期,这个时期,信息组织从最完整的意义上实现了整序信息、科学分流、促进选择、保证利用的组织职能(organizing function)。 1-3简述信息组织学的理论方法(理论基础与方法基础)。 系统论(基于“整体大于部分之和”的原理,信息组织的目的是要建立信息系统)、耗散论(信息组织所要建立的信息系统应该是一个与外界保持信息交换的开放系统)、协同论(一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的)是信息组织的理论基础。 语言学(要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统)、逻辑学(信息组织是一种思维活动,它必须遵循科学的思维方法才能保证信息组织的序化质量)、知识分类学(信息组织以知识分类为基础,可以较好地揭示各个知识领域之间的关系和规律性)是信息组织的方法基础。 1-4信息组织研究的主要内容是什么?

《信息组织》教学大纲

《信息组织》教学大纲 课程编码:11272005 课程名称:信息组织 英文名称:Information Organization 开课学期:7 学时/学分:40 / 2.5 课程类型:专业课(必修) 开课专业:信息管理与信息系统专业本科生 选用教材:张帆主编:《信息组织学》,科学出版社,2005年2月 主要参考书: 1.周宁主编:《信息组织》,武汉大学出版社,2005nian版 2.段明莲编著:《文献信息资源编目》,北京大学出版,2000年 3.冷伏海主编:《信息组织概论》.科学出版社,2003年 4.熊光莹主编:《计算机编目技术手册》,北京图书馆出版社,1999年 5.戴维民等:《文献信息数据库建库技术》,北京图书馆出版社,2001年 6.曹锦丹编著:《信息组织实习指导书》.吉林大学校内讲义,2006年 7.中国图书馆分类法编辑委员会编:《中国图书馆图书分类法使用手册》,北京图书馆出版社,1999第四版 执笔人:曹锦丹 一、课程性质、目的与任务 信息组织课程是高等院校信息管理与信息系统专业的主干课程,是信息管理与信息系统专业本科生必修的专业基础课。本课可为后续专业课程学习提供理论基础,是高等信息管理与信息系统专业教育不可缺少的组成部分。 通过本课程的学习,使学生系统掌握信息组织的基本理论、方法和技能,熟悉不同信息组织方法的实际应用,了解网络环境下信息组织的研究状况、最新进展与技术,并能初步分析和解决有关信息组织理论及实践中的相关问题。 二、教学基本要求 1、了解信息组织学科领域的研究对象及内容,对网络环境下的信息组织活动及主要环 节有全面认识。 2、了解国内外信息组织的最新进展及主要技术。 3、系统掌握本学科的基本概念、基本理论、基本原理以及有关的技术方法。 4、本课程采用课堂教学为主、实验为辅的教学方法。对于课程内容中涉及到的操作性 比较强的内容,如:机读目录编制及分类标引等,采用实验的方式由学生自己动手操作,在 操作的过程中增强对课堂知识的理解与记忆。 5、注重培养学生的思维能力,采用理论讲述与案例分析相结合的方法进行教学,培养 和提高学生分析问题和解决问题的能力,使学生完成本门课程的学习任务之后,能够自觉地对实践中存在的问题进行反思并提出解决办法。 三、各章节内容及学时分配

网络信息资源组织的方式与方法

网络信息资源组织的方式与方法 【摘要】本文先对网络信息资源的特点进行了简要说明,进而深入探讨了网络信息资源组织的方式与方法,以便进行网络信息资源组织的优化研究。 【关键词】网络资源组织;信息组织;特点;方式;方法 1.网络信息资源的特点 1.1数量庞杂而无序 网络的高度开放与自由,信息发布缺乏统一标准和宏观管理,使得任何单位、组织和个人都可以在网上无限制地发布信息,致使网络信息资源非常丰富,但是对于信息组织而言就显得庞杂而无序:①分布面广,信息源遍布全球,多语种且涵盖了几乎所有知识领域;②格式不一,包括文本、图像、音频和视频等信息对象,这些信息对象又各自包括多种文件存取格式;③网络信息分布具有很大的自由度和随意性,缺少质量控制和管理机制,使得网络信息繁杂、混乱,质量良莠不齐,安全存在隐患,给用户选择、利用网络资源带来了障碍;④数量巨大的网络信息资源来源于各行各业,包括不同学科、不同领域、不同地区、不同语言的各种信息,其内容是非常丰富的,并且以文本、图像、音频、视频、软件、数据库等多种形式存在。 1.2超文本链接与动态型 利用超文本链接技术,网上相关信息通过网络节点被方便地链接起来,使网络信息资源形成了立体网状的体系,信息的关联性大大加强,有利于信息的组织。但同时,网页、网站和网络的高速更新和淘汰,导致网络信息资源具有了动态性特点,网上无效链接比比皆是,网络信息的稳定性、可信度降低,影响到信息组织的策略和方法。 2.网络信息资源组织的方式 2.1文件组织方式 以文件方式组织网络信息资源简单方便,它可以存储程序、图形、图像、图表、音频、视频等非结构化信息。但随着网络信息资源利用的不断普及和信息量的不断增多,特别是当 信息结构较为复杂时,文件方式对这些信息的管理就显得力不从心,更加难以实现有效的控制,从而降低了信息组织的效率。 2.2搜索引擎方式

信息组织

第一章 信息组织的定义 信息组织,亦成称信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容进行分析、选择、处理、叙化,并以适当的形式加以提供的活动。 信息资源的概念 信息资源是指一切以记录形式存在的信息载体。与“文献”含义接近。 信息组织和揭示的层次 信息组织和揭示的层次:存在单位,个体,信息成分。根据使用的需要确定。 就其组织和揭示的层次而言,直接以信息资源的存在形式为处理对象,例如直接以图书、期刊、网站等为处理单元。也可以期刊、报刊、网站中的个体,如论文、新闻、网站中的构成部门为处理单位。还可以选择其中的信息成分作为处理的单元。(数据库) 信息组织和信息检索的关系 信息组织是信息检索的基础和前提,信息检索是信息组织的出发点和归宿。 信息组织的形式 信息组织的形式,信息资源,文献记录。

对信息资源进行组织,是指按照一定的方式将信息资源本身直接纳入信息资源集合。 文献组织的排列方式 文献组织的两种基本排列方式,固定排列法,按一定意义的次序排列。 检索工具的类型 按照检索工具的对象和特点,检索工具分为文献目录,索引,机读数据库,网络搜索引擎。 文献目录,以各种媒体的文献单元为对象,包括文献收藏目录和书目。 索引以文献集合中的文献单元或文献中的信息单元为揭示对象的检索工具。 按照数据的特点,机读数据库可以分为参考数据库和源数据库。 按照依据的标识特征,检索工具可以分为,以信息资源的外部特征为依据,以信息资源的内容特征为依据。(以表达信息资源主题内容的表示为依据,提供从内容角度进行检索的途径。包括主题法和分类法。) 责任名、题名、机构名、出版社、标准书号、专利号、档案号、文献登录号为外部特征。 关键词、摘要、分类号为内容特征。 根据系统中所用的标识是否进行控制,检索工具可以

自考信息组织简答

2、下列属于布尔检索的是()(分数:2分) A. + B. - C. | D. () E. ! 标准答案是:ACD。 3、在下列元数据中,()不具有内容选择和过滤机制。(分数:2分) A. DC B. PICS C. CDF D. RDF E. CAD 标准答案是:BCD。 4、在HTML语言中, 不能实现外联图像的语句是()。(分数:2分) A. < A HREF=”文件名”>…… B. < IMG SRC=”文件名”>…… C. …….. D. …. E. < A HREF=”文件名”> 标准答案是:BCD。简答练习 1、简述文献分类在图书情报领域的应用。 文献分类在图书情报领域的应用主要包括:(1)利用分类成果编制分类目录于索引。(2)利用分类成果组织分类排架。(3)利用分类成果对文献情报进行统计和清点。(4)利用分类成果向读者推荐、介绍文献情报,开展咨询服务等。 2、试述叙词标引的选词规则。 叙词标引的选词规则如下:(1)必须选用词表中正式主题词标引文献,不得选用非正式主题词标引。(2)必须首先选用与文献主题概念最相应的、最恰当的专指主题词进行标引。(3)如果词表中没有单个最专指的主题词标引文献,应选用最关联的两个或两个以上的主题词组配标引。(4)如果词表中既无单个的最专指的

主题词,又无恰当的关联主题词组配时,可选用最临近的上位主题词进行标引。(5)如果词表中既无专指的主题词,又无相应主题词组配时,也无合适的上位主题词时,可采用含义相近的主题词进行标引。(6)对于具有较大检索意义的新词,采用上述诸条均不能解决问题,可用增加主题词的方法标引。(7)对专指性强的主题进行标引,可采用款目词加倒置自然语言的办法。 3、简述关键词索引的类型。 关键词索引的类型主要有:(1)题内关键词索引(KWIC Index);(2)题外关键词索引(KWOC Index);(3)双重关键词索引(DKWIC Index);(4)单纯关键词索引(Keyword Index);(5)词对式关键词索引;(6)简单关键词索引;(7)PRECIS索引等; 4、简述叙词表的结构。 叙词表的结构一般都由字顺表和辅助索引两部分组成。字顺表包括主表和附表两部分,辅助索引则包括范畴索引(分类索引)、词族索引(等级索引)或词族图、专业叙词索引、轮排索引和双语种对照索引等。 5、简述信息主题组织的特点。 主题组织是以描述信息源内容特征的词语来表达各种概念,并按词语字顺组织存取系统。主题组织法由于直接采用自然语词为检索标识,以事物为中心类聚信息,在表达信息源内容主题方面具有直观易解、适应性强等优点。此外,主题组织法不仅在词语标识之间建有“语义”联系,而且组配灵活,因此能较好的满足多元检索的需要。 6、简述叙词法采用概念组配的意义和作用 叙词法采用概念组配的意义:1.控制主题词表词汇量,缩减词表篇幅。2.实现多

信息组织知识要点要点

知识要点 第一章绪论 1、什么是信息组织?(理解) 信息组织:对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。2、信息组织的发展阶段——按组织对象划分(理解) 按组织对象划分信息组织经历了三个阶段:文献组织阶段、信息组织阶段、知识组织阶段文献组织阶段——组织对象:传统文献实体,不涉及文献内容本身。 信息组织阶段——组织对象:从广度上,以纸质信息为中心转向以电子媒介信息为中心; 从深度上,除了对文献实体进行组织,还要深入信息内容。 知识组织阶段——组织对象:从显性知识扩展到隐性知识。知识组织直接给用户提供直 观的、可操作的系统化知识。不再局限于利用片面的信息来满足用户 的需求,而是对用户的需求系统分析,向用户提供全面、完善的解决 方案。 按职能划分信息组织经历了三个阶段(补充): 清册职能时期 查检职能时期 组织职能时期 3、网络信息组织的基本方法(掌握) ①文件方式

?一般用于局域网内的非结构化信息组织。 ?优点:通过FTP协议进行传输,简单方便 ?缺点:以文件为单位共享和传输信息会使网络负载越来越大 ②自由文本方式 ?主要用于全文数据库的组织 ?对非结构化的文本信息进行组织和处理的方式 ?能够完整地反映出一次文献的全貌 ?通过计算机自动进行文献信息的处理和组织,支持全文检索。 ③数据库方式 ?一般用于结构化/规范化信息组织。 ?优点:最小存取单位是字段,从而大大降低网络数据传输的负载。 ?缺点:对非结构化信息处理难度大 ?数据库方式是当前普遍使用的网络信息资源的组织方式。 ④主页方式 ?网页一般通过HTML语言规则将文本、图像、声音、视频等各种类型的信息集合在一起。 ⑤超文本方式 ⑥主题树方式 ?主题树方式是一种可供检索和查询的等级式主题目录。它以人工方式或半自动方式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。 ?主题树方式不太适合大型的综合性的网络信息资源系统,而较适合专题指引库的建立。

《信息组织》复习提纲

2010年秋季学期信息管理与信息系统专业 《信息组织》课程期末复习提纲 一﹑复习方法 以本复习提纲作为复习的主要线索,掌握提纲中所涉及的各知识点。 二、参考资料 1 马张华《信息组织》第三版清华大学出版社 2008年5月第3版 2 《信息组织》网络课件 注:教材与课件在编排顺序和内容详略上有所不同,具体的对应关系见学期初挂在论坛上的“学习指导”。所以在复习时请以教材为主,配合使用网络课件。 三、考试方式与试卷结构 采用闭卷方式。 考试的具体形式包括:名词解释、填空题、选择题、问答题。 名词解释――主要帮助掌握术语体系;为了方便复习,本课程提供完整的名词复习范围。 填空和选择――帮助掌握基本知识; 问答题――帮助掌握内容的深度了解。 四、各章节知识点 第一章 一、名词解释 信息组织、文献目录、索引、检索语言 二、简答题 1.信息组织与信息检索的关系。(了解) 2.根据对象与特点划分,检索工具有哪些类型(掌握) 3.两种基本检索途径及其特点(掌握) 4.传统检索系统中对信息资源处理的基本做法。(掌握) 第二章 一、名词解释 检全率、检准率

二、简答题(了解) 1、评价一个信息组织系统应考虑的基本因素。 2、信息组织中的规范控制主要有哪些方法。 第三四章 一、、名词解释 信息描述、元数据、检索点、MARC格式 二、几个典型的信息描述规范,如《文献著录总则》、《都柏林核心集》的基本描述项目(了解) 三、简答题:信息描述的作用有哪些(了解) 第五章分类法 第一节 一、名词解释 信息资源分类、等级列举式分类法、分面组配式分类法 二、简答题 1. 简述信息资源分类的特征、作用。(了解) 2. 信息资源分类法的含义是什么?分为哪几种类型?(要求能根据实例判断类型)(掌握) 第二节 一、名词解释 基本部类、复分表(了解)、顺序标记制、层累标记制、八分法、双位制、预留空号法、类目索引(掌握) 二、简答题 1、分类法的结构组成及各部分的作用。(掌握) 2、类目体系的结构组成。(掌握) 3、复分表的作用。(了解) 4、标记符号的要求、种类、编号制度、常用标记技术(掌握) 5、类目索引的几种常见类型及其定义。(掌握) 第三节 一、名词解释 引用次序、同位类、交替类目 二、简答题 1、引用次序对于类目体系展开的作用(掌握) 2、传统分类法对于横向关系的处理方法(掌握) 3、类目体系中类目之间存在的基本关系及表现形式。(掌握)

《信息分析报告方法》习题

《信息分析方法》复习题 一、单项选择: 1.信息分析有许多相关概念,但以下概念中与信息分析无关的是【 A 】A.信息组织 B.技术跟踪 C.数据分析 D.情报研究 2.信息分析的目的是【 D 】A.为信息咨询服务 B.为科学研究服务 C.为信息管理服务 D.为科学决策服务 3.信息分析工作中研究方法的科学性主要表现在【 D 】A.采用科学的研究方法 B.数据的客观性和准确性 C.研究的相对独立性 D.以上全是

4.信息分析的基本功能是整理、评价、预测和【 A 】A.反馈 B.综合 C.评价 D.推理 5.信息分析中进行多因素之间关系的定量研究,主要依赖以下哪种方法【 D 】A.系统分析 B.社会学 C.预测学 D.统计学 6.文献收集中的检索方法有多种。从时间上看,如果是从与课题相关起止年代由远而近地开始查找,这种检索方法则是【 B 】A.追溯法 B.顺查法 C.倒查法 D.常规法 7.对照两个或两个以上研究对象,以确定其间差异点和共同点的一种逻辑思维方法称为

【 C 】A.因素法 B.差量法 C.比较法 D.相关法 8.一切推理可以分为哪两大类【 D 】A.常规推理、直言推理 B.简单判断的推理、复合判断的推理 C.假言推理、选言推理 D.演绎推理、归纳推理 9.考察某类事物中的部分对象具有某种属性而推出该类事物都具有此属性的推理形式是 【 B 】A.常规推理 B.简单枚举推理 C.假言推理 D.选言推理

10.特尔菲法中专家意见的协调程度可以用以下哪一个来表示 【 D 】 A.评分的算术平均值 B.对象的满分频度 C.对象的评价等级和 D.协调系数和变异系数 11.下列各句话中,以下哪一句没有采用相关分析【 C 】A.山雨欲来风满楼 B.瑞雪兆丰年 C.一年之计在于春 D.春江水暖鸭先知 12.回归法中最基本的方法是 【 A 】 A.一元线性回归 B.二元线性回归 C.多元线性回归 D.非线性回归

我认为的未来的互联网的信息组织方式

我认为在未来的互联网的信息组织方式,要根据之前阶段的发展而定。事物不可能被颠覆,只是不断的发扬与继承,也只有旧事物已经起不到任何作用时,新事物才能在其基础上将其颠覆。 首先,互联网信息组织方式到现在为止经历了三个阶段。一次网络信息资源组织方式、二次网络信息资源组织方式和三次网络信息资源组织方式。一次网络信息资源是指网上传输的原始信息资源是未经过加工处理的第一手信息资源;二次网络信息资源是指将一次网络信息资源进行描述、揭示、分析和存储后,形成了有序化、系统化的网络信息资源;三次网络信息资源是指对二次网络信息资源进行组织而形成的网络信息资源。并且到今天,这三个阶段依旧在信息生成到入网的不同阶段起着相当的作用。 一次网络信息资源组织方式有:文件方式、主题树方式、超文本方式、超媒体方式、自由文本方式。二次网络信息资源组织方式有:机器人搜索引擎方式、指示数据库方式、元数据库方式、浏览器书签方式。三次网络信息资源组织方式有:网络数字图书馆组织方式(对虚拟图书馆和数字图书馆中的二次网络信息资源进行的再组织)、网络信息资源评价网站组织方式、元搜索引擎目录组织方式。(以上搜索于“百度知道”) 当然,随着现今互联网技术的发达程度,多种应用程序的普及,普通人又多了一个身份--信息资源的生产者。这也就造成了信息资源的爆炸式增长。当然,这也造成了信息质量的良莠不齐。因此如果再任其肆无忌惮的发展,只会导致无用信息资源的泛滥。并且现今“云”技术也已初具规模。那么可预见的未来,会将“云”应用到极致。将各用户的数据信息发送至云端进行处理与存储,所有信息资源汇于一处。所有用户进入一个统一的服务器进行工作。也许,未来的各种线上图书馆、搜索引擎等也只是不同的端口而已。各自进行着自己的检索方式,但都要服从服务器系统的管理。当然,还要具备相应的对信息的评审系统,虽然计算机技术的存储量会随着时间而呈指数增长,但是无用的信息我们必须摒弃。因为作为前辈,我们要给后世留下最具意义的研究成果,而不是无聊的空想的型似精神毒品的无用信息。当然,人工智能处理大数据也是势在必行。但是人工智能的学习功能还有待人们研究。因为我们要让人工智能为我们解决大数据问题,就不能让他太智能。一旦人工智能有了自己的思维,很好有可能就会再互联网、物联网中肆意串行,甚至破坏人类文明的秩序。所以必须对人工智能的智能程度加以商榷。

信息组织的两种重要方法——分类法与主题法——尤世民 2014103565

分类法与主题法 一、分类法 分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。 信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。 (一)等级列举组配式 等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。常见的有《杜威十进制分类法》(DDC)、《中图法》等。 (1)杜威十进分类法(Dewey Decimal Classification,DDC) 杜威十进分类法是广为全球各地图书馆使用的分类法。这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。 DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。此外,DDC更能用来组织网际网络上的各种资源。 杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。最新的版本为2004年版。该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。例如330 表经济学+ .9 表地区别论述+ .04 表欧洲= 330.94 表欧洲经济学。 10大分类编辑 000 -计算机科学、资讯与总类 100 -哲学与心理学

相关主题
文本预览
相关文档 最新文档