当前位置:文档之家› 情报检索语言

情报检索语言

情报检索语言
情报检索语言

虚拟现实(VR)就是利用计算机和其它的专用硬件和软件产生一种境界的仿真,参与者可以通过视觉、听觉和触觉等感觉与仿真的内容交互操作,达到一种“真实”的感觉,所以有人也称其为“灵境”。

信息构建就是为用户提供序化、优化及美化的信息。它需要借助一切信息组织、信息呈现的技术和方法,如图形设计、可用性工程、用户经验、人机交互、图书馆学信息科学中的主题法分类法等的理论方法,在用户需求分析的基础上,对信息进行组织、布局、优化,如设计导航系统、标签系统、索引和检索系统,以及内容布局等。

超文本是一种新型的信息组织技术,它以结点为单位,结点与结点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络。

数据仓库是支持决策过程的、面向主题的、集成化的、稳定的、不同时间的数据集合。这个定义体现了数据仓库作为信息组织技术和工具的鲜明特征,如主题性、有序性等。

自动归类是指计算机通过词频统计、语法分析和语义分析等途径得到代表文献内容的类主题词,然后按照某一分类表将文献划分到某个类目的过程。

自动标引是以计算机代替人工,自动生成表达信息记录内容特征的主题、分类或其它有意义的标识,它是标引技术与计算机结合的产物,是信息组织自动化的基础。

数据管理就是对数据进行分类、组织、编码、存贮、检索和维护。

数据库(Database,DB)是存储在一起的相关数据的集合。

主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。

主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。

组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法

关键词是指在文献的标题、摘要或正文中出现的、对表达文献主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。

关键词法原理的应用,常有三种形式,即题外关键词索引、题内关键词索引和单纯关键词索引

条形码是由一组粗细不一、相互平行的黑白条符组成并按一定编码规则组织起来,用来表示字母、数字、甚至汉字等信息。

信息编码是指用一个或一组按特定规则排列起来的符号来表达信息的过程,它实质上包含两个环节,一是信息的代码化;二是代码的组织。

综述是对与主题相关的大量初始信息记录或非记录形式传播的大量初始信息或事实等进行分析、归纳、综合且按一定逻辑顺序而组织成的能在一定时间和空间上反映特定课题研究的全部或大部分情报的具有研究性质的二次信息产品。综述反映的是一批相关文献的信息,是它们的总体概括和总结。

多媒体硬件系统是由计算机硬件设备、光盘存储器(CD-ROM)、音频输入/输出和处理设备、视频输入/输出和处理设备等选择性组合而成。

代码是符号的一种,它与语言文字、图形、数字符号一样,可以用来代表或描述特定的信息,它不是通常的符号,而是指那些为便于信息组织、传播、存贮检索和加工处理而设计的非常规的符号。

文献目录以各种文献为揭示对象,揭示内容都是与文献有关的特征,如题名、作者、出版者、出版日期、载体形态、主题内容、获得方式

实体目录是将物质实体作为揭示对象的一种目录形式,其中商品、产品目录最为常见。

事实目录事实目录以与人类有关的各种活动、事实现象等作为揭示对象,内容涉及各种活动。

索引组织法是指将文献中的具有检索意义的特征项或语词、符号、代码等提出来形成一条条的记录,在每条记录下面注明来源地址如页码、位置、时间等,并按照一定的规则排列起来的信息组织方法。

信息重组的途径和原则

(1)将信息时空相近的信息或信素进行重组。

(2)将时间序列上相近、信息空间跨度较大的信息进行重组。通过这一途径,可以实现

(3)将时间序列上跨度较大、信息空间上相近的信息进行重组。

(4)将时间序列和信息空间上差异都较大的信息进行重组。

信息重组应遵循的原则一般而言,信息重组应遵循下列原则:

(1)针对性。宏观上要针对社会和时代的需求,微观上要针对用户的具体需求。

(2)全面系统综合。信息内容应完整,信息组合应有严密的逻辑性。

(3)时效性。信息内容应新颖、不过时。

(4)客观真实。消除信息中的“噪音”和虚假成分。

(5)易于接受。信息内容简明易懂,便于用户消化吸收

信息重组是指采用一定的方式,按一定的属性,将已有的某一方面的大量分散、杂乱的信息经过整序、优化,形成一个便于有效利用的信息系统的过程。

目录的类型

按照目录所揭示信息内容的不同可以分为文献目录、实体目录、事实目录

按目录载体特征的不同,可分为印刷型目录、感光型目录和电子型目录两种类型按目标内容所涉及的范围,可将目录分综合性目录和专题性目录;按目录专用功能不同,可以将目录区分为报道性目录和检索性目录;按目录中各个记录单元的组织排列方式的不同,可以分为分类目录、主题目录、字顺目录、编年目录;按目录存在方式的不同,可以区分为独立目录和附属目录。

索引记录由索引标目项和出处项两大部分构成

目录的编制方法

书本式目录下制作,要经过选题、编写前言;制作单一记录单元、组织排列记录单元;编定目录和其它辅助资料;审核印刷等程序。每一程序的具体操作方法和要求如下:(1)选题(2)编写前言(3)制作单元记录

(4)编排目录正文(5)编定目次(6)编制辅助资料(7)审校、印刷、装订

引文索引具有十分鲜明的特点:(1)引文索引反映了作者之间、文献之间的引用和引用的关系;(2)提供回溯性检索;(3)语义相对稳定、适合计算机处理;(4)引得深度较大。

引文索引的功能和作用

引文索引的独特结构决定了它具有一些独特的功能。

1)首先,引文索引提供了一种新颖的关系检索方法。用户只要沿着“文献间引用关系”这条主线,就能检索到相关的文献,象滚雪球一样越滚越多。而且这种关系检索不受学科分界和时空的限制,比一般检索工具更适于查找交叉学科、边缘学科的课题,对把握某个学科的发展脉络具有其它检索工具所没有的作用。

2)其次,引文索引是科学计量的重要工具。引文索引中,引用与被引用关系把各种文献联结成一个引文网络系统,使整个科学成为一个跨越时空的立体体系。运用引文分析法,能定量地反映科学论文之间各种显形或隐性的相关性,有助于学科间的交叉继承关系、科学发展状况的研究,有助于系统把握研究热点乃至对科学的发展方向进行合理的预测。

3)引文索引还是文献计量研究的重要工具,引文索引为测定核心期刊、评定期刊、图书、论文质量,评价作者学术水平,研究文献老化规律等方面提供较为客观的指标,使之更具科学性。通过引文索引,我们还可以掌握某些作者或作者群的研究动向。这对指导文献收藏有重大意义。

SCI由引文索引和来源索引两部分组成

SCI内容是由引证者与被引证者相互关联的,由引文索引、来源索引和轮排主题索引三部分组成,具有以下四个检索系统:引文索引,②来源索引③团体索引④轮排主题索引。上述四种索引体系,是以引用及被引用为主要线索,从而揭示了作者与作者之间、文章与文章之间的继承与发展。

SCI的主要作用及特点

(1)作为评价科技工作者学术水平和工作成效的客观指标之一。SCI可以揭示某作者发表

(2)SCI可检索通过自己的几种检索工具可以

(3)为科研管理提供重要的参考依据。

(4)用于评价科学期刊的质量,为选择和确定核心期刊提供重要依据。

(5)利用文献之间的引证关系,可查到一系列相关文献。以上五项作用中,前二项是SCI所具备的特殊功能,是其他索引所没有的。

《全国报刊索引》的不同版本(1)印刷版(2)电子版(3)网络版

《全国报刊索引》的特点

(1)收录范围广:(2)著录格式标准化:

(3)增加服务项目, 提供原始资料。

(4)建立机读文献数据库, 方便用户独立操作。

文摘是对初始信息内容进行浓缩加工,即抽取其中的主要事实和数据,生产出的、基本保持原有信息含义的信息组织产品,是原信息的精华和反映。

文摘的类型

①按文献内容压缩的程度,可分为报道性文摘和指导性文摘,

②按加工手段,可分为手工文摘和机编文摘。

③按文摘编写的时间顺序,可分为首次文摘、同期文摘和期后文摘。

④按照文摘的具体对象,可分为报刊文摘、会议论文文摘、学位论文文摘、科技报告文摘、专利文摘、人物机构文摘等

⑤按文摘所涉及的知识各门类,可分为综合性文摘和学科性文摘。

⑥按文摘的编著者分,可将文摘分为作者文摘和文摘员文摘和读者文摘。

文摘的特点

①浓缩性:②真实性:③情报性:④独创性:

文摘编写一般应遵循以下几条原则:①忠实原则:要如实、客观地反映原始信息,不能加进编者的主观见解或评论;②逻辑性原则:合乎语法,遵循原始信息的逻辑结构;③新颖性原则:要着重反映新内容和新观点;④规范性原则:如要用第三人称,要采用规范化的名词术语等;⑤简明性原则:文摘结构要简明,表达要简明,语义要连贯。

文摘编写具体方法有:缩小法、提炼法、列举法、重构法。文摘编写一般需经过以下几个环节。①全面阅读、分析初始信息记录,在理解要点的基础上,将原文中有代表性和有重要价值的语句用符号标记或抄录下来。②比较归纳已标记或抄录的语句,按原文逻辑顺序或语句本身的逻辑关系组织起来。按照标准规定撰写文摘正文,并与原文查核对。

综述的特点①综合性:②浓缩性:③简明性:④客观性:

综述的编写

(1) 确定选题与研究重点(2) 资料收集(3) 分析和评价资料的价值。

(4) 整理资料使之系统化(5) 撰写综述

多媒体系统是指能对文本、图形、图像、动画、视频和音频等多媒体信息进行逻辑互连、获取、编辑、存储和播放等功能的一个计算机系统。

多媒体课件的设计过程

(1)确定选题(2)稿本编写(3)确定软件框架(4)数据准备(5)系统制作

多媒体电子出版物的设计过程

(1)节目规划阶段 (2)设计阶段 (3)素材制作阶段 (4)节目编辑合成阶段 (5)测试评估阶段 (6)生产制造及加工推广阶段

代码的功能

(1)代码能够简明、精确地描述信息。

(2)代码可以反映信息的类别特征

(3)代码有利于信息组织,

(4)代码可以服务于特殊的信息处理需求

代码的类型

(1)按代码构成成分不同,代码可分为单纯代码和混合代码。

(2)按照代码组织功能不同,可以将其划分成排序码和无序码。

(3)按代码组合的方式不同,可分成层次码、特征组合码和镶嵌式组合码。

4)按代码主要用途,可分为信息识别组织代码和信息传输/交换代码。

在信息组织中,信息编码应具有如下一些基本功能,

(1)能简化信息表达,便于信息的识别、记忆、组织、传播、存贮和检索。语言文字是一个庞大的符号系统,用其表达、识别记忆信息一般要耗费大量时间,随着信息的激增,这一问题更显突出,为此,人们迫切需要设计各种代码,使信息变得更加简明、有序,易于记忆存贮和识别检索。

(2)在要求保密的情况下,能弥补基本符号由于通信导致不易保密的缺陷。

条形码技术的特点

(1)信息输入速度快(2)信息输入准确性高(3)信息的保持性高(4)信息采集量大条形码设计的注意事项

(1)条码字符集:(2)条码符号的密度:(3)条码的结构:4)编码方法:

5)编码容量:6)条码的连续性与非连续性:7)条码的长度:

8)条码识读的方向性:9)条码的纠错能力:

密码的类型

1)替代密码2)伪文密码3)隐式密码:4)移置密码:5)公开密钥密码

密码三要素1)明文2)密钥3)密文

单元词法的主要特点是:标题是组配构成的,而且是“后组式的”。

(1)摆脱了标题法中每个标题只能选择一种标题形式作为正式标题的局限性,也就是可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引;(2)单元词之间不存在次序问题。但是这有可能会产生误检,例如在查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学校图书馆”的额外内线都检索出来。

(3)组成“标题“的每一个单元词都是排检词,都可以作为检索入口,因而与标题法相比,单元词的检索途径较多。

(4)利用对单元词的增加或减少,可以进行扩检或缩检。

(5)标引深度较高。单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。每张单元词卡片一般可以记录200个文献号码,而且还可以继续使用第2、3张卡片。如果采用比孔卡片,则可以记录更多的文献号码,因而可以大大提高文献的标引深度。例如,美国杜邦公司的几个检索系统,有许多文献标引了400多个单元词。

(7) 有利于向计算机检索方向发展。

单元词法最初不编制词表,因而对词义的控制和词义的规范都不作要求,但是后来也编制了词表并使用语义参照系统。

标题语言基本构成要素是主标题、副标题和说明语。

作为一种传统的的主题法,标题词表的特点有:

(1)采用列举式词表(2)定组式标题结构(3)操作简便

叙词法的主要特点是:

(1)直接以规范化了的自然语言——叙词作为标识符号,直观性强;

(2)直接从论述和研究的具体对象和问题出发进行选词,并采用叙词组配来描述主题,专指性强;

(3)叙词法能随时加以增设修改,适应性强;

(4)对叙词主要采用字顺排列方式,查找迅速;

(5)主要采用后组式概念组配方法,灵活性强;

(6)对同一主题的文献,可以作多维检索(多途径检索);

(7)叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用

组配时需要注意这几个问题:

(1)要尽量使用词表中给出的主题词,只有词表中单个主题词不能够表达主题,才进行组配;

(2)要防止单纯字面组配,组配必须是概念组配;

(3)要防止多标识组配,必须选用与所表达的主题关系最密切、最邻近的主题词进行组配。

(4)要防止越级组配,也就是在标引时不能以粗(大概念——泛指词)代细(小概念——泛指词)或以细代粗。

主题词具有概念性、控制性、组配性、语义性、动态性等特征

主题语言要素

主题语言的要素,包括以下四个方面:

①语词标识:标识有两类即号码标识和语词表示,语词表示是采用自然语言中的但经过控制的名词术语,作为描述文献主题的标识。

②字顺系统:汉字字顺系统主要有音序和形序。

③参照系统:是主题词表显示主题词语义关系的语义词网络。

④主题检索工具:是根据主题语言原理编制的各种主题检索工具,主要是主题目录、主题索引、计算机中的主题词倒排档等。

目前常用的汉语分词技术有:

(1)词典分词法:(2)切分标记法:(3)单汉字标引:(4)智能分词法:

自动标引的基本过程是计算机读入待标引的信息和标引工具集,对读入的信息记录的进行内容(而不仅仅是文本)分析统计,选择相关语词或其它(如波形、图像轮廓)标识。将选择出的标识与计算机内存贮的标引工具集进行匹配扫描。将自动标引结果和标引对象的信息存贮在一起,形成一条完整记录。

自动分类通常包括自动聚类、自动归类

归类一般过程包括:对文献的题目或文摘进行分词,同时从词典中取出词法和语文知识赋予每个词。采用词频统计,语法和语义分析方法时,进行主题分析,选出类主题,然后利用一个能够反映类主题目之间相应关系的主题词进行归类,并转换为类号。

数据库建设中的信息组织问题,这些错误出现的主要原因有:

(1)人为输入错误

(2)由于记录符号及格式方面的非规范化导致的。

(3)数据采集滞后、失真导致的。

(4)数据标引方面的问题导致的。如错标漏标、标引深度不统一等等。因此,在数据库建设中就严格加强标准化和规范化控制,充分做好信息的组织工作。

数据仓库系统

1) 源数据。2) 仓库管理。3) 分析工具。

系统开发方法

1)自顶向下(top-down)的方法2)生命周期法(life cycle),

3)需求分析法(requirement analysis),4)原型法(prototyping)其做法5)OO法数据库系统设计步骤

(1)需求调查(2)系统分析与概念结构设计(3)逻辑结构设计

(4)物理结构设计(5)数据库的实现与维护

数据仓库的特征

(1)数据量巨大。(2)数据按主题归类。(3)数据具有集成性和有序性。

(4)数据具有稳定性。(5)数据具有一定的时限。

超文本是结点、链和网络三要素的组合

链的结构一般可分为三部分:链源、链宿及链的属性

链的属性链的属性决定了链的类型,链的类型有:

①索引链:②结构链:③隐形关键字链

超文本的基本特征

(1)非线性组织结构

(2)单元(或信息块)是超文本信息组织的对象

(3)信息的层次性

(4)交互界友好

(5)具有检索(retrieval)功能。

超文本的体系结构 1用户接口层 2超文本抽象机 3数据库层

超文本信息组织过程

(1) 获取任务信息

(2) 任务信息的理解和分析

(3)组织成超文本

(4) 用户界面设计

虚拟现实研究涉及到如下几个方面:仿真(模拟)、计算机图形、人机接口、体视学(从三维观察物体)以及人造现实(artificial reality)。

虚拟现实系统的组成1.虚拟现实显示设备 2.音频系统 3.虚拟环境发生器 4.虚拟现实输入输出设备

网络信息的类型1、网上一次信息2、网上二次信息

网上一次信息

(1) 主页方式(Home page)

(2)电子邮件

(3)BBS 网络新闻一般也属于一次信息源,它的新颖性很高,有些网站的新闻甚至比传统的媒体

(4)Usenet、Newsgroups

网页编写语言包括HTML、JavaScript、VbScript以及目前流行的ASP、https://www.doczj.com/doc/2f18576077.html,、PHP、JSP、XML、Java等。不同之处在于,ASP学习简单、使用方便;PHP软件免费,运行成本低;JSP多平台支持,转换方便。

网上信息具有一些新的特点,主要表现为:

1)数量庞大、增长迅速。

2)内容丰富、形式多样。

3)变化频繁、价值不一。

4)结构复杂、分布广泛。

5)因特网对网上信息资源的组织却没有统一的要求。网上信息存储在世界各地的服务器

目前网上二次信息的组织主要有下列形式:

(1) 搜索引擎(Search engine)形式

(2) 菜单索引方式(Menu type)

网络信息组织是指人们根据网络信息本身的特点(或属性)、运用各种工具和方法,对网络信息进行加工、整理、排列、组合,使之有序化、系统化、规律化,从而有利于网络信息的存储、传播、检索、利用,以满足人们的网络信息需求的活动过程。因此网络信息组织的对象是网络信息,如网页(WWW)、Email、Ftp、Gopher、BBS、Usenet等,其中以网页为主要存在形式。

网络信息组织的内涵

网络信息组织同其他信息组织一样,即经过序化阶段和优化阶段两个过程对信息进行整序。

分类法和主题法是信息组织最为重要的两种方法。

进行网络信息分类的原则有:直接性原则、实用性性原则、自然性原则、快捷性原则等,根本上要使分类具有简明性、实用性、科学性和开放性。

网络信息组织面临的新挑战

(1)网上信息组织需要实现自动化。

(2)网上信息组织要从纯文本向多媒体方向发展。

(3)网上信息组织要求从数据结构转向知识表示。

目前网上信息组织的主要方式大致有四种:文件方式、数据库方式、主题树方式和超媒体方式。

1.文件方式

2.数据库方式

3.超级链接方式

4.主题树方式

5.搜索引擎方式

数据库与超媒体技术的结合将是网上信息组织方法发展的新方向。目前,人们提出了三种结合途径。

网络信息组织方法体系

1.通过超级链接联结数据库

2.在数据库上附加链服务

3.建立超媒体结构的数据库系统

分类法在网络信息组织中的应用有两条途径:

1.将传统分类法面向网络进行改造

传统的分类法是网络信息分类的基础。采用文献分类法对信息进行组织的网络分类体系大致分以下一些类型:

(1)依据综合性分类表建立综合性网络信息系统。

(2)依据专业分类表建立专业性的网络信息系统。

(3)依据综合性类表的某一专类建立专业性网络信息系统。

2.创建新的网络信息资源分类体系

创建的网络信息分类体系的特点是:

体系结构简明,便于网民操作;

主题聚类为主、学科分散,便于网民理解;

突出强化生活性类目,淡化学科性类目,贴近网民生活;

多角度重复列类,增加检索途径;

充分揭示事物的多重属性,通过多重列类,利用链接技术,有选择地同时建立多个引用次序的类目体系;

采用多元划分,减少点击次数;

类名措词时尚,具有吸引力;

建立主从分类体系,提供多种选择;

采用超文本链接技术,实现任意跳转;

系统及时得到维护,随时增、删、改;实现了分类体系的动态组织;

实现界面友好,检索方便快捷。直观地显示类目体系,直接显示类名,使整个类目体系直观明了;

多数类目按用户使用频率高低排序在同一个划分等级中

3.建立统一的网络信息资源分类体系迫在眉睫

主题法在网络信息组织中应用的研究

(1)关键词法的应用。

(2)主题词表的应用。

(3)标题词表的应用。

主题法在网络信息组织中应用实践

(1)利用传统主题表组织网上信息资源。

(2)建立主题范畴系统组织信息,同时又通过标注分类号,使按主题法组织的信息保持与分类体系的联系。

(3)同时使用主题代码系统和分类表组织信息。

总结起来,主题语言在网络信息资源组织中表现为两个方面,

一是利用传统主题表组织网上信息资源,传统的主题法仍被用于网上信息组织。现有词表通常都是控制词表,其基本功能就是通过同义词控制和词语之间的关

系促进更好的检索结果反馈和通过同形异意词控制来达到更高的精确度,如一些网络信息检索系统采用了《美国国会图书馆主题表》、《医学主题表》等,但这种情况并不多;

另一方面主要表现为关键词语言在网络搜索引擎的广泛使用。网站、网页的题名、地址、摘要及正文中的自然语词都可被选作关键词来建立索引数据库,用户通过检索系统的关键词检索功能获取指向相关网络信息的超链接,搜索引擎就是利用关键词语言组织网络信息资源。

主题法在网络信息组织中的应用方式有:

(1)使用关键词法组织网络信息。

(2)使用叙词法组织网络信息。

学科门户的特征

随着学科门户网站的发展,以及人们对学科门户网站研究的不断深入,可以发现学科门户网站有一些共同的特征:

(1)提供网上大量网站或文献链接的在线服务。

(2)根据特定的质量和范围标准,运用人的智力劳动过程选择资源。

(3)依靠人的智力完成内容描述。内容描述可以采用给定的关键词或受控术语,这是个很好的方法,但并非必不可少。

(4)依靠人的智力构建浏览/分类结构(不包括完全无组织的链接表)。

(5)至少部分是人工为每个资源创建(书目)元数据。

网站信息内容评估

1.影响力

①访问人次数:②访问时间:③引用比率:④所属机构权威性:

2.具体内容

3.表现形式

①美观性:②条理性:③科学性:

网站技术内容评估内容

1.性能①硬件:②软件:

2.维护

Web2.0的特征

(1)面向服务:(2)用户参与:(3)集体智慧:(4)内容聚合:(5)信息产生的多样化Web2 . 0 环境下的信息组织应注意以下几点:

(1)应该能够处理多种类型的信息资源,符合信源分布分散的实际情况。不同类型的资源需要按不同的方式予以组织。

(2)应该符合用户的需要,为用户输出有序的信息流。

(3)应该注意与新技术的结合,特别应该重视RSS、超媒体技术对信息组织的影响。在Web2.0中得到广泛使用的RSS 技术,采用了向用户”推”的原理实现信息组织。信息不仅可以拉(从信息用户的角度),而且可以推(从信息发布者的角度)。

(4)应该实现信息的深层挖掘。Web2.0的内容稂莠不齐,有价值的专业分析讨论与各种杂谈闲聊掺杂在一起,信息组织不光要把信息整理得有序化,还应该对

信息进行提炼、过滤、重组等优化策略,提高信息利用价值。

Web2.0的主要形式

(1)博客(2) 播客(3)维基(Wiki):(4)RSS

Web2.0的主要实现技术

(1)SNS SNS是一个采用P2P 技术,构建的下一代基于个人的网络基础软件

(2)TAG TAG 是由用户自由选择的对网站的内容分类和标识的关键词。

(3)Ajax Ajax是Asynchronous、JavaScript 和XML 的简称,异步交互、基于JavaScript 脚本和XML 封装数据,是Ajax的3大特征。

信息构建的层次

一般而言,IA包括4个层次,即信息获取、信息组织、信息设计、信息表达。从获取到表达使复杂信息变明晰,从大量信息到用户最终得到的有用信息,使信息可以理解,能够为需求者所用。

信息构建的内容、层次和特点

最底层的、变化速度最慢的是分类方案,它是信息构建基础环境的基础,也是建立导航系统和标识系统的基础;

内嵌式导航系统由可浏览的分类、索引和检索系统组成,它奠定了用户浏览和检索的基础。其中需要注意的是,要保证内容标引的一致性。

可操作技术(比如内容管理系统、搜索引擎、门户软件)的变化速度也是较慢的,因为它们也与内容和过程相联系。

控制词表的变化速度较快,它是“看不见”的后台部件,消除语义模糊性带来的搜索障碍。作为自然语言的集合,最简单的词表包括了某一特定领域的标准术语和等价术语,更高一级的定义了术语的等级关系,最高级的建立了概念间的关联.

适应性的查找工具得益于不断的发展,例如指南、索引和过滤选择等。

变化速度最快的一层是内容、服务和界面,这一层可以不断更新以反映组织资源现状和满足用户的需求。美国雅虎不断推出一系列新服务,使得用户可根据自己的喜好设置个性化的门户站点,界面也有相应的变化。我国的学术期刊网,改版后的界面发生了很大的变化,用户进行信息检索更为便捷。

总之,将信息构建区分为变化速度不一的6个层次,允许各层次不断发展以适应随时间不断变化的环境,从而建立一个持久的又具有适应性的信息空间结构,破破坏性创造的死循环。

信息构建的特点主要有:

①强调可用性和可视化,

②强调以用户为中心,重视用户体验

③强调多技术应用、多角度揭示。

信息构建是信息组织学科的新发展。它将现代信息技术、认知科学、图书馆学、情报学、图形设计、通信技术等多学科的知识与信息组织学科进行综合研究,为满足用户信息需求进行创新服务,它代表着当代信息组织的前沿。它不仅强调信息的序化、优化,还特别注意信息的美化,将信息的良好结构与表现形式统一成有机整体。

信息构建的原则

①人们比较容易理解与自己已经理解的事物相关的新的事物。②信息组织方式只有5种,可将其简化为LATCH,即地序法、字顺法、时序法、分类法、等级结构法。③信息表达的标准是清晰,而不是美观。④确定哪些信息值得保留,哪些信息是你真正想要的。⑤大多数信息是没用的,要勇于放弃无用信息。

信息构建的过程

①“概念设计”阶段:

②“组织信息内容”阶段:

③“生成信息结构”阶段:

④“设计信息界面”阶段:

⑤“提供信息导航”阶段:

⑥“信息展示和发布”阶段:

信息构建的方法

信息构建过程中采用两种主要的方法:自顶向下法(top-down) 和自底向上法(bottom-up)。

2 信息构建的工具

从IA 所涉及到的技术而言,信息构建过程所需要的手段这些技术工具主要包括以下内容:(1) 叙词表管理工具;(2) 自动标引软件;(3) 自动分类软件;(4) 搜索引擎技术;(5) 协作性过滤工具;(6)门户解决方案;(7) 内容管理工具;

(8) 分析软件;(9) 数据库管理工具。

网站信息构建是指借助一切信息组织、信息呈现的技术和方法,如图形设计、可用性工程、用户经验、人机交互、图书馆学信息科学中的主题法分类法等的理论方法,在用户需求分析的基础上,对网站信息进行组织、布局、优化,如设计导航系统、标签系统、索引和检索系统,以及内容布局。

网站信息构建的核心集

(1)组织系统。组织系统负责信息的分类,由它确定信息的组织方案和组织结构,对信息进行逻辑分组,并确定各组之间的关系。

(2)标识系统。标识系统负责信息内容的表述,为内容确定名称、标签或描述。包括页标题、主页上的链接、索引入口、产品名、公司名等。这些在网站上随处可见。它可以使链接与页面主题相一致。

网站信息构建的目标

具体分析主要是以下四个方面:

(1) 信息的清晰化。无论是导航、标识、组织和浏览哪一种处理方式,都应该起到如同建筑物或道路的标志牌一样的功效。

(2)信息可理解。“ 让信息可理解”是创建信息构建这样一个理念的初衷。为了保证良好的信息接收效果,信息发送者需要对信息的解释和理解的方式、特征和规律事先进行调查、分析和研究,在此基础上,将信息的内容集成,并发布到信息的传输载体和信息界面上。

(3)信息的有用性、可用性强。有用性指信息内容具有潜在的能满足用户需求的功能,可用性指通过提供的操作手段能够让用户实现他们查询、购物、学习、

娱乐等方面的需要。

(4)良好的用户体验。用户体验是指帮助用户快速和容易地在网站上完成他们任务的活动。

信息构建师的能力

(1)有效合作的能力。信息构建师通常是和一个小组的成员一起工作的,小组成员有各自不同的专业技能和学科背景,包括美术设计员、网站程序设计员、目录专家、技术交流员、可用性专家(usability expert)以及信息构建师。在所有的成员当中,信息构建师往往充当项目管理者的角色,要跟小组成员进行交流并且有效协调他们各自的工作。信息构建师需要具有与不同的人群共同工作的能力,比如各种各样的同事和客户,并且具有能够使得这个工作团队协调运作的能力。

(2)能够保持不断学习的主动性和积极性。如果想要成为一个成功的信息构建师,就要顺应技术瞬息万变的潮流,不断改变观念、扩充知识、更新技术。而且,正如前面所说的,信息构建师的知识范围是相当广泛的,在学校短短的几年时间里面很难全部掌握,需要不断地继续学习与信息构建相关的知识。

(3)适应性。信息构建师的适应性既指具有一定的灵活性和创新性,而不是照搬教条;也指能够适应新技术和新应用的发展。

信息构建师的工作主要包括以下9个方面:

①确定网站的任务和目标,用简单化的语言表达上述问题,建立可以观察的、可度量的目标。制定实现这些目标的计划。确定各个目标的解决方案;

②分析用户提出的问题,明确客户对网站的概念和看法,了解客户对网站的远景期望;

③确定网站受众(最终用户),对受众进行分类和排序;

④确定网站内容,列出内容清单;

⑤确定服务器环境,决定发布内容的技术,包括选择服务供应商以及选择服务器操作系统和软件;

⑥创建信息结构或地图,指明通向知识的适合于特定用户的个人路径,确定哪些内容将优先展示给用户,哪些内容放在网站深处,它规定了网站的受众游历网站的路线;

政府网站信息构建的四大目标是:清晰化、易理解、有用和可用、用户体验良好

编程语言种类及介绍

编程语言种类及其介绍 机器语言:纯粹的机器代码 汇编语言:8086汇编、Win32汇编、.NET的汇编 高级语言: Basic、Pascal、Object Pascal、C、C++、C#、Java、ASP、https://www.doczj.com/doc/2f18576077.html,、Perl、PHP、SQL、FORTRAN 、Visual Basic、Visual https://www.doczj.com/doc/2f18576077.html,、Delphi、Visual C++、C++ Builder、C# Builder、Visual Foxpro 等等 上面一排都是纯粹的编程语言,而下面一排都是经过发展过后的编程语言,下面我们对各种语言进行简单的介绍: 机器语言:机器语言是有0,1,0,1的二进制代码组成,可以有计算机直接执行。效率最高,但是通用性不强,对于不同的硬件需要不同的程序。说白了,不适合人来编程。 汇编语言:效率稍微低于机器语言,通过简单的助记符来替代繁琐而枯燥的0,1代码。同样的通用性不强,对于不同的硬件需要设计不同语言。学习曲线比较大,需要硬件知识很多。介于其特殊的性质,在某些行业中得到广泛的应用。 高级语言:通过人类可以识别的自然语言(主要是英语)来进行编程,效率再次降低,但是程序编制难度和可读性大幅提高。可移植性好,实用性较好。比较适合大规模开发,是现在大多数人选择的语言。而且Java语言和.NET平台的出现在一定程度上解决了由于平台的不同所导致的移植困难的情况。 ======================================= Basic 微软公司上个世纪八十年代(具体什么时候我不记得了)推出的计算机语言,当时造成了计算机软件开发世界的强烈震动,它的出现将很多程序员由枯燥的编码中解放出来,而有更多的精力来进行程序结构的开发。(因为我很早前曾经学习过这个语言,对其有一定程度的了解)但是,它同C、Pascal语言一样,是结构化语言,在对待大型开发中会觉得逐渐力不从心,程序员需要关注的内容实在太多了。其实现在来说,学习Basic已经没有什么意义了。因为它的改进版本Visual Basic和Visual https://www.doczj.com/doc/2f18576077.html,无论是在功能上还是在实用性上都大大地超过了他们的祖先。 Pascal 结构化语言,语法结构严谨,易于教学。相对于C语言,缺乏一定的灵活性。但是正是其严谨的语法,很多Pascal程序员倾心于其“诗篇一样的结构”,曾经一直是大专院校计算机专业必学的语言。它的改进版本Object Pascal和Delphi都超过了它。 Object Pascal 这是改进版的Pascal,它是面向对象的Pascal,是Delphi语言的核心。 C 上个世纪七十年代又贝尔实验室开发,当时他们是为了解决一个实际问题,将B语言改进后得到的,后来贝尔实验室又用它重写了UNIX操作系统。是所有工科学生和计算机学生必须学习的语言。它的特点很多了:贴近硬件,执行效率高,使用灵活,功能强大。但它毕竟还是结构化编程语言。在进行大型开发上显得还是有点力不从心,往往编程人员需要绞尽脑汁想出各种“精巧”的算法来实现某个目的。不过在学习操作系统和进行单片机开发上,它的作用是举足轻重的。

检索语言的分类

检索语言的分类:按照揭示和反映信息内外部特征的不同,检索语言可划分为:分类语言:以数字、字母(或字母与数字结合)为检索标识,作为有关类目的代号。 主题语言:分为标题词语言、叙词语言和关键词语言; 名称语言:以人名、地名、机构名、篇名、书名等为检索标识; 代号语言:以文献特有的顺序号(如专利号、标准号、合同号等)为检索标识 邻近位置算符(W)W是with的缩写。(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。 邻词位置算符(nw)A(nw)B,表示两个词的次序不变,其间可以插入n个词。 句子位置算符(S)S是sentence的缩写。A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 字段位置符(F)F是field的缩写。A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。 记录位置算符(C)C是citation的缩写。A(C)B 其作用等同于A and B,均表示A和B 同时出现在同一记录内,但词序不限,也不要求在同一字段内。 截词符号 常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$” 截词类型 (1)后截断,前方一致。如:“comput*”表示computer、computers、computing等。(2)前截断,后方一致。如:“*computer”表示minicomputer、microcomputer等。(3)中截断,中间一致。如:“*comput*”表示minicomputer、microcomputers等。 1 .括号改变运算顺序。 2 .引号引号内的检索项以整体形式出现。精确匹配: “”和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 3 .个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。 【实例】在某些搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。 1. 直接法(1)顺查法(2)倒查法(3)抽查法 2. 追溯法

程序与程序设计 教学设计

程序与程序设计教学设计 一、教学目标 知识目标:1、掌握计算机程序的概念 2、掌握计算机程序的概念、计算机语言分类及其特征。技能目标:通过阅读程序,学生主动探寻算法与程序的关系 情感态度与价值观:编程语言没有好坏之分,应选择适合自己的语言深入学习 二、教学重点和难点 重点:1、计算机语言的概念。 2、高级语言的特征 难点:程序的编译与解释 三、教学过程 以九歌机器人七秒成诗引入新课 (一)程序和程序设计 计算机能做很多的事情,包括各种控制活动,它们都是在程序的控制和指挥下进行的,可以这么说:离开了程序,计算机什么也干不了。 1、程序及其特征 (1)程序(Program):是一组操作的指令或语句的序列,是计算机执行算法的操作步骤。 (2)程序的特征: 一个或多个操作,每一个操作都有执行对象。

序执行。 2、程序的基本结构 (1)顺序结构 (2)选择结构 (3)循环结构 3、程序设计:从分析问题、建立模型、设计算法、编写修改程序,一直到程序正确运行的整个过程。 (二)程序设计语言 程序设计语言:是指人们编制程序所使用的计算机语言。 程序设计语言的分类: 机器语言 汇编语言 高级语言 1、机器语言 机器语言(machine language):把直接用二进制代码表示的计算机指令系统称为机器语言。 机器语言特点: ①用机器语言编写的程序可以被计算机直接执行,速度快,占用内存少。 ②编写程序相当繁琐。

③程序不具有通用性。 2、汇编语言 汇编语言(assembly language):用符号和数字来代替二进制代码的计算机语言称为汇编语言。 汇编语言特点: ①不能被计算机直接执行。 ②编写程序比机器语言方便得多。 ③程序不具有通用性。 3、高级语言 高级语言(high-level language):由一系列按一定语法规则的语句组成(与计算机内部结构无关、通用、用其编写的程序需要“翻译”后才可执行)。 高级语言特点: ①不能被计算机直接执行。 ②易读、易改,编写程序方便。 ③程序通用性好。 补充:Basic语言的发展历程 BASIC(Beginner’s All-purpose Symbolic Instruction Code的缩写,即初学者通用符号指令代码)语言简单易学,适合初学者。 BASIC语言于1964年问世作者:John.G.Kemeny 和Thomos E.Kurtz."Beginner's All-purpose Symbolic instruction Code" BASIC(第一代)

文献检索作业考试答案

名词解释: 1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。广义的文献检索包括文献的存储和文献的检索两个过程。狭义的文献检索就是找出自己所需的文献。 2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。检索的匹配就是通过检索语言的匹配来实现的。 3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。如叙词语言、单元词语言、关键词语言属此类型。 4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。 5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。 6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。 7.电子图书:又称为数字图书或Ebook,是随着电子出版、互联网以及现代通信电子技术的发展应运而生的一种新的图书形式。电子图书应具有三要素:(1)电子图书内容。(2)电子图书的数字存储设备。(3)电子图书的阅读软件。 8.网络电子图书:是以电子形式出版发型,以互联网为流通渠道、以数字内容为流通介质、以网上交易为主要支付手段的图书。 9.前方一致检索:也称为后截断检索,是指在某一检索项内容中,检索前方与检索字/词完全一致的文献。前方一致检索适用于数值索引的检索项。 10.多项双词逻辑组合检索:多项是指可以选择多个检索项;双词是指一个检索项中可以输入两个检索词(在两个输入框中输入),每个检索项中的两个词之间可进行五种组合:并且、或者、不包含、同句、同段,每个检索项中的两个检索词可以分别使用词频、最近词、扩展词;逻辑是指个检索项之间可使用逻辑与、逻辑或、逻辑非进行项间组合。 11. 双词频控制检索:是指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 12. 引文:所谓引文就是参考文献

第十章-程序设计语言

/ 程序设计语言 您现在的位置:希赛网> 云阅读> 软件设计师考试试题分类精解(2018 版)> 试题1(2017年下半年试题20) 第 10 章:程序设计语言作者:希赛软考学院来源:希赛软考学院2017年11月21日试题1(2017年下半年试题20) 更适合用来开发操作系统的编程语言是()。 (20)A.C/C++ 试题分析 现行操作系统均由C/C++开发。 试题答案 , (20)A 试题2(2017年下半年试题21) 以下关于程序设计语言的叙述中,不正确的是()。

(21)A.脚本语言中不使用变量和函数 B.标记语言常用于描述格式化和链接 C.脚本语言采用解释方式实现 D.编译型语言的执行效率更高 试题分析 脚本语言中使用变量和函数来完成程序。 试题答案 (21)A ! 试题3(2017年下半年试题22) 将高级语言源程序通过编译或解释方式进行翻译时,可以先生成与源程序等价的某种中间代码。以下关于中间代码的叙述中,正确的是()。 (22)A.中间代码常采用符号表来表示 B.后缀式和三地址码是常用的中间代码 C.对中间代码进行优化要依据运行程序的机器特性 D.中间代码不能跨平台 试题分析 B只是类似于三地址码, CD与具体的机器无关。 试题答案 (22)A

% 试题4(2017年下半年试题48) 编译过程中进行的语法分析主要是分析()。 (48)A.源程序中的标识符是否合法 B.程序语句的含义是否合法 C.程序语句的结构是否合法 D.表达式的类型是否合法 试题分析 语法分析主要是分析数据类型是否合法。 试题答案 (48)D 试题5(2017年下半年试题49) — 某确定的有限自动机(DFA)的状态转换图如下图所示(0是初态,4是终态),则该DFA能识别()。

情报检索语言研究综述

情报检索语言研究综述 80国家图书馆学刊2004年第3期(总第49期) 画被瀛 情报检索语言研究综述 沙淑欣 摘要从人工语言研究,自然语言研究,网络情报检索语言研究,自然语言与人工语言一体化研 究,兼容与互换问题研究及其他方面问题的研究六个方面对2000年至今有关检索语言方面 的文章 进行梳理,以呈现新世纪情报检索语言研究的全貌.参考文献36. 关键词情报检索语言人工语言自然语言网络环境兼容 分类号G254.0 检索语言是信息交流的工具,是知识组 织的中心环节,是信息用户开启信息资源的 钥匙,其重要性得到学术界及全社会的普遍 重视.有关检索语言的研究一直是图书情报 学,语言学,计算机科学共同关注的领域.现 对2000年至今有关检索语言方面的120余 篇(不包括《中图法》方面的文章)学术论文进 行梳理,以明确新世纪情报检索语言研究的 现状,成就,热门研究课题及其发展趋势. 1人工语言研究

对于高要求的检索来说,控制是绝对必 要的.人工语言就是对概念及其标识系统实 施严格规范的检索语言.人工语言按其结构 原理可分为主题语言,代码语言三分类语言, 种类型.近四年来对这方面研究的文章较 少,且主要集中在网络环境下的知识分类组 织,情报检索语言发展趋势,分类主题一体化 以及对《中图法》的研究上. 1.1分类法理论与实践研究 情报检索语言中的受控语言最初是为克 服很早就被纳入了情报检索语言系统的自然 语言的不足而产生的?.自汉代刘向,刘歆 的《七略》算起,图书分类法已经有2000多年悠久的历史,而且分类语言是现今所有情报 检索系统中使用最普遍的一种检索语言.新 世纪,除少量文章对国内外其他分类法做比 较粗浅概略的介绍外,大多数文章围绕《中图法》展开.据不完全统计,相关文章有360多篇,包括《中图法》与其他分类法的比较研究; 各学科文献分类研究;《中图法》类目复分,组配技术,标记体系,类目修订,类目注释等研 究.韩立栋在《<中图法>(第四版)问题述评》一文中,分析了《中图法》(第四版)中存在的类名问题,仿分问题,沿革注释问题,总论

计算机编程语言如何分类

计算机有哪些编程语言_计算机编程语言如何分类 计算机编程语言分类 第一代机器语言 机器语言是由二进制0、1代码指令构成,不同的CPU具有不同 的指令系统。机器语言程序难编写、难修改、难维护,需要用户直 接对存储空间进行分配,编程效率极低。这种语言已经被渐渐淘汰了。 第二代汇编语言 汇编语言指令是机器指令的符号化,与机器指令存在着直接的对应关系,所以汇编语言同样存在着难学难用、容易出错、维护困难 等缺点。但是汇编语言也有自己的优点:可直接访问系统接口,汇 编程序翻译成的机器语言程序的效率高。从软件工程角度来看,只 有在高级语言不能满足设计要求,或不具备支持某种特定功能的技 术性能(如特殊的输入输出)时,汇编语言才被使用。 第三代高级语言 高级语言是面向用户的、基本上独立于计算机种类和结构的语言。其最大的优点是:形式上接近于算术语言和自然语言,概念上接近 于人们通常使用的概念。高级语言的一个命令可以代替几条、几十 条甚至几百条汇编语言的指令。因此,高级语言易学易用,通用性强,应用广泛。 第四代非过程化语言 4GL是非过程化语言,编码时只需说明“做什么”,不需描述算 法细节。 数据库查询和应用程序生成器是4GL的两个典型应用。用户可以用数据库查询语言(SQL)对数据库中的信息进行复杂的操作。用户只 需将要查找的内容在什么地方、据什么根条件进行查找等信息告诉

SQL,SQL将自动完成查找过程。应用程序生成器则是根据用户的需 求“自动生成”满足需求的高级语言程序。真正的第四代程序设计 语言应该说还没有出现。所谓的第四代语言大多是指基于某种语言 环境上具有4GL特征的软件工具产品,SystemZ、如PowerBuilder、FOCUS等。第四代程序设计语言是面向应用,为最终用户设计的一 类程序设计语言。它具有缩短应用开发过程、降低维护代价、最大 限度地减少调试过程中出现的问题以及对用户友好等优点。 程序设计语言分类 一、从应用角度分类 从应用角度来看,高级语言可以分为基础语言、结构化语言和专用语言。 (1)基础语言 基础语言也称通用语言。它历史悠久,流传很广,有大量的已开发的软件库,拥有众多的用户,为人们所熟悉和接受。属于这类语 言的有FORTRAN、COBOL、BASIC、ALGOL等。FORTRAN语言是目前国 际上广为流行、也是使用得最早的一种高级语言,从20世纪90年 代起,在工程与科学计算中一直占有重要地位,备受科技人员的欢迎。BASIC语言是在20世纪60年代初为适应分时系统而研制的一 种交互式语言,可用于一般的数值计算与事务处理。BASIC语言结 构简单,易学易用,并且具有交互能力,成为许多初学者学习程序 设计的入门语言。 (2)结构化语言 20世纪70年代以来,结构化程序设计和软件工程的思想日益为 人们所接受和欣赏。在它们的影响下,先后出现了一些很有影响的 结构化语言,这些结构化语言直接支持结构化的控制结构,具有很 强的过程结构和数据结构能力。PASCAL、C、Ada语言就是它们的突 出代表。 PASCAL语言是第一个系统地体现结构化程序设计概念的现代高 级语言,软件开发的最初目标是把它作为结构化程序设计的教学工

老年痴呆症的分类介绍

老年痴呆症分为以下4种,血管性痴呆、额颞叶痴呆、路易体痴呆、混合性痴呆。 什么是血管性痴呆? 血管性痴呆(VaD)是与脑血管因素有关的痴呆统称。疾病病因主要是脑内血管病变,即颈动脉与椎基底动脉两大系统。可以是这些血管本身的病变,也可以是颅外大血管及心脏的病变,间接影响脑内血管,供血不足而致脑组织缺血缺氧性改变,最终使大脑功能全面衰退。 血管性痴呆分类 VaD的神经病理分类包括缺血性和出血性脑损害所致的痴呆、低血氧-低灌流性痴呆。 多发性脑梗死性痴呆(MID) MID定义为大血管阻塞所导致的大面积梗死,尤其是多发生在内环状动脉或Willis环及其它主要大脑动脉上。 关键性梗死性痴呆 关键性梗死性痴呆是由重要皮质、皮质下功能区域的几个小面积梗死灶,有时甚至是单个梗死病灶所引起。最为人们所知的是双侧丘脑梗死导致的具额叶特征的痴呆,其它关键部位如角回、基底前脑-基底下丘脑结构、带状回的病灶也可导致痴呆。 小血管性痴呆 小血管疾病引起的损害可以是皮质性的,也可是皮质下的。皮质下梗死可出现在丘脑背内侧核,尾状核,额叶皮质和上述结构在白质的联系通路等部位。发生在基底节和脑桥的多发性腔隙性梗死可出现假性球麻痹,额叶皮质的多发性腔隙性梗死可产生伴额叶体征的痴呆综合征。Binswanger病(Binswanger disease,BD)是一种较为常见的小血管性痴呆,临床表现为进行性、隐匿性发展的痴呆,常伴明显的意志缺失,情感和行为改变(激越,易激惹,抑郁,欣快,情感失禁),注意力不集中,精神运动迟缓,假性球麻痹和一些皮质症状(如步态不稳,尿失禁,帕金森症等)。病理改变为脑室周围白质的广泛性脱髓鞘病变与多发性腔隙灶共存,伴星形胶质细胞增生。严重病理中,整个白质近乎消失,仅存未受损的短弓状纤维。 低血氧-低灌流性痴呆 痴呆也可在缺血状态下的弥漫性大脑损害或局限性大脑损害(因局部脑组织对缺血的选择性易感性所致)后出现。痴呆可能由继发于心脏骤停或严重低血压的脑缺血性损害,血液

检索工具的分类

1.检索工具的分类 (1)按照信息搜集方法分类 按照信息搜集方法的不同,搜索引擎系统可以分为三大类: 1)目录式搜索引擎(Directory Search Engine) 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory. 2)机器人搜索引擎(Crawler-Based Search Engine) 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google. 3)元搜索引擎(Meta Search Engine) 这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket. 目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索"便搜索人工分类库,选择"网页搜索"便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有"门户化"的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的"网络门户". (2)按照检索软件分类 按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。 全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。 非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。 主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。 (3)按照检索语言分类 目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。 2.全文数据库的检索软件 (1)Alta Vista 检索引擎 Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库,Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的

程序和程序设计语言(教学设计)

第 3 节程序和程序设计语言 、教学目标 知识目标:1、掌握计算机程序的概念 2、掌握计算机程序的概念、计算机语言分类及其特征。 技能目标:通过阅读程序,学生主动探寻算法与程序的关系 情感态度与价值观:编程语言没有好坏之分,应选择适合自己的语言深入学习 二、教学重点和难点 重点:1、计算机语言的概念。 2、高级语言的特征 难点:程序的编译与解释 三、教学过程 以九歌机器人七秒成诗引入新课 一)程序和程序设计 计算机能做很多的事情,包括各种控制活动,它们都是在程序的控制和指挥下进行的,可以这么说:离开了程序,计算机什么也干不了。 1、程序及其特征 (1)程序(Program):是一组操作的指令或语句的序列,是计算机执行算法的操作步骤。 2)程序的特征: 解决问题的每一个算法步骤对应着程序中的一个或多个语句实现一个或多个操作,每一个操作都有执行 对象。 在程序中被施行操作的对象称为数据。 除了有特殊的程序转向控制语句外,程序都是从第一条语句开始顺序执行。 2、程序的基本结构 1)顺序结构2)选择结构3)循环结构 3、程序设计:从分析问题、建立模型、设计算法、编写修改程序,一直到程序正确运行的整个过程。 (二)程序设计语言 程序设计语言:是指人们编制程序所使用的计算机语言。 程序设计语言的分类: 机器语言汇编语言高级语言

1、机器语言 机器语言(machine Ianguage):把直接用二进制代码表示的计算机指令系统称为机器 语言。 机器语言特点: ①用机器语言编写的程序可以被计算机直接执行,速度快,占用内存少。 ②编写程序相当繁琐。 ③程序不具有通用性。 2、汇编语言 汇编语言(assembly Ianguage):用符号和数字来代替二进制代码的计算机语言称为汇 编语言。 汇编语言特点: ①不能被计算机直接执行。 ②编写程序比机器语言方便得多。 ③程序不具有通用性。 3、高级语言 高级语言(high-level Ianguage ):由一系列按一定语法规则的语句组成(与计算机内部结构无关、通用、用其编写的程序需要“翻译”后才可执行) 咼级语言特点: ①不能被计算机直接执行。 ②易读、易改,编写程序方便。 ③程序通用性好。 补充:Basic语言的发展历程 BASIC ( Beginner' s All-purpose Symbolic Instruction Code 的缩写,即初学者通用符号指令代码)语言简单易学,适合初学者。

(完整版)言语障碍的分类

一、失语症 失语症是言语获得后的言语障碍,是由于大脑损伤所引起的言语功能受损或丧失,常常表现为听、说、读、写、计算等方面的障碍。成人和儿童均可发生。 二、构音障碍 凡是参与言语运动的任何环节的器质性障碍、言语运动不协调都可以引起构音障碍。可以把构音障碍分为(中枢性构音障碍)、器质性构音障碍和功能性构音障碍。 三、听力障碍所致的言语障碍 听力损失是造成语言学习和应用障碍的最直接原因。听力损失严重,对言语发展越不利。从言语康复的预后看,鉴别听觉障碍出现在获得言语之前或是获得言语之后尤为重要。根据听力受损时间可将听力障碍分为先天性听力损失和后天性听力损失。 四、发育性言语障碍 儿童语言发育迟缓是指儿童在生长发育过程中其言语发育落后于同年龄其他儿童的情况。最常见的病因有大脑功能发育不全、自闭症等。这类儿童的大多数通过语言训练虽然不以达到正常儿童的言语发育水平,但是通过言语治疗可以尽量发挥其现有的和被限制的言语能力,不仅言语障碍会有很大程度的改善,还能促进患儿的社会适应能力。 五、脑瘫引起的言语障碍 脑性瘫痪,简称脑瘫,是指出生前到出生1个月内大脑发育过程中各种致病因素所致的非进行性脑损伤综合症,以中枢神经性运动障碍及姿势异常为主要表现,并常伴有不同程度的精神发育迟滞、智力障碍、癫痫、言语及视觉、听觉、行为和感知异常等多种障碍。常见病因有脑缺氧、感染、外伤等。 脑瘫患儿的脑损伤可直接损害语言脑区,而合并的视觉、听觉等感觉系统异常、智能异常、口运动异常等,使言语的输入、输出和中枢处理过程不同程度地受损,限制了正常模式的语言发育,而家庭和社会对患儿的失望及不适当的补偿更促成言语障碍的发生。脑瘫儿童的言语障碍可根据其不同的表现归纳为以下几类:构音障碍、语言发育迟缓迟滞以及听觉障碍所导致的言语障碍等。 六、口吃 口吃是人类的一种言语流畅性障碍。世界成人1%是口吃者,我国儿童口吃患病率约为5%。不论何种文明也不论何种文化与语言都可能有口吃发生。同卵双生的口吃共患率比异卵双生的共患率要高,这表明遗传因素起着作用。另外研究发现口吃者男性居多。 部分儿童是在言语发育过程中不慎学习了口吃,或与遗传以及心理障碍等因素有关。口吃常表现为在辅音、元音及单词的发音方面出现重复、拖音及不适当的停顿,属言语流利障碍。部分儿童可随着成长自愈;没有自愈的口吃常常伴随至成年,但经过科学的矫正与训练,完全可以达到正常人说话水平

检索语言

一、名词解释 查全率 是指系统在进行某一检索时 检出的相关文献量与系统文献库中相关文献总量的比率 它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。 检索语言 是根据信息检索的需要创造出来的一种人工语言 是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 标题词法是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。标题词指经过词汇控制,用来标引文献的词或词组,通常为比较定型的事物名称。 信息素质:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的一系列能力的总和。 二、简答题 1.简述检索语言的基本功能 答: 1) 对文献的信息内容(及某些外表特征)加以标引的功能。要求利用检索语言能够正确标引文献信息内容及其外表特征。 2) 集中文献的功能。对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率。 3) 信息组织的功能。对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索。 4) 一致性功能。便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性。 5) 获得最高查全率和查准率的功能。保证检索者在按不同需要检索文献时,都能获得最高的查全率和查准率。 6) 桥梁和纽带功能。在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,以提高信息检索的准确性。2.分类检索语言的作用 答: ①这是进行分类标引和组织分类检索工具的规范。②它能作为对文献资料进行分类排架的依据。但在档案机构一般要采用另一种类型的分类体系来组织分类排架。③它是检索者从分类途径检索文献资料的指南。④它是文献工作者工作中常用的参考手册。 三、文献信息检索

程序设计语言分为三大类

程序设计语言分为三大类 程序设计语言通常分为:机器语言、汇编语言、高级语言三类。 三者的区别如下: 一、定义不同 1、机器语言 机器语言是最底层的语言,只有“0”和“1”,二进制语言,就像开关一样,0是关,1是通过。一句话,就是写出一串串由“0”和“1”组成的指令序列交由计算机执行,这种语言,就是机器语言。 2、汇编语言 汇编语言指令是机器指令的符号化,与机器指令存在着直接的对应关系。通常用一些简洁的英文字母、符号串来替代一个特定的指令的二进制串,比如,用“A D D”代表加法,“M O V”代表数据传递等等。 3、高级语言

高级语言是面向用户的、基本上独立于计算机种类和结构的语言。高级语言的一个命令可以代替几条、几十条甚至几百条汇编语言的指令。 二、语言类型不同 1、机器语言是纯粹的二进制数据表示的语言,是电脑可以真正识别的语言。汇编语言和高级语言经过编译连接最终都会变成机器语言才能被CPU识别和运行。 2、汇编语言是以人们比较熟悉的词句直接表述CPU动作形成的语言,是最接近CPU运行原理的较为通俗的比较容易理解的语言。 3、高级语言,是以“人”的思维逻辑来描述电脑运行的语言,完全脱离了CPU的“思维”模式,所以可移植性很高。 三、与计算机的相关程度 1、机器语言是机器能够直接识别的语言,能够直接作用在计算机上。 2、汇编语言程序与处理器指令系统密切相关,程序员可直接、有效

地控制系统硬件,形成的可执行文件运行速度快、占用主存容量少。汇编语言与处理器密切相关,且语言程序的通用性、可移植性较差。 3、高级语言与具体计算机无关,不针对具体计算机系统。高级语言程序可以在多种计算机上编译后执行,可以直接、有效地控制计算机硬件,易于产生速度快、容量小的高效率目标程序。

(完整版)言语和语言障碍的分类

言语和语言障碍的分类 一、分类 关于言语和语言障碍的分类问题,目前尚有争议。国内学者一般采取两种分类方法:一种是把言语障碍和语言障碍合并,统称为言语障碍(或交往障碍),而后再分为构音障碍、声音障碍、口吃和语言障碍四大类;另一种是把言语障碍和语言障碍分开,前者再分为构音障碍、声音障碍、口吃三大类,后者分为失语症和语言发展迟缓两大类。在这里,我们采用后一种分类方法。下面简要地介绍各类言语和语言障碍的主要表现及产生的原因。 (一)构音障碍 构音障碍,又称为发音障碍,指的是发音器官在发某个或是某些元音音位、辅音音位或是声调音位的语音时发生异常。 构音障碍是最常见的言语障碍之一,其表现形式主要是以下四种: 1、增音即增加不应该有的音素。例如,将“三”san 发成sang;将“害怕”发成“haipia”。 2、遗漏说话时漏掉了某些或某个应该有的音素。例如,将“剪刀”发成jian ao,漏掉了“d”这个音素;将“月亮”发成yue yang,亮的发音中漏掉了”l“这个因素。 3、歪曲把一个音位发成该语音系统中没有的音位

而出现走音现象。 4、替换把一个音位发成该语音系统中的另一个音位,例如,把“电视”发成“tian shi”,“d”被“t”所替换。 构音障碍产生的原因是多种多样的,有解剖、生理方面的原因,也有心理和环境方面的原因。能引起构音障碍的解剖和生理方面的原因主要包括唇裂、腭裂、舌系带短、上下齿咬合不良、软腭麻痹、发音器官肌肉运动不协调等。心理方面的原因主要包括不同程度的听力损失、语音分辨能力差、发音器官的运动觉障碍、听觉记忆广度过窄、发育迟缓、情绪障碍等。另外,如果在音位习得阶段,儿童处在不利于习得正确发音的语言环境中,也容易引起构音障碍。 (二)声音障碍 声音障碍是指说话的音高、音量或是音质出现异常。 1、音高异常即说话的频率过高或是过低,声音与说话人的年龄、性别等不相符。例如,一个成年男性仍像一年级小学生那样用很尖的声音说话就会被认为不正常。而一个女性用很低的嗓音说话,也会让人感觉不舒服。此外,如果说哈的音调平直而单调,缺少起伏变化,这种情况也属于音高异常。 造成声音过高的原因之一是因职业需要不得不提高嗓音,久而久之便成为一种习惯。另一种原因是有些男孩没有

当今搜索引擎技术及发展趋势

当今搜索引擎技术及发展趋势 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球目前的网页超过8亿,有效数据超过9T,并且仍以每4个月翻一番的速度增长。用户要在如此浩瀚的信息海洋里寻找信息,必然会“大海捞针”无功而返。搜索引擎正是为了解决这个“迷航”问题而出现的技术。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。搜索引擎技术因而成为计算机工业界和学术界争相研究、开发的对象。一、分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。这类搜索引擎的代表是:、LookSmart、Open Directory、Go Guide等。2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:“天网”、悠游、OpenFind等。3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。二、性能指标我们可以将WEB信息的搜索看作一个信息检索问题,即在由WEB 网页组成的文档库中检索出与用户查询相关的文档。所以我们可以用衡量传统信息检索系统的性能参数-召回率(Recall)和精度(Pricision)衡量一个搜索引擎的性能。召回率是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统(搜索引擎)的查全率;精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统(搜索引擎)的查准率。对于一个检索系统来讲,召回率和精度不可能两全其美:召回率高时,精度低,精度高时,召回率低。所以常常用11种召回率下11种精度的平均值(即11点平均精度)来衡量一个检索系统的精度。对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的WEB网页,所以召回率很难计算。目前的搜索引擎系统都非常关心精度。影响一个搜索引擎系统的性能有很多因素,最主要的是信息检索模型,包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制三、主要技术一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。 1.搜索器搜索器的功能是在互联网中漫游,发现和搜集信息。它常常是一个计算机程序,日夜不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死连接和无效连接。目前有两种搜集信息的策略:从一个起始URL集合开始,顺着这些URL 中的超链(Hyperlink),以宽度优先、深度优先或启发式方式循环地在互联网中发现信息。这些起始URL 可以是任意的URL,但常常是一些非常流行、包含很多的站点(如!)。将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。搜索器搜集的信息类型多种多样,包括HTML、XML、Newsgroup文章、FTP文件、字处理文档、多媒体信息。搜索器的实现常常用分布式、并行计算技术,以提高信息发现和更新的速度。商业搜索引擎的信息发现可以达到每天几百万网页。2.索引器索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。

语言障碍知识

语言障种类繁多,今天为大家介绍一下脑性语障的分类。 一、语音障碍 语音障碍发病于儿童9岁之前。不能正确说单词的正常发展幼儿不属于语音障碍。这种障碍的原因尚未明了,但是某些原因是儿童不能理解他(她)语言发声时的规则。儿童发出的言语声音与其年龄和文化不相符。儿童似乎不能理解如何区分和发出语言的音素或声音来组成一个可被理解的词语。 100个孩子中约有4或5个孩子发生障碍,并且男孩多于女孩。 从概念上很难将语音障碍与发音障碍区分开来。发音障碍儿童只是难以正确发出声音;而语音障碍儿童似乎不能很好地理解语言的声音。他(她)可能不理解声音的独特性以及声音间的差异,从而在发出言语声音的方式上存在问题。例如,不理解词尾辅音的儿童就会把“hat”发成“ha”,把“dog”发成“do”。 语音对于读写能力是至关重要的。学习阅读需要理解字母法则一,也就是系统地组合字母来代表声音,而这些声音组合起来可以构成单词。语音意识是对语言声音结构的理解;它包含将声音组合成单词的能力、将单词分割成声音的能力,以及处理口语声音的能力。没有语音意识,学生就不能理解字母原则,也就无法解码单词。并非所有语音障碍儿童都缺乏语音意识。有些儿童在口语工作记忆上(记住已经说过的和他们想要说的内容)或者单词学习和单词提取上存在严重问题。工作记忆和单词提取的缺陷被认为是一种语音加工障碍。 语音障碍出现时可能伴有其他障碍。有许多不同的语音理论和替代性分类系统,我们在这里无法一一阐述;这些足以说明语音障碍表明儿童对语言声音系统的理解无法与其年龄及文化相符。语音障碍会影响言语声音的生成,通常也会影响读写能力。 二、发音障碍 发音障碍是指发声时出现错误。该障碍从本质上说并非一种语音障碍,而是个体遗漏、替换、歪曲或增加言语声音的障碍。比如口齿不清,包括替换或者歪曲/s/这个音。遗漏、替换、增加单词声音或者发音质量较差可能会让说话者很难被理解甚至无法被理解。言语发音上的这些错误也会带来严重的社会性惩罚,让说话者受到嘲笑或奚落。 何时将发音错误视作一种障碍?这取决于临床医生客观的诊断,这种诊断受到经验、错误数量及类型、错误一致性、说话者的年龄和发展特征,以及个体言语的可理解性的影响。

检索工具分类

1.检索工具的分类(1)按照信息搜集方法分类按照信息搜集方法的不同,搜索引擎系统可以分为三大类:1)目录式搜索引擎(Directory Search Engine)以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入(维护工作量大)、信息量少、信息更新不及时。这类搜索引擎的代表是:Yahoo!、LookSmart、Ask Jeeves、Snap、Open Directory。2)机器人搜索引擎(Crawler-Based Search Engine)由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google。3)元搜索引擎(Meta Search Engine)这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量大,缺点是不能够充分使用元搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是WebCrawler、InfoMarket。目前,商业的搜索引擎站点正在结合各种搜索引擎的优点,在类型上有逐渐融合的趋势。例如,Yahoo!在保持人工分类的同时,使用Inktomi的机器人搜索引擎,用户查询时,如果选?quot;网站搜索”便搜索人工分类库,选择”网页搜索”便搜索机器人搜索引擎的索引库。一些传统的机器人搜索引擎也增加了人工分类的内容,以提供高精度的导航信息。另外搜索引擎站点有”门户化”的倾向,在提供搜索服务的同时,提供多样的网络服务,如新闻、股票、天气预报、虚拟社区、游戏、电子商务等等,成为名副其实的”网络门户”。(2)按照检索软件分类按照服务提供方式的不同,检索软件也可以分为三大类:全文数据库检索软件、非全文数据库检索软件、主题指南类检索软件。全文数据库检索软件正常运作的前提是网站拥有大量的信息,因此必须依靠强大的数据库作为后盾。它能够提供完整的文献和信息检索,查全率很高。但由于信息量非常大,检索起来比较困难,对检索技术的要求很高。非全文数据库检索软件具有速度快、使用简便、索引量大的特点,但仅提供部分全文检索,有时需要二次检索,感到不太方便。主题指南类检索软件是目前网络检索中最常用的检索软件。这种软件查准率高、速度快、使用方便。现大部分网站都具备主题指南类检索功能。(3)按照检索语言分类目前,因特网几乎使用了世界所有语言。每一种语言都形成了自己独特的检索体系。比较常用的语言有英文、法文、德文、日文、俄文、中文等。2.全文数据库的检索软件(1)Alta Vista 检索引擎Alta Vista检索引擎为数字设备公司(DEC)开发,号称是目前最大的Web索引数据库。Alta Vista检索引擎提供两种检索方法:简单检索和高级检索。高级检索包括了简单检索的所有特性,还允许使用布尔运算符和接近操作符、括号等,查找的结果按关键词排序。Alta Vista总能返回有用的信息,但由于没有对内容进行选择,它的”信噪比”也是最大的。使用Alta Vista检索引擎时应注意:要进行有效的检索,最好尽可能多而精确地输入描述所感兴趣的主题的词或词组。提供的词组越精确,检索结果就越好。如果你输入的词包含大写字母,则检索对大小写就比较敏感。如输入Telephone 则只检索含有这个词的内容,而输入telephone 则不论大小写都检索。如果要把一些词作为词组或一个整体来查询时,最好把它们加上双引号。如果要求特定单词包含在索引的文档中,可以在它前面加一个”+”号,如:+Telephone,并且在”+”号和单词之间不能有空格。相应的,如果要排除含有特定单词的文档,可以在它前面加一个”-”号,如-cool。进行简单查找的时候,可以在单词的末尾加一个通配符来代替任意的字母组合(最多可代替5个小写的

相关主题
文本预览
相关文档 最新文档