当前位置:文档之家› 军事领域中概念抽取及其应用

军事领域中概念抽取及其应用

第7卷第4期2016年8月

指挥信息系统与技术

Command Information System and Technology

Vol.7 No.4

Aug.2016

?实践与应用?doi:10. 15908/https://www.doczj.com/doc/0b14766562.html,ki.cist.2016. (M.012

军事领域中概念抽取及其应用

郑玄蒋锴钱夔徐俊瑜

(中国电子科技集团公司第二十八研究所南京210007)

摘要:在军事领域的概念抽取中,以军事领域核心概念作为种子概念扩充了领域概念,并提出了基于核心概念结构的候选概念评价方法。该方法利用核心概念表征的不同语义范围,对语料进行层次聚类,计算不同层次细粒度的统计特征,对候选概念的领域归属度进行评价,避免语料分布不均匀造成候选概念的归属度差异。试验表明,该方法在一定程度上提升了准确率和召回率,通过不 同细粒度的领域相关度和领域一致度统计特征,优化候选概念的抽取和排序,可应用于概念集^广充和概念推荐等场景。

关键词:概念抽取;领域相关度;领域一致度;核心概念结构

中图分类号:TP391 文献标识码:A文章编号:1674-909X(2016)04-0072-05

Concept Extraction and Its Application in Military Domain

ZHENG Xuan JIANG Kai QIAN Kui XU Junyu

(T he 28th Research Institute of China Electronics Technology G roup C orporation, Nanjing 210007, China) Abstract:Aimed at concept extraction in military domain,a domain concept is expanded by tak-ing the core concepts of military domain as the seed concepts.An evaluation method for candidate concepts based on structure of the core concept is proposed.Utilizing different semantic ranges represented by the core concepts,the method clusters the corpuses in the hierarchies and calcu-lates fine-grained statistical characteristics in the different hierarchies.Then,the domain consis-tency and the relevancy of the candidate concepts are evaluated to avoid the gap caused by uneven corpuses.Experimental results show that the method improves the precession and the recall rate. With the different fine-grained statistical characteristics of the domain consistency and the rele-vancy,the method can optimize the extraction and the sorting of the candidate concepts,thus it can be applied in the concept set expansion and the concept recommendation.

Key words:concept extraction;domain relevancy;domain consistency;core concept structure

〇引言

本体(Ontology)概念起源于哲学领域,用于解 释或说明客观存在的系统。在人工智能领域,Neches[1]将本体定义为给出构成相关领域词汇的 基本术语和关系,以及利用这些术语和关系构成的 规定这些词汇外延的规则定义。最著名并被广泛引 用的定义由Gmber[2]提出,他认为本体是概念模型 的明确规范说明。

本体作为知识表达的共享模型概念,在知识工程、知识管理、信息检索、数字图书馆和语义网(Se-mantic Web)等众多领域扮演重要角色。本体对概

念化空间内知识进行明确表示和规范描述,提供人 与机器间对信息结构的共同理解,实现对领域知识 的推理。知识工程是以知识为基础的系统,是使用

智能软件建立的专家系统。

WebOnto,Prot6g6,OntoEdit 及 KAON 等本 体构建工具也随着本体定义的发展而发展。借助本 体构建工具,研究人员可不必了解本体描述语言细 节,根据本体内容即可构建本体,但本体内容仍依赖

收稿日期:2015-07-01

相关主题
文本预览
相关文档 最新文档