当前位置:文档之家› 生物医学文本中药物信息抽取方法研究

生物医学文本中药物信息抽取方法研究

哈尔滨工业大学工学博士学位论文

目录

摘要.............................................................................................I ABSTRACT......................................................................................III

第1章绪论 (1)

1.1课题背景及意义 (1)

1.2国内外研究现状 (3)

1.2.1信息抽取概述 (3)

1.2.2通用领域命名实体识别研究现状 (6)

1.2.3通用领域实体关系抽取研究现状 (8)

1.2.4生物医学领域药物名识别研究现状 (11)

1.2.5生物医学领域药物相互作用关系抽取研究现状 (18)

1.3本文研究内容及创新点 (22)

1.3.1研究内容 (22)

1.3.2主要创新点 (24)

1.4本文内容安排 (25)

第2章基于多语义特征融合的药物名识别方法 (26)

2.1引言 (26)

2.2基于多语义特征融合的药物名识别 (27)

2.2.1Skip-gram模型 (27)

2.2.2特征抽取 (30)

2.2.3药物名标注 (33)

2.2.4后处理 (34)

2.2.5基于多语义特征融合的药物名识别算法描述 (35)

2.3实验与分析 (36)

2.3.1药物名识别实验数据 (36)

2.3.2评价准则 (37)

2.3.3实验设置 (38)

2.3.4实验结果与分析 (38)

2.4本章小结 (42)

-VI-

目录

第3章基于特征组合与特征选择的药物名识别方法 (44)

3.1引言 (44)

3.2面向药物名识别的特征生成框架 (44)

3.2.1简单特征模板 (45)

3.2.2特征组合 (46)

3.2.3特征选择 (47)

3.3基于特征组合与特征选择的药物名识别算法 (51)

3.4实验与分析 (51)

3.4.1实验数据与设置 (51)

3.4.2实验结果与分析 (51)

3.5本章小结 (56)

第4章基于文本序列卷积神经网络的药物相互作用关系抽取方法 (57)

4.1引言 (57)

4.2药物相互作用关系抽取任务描述 (58)

4.3基于文本序列卷积神经网络的药物相互作用关系抽取 (60)

4.3.1数据预处理 (60)

4.3.2文本序列卷积神经网络模型 (62)

4.4实验与分析 (64)

4.4.1药物相互作用关系抽取实验数据 (64)

4.4.2评测方法 (66)

4.4.3实验设置 (66)

4.4.4实验结果与分析 (67)

4.5本章小结 (72)

第5章基于依存结构卷积神经网络的药物相互作用关系抽取方法 (73)

5.1引言 (73)

5.2依存句法树 (74)

5.3基于依存结构卷积神经网络的药物相互作用关系抽取 (77)

5.3.1数据预处理 (77)

5.3.2依存结构卷积神经网络模型 (77)

5.4基于候选关系实例长度的组合方法 (80)

5.5实验与分析 (81)

5.5.1实验设置 (81)

5.5.2实验结果与分析 (83)

-VII-

哈尔滨工业大学工学博士学位论文

5.6本章小结 (87)

结论 (88)

参考文献 (90)

攻读博士学位期间发表的论文及其他成果 (107)

哈尔滨工业大学学位论文原创性声明和使用权限 (108)

致谢 (109)

个人简历 (111)

-VIII-

Contents

Contents

Abstract(In Chinese)..........................................................................I Abstract(In English)..........................................................................III

Chapter1Introduction (1)

1.1Background and motivation (1)

1.2Related work (3)

1.2.1Overview of information extraction (3)

1.2.2Related work on named entity recognition in general domain (6)

1.2.3Related work on relation extraction in general domain (8)

1.2.4Related work on drug name recognition in biomedical domain (11)

1.2.5Related work on drug-drug interaction extraction in biomedical domain..18 1.3Research contents and main contributions of this thesis (22)

1.3.1Research contents (22)

1.3.2Main contributions (24)

1.4Organization of this thesis (25)

Chapter2Drug name recognition method based on fusion of multiple seman-tic features (26)

2.1Introduction (26)

2.2Drug name recognition based on fusion of multiple semantic features (27)

2.2.1Skip-gram model (27)

2.2.2Feature extraction (30)

2.2.3Drug name labeling (33)

2.2.4Postprocessing (34)

2.2.5Description of drug name recognition algorithm based on fusion of mul-

tiple semantic features (35)

2.3Experiments and analysis (36)

2.3.1Experimental data set for drug name recognition (36)

2.3.2Evaluation criteria (37)

2.3.3Experimental settings (38)

-IX-

哈尔滨工业大学工学博士学位论文

2.3.4Experimental results and discussions (38)

2.4Summary of this chapter (42)

Chapter3Drug name recognition method based on feature conjunction and feature selection (44)

3.1Introduction (44)

3.2Drug name recognition oriented feature generation framework (44)

3.2.1Simple feature templates (45)

3.2.2Feature conjunction (46)

3.2.3Feature selection (47)

3.3Description of the algorithm for drug name recognition based on feature con-

junction and feature selection (51)

3.4Experiments and analysis (51)

3.4.1Experimental data set and settings (51)

3.4.2Experimental results and discussions (51)

3.5Summary of this chapter (56)

Chapter4Text sequence-based convolutional neural network for drug-drug interaction extraction (57)

4.1Introduction (57)

4.2Description of drug-drug interaction extraction (58)

4.3Text sequence-based convolutional neural network for drug-drug interaction

extraction (60)

4.3.1Data preprocessing (60)

4.3.2Text sequence-based convolutional neural network (62)

4.4Experiments and analysis (64)

4.4.1Experimental data set for drug-drug interaction extraction (64)

4.4.2Evaluation method (66)

4.4.3Experimental settings (66)

4.4.4Experimental results and discussions (67)

4.5Summary of this chapter (72)

Chapter5Dependency-based convolutional neural network for drug-drug in-teraction extraction (73)

5.1Introduction (73)

5.2Dependency parsing tree (74)

-X-

Contents

5.3Dependency-based convolutional neural network for drug-drug interaction

extraction (77)

5.3.1Data preprocessing (77)

5.3.2Dependency-based convolutional neural network (77)

5.4Combined method for drug-drug interaction extraction based on the lengths

of candidate instances (80)

5.5Experiments and analysis (81)

5.5.1Experimental settings (81)

5.5.2Experimental results and discussions (83)

5.6Summary of this chapter (87)

Conclusions (88)

References (90)

Papers published in the period of https://www.doczj.com/doc/b815479717.html,cation (107)

Statement of copyright and Letter of authorization (108)

Acknowledgements (109)

Resume (111)

-XI-

第1章绪论

第1章绪论

1.1课题背景及意义

随着生物医学研究的飞速发展,生物医学文献的数量急剧增长。截至2015年,生物医学领域的权威文献数据库MEDLINE1已经收录了超过2200万篇文献,这些文献来源于40多种语言的5600多个期刊。目前,MEDLINE收录文献的数量在以每天2000–4000篇的速度增长,单在2014年就新增75万篇文献。海量的生物医学文献中蕴含着丰富的、前沿的生物医学知识,是相关从业人员重要的知识来源[1]。例如,生物医学领域的研究人员通过最新发表的文献了解本领域的研究动态。医疗专业人员通过查阅文献了解相关领域的研究成果与最新发现,以便在临床治疗中做出相应的决策。然而文献数量指数级的增长速度使生物医学领域的相关从业人员淹没在海量文献中[2],他们很难全面了解本领域的研究成果与最新发现,从而错过大量有价值的知识。

虽然有一些可以公开访问的文献检索系统能够帮助用户从海量的文献中筛选出与某主题相关的文献。例如,美国国家医学图书馆(U.S.National Library of Medicine)开发与维护的文献检索系统PubMed2提供对包括MEDLINE在内的若干个生物医学文献数据库的检索服务。爱思唯尔出版公司(Elsevier)开发与维护的文献检索系统Embase3提供对8500多个学术期刊的文献检索服务,其中包括2800多个MEDLINE没有覆盖到的期刊。但是,这些文献检索系统都是基于关键词的系统[3],要求用户根据自身的信息需求定制查询关键词或者短语,然后将查询关键词或短语输入到检索系统,系统按照相关度返回与用户查询相关的文献列表。随着文献数量的急剧增长,基于关键词的文献检索系统已经不能满足用户的需求[4]。首先,从海量的文献中检索目标文献时,选择合适的查询关键词变得没那么容易。其次,即使用户输入合适的查询关键词来检索文献,系统会返回成百上千包含查询关键词的文献,从系统返回的文献列表中获取符合自身信息需求的文献也很耗时。尽管有些检索系统会利用排序算法计算查询关键词与文献的相关度,按照相关度大小对文献排序,但是排序结果较差,不能满足用户要求[5]。例如,用户要查询与抗疟药物甲氟喹(mefloquine)1https://https://www.doczj.com/doc/b815479717.html,/pubs/factsheets/medline.html

2https://www.doczj.com/doc/b815479717.html,/pubmed

3https://https://www.doczj.com/doc/b815479717.html,/solutions/embase-biomedical-research

-1-

相关主题
文本预览
相关文档 最新文档