当前位置:文档之家› 贝叶斯网络研究现状与发展趋势的文献计量分析

贝叶斯网络研究现状与发展趋势的文献计量分析

贝叶斯网络研究现状与发展趋势的文献计量分析
贝叶斯网络研究现状与发展趋势的文献计量分析

Computer Science and Application 计算机科学与应用, 2020, 10(3), 493-504

Published Online March 2020 in Hans. https://www.doczj.com/doc/3d2116773.html,/journal/csa

https://https://www.doczj.com/doc/3d2116773.html,/10.12677/csa.2020.103052

The Bibliometric Analysis of Current

Studies and Developing Trends on

Bayesian Network Research

Zhongzheng Xiao1, Nurbol2, Hongyang Liu3

1College of Information Science and Engineering, Xinjiang University, Urumqi Xinjiang

2Network Center, Xinjiang University, Urumqi Xinjiang

3Xichang Satellite Launch Center, Xichang Sichuan

Received: Feb. 26th, 2020; accepted: Mar. 12th, 2020; published: Mar. 19th, 2020

Abstract

In this paper, 2,930 literatures related to Bayesian network in the recent 10 years in the web of science were taken as the research object. Based on the literature metrological content analysis method, the focus, development rules of research context, existing commonalities and differences, and research status at home and abroad were systematically reviewed. The study found that, as of now, especially in the prevalence of neural networks, Bayesian networks can be deepened and have great potential because of their strong mathematical interpretability. The analysis results are helpful to provide reference for the research status and progress of scholars in the field of Bayesian network research in China.

Keywords

Bayesian Network, Map Analysis, Citespace, Research Context

贝叶斯网络研究现状与发展趋势的文献计量

分析

肖中正1,努尔布力2,刘宏阳3

1新疆大学信息科学与工程学院,新疆乌鲁木齐

2新疆大学网络中心,新疆乌鲁木齐

3西昌卫星发射中心,四川西昌

收稿日期:2020年2月26日;录用日期:2020年3月12日;发布日期:2020年3月19日

肖中正 等

本文以web of science 中近10年2930篇与贝叶斯网络有关的文献为研究对象,基于文献计量内容分析方法系统地回顾了国内外在贝叶斯网络领域的关注点、研究脉络的发展规律、存在的共性与差异性和研究现状。研究发现,截至目前,特别是在神经网络盛行的现在,贝叶斯网络可以凭借其具有较强的数学可解释性,在智能计算领域的贡献不断深化且具有极大的潜力。分析结果有助于为我国贝叶斯网络研究领域的学者提供研究现状及进展的参考。

关键词

贝叶斯网络,图谱分析,CiteSpace ,研究脉络

Copyright ? 2020 by author(s) and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY 4.0). https://www.doczj.com/doc/3d2116773.html,/licenses/by/4.0/

1. 引言

贝叶斯网络是由途径研究(因果推理链)、因果推断等慢慢衍生而来的。1982年,Pearl 等人将贝叶斯网络的概率推理应用于人工智能当中,此后,专家系统中的不确定性表示和推断更多地开始使用贝叶斯网络。和其他人工智能的算法比较,贝叶斯网络因为将图形解释和计算与概率论完美地结合在一起,所以在处理不确定的问题上有比较大的优势。这些优势表现在灵活的依赖性拓扑结构;易于理解和解释,有明显的语义强大的不确定性问题处理能力;能有效地进行多源信息融合。随着对贝叶斯网络的不断研究,其逐渐成为数据挖掘、人工智能等领域解决不确定性问题的关键方法之一,是这些年的一个研究热点[1]。

基于此,这篇文章用web of science 的核心数据库为数据源,借助CiteSpace 工具的文献计量方法对收集到的文献进行统计分析并绘制出知识图谱,解决下面的三个研究问题:

(1) 国内外近10年来在贝叶斯网络领域的主要国家和研究机构有哪些? (2) 国内外近10年来贝叶斯网络领域的研究热点有哪些? (3) 国内外贝叶斯网络领域的研究方向的发展有什么趋势?

本文的具体工作如下:首先阐述了数据来源与研究方法,然后对贝叶斯网络分析研究进行描述,得到该领域的主要研究机构及国家、最佳的研究热点以及大致的发展趋势。最后对分析所得到的结果进行总结,希望能用客观以及可视化数据的展示将国内外对于贝叶斯网络研究的现状和大致趋势呈现出来,为我国贝叶斯网络领域的研究人员提供较为清晰的参考。

2. 数据来源和研究方法

2.1. 数据来源

文献来源于Thomson Reuters 公司开发的Web of Science 信息检索平台。1) 采用的文献检索方法为TS = ((data “Bayesian network ”) or (data “probabilistic network ”))。2) 时间跨度 = 2008~2018。3) 索引数据库 = (SCI -EXPANDED),文献类型 = (PROCEEDINGS PAPER OR ARTICLE),共得到文献2930篇。经过对比和筛选,删去了与贝叶斯网络无关的文献,最终获得1613条文献题录。这些文献题录包括作者、标题、关键词、摘要、作者地址、引用的参考文献、被引频次、出版日期等属性,供可视化分析。

Open Access

肖中正等2.2. 研究方法说明

本文的基本流程如图1所示。

Figure 1.Research method flow chart

图1. 研究方法流程图

在信息化社会飞速发展的今天,大多数学者选择用数据信息绘制知识图谱对学科知识进行可视化。与其它软件相比,Citespace软件是一款着眼于分析科学分析中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款引文可视化分析软件,由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”,本文以贝叶斯网络的文献数据为基础,分析贝叶斯网络的研究热点、未来趋势等,为相关研究提供依据[2]。

3. 研究概况

首先使用Carrot2聚类分析工具,对文章题目与摘要中出现的短语运用TF-IDF算法进行词频统计处理得到每篇文章的重点词,接下来运用Lingo算法对提取出来的重点词进行聚类处理,得到图2。以求初步了解在贝叶斯网络的研究过程中都涉及到了哪些领域,并通过气泡大小初步判定哪些分支较为热门哪些分支研究较少。

Figure 2.Keyword clustering bubble chart

图2. 重点词聚类气泡图

肖中正等

将图2中的结果,对比相关领域资料,对每一个领域进行归纳统计,得到贝叶斯方法在具体研究和工程应用中涉及的运用方向分支表如表1所示。

Table 1. Use direction branch table

表1.运用方向分支表

涉及方向运用简介涉及重点词应用场景

数学方向贝叶斯方法在数学领域运用最为广泛,主要

以统计学分支下的逻辑推理为主。而由逻辑

推理可得出的结果又间接推动了概率预测、

分类方法的发展。进而以贝叶斯在数学领域

内的研究成果为基础,使得其可以进一步运

用在计算机和生物医学方面。

Bayesian Estimation (贝叶斯估

计)、Probabilistic Knowledge (概

率知识)、Dynamic Probabilistic

(动态概率论)、Probabilistic

Parameters (概率参数)、

Inference methods (推理方法)

赛事预测、股票预测、数据

分类、风险分析等

计算机方向贝叶斯在因果推理上表现出的先天优势,使

得贝叶斯方法与目前计算机方向发展热门的

人工智能需求不谋而合。同时,在计算机解

决部分只需要近似解问题情况的时,相比传

统算法通过海量计算作为成本得出确定性的

结果。将贝叶斯方法运用在算法中可以有效

降低整个算法的时间复杂度,进而优化算法

提升效率。

Machine Learning (机器学习)、

Algorithmic development (算法

开发)、Efficient methods (效率方

法)、Optimization methods (最优

化方法)

机器人决策、近似问题算法

求解、数据挖掘、特征识别

生物医学方向基因与基因之间的潜在关联关系在生物学方

向具有重大研究价值。而由于自然界生物种

类极其丰富,基因关联网络的构建具有复杂

性极高、计算量极大的特点。通过贝叶斯方

法,利用其因果推理的特性可以高效获取具

备潜在关联的基因配对信息,进而进一步揭

示不同基因之间的作用机理与功能性信息,

为医药学方向研究疾病的发病原理和应对方

法提供一定的指导作用。

Gene Networks (基因网络)、

Gene Expression (基因表达)、

Complex Structure (结构复杂性)

基因表达图谱分析、调控网

络的构建、情绪分析等

3.1. 主要研究国家与机构分析

通过对国家和机构进行分析,可以帮助了解相关国家或机构对贝叶斯网络领域的研究程度以及它们之间的合作情况。图3为设定工具阈值和相关系数后,绘制的国家及机构图谱,圆形节点代表国家,直线分支上的小节点代表机构,节点大小代表发文量多少;节点间的连线代表对应的两个国家或机构之间有合作关系;连线的粗细程度代表两者之间合作的紧密程度[3]。

通过对研究机构聚类分析,得到知识图谱图3。分析图3和表2可以发现,发文量Top15的研究机构隶属于9个国家:中国3所,美国3所,西班牙3所,韩国、法国、荷兰、丹麦、比利时和巴西各1所。其中,丹麦和比利时的国家发文量排名不在国家发文量排名的Top15中,而这两个国家的研究机构的发文量排名却在机构发文量Top15中,对比该机构和国家发文数量可以发现,这两个国家发表的文献几乎全由丹麦奥尔堡大学、比利时鲁汶大学贡献。英格兰、德国、加拿大、意大利和日本,虽然这些国家的发文量排在前列,但其国家的研究机构发文量却不在机构发文排名前列,说明这些研究机构的分布相对分散。

肖中正等Figure 3.Country and institution knowledge chart

图3. 国家及机构知识图谱

Table 2. Top 15 research institutions and countries by number of publications

表2.按文献发表数量排名Top15的研究机构和国家

研究机构文献数量十年内首次

发文年份

国家文献数量国家中心性

美国伦斯勒理工学院(Rensselaer Polytech Inst) 26 2008 美国363 0.46 西班牙格拉纳达大学(Univ Granada) 25 2009 中国214 0.1 荷兰拉德堡德大学(Radboud Univ Nijmegen) 20 2008 英格兰129 0.21 云南大学(Yunnan Univ) 18 2008 西班牙118 0.08 西班牙马德里大学(Univ Politecn Madrid) 16 2008 法国104 0.28 巴西圣保罗大学(Univ Sao Paulo) 15 2008 德国101 0.1 清华大学(Tsinghua Univ) 15 2012 加拿大86 0.04 比利时鲁汶大学(Katholieke Univ Leuven) 14 2008 意大利65 0.04 美国乔治梅森大学(George Mason Univ) 12 2008 荷兰59 0.01 西班牙阿尔梅里亚大学(Univ Almeria) 12 2012 日本53 0 法国南特大学(Univ Nantes) 12 2012 澳大利亚51 0.04

丹麦奥尔堡大学(Aalborg Univ) 11 2013 韩国49 0.01 中国科学技术大学(Univ Sci & Technol China) 11 2010 瑞士43 0.03 韩国延世大学(Yonsei Univ) 10 2008 印度32 0.05 美国卡耐基梅隆大学(Carnegie Mellon Univ) 10 2008 巴西30 0

中心性是用来表示一个节点和其他节点的关联包括其节点在整个网络中的重要程度。中心性越高的研究机构影响力越大。从中心性的角度看许多国家的中心性是0,这表示他们对其他的国家对于贝叶斯网络的研究没有产生影响。中心性大于0的总共有28个国家,其中美国中心性最高,英国和法国在中心

性上并列第二,德国排第四,中国排第五。总体来说,美国在国际上的贝叶斯网络研究领域上占着主导

肖中正等

的地位,并具有很强的影响力。日本、巴西两国虽然发文量在Top15,但其中心性却都为0,说明日本和巴西对于贝叶斯网络的研究较为封闭,并且对于其他国家的研究并没有产生较为大的影响。

3.2. 作者分析

作者的发文量间接反映了作者在某一领域的影响力。据统计,检索的1613篇文献中,共得到作者

1723

位。根据普莱斯定律来确定贝叶斯网络研究领域的高产作者,其计算公式为0.749

M

=

其中N max为该研究领域发文量最多的作者所发表的论文篇数,M为核心作者发文篇数下限,从表2中易知N max = 26,计算M = 3.819,取整为4,即发表论文4篇及4篇以上的作者为贝叶斯网络研究领域的核心作者,共计48名。

从表3可知大多数作者发文量都在10及10以下,该表列出的首次出现年份是基于本文的研究文献。其中Ji Q第一(26篇),Ji Q教授主要的研究兴趣是和人工智能应用相关,包括人工神经网络(主要是基于无监督学习),多智能体系统和混合人工智能,专门解决在计算机网络安全领域的问题[4];Leray P教授(19篇)的研究兴趣主要集中在贝叶斯网络的构建,特别关注于探索性投影寻踪、自组织映射和核方法[5]。从首次发文年份上看,集中分布在2008年至2012年,说明2008年以前,研究人员对贝叶斯网络的研究正处于逐步摸索的阶段,并在2008年至2012年渐渐有了研究成果。

Table 3. Number of TOP10 author posts in the past ten years

表3.近十年TOP10作者发文数量

作者文献数量十年内首次发文年份所属机构

Ji Q 26 2008 美国伦斯勒理工学院

Leray P 19 2008 法国南特大学

Liu WY 18 2008 云南大学

Larranaga P 17 2008 西班牙马德里大学Yue K 17 2008 云南大学

Bielza C 15 2011 西班牙马德里大学

Lucas PJF 12 2009 荷兰拉德堡德大学

Moral S 10 2011 西班牙格拉纳达大学

Cho SB 10 2008 韩国延世大学

Salmeron A 9 2012 西班牙阿尔梅里亚大学Gomez-Olmedo M 9 2012 西班牙格拉纳达大学Cano A 9 2012 西班牙格拉纳达大学

Wang SF 8 2014 中国科学技术大学

Sucar LE 8 2010 美国国家航空航天局

Maua DD 6 2014 巴西圣保罗大学

3.3. 贝叶斯网络研究的主要来源出版物共引分析

通过分析贝叶斯网络学术领域的文献出版物能够比较准确地确定该领域的核心出版物的分布情况。在Cite Space中“node type”选择参数“Cited Journal”,得到出版物分布的共引网络图谱和如表4所示的贝叶斯网络文献发表数量TOP15的被引期刊。

肖中正等Table 4. Bayesian network literature published in the TOP15 cited journals

表4.贝叶斯网络文献发表数量TOP15的被引期刊

被引期刊文献数量被引期刊中心性

PROBABILISTIC REASON 476 0.12

MACH LEARN 433 0.16

ARTIF INTELL 426 0.14

LECT NOTES COMPUT SC 402 0.03

INT J APPROX REASON 301 0.18

J MACH LEARN RES 295 0.09

LECT NOTES ARTIF INT 269 0.11

IEEE T PATTERN ANAL 246 0.1

J ROY STAT SOC B MET 211 0.06

ANN STAT 184 0.1

PROBABILISTIC GRAPHI 180 0.01

BIOINFORMATICS 172 0.05

J ARTIF INTELL RES 171 0.15

IEEE T KNOWL DATA EN 167 0.07

SCIENCE 163 0.05

其中PROBABILISTIC REASON的被引文献数量高达476篇,排在第一位。MACH LEARN的被引文献数量为433篇,排名第二,ARTIF INTELL的被引文献数量为426篇,排名第三,随后的还有LECT NOTES COMPUT SC (402篇)、INT J APPROX REASON (301篇)等。从中心性来看,INT J APPROX REASON以0.18排在首位,随后的有MACH LEARN (0.16),J ARTIF INTELL RES (0.15),PROBABILISTIC REASON (0.12)等。前五个出版物不仅被引文献的数量很多,在领域内的影响也很大,尤其Lecture Notes in Computer Science占有绝对的领先地位,该丛书每年都出版了诸如Computer Security -ESORICS、Network and System S。

ecurity等书籍,涉及了当年的热点研究问题。此外,J ARTIF INTELL RES虽然被引文献的数量不是特别多,但是中心性很高,近十年的影响因子也很高,说明在领域内影响力较大。综合可以看出,Lecture Notes in Computer Science、Machine Learing、International Journal of approximate Reasoning和Artificial Intelligence In Medicine这些学术出版物是该领域中较为重要的组成部分,SCIENCE的在自然科学领域虽然有较大影响,但是在贝叶斯网络的研究中其中心性只有0.05,相对来说在这个领域影响力较低。

3.4. 核心文献分析

文献的被引频次是最能直接体现文献学术影响力及其价值的重要指标。表5是被引频次top10的文献统计列表,从表中可知Stegle发表的“A Bayesian Framework to Account for Complex Non-Genetic Factors in Gene Expression Levels Greatly Increases Power in eQTL Studies”位居第一位,被引频次高达132次,该文研究了一种用于绘制表达数量性状基因座(eQTL)的概率方法,该方法使用贝叶斯建模,它可以模拟基因型的贡献以及已知和隐藏的混杂因子[6]。第二位核心文献是Ahmadlou发表的“Enhanced probabilistic

肖中正等

neural network with local decision circles: A robust classifier”一文,被引频次为120次,该文探讨了通过使用简单贝叶斯规则的核密度估计,在模式层中计算测试数据对每个训练数据的可能性,并使用局部决策圈(LDC)提出了增强和广义PNN (EPNN),以提高其对数据中噪声的鲁棒性[7]。Psorakis发表的“Adaptive Overlapping Community Detection with Bayesian Non-Negative Matrix Factorization”排在第三位,被引频次为117次,该文提出利用非负矩阵分解(NMF)进行群落检测,可以从整个网络相邻矩阵中找到两个非负矩阵,两个矩阵的乘积很好地逼近原始矩阵。通过分解过程中的贝叶斯解释,不仅可以用Shrinkage方法在大型网络中捕获最合适的社区数,还可以验证在模糊情况下如何将节点分配给社区的良好阈值。该方法应用于一些真实网络和具有基准的合成网络。重叠群落检测的实验结果表明,该方法能够有效地找到群落数量和重叠度,并且比其他现有的重叠群落检测方法具有更好的性能[8]。结合表5的关注点来看,有多篇都与生物医学相关,例如Zoppoli发表的“Time Delay-ARACNE: Reverse engineering of gene net-works from time-course data by an information theoretic approach”一文介绍了一种从基于信息理论的算法并利用时间序列测量推断基因调控网络的方法,这种算法的基本思想是通过假设作为基础概率模型的静态马尔可夫随机场来检测表达谱之间的时间延迟的依赖性。使用自动计算的阈值过滤掉信息量较少的依赖关系,保留最可靠的连接[9]。贝叶斯网络模型在生物医学领域有着其他机器学习不具备的优势[10]。

Table 5. Top10 cited references

表5.被引频次Top10的文献

文献关注点作者被引频次

A Bayesian Framework to Account for Complex Non-Genetic Factors in Gene Ex-

pression Levels Greatly Increases Power in eQTL Studies

贝叶斯复杂控制性Stegle 132 Enhanced probabilistic neural network with local decision circles: A robust classifier 概率神经网络Ahmadlou 120

Adaptive Overlapping Community Detection with Bayesian NonNegative Matrix

Factorization

重叠社团检测Psorakis 117

TimeDelay-ARACNE: Reverse engineering of gene networks from time-course data

by an information theoretic approach

因果网络Zoppoli 114

Empirically building and evaluating a probabilistic model of user affect 动态贝叶斯网络Conati 113 Comparison of co-expression measures: mutual information correlation and model

based indices

基因监管网络Song 96

Neural Dynamics as Sampling: A Model for Stochastic Computation in Recurrent

Networks of Spiking Neurons

马尔可夫链Buesing 89

A Bayesian Approach to Model Checking Biological Systems 系统生物学Jha 86

A Bayesian regularized artificial neural network for stock market forecasting 贝叶斯正则化人工

神经网络

Ticknor 72

A review of recent advances in learner and skill modeling in intelligent learning

environments

学习者模型Desmarais 71 4. 基于共词分析的研究热点

共词分析相比文献的共被引和耦合,其得到的结果是非常直观的。即研究者直接可以通过共词分析的结果,对所研究领域的主题进行分析。图4中心性由最外层十字代表。关键字重叠则由同心十字表示,关键词年份不同十字的深浅层次也不同。关键词之间的远近则代表着其之间的关系。其中同心十字与文字大小成正相关,文字越大也表示关键词被引频次越高[11]。表6列出的前十五个词是词频较高和中心性较高的关键词。

肖中正 等

Figure 4. Key word knowledge map 图4. 关键词知识图谱

Table 6. List of high-frequency words and high centrality keywords for Bayesian network research (Top15) 表6. 贝叶斯网络研究高频词及高中心性关键词一览表(Top15)

高频关键词

高中心性关键词

排序 关键词

词频 排序 关键词 中心性 1 贝叶斯网络(bayesian network)

606 1 选择分类(selection) 0.17 2 模型(model) 173 2 概率(probability) 0.17 3 算法(algorithm) 151 3 识别(recognition) 0.15 4 网络(network) 131 4 贝叶斯网络(bayesian network)

0.1 5 系统(system) 113 5 诊断(diagnosis) 0.1 6 推断(inference)

109 6 模型(model) 0.09 7 概率网络(probabilistic network) 69 7 分类(classification) 0.09 8 概率推断(probabilistic inference)

68 8 不确定性(uncertainty)

0.09 9 分类(classification) 68 9 概率图形化模型(probabilistic graphical model)

0.09 10 不确定性(uncertainty) 62 10 神经网络(neural network)

0.09 11 信念网络(belief network)

61 11 信息(information) 0.09 12 概率图形化模型(probabilistic graphical model) 61 12 最优化(optimization) 0.09 13 动态贝叶斯网络(dynamic bayesian network)

58 13 概率模型(probabilistic model)

0.09 14 贝叶斯推断(bayesian inference) 53 14 鉴定(identification) 0.09 15

神经网络(neural network)

42

15

推断(inference)

0.08

肖中正等

Cite Space V可以直接使用WOS等数据库的文献记录,通过提炼研究的关键词或主题词的频次及不同的关键词或主题词之间共现关系,并采用可视化的形式展现主题词或关键词的频次高低、聚类关系,得出研究热点。将最终精炼整理得到的1613篇论文全记录信息导入Cite Space V,时区分隔(Time Slicing) = (From2008 To2018) (1Years Per Slice);主题词来源(TermSource)为标题(Title)、摘要(Abstract )、作者关键词(Author Keywords (DE))、扩展关键词(Keywords Plus (ID)),即全部勾选;节点类型(Node Types)选择关键词(Keyword);选择最小生成树算法(Minimum Spanning Tree)进行剪枝(Pruning);视图方式( Visualization) 保持默认;进行图谱绘制。根据本文的主题,需要对图谱绘制使用的关键词节点进行去重复和合并,合并在不同论文中不同表达形式而意义相同的关键词。合并后“baysian network”的词频达到606次,是本研究中贝叶斯网络领域的最重要的主题词。通过最小生成树算法进行聚类分析,得到如表6所示的高频关键词、高中心性关键词表。从表6中可以看出,在全球范围内来说贝叶斯网络研究领域十分广泛,不仅围绕人工智能、模式识别、机器学习、数据挖掘等传统贝叶斯网络技术应用层面展开,还关注于规划识别、模型诊断、模型诊断串行译码和遥感数据分类等;且在交叉学科如冠心病中医临床诊断、对移动机器人进行避障等领域也有数量可观的论文发表[12]。

5. 研究总结与启示

贝叶斯之父pearl 1985年在《Artificial Intelligence》杂志上首先提出了基于贝叶斯理论的贝叶斯网络的构想。由于贝叶斯网络很好地结合了概率论以及图论相关理论,与当时最流行的基于线性规则的推理相比,能够很好地解决复杂、模糊和不确定问题。因而,在以后的不确定场景下,贝叶斯网络得到了很好的应用,并且逐步取代其他机器学习算法。与此同时,贝叶斯网络出现给很多学者在因果推断问题上提供了一种新的思路,因为这种算法能够有效且直观地解决因果关系问题,这也被称为概率图模型,如隐马尔科夫模型(HMM)和动态贝叶斯网络(DBN)等。表7列出三个阶段的主要研究热点、研究领域以及研究脉络。

Figure 5.Keywords development context timeline diagram

图5. 关键词发展脉络时间轴图

肖中正等Table 7. Phase analysis table

表7.阶段分析表

时间1985~1990 1990~2005 2005~至今

研究热点贝叶斯理论、链式公式、因果关系、

贝叶斯推断等

贝叶斯网络、数据挖掘、结构学习、

参数学习等

诊断、模型、大数据、分类、

概率图形化模型等

研究领域数学领域、机器学习领域等数据挖掘领域、人工智能领域、计算

机感知领域[13]等

医学诊断领域、大数据领域、

决策信息融合领域等

研究脉络该时期涉及到的领域较少,主要进

行网络基础理论体系和不确定性

推理的研究

贝叶斯网络发展进入新阶段,国际上

开始致力于网络拓扑结构以及参数

等的学习,利用大量数据对贝叶斯网

络进行构建

该时期有了系统的知识体系

和技术支撑,贝叶斯网络应用

趋于成熟化,在医疗中的应用

更是独占鳌头[14]

关键词通常是对文章主旨和中心内容的凝练,为检索、阅读等带来很大的便利。Web of Science核心数据库中的所有文章都新增了补充关键词(keywords plus),这些关键字是通过聚类算法计算得出的。从贝叶斯网络领域每年不同的关注点出发,分析研究贝叶斯网络的发展动向。本文利用CiteSpace 软件生成关键词,从关键字和相关领域术语的变化过程中,可以推断出发展趋势动向,使用时间轴视图绘制其演化过程,便可得到关键词发展脉络时间轴图。

图5中“十字”形节点的大小与此关键词共被引的程度成正比。与关键词节点相连连线的颜色对应关键词出现的年份。

本文简要介绍并分析了国内外近10年有关贝叶斯网络的研究概况和研究热点,可供学者从多方面对该领域进行了解。通过以上介绍,我们可以将该领域研究分为三个阶段:(1) 1990年以前:主要是在贝叶斯网络数学理论方面做研究,在建立贝叶斯网络时也都是以专家先验知识为基础而构建的;(2) 1990~2005年:主要研究如何在大量数据的基础上,进行贝叶斯网络的自主构建;(3) 2005~至今:主要研究贝叶斯网络的应用,来解决实际问题。结合前文的分析,对全文总结如下:

1) 国内外贝叶斯网络领域的研究文献质量一直在稳步提升,在文献数量上美国和中国最有很大的优势,但在文献影响力上美国、英国和法国处于领先地位,而中国凸显出文献数量多国际影响力低的特点。在这十年内,发表论文的机构主要集中在伦斯勒理工学院、格拉纳达大学、云南大学和中国科学技术大学。其中美国伦斯勒理工学院的Ji Q.教授将动态贝叶斯网络广泛应用于计算机视觉、计算机感知,并将理论用于人机交互(特别是人类状态监控),情景意识和决策信息融合[15]。

2) 在近十年内,贝叶斯网络的应用趋于成熟化,它在实际应用中发挥了巨大作用并且体现了深厚的潜力。比如在医学分析领域中有PATHFINDER系统,特别事在对“淋巴结点”分析和诊断中有比较好的表现;CPCSBN远程医疗系统,总共有四百多个节点和九百多条弧,相比较于世界上主要的远程诊疗方法,其性能处于领先地位;ALARM网,具有三十多个节点和四十多条弧,其描述了在手术室中潜在细菌的问题,经常用来做贝叶斯网络在结构学习中检验的标准[16]。Ji Q.等用动态贝叶斯网络分类器进行人脸识别的研究;Pedro Larranaga等将贝叶斯网络分类器用于诊断和治疗帕金森综合征;Hudson等将贝叶斯网络用于模拟军事对抗和预测;C. Bielza等利用贝叶斯网络确定早期阿尔茨海默病的标志和病发机制。

3) 近年来,对于贝叶斯网络的研究越来越深入,但学者们大都分布在美国、西班牙、法国和中国这几个国家,中国学者的整体论文数量较多,但高水平、影响因子较高的文章却不多,这也跟国内目前比较推崇神经网络和深度学习有关。2018年“贝叶斯网络之父”Pearl推出自己的新书《The Book of Why》,81岁的Pearl在新书中描述了一个未来世界真正的人工智能是如何进行思考并且做出决策的。他认为让人工智能真正智能起来的关键因素是进行因果推理。机器不能仅仅把发烧和疟疾联系起来,更要能推断

肖中正等

出疟疾是可以引起发烧。只要这种因果框架被建立起来,机器就有能力提出反事实的问题——询问在干预介入的情况下因果关系会如何变化,Pearl认为这才是人工智能科学思考的基础。

参考文献

[1]曹杰. 贝叶斯网络结构学习与应用研究[D]: [博士学位论文]. 合肥: 中国科学技术大学, 2017.

[2]乔萨础拉, 努尔布力, 苏芮. 数据可视分析研究现状与发展趋势的图谱分析[J]. 现代电子技术, 2018, 41(14):

161-165+169.

[3]陈悦, 陈超美, 刘则渊, 胡志刚, 王贤文. CiteSpace知识图谱的方法论功能[J]. 科学学研究, 2015, 33(2): 242-253.

[4]Chaturvedi, I., Ragusa, E., Gastaldo, P., et al. (2017) Bayesian Network based Extreme Learning Machine for Subjec-

tivity Detection. Journal of the Franklin Institute, 355, 1780-1797. https://https://www.doczj.com/doc/3d2116773.html,/10.1016/j.jfranklin.2017.06.007

[5]崔佳旭, 杨博. 贝叶斯优化方法和应用综述[J]. 软件学报, 2018, 29(10): 3068-3090.

[6]Anton-Sanchez, L., Larra?aga, P., Benavides-Piccione, R., Fernaud, I., De Felipe, J. and Bielza, C. (2017) Three Dimen-

sional Spatial Modeling of Spines along Dendritic Networks in Human Cortical Pyramidal Neurons. PLoS ONE, 12,

e0180400. https://https://www.doczj.com/doc/3d2116773.html,/10.1371/journal.pone.0180400

[7]Zhang, J., Ahlbrand, B., Malik, A., et al. (2016) A Visual Analytics Framework for Microblog Data Analysis at Mul-

tiple Scales of Aggregation. Computer Graphics Forum, 35, 441-450. https://https://www.doczj.com/doc/3d2116773.html,/10.1111/cgf.12920

[8]Lau, C.L. and Smith, C.S. (2016) Bayesian Networks in Infectious Disease Eco-Epidemiology. Reviews on Environ-

mental Health, 31, 173-177. https://https://www.doczj.com/doc/3d2116773.html,/10.1515/reveh-2015-0052

[9]Karimi, I. and Salahshoor, K. (2012) A New Fault Detection and Diagnosis Approach for a Distillation Column Based

on a Combined PCA and ANFIS Scheme.2012 24th Chinese Control and Decision Conference, Taiyuan, 23-25 May

2012,3408-3413. https://https://www.doczj.com/doc/3d2116773.html,/10.1109/CCDC.2012.6244542

[10]Cai, B., Huang, L. and Xie, M. (2017) Bayesian Networks in Fault Diagnosis. IEEE Transactions on Industrial Infor-

matics, 13, 2227-2240. https://https://www.doczj.com/doc/3d2116773.html,/10.1109/TII.2017.2695583

[11]邱均平, 韩雷. 近十年来我国知识工程研究进展与趋势[J]. 情报科学, 2016, 34(6): 3-9.

[12]耿杨, 邵苏杰, 郭少勇, 喻鹏. 基于可见损伤持续时间贝叶斯网络的视频QoE评估方法[J]. 通信学报, 2017,

38(6): 136-141.

[13]李玉兰. 基于贝叶斯网络的列控车载设备故障诊断研究[D]: [硕士学位论文]. 北京: 北京交通大学, 2016.

[14]陈晓艳, 董朝轶. 动态贝叶斯网络结构搜索法辨识生物神经网络连接[J]. 生命科学研究, 2017, 21(6): 527-533.

[15]王双成, 高瑞, 杜瑞杰. 具有超父结点时间序列贝叶斯网络集成回归模型[J]. 计算机学报, 2017, 40(12):

2748-2761.

[16]赵建喆. 具有认知特性的贝叶斯网络结构学习方法研究[D]: [博士学位论文]. 沈阳: 东北大学, 2015.

贝叶斯网络研究现状与发展趋势的文献计量分析

Computer Science and Application 计算机科学与应用, 2020, 10(3), 493-504 Published Online March 2020 in Hans. https://www.doczj.com/doc/3d2116773.html,/journal/csa https://https://www.doczj.com/doc/3d2116773.html,/10.12677/csa.2020.103052 The Bibliometric Analysis of Current Studies and Developing Trends on Bayesian Network Research Zhongzheng Xiao1, Nurbol2, Hongyang Liu3 1College of Information Science and Engineering, Xinjiang University, Urumqi Xinjiang 2Network Center, Xinjiang University, Urumqi Xinjiang 3Xichang Satellite Launch Center, Xichang Sichuan Received: Feb. 26th, 2020; accepted: Mar. 12th, 2020; published: Mar. 19th, 2020 Abstract In this paper, 2,930 literatures related to Bayesian network in the recent 10 years in the web of science were taken as the research object. Based on the literature metrological content analysis method, the focus, development rules of research context, existing commonalities and differences, and research status at home and abroad were systematically reviewed. The study found that, as of now, especially in the prevalence of neural networks, Bayesian networks can be deepened and have great potential because of their strong mathematical interpretability. The analysis results are helpful to provide reference for the research status and progress of scholars in the field of Bayesian network research in China. Keywords Bayesian Network, Map Analysis, Citespace, Research Context 贝叶斯网络研究现状与发展趋势的文献计量 分析 肖中正1,努尔布力2,刘宏阳3 1新疆大学信息科学与工程学院,新疆乌鲁木齐 2新疆大学网络中心,新疆乌鲁木齐 3西昌卫星发射中心,四川西昌 收稿日期:2020年2月26日;录用日期:2020年3月12日;发布日期:2020年3月19日

网络流行语研究的文献综述

网络流行语研究的文献综述 摘要:信息时代不断迈进,网民群体的规模日益扩大。网络已语言成为网民之间交流的必备工具。其中,网络流行语不仅是网民交流的个性工具,更是网民对社会发出的个性呐喊。网络流行语反映了各个社会阶层对社会、国家的各种情绪和观点,反映了一个国家在经济、政治、文化各方面与时俱进的变化。而它的流行除了语言因素外,社会因素起着至关重要的作用。同时,网络流行语影响着现代汉语的前景和发展。 关键词:网络流行语社会汉语 研究回顾: 一、网络流行语流行的因素 语言因素和社会因素是网络流行语流行的两个主要原因。网络流行语以其简洁、生动、创新、个性、别具内涵、与时俱进的反传统、反规范的新姿态吸引着一大批追随者。网络流行语的形式多样,有缩写、谐音、符号、数字、单词、语句等各种形式,极具个性和创新。而网络的普及、网民群体的扩大极大地推动了网络流行语的形成和传播。 随着时代的发展,网民需要一种新的表达形式来宣泄情绪、发表意见和观点,网络流行语正好体现了这种”“新鲜”。国家领导和国家政策的支持网络舆情,网民个性表达受到鼓舞,用“替代”、“隐晦”的网络流行语表达个人对社会敏感事件的观点和意见既是被迫也是必然。这是公民意识提高的表现,是国家政治文明建设的需要。网络流行语的既是个性化的代表,也是大众性的代表,在一定程度上传达民情民声,记录着社会进程。网络流行语代表着一种时尚潮流,虚荣心、从众心理等社会心理诉求促使更多网民追随这些流行语,从而推动网络流星雨的传播。 二、网络流行语对汉语的影响 网络流行语一反传统汉语的规范,创造了大量的新词汇,丰富了汉语语言词汇,有益于汉语的发展。但同时我们也看到网络流行语具有很大的随意性,会造成信息传输的失真和交流的障碍。网络流行语看似是书面语,却相当的口语化,这对汉语的书面表达具有极大的负面影响,尤其是对青少年群体。 我的看法: 所参考的四篇文献从社会心理、文化、国家政策、语言学、时代发展这几个方面阐述了网络流行语流行的原因。质性研究多于量性研究。我觉得在研究网络流行语流行的原因时也可以进行一些量性研究和比较研究。比如,国内的以年龄划分与以阶层划分的各个群体在使用网络流行语的数量、频率、范围上有什么不同?与之相对应的国外群体使用网络流行语有何不同?不同的网络流行语的传播途径是否不同?经过比较也许可以发现造成网络流行语流行的一些隐性因素,

1选题:本课题国内外研究现状述评,提出选题的背景及意义.doc

1.选题:本课题国内外研究现状述评,提出选题的背景及意义。 2.目标与内容: 本课题研究拟完成的研究目标和主要研究内容,研究内容要对?拟解决的问题进行具体化。3、研究思路与方法:本课题研究的技术路线、方法和计划。4.预期价值:本课题理论创新程度和实践应用价值。(课题设计论证限3000字以内) 一直以来如何有效的提高学生的学习效率和教师的教学效率不断的得到大量的研究,近二十年以来,随着计算机信息技术和互联网应用的飞速发展,在教育心理学中正在发生着一场革命,应用建构主义的学习理论(Slavin, 1994)来指导改革教学成为一大趋势。建构主义学习理论从“学习的含义”(即关于“什么是学习”)与“学习的方法”(即关于“如何进行学习”)这两个角度说明学习的影响因素及提高学习效率的方法,建构主义学习理论认为学习是在一定的基础知识之上,在一定的情境即社会文化背景下,借助其他人的帮助即通过人际间的协作活动而实现的意义建构过程。“情境”、“协作”、“会话”和“意义建构”是学习环境中的四大要素或四大属性。所谓“情境”即是学习的综合环境;“协作”: 指学习中与他人的沟通与合作;“会话”:学习小组成员之间通过会话商讨如何完成规定的学习任务的计划;“意义建构”:建构事物的性质、规律以及事物之间的内在联系,是整个学习过程的最终目标。建构主义的学生观、教师观和知识观和以往的学习理论有了很大的变化,应用建构主义学习理论来提高教学效率正成为当前的研究热点,但目前的研究多从学习的方法论和学习技术本身入手,考虑学生的具体群体的学习特点较少,不能很好的有的放矢,在分析学生的学习影响因素时多直接用常规的数理统计理论进行分析与讨论,而实际上影响学生的学习因素是相当复杂与繁多的,而且学习因素之间W能存在相互的因果关系,而这种因果关系有时往往不知道,因素之间的影响到底多大,定量的关系不明确,甚至可能有很多隐藏的因素在起作用,发现学习的各种影响因素及其因果关系与比重,以及它们的变化分布规律对我们找出主要因素从而正确指导教学以及设计调查问卷摸查学生的学习基础与学习特点对教师的教学设计和提高教学效率具有重要意义,目前对此的研究还比较少。 贝叶斯网络又称信度网络,是Bayes方法的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一。自1988年由Pearl提出后,己知成为近几年来研究的热点一般的贝叶斯网络结构是一个有向无环图(Directed Acyclic Graph,DAG),如图1所示,由代表变量节点及连接这些节点有向边构成。节点代表随机变量,节点间的有向边代表了节点间的互相关系(由父节点指向其后代节点),用条件概率进行表达关系强度,没有父节点的用先验概率进行信息表达, 节点变量可以是任何问题的抽象(如知识表达),适用于表达和分析不确定性和概率性的事件,可以从不完全、不精确或不确定的知识或信息中做出推理。贝叶斯网络本身是一种不确定性因果关联模型,贝叶斯网络与其他决策模型不同,它本身是将多元知识图解可视化为一种概率知识表近与推理模型,更为贴切地蕴含了网络节点,变量之间的因果关系及条件相关关系,如果节点表达为学习因素,

网络入侵与防范研究文献综述

学 毕业设计(论文)文献综述 院(系): 专业: 姓名: 学号: 完成日期:

关于网络入侵防范技术研究的文献综述 文献[1]:文献通过大量的实例,以实际应用为基础,全面系统地介绍了Windows操作系统的管理、基于不同操作系统的网络安全管理和网络设备管理等网络管理技术和实现方法。它的主要内容包括网络管理基础、文件和磁盘管理、活动目录及组策略的管理、Windows 2000/2003服务器的日常管理、网络打印机的管理、DHCP服务器的管理、Windows Server 2003证书的应用和管理、网络防病毒系统的部署和管理、SUS和WSUS补丁管理系统的应用、交换机和路由器的基本管理、交换机VLAN的管理、交换机生成树的管理、访问控制列表(ACL)的应用和管理、网络地址转换(NAT)的应用和管理。文献1、2为我们很好的理解网络及它可能存在的漏洞打下基础,并明白由此而衍生的入侵与防范机理。 文献[2]:该文献首先从常用网络接入技术入手,说明了网络的基本概念,对ISO的OSI分层模型和Internet的分层模型进行了比较;然后,按照从低层到高层的顺序,分别说明各层的功能,并对这些层中的应用情况做了详细介绍;最后,对局域网设计的过程和网络安全进行详细说明。 文献[3]:文献从网络安全所涉及的攻击防御正反两个方面入手,在深入剖析各处黑客攻击手段的基础上,对相应的防御对策进行了系统的阐述。无论是攻击还是防御技术,除了介绍必要的基础知识并深入分析其原理外,还介绍了典型工具及操作实例,让我们在攻防技术的实际运用中建立起对网络安全深刻的认识。 文献[4]:文献向读者介绍了有关网络安全技术方面的内容,为了了解黑客在攻击网络时常用的方法,必须要熟悉网络编程技术。它分为两个部分,第一部分主要是网络基础知识和Visual C++网络编程技术,第二部分是本书的核心内容,给我们分析了网络攻击的原理、典型的技术手段,并给出了相应的防范措施和工具。此外,改文献还介绍了网络系统安全漏洞问题、信息加密技术等内容。 文献[5]:文献全面详细地介绍了信息、信息安全、计算机犯罪、计算机病毒、信息保障体系及信息战的基本概念;阐述了计算机病毒的宏观防范策略与病毒寄生环境;着重剖析了典型的计算机病毒机理、病毒的传染机制及触发机制;论述了计算机病毒的检测技术、清除技术和预防机制;穿插介绍了计算机病毒技术和反病毒技术的新动向与发展趋势。通过文献[3],我们可以很清晰的了解到各种病毒的攻击原理及其发展历程。 文献[6]:文献全面、系统地讲述了C语言的各个特性及程序设计的基本方法,包括基本概念、类型和表达式、控制流、函数与程序结构、指针与数组、结构、文件、位运算、标准库等内容。这两本文献让我们对C语言功能之强大,应用之广泛有了深刻的认识。 文献[7]:文献从基本概念、基本技术、技术细节和疑难问题4个角度,分C语言、变量和数据存储、排序与查找、编译预处理等21个专题,收集了有关C程序设计的308个常见的问题。每一问题的解答都配有简明而有说服力的例子程序,相关的问题之间还配有详尽的交叉索引,通过该文献可以迅速完善自己的知识体系,并有效地提高自己的编程水

贝叶斯网络结构学习及其应用研究_黄解军

收稿日期:2004-01-23。 项目来源:国家自然科学基金资助项目(60175022)。 第29卷第4期2004年4月武汉大学学报#信息科学版 Geomatics and Information Science of Wuhan U niversity V ol.29No.4Apr.2004 文章编号:1671-8860(2004)04-0315-04文献标识码:A 贝叶斯网络结构学习及其应用研究 黄解军1 万幼川1 潘和平 1 (1 武汉大学遥感信息工程学院,武汉市珞喻路129号,430079) 摘 要:阐述了贝叶斯网络结构学习的内容与方法,提出一种基于条件独立性(CI)测试的启发式算法。从完全潜在图出发,融入专家知识和先验常识,有效地减少网络结构的搜索空间,通过变量之间的CI 测试,将全连接无向图修剪成最优的潜在图,近似于有向无环图的无向版。通过汽车故障诊断实例,验证了该算法的可行性与有效性。 关键词:贝叶斯网络;结构学习;条件独立性;概率推理;图论中图法分类号:T P18;T P311 贝叶斯网络学习是贝叶斯网络的重要研究内容,也是贝叶斯网络构建中的关键环节,大体分为结构学习和参数学习两个部分。由于网络结构的空间分布随着变量的数目和每个变量的状态数量呈指数级增长,因此,结构学习是一个NP 难题。为了克服在构建网络结构中计算和搜索的复杂性,许多学者进行了大量的探索性工作[1~5]。至今虽然出现了许多成熟的学习算法,但由于网络结构空间的不连续性、结构搜索和参数学习的复杂性、数据的不完备性等特点,每种算法都存在一定的局限性。本文提出了一种新算法,不仅可以有效地减少网络结构的搜索空间,提高结构学习的效率,而且可避免收敛到次优网络模型的问题。 1 贝叶斯网络结构学习的基本理论 1.1 贝叶斯网络结构学习的内容 贝叶斯网络又称为信念网络、概率网络或因果网络[6] 。它主要由两部分构成:1有向无环图(directed acyclic graph,DAG),即网络结构,包括节点集和节点之间的有向边,每个节点代表一个变量,有向边代表变量之间的依赖关系;o反映变量之间关联性的局部概率分布集,即概率参数,通常称为条件概率表(conditional probability table,CPT),概率值表示变量之间的关联强度或置信度。贝叶斯网络结构是对变量之间的关系描 述,在具体问题领域,内部的变量关系形成相对稳定的结构和状态。这种结构的固有属性确保了结构学习的可行性,也为结构学习提供了基本思路。贝叶斯网络结构学习是一个网络优化的过程,其目标是寻找一种最简约的网络结构来表达数据集中变量之间的关系。对于一个给定问题,学习贝叶斯网络结构首先要定义变量及其构成,确定变量所有可能存在的状态或权植。同时,要考虑先验知识的融合、评估函数的选择和不完备数据的影响等因素。 1.2 贝叶斯网络结构学习的方法 近10年来,贝叶斯网络的学习理论和应用取得了较大的进展。目前,贝叶斯网络结构学习的方法通常分为两大类:1基于搜索与评分的方法,运用评分函数对网络模型进行评价。通常是给定一个初始结构(或空结构),逐步增加或删减连接边,改进网络模型,从而搜索和选择出一个与样本数据拟合得最好的结构。根据不同的评分准则,学习算法可分为基于贝叶斯方法的算法[3,7]、基于最大熵的算法[8]和基于最小描述长度的算法[1,2]。o基于依赖关系分析的方法,节点之间依赖关系的判断通过条件独立性(CI )测试来实现,文献[9,10]描述的算法属于该类算法。前者在DAG 复杂的情况下,学习效率更高,但不能得到一个最优的模型;后者在数据集的概率分布与DAG 同构的条件下,通常获得近似最优的模型[11],

复杂网络研究概述(综述范文)

复杂网络研究概述 周涛柏文洁汪秉宏刘之景严钢 中国科学技术大学,近代物理系,安徽合肥:230026 摘要:近年来,真实网络中小世界效应和无标度特性的发现激起了物理学界对复杂网路的研究热潮。复杂网络区别于以前广泛研究的规则网络和随机网络最重要的统计特征是什么?物理学家研究复杂网络的终极问题是什么?物理过程以及相关的物理现象对拓扑结构是否敏感?物理学家进入这一研究领域的原因和意义何在?复杂网络研究领域将来可能会向着什么方向发展?本文将围绕上述问题,从整体上概述复杂网络的研究进展。 关键词:复杂网络小世界无标度拓扑性质 A short review of complex networks Zhou Tao Bai Wen-Jie Wang Bing-Hong?Liu Zhi-Jing Yan Gang Department of Modern Physics, University of Science and Technology of China, Hefei, 230026 Abstract: In recent years, the discoveries of small-world effect and scale-free property in real-life networks have attracted a lot of interest of physicists. Which are the most important statistical characteristics for complex networks that known from regular networks and random networks? What is the ultimate goal of the study of complex networks? Are physical processes sensitive to the topological structure of networks? What are the reason and meaning that physicist come into the research field on complex networks? What are the directions for future research? In the present paper, we concentrate on those questions above and give a general review about complex networks. Keyword: complex networks, small-world, scale-free, topological characters 1 引言 自然界中存在的大量复杂系统都可以通过形形色色的网络加以描述。一个典型的网络是由许多节点与连接两个节点之间的一些边组成的,其中节点用来代表真实系统中不同的个体,而边则用来表示个体间的关系,往往是两个节点之间具有某种特定的关系则连一条边,反之则不连边,有边相连的两个节点在网络中被看作是相邻的。例如,神经系统可以看作大量神经细胞通过神经纤维相互连接形成的网络[1];计算机网络可以看作是自主工作的计算机通过通信介质如光缆、双绞线、同轴电缆等相互连接形成的网络[2]。类似的还有电力网络[1]、社会关系网络[1,3-4]、交通网络[5]等等。 数学家和物理学家在考虑网络的时候,往往只关心节点之间有没有边相连,至于节点到底在什么位置,边是长还是短,是弯曲还是平直,有没有相交等等都是他们不在意的。在这里,我们把网络不依赖于节点的具体位置和边的具体形态就能表现出来的性质叫做网络的拓扑性质,相应的结构叫做网络的拓扑结构。那么,什么样的拓扑结构比较适合用来描述真实的系统呢?两百多年来,对这个问题的研究经历了三个阶段。在最初的一百多年里,科学家们认为真实系统各因素之间的关系可以用一些规则的结构表示,例如二维平面上的欧几里德格网,它看起来像是格子体恤衫上的花纹;又或者最近邻环网,它总是会让你想到一群手牵着手围着篝火跳圆圈舞的姑娘。到了二十世纪五十年代末,数学家们想出了一种新的构造网

Promedas—贝叶斯网络在医学诊断中的应用

Promedas—贝叶斯网络在医学诊断中的应用1. 综述 现代的医学诊断是一个非常复杂的过程,要求具备患者准确的资料,以及对医学著作深刻的理解,还有多年的临床经验。这样的情况尤其适用在内科诊断中,因为它涵盖了一个巨大范围的诊断门类。而且也因此使得内科诊断成为了一个需要专攻的学科。 诊断是一个过程。通过这个过程,医生为病人的症状寻找拥有最佳解释的病因。这个研究的过程是一个连续的过程,即病人的症状会指示医生对其进行一些初步的检查。基于这些初步检查的结果,一个关于可能的病因的试探性的假设形成了。这个过程可能会在若干个循环中推进,直到病人被以充分的确定性来做了诊断,而且其症状的病因也被建立起来。 诊断过程的一个很重要的部分是标准化诊断的形式。这里有若干的规则来限制:依据病人的症状以及检验的结果,什么样的检查应该被执行,它们的顺序应该是什么样的。这些规则形成了一个决策树,其节点是诊断的中间过程;依据当前诊断的结果,其枝干指向额外的检查。这些规则是由每个国家的一个医学专家委员会制定的。 在平时遇到的大部分诊断里,上面提到的指南已经足以准确的指导我们做出正确的诊断。对于这种“一般”的情形,一个“决策支持系统”是没有必要的。在10%~20%的案例中,进行诊断的过程是很困难的。因为对于正确的诊断结果的不确定性,以及对下一步进行什么检查的不确定性,不同的医生在不同的诊断过程中做出的决策是不一样的,而且缺乏“推理”。在这些案例中,通常一个专攻此类疾病的专家或者详细描述此类疾病的著作将会被咨询。对于这种困难的情形,基于计算机的决策支持系统可以作为一个可供选择的信息来源。而且,这样一个由计算机提供帮助的决策支持系统在指出其他一些原来可能被忽略的疾病方面是有帮助的。它可能就此导致一个被提高的,更加理性的诊断过程,并且更见高效和廉价。

确定性网络研究综述

2019年6月 Journal on Communications June 2019 2019119-1 第40卷第6期 通 信 学 报 V ol.40 No.6确定性网络研究综述 黄韬,汪硕,黄玉栋,郑尧,刘江,刘韵洁 (北京邮电大学网络与交换国家重点实验室,北京 100876) 摘 要:现有的互联网面对激增的视频流量和工业机器应用,存在着大量的拥塞崩溃、数据分组时延等问题, 而许多网络应用,例如工业互联网、远程医疗、无人驾驶、VR 游戏等,需要达到1~10 ms 时延,微秒级抖动, 但传统的网络只能将端到端的时延减少到几十毫秒。在这样的背景下,对网络端到端时延的控制如何从“尽力 而为”到“准时、准确”,成为当前全球关注的热点领域。通过介绍确定性网络的应用场景与需求,描述当前 该领域的主要研究成果,总结分析了该领域的研究发展趋势和核心问题,期望对该领域的研究起到参考和帮助 作用。 关键词:确定性网络;时间敏感网络;5G 移动通信;工业互联网;服务质量;超低时延 中图分类号:TP393 文献标识码:A doi: 10.11959/j.issn.1000?436x.2019119 Survey of the deterministic network HUANG Tao, WANG Shuo, HUANG Yudong, ZHENG Yao, LIU Jiang, LIU Yunjie State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications, Beijing 100876, China Abstract: The current Internet faces a huge increase in video traffic and industrial machine applications, causing a lot of congestion and packet delays. Besides, many network applications, such as industrial Internet, telemedicine, driverless, VR games, etc, require a latency from 1 to 10 milliseconds and jitters within microsecond. But traditional network can only reduce the end-to-end latency to tens of milliseconds. Under this background, how to transit from “best effort” to “punctuality, accuracy”, controlling the end-to-end delay has become a hot field of global network research. The applica- tion scenarios and requirements of the deterministic network were introduced ,and the main research results of the current parties were described as well as the trend of development and core issues were summarized. It hopes to provide a refer- ence and help for the research in this field. Key words: deterministic network , time sensitive network, 5G mobile communication, industrial internet,quality of ser- vice, ultra-low latency 1 引言 以太网自20世纪70年代诞生以来,由于其简 单的网络连接机制、不断提高的带宽以及可扩展性 和兼容性而被广泛使用,根据全球移动数据流量预 测报告[1]显示,到2020年全球IP 网络接入设备将 达263亿台,其中工业和机器连接设备将达122亿台,相当于总连接设备的一半,同时高清和超高清互联网视频流量将占全球互联网流量的64%。 激增的视频流量和工业机器应用,带来了大量的拥塞崩溃和数据分组时延。同时,许多网络应用,例如工业互联网中的数据上传和控制指令下发、远程机器人手术、无人驾驶、VR 游戏等,需要将端到端时延控制在1~10 ms ,将时延抖动控制在微秒收稿日期:2018–12–26;修回日期:2019–02–10 基金项目:中国博士后科学基金资助项目(No. 2018M641281);国家自然科学基金资助项目(No.61872401) Foundation Items: China Postdoctoral Science Foundation Project (No.2018M641281), The National Natural Science Foundation of China (No.61872401)

算法杂货铺——分类算法之贝叶斯网络(Bayesian networks)

算法杂货铺——分类算法之贝叶斯网络(Bayesian networks) 2010-09-18 22:50 by EricZhang(T2噬菌体), 2561 visits, 网摘, 收藏, 编辑 2.1、摘要 在上一篇文章中我们讨论了朴素贝叶斯分类。朴素贝叶斯分类有一个限制条件,就是特征属性必须有条件独立或基本独立(实际上在现实应用中几乎不可能做到完全独立)。当这个条件成立时,朴素贝叶斯分类法的准确率是最高的,但不幸的是,现实中各个特征属性间往往并不条件独立,而是具有较强的相关性,这样就限制了朴素贝叶斯分类的能力。这一篇文章中,我们接着上一篇文章的例子,讨论贝叶斯分类中更高级、应用范围更广的一种算法——贝叶斯网络(又称贝叶斯信念网络或信念网络)。 2.2、重新考虑上一篇的例子 上一篇文章我们使用朴素贝叶斯分类实现了SNS社区中不真实账号的检测。在那个解决方案中,我做了如下假设: i、真实账号比非真实账号平均具有更大的日志密度、各大的好友密度以及更多的使用真实头像。 ii、日志密度、好友密度和是否使用真实头像在账号真实性给定的条件下是独立的。 但是,上述第二条假设很可能并不成立。一般来说,好友密度除了与账号是否真实有关,还与是否有真实头像有关,因为真实的头像会吸引更多人加其为好友。因此,我们为了获取更准确的分类,可以将假设修改如下: i、真实账号比非真实账号平均具有更大的日志密度、各大的好友密度以及更多的使用真实头像。 ii、日志密度与好友密度、日志密度与是否使用真实头像在账号真实性给定的条件下是独立的。 iii、使用真实头像的用户比使用非真实头像的用户平均有更大的好友密度。

贝叶斯网络研究

黄友平 构建一个指定领域的贝叶斯网络包括三个任务: ①标识影响该领域的变量及其它们的可能值; ②标识变量间的依赖关系,并以图形化的方式表示出来; ③学习变量间的分布参数,获得局部概率分布表。 实际上建立一个贝叶斯网络往往是上述三个过程迭代地、反复地交互过程。 一般情况下,有三种不同的方式来构造贝叶斯网:①由领域专家确定贝叶 斯网的变量(有时也成为影响因子)节点,然后通过专家的知识来确定贝叶斯网络的结构,并指定它的分布参数。这种方式构造的贝叶斯网完全在专家的指导下进行,由于人类获得知识的有限性,导致构建的网络与实践中积累下的数据具有很大的偏差;②由领域专家确定贝叶斯网络的节点,通过大量的训练数据,来学习贝叶斯网的结构和参数。这种方式完全是一种数据驱动的方法,具有很强的适应性。而且随着人工智能、数据挖掘和机器学习的不断发展,使得这种方法成为可能。如何从数据中学习贝叶斯网的结构和参数,已经成为贝叶斯网络研究的热点。③由领域专家确定贝叶斯网络的节点,通过专家的知识来指定网络的结构,而通过机器学习的方法从数据中学习网络的参数。这种方式实际上是前两种方式的折中,当领域中变量之间的关系较明显的情况下,这种方法能大大提高学习的效率。 在由领域专家确定贝叶斯网络的节点后,构造贝叶斯 网的主要任务就是学习它的结构和参数。 为使贝叶斯网作为知识模型是可用的, 在学习过程中致力于寻找一种最简单的网络结构是非常必要的,这种简单的结构模型称之为稀疏网络,它含有最少可能的参数及最少可能的依赖关系。 Bayesian 网是联合概率分布的简化表示形式,可以计算变量空间的任意概 率值。当变量数目很大时,运用联合概率分布进行计算通常是不可行的,概率数目是变量数目的指数幂,计算量难以承受。Bayesian 网利用独立因果影响关系解决了这个难题。Bayesian 网中三种独立关系:条件独立、上下文独立及因果影响独立。三种独立关系旨在把联合概率分布分解成更小的因式,从而达到节省存储空间、简化知识获取和领域建模过程、降低推理过程中计算复杂性的目的,因此可以说独立关系是Bayesian 网的灵魂。 贝叶斯网络结构的方法分成两类: 基于评分的方法(Based on scoring)和 基于条件独立性的方法(Based on Conditional independence)。 。基于评分的方法把贝叶斯网络看成是含有属性之

相关主题
文本预览
相关文档 最新文档