摘要
摘要
在现代工业生产中,机械设备的稳定运行对保证生产效率和安全至关重要。
由于机械设备故障频发,故障诊断和维护成为了一个亟待解决的问题。随着人工
智能技术的发展,利用知识图谱进行对机械设备故障的智能化分析已成为研究热
点。本文分析了机械设备故障领域的特点,阐明了数据构建时存在的主要挑战,
包括数据不平衡,数据分布稀疏等问题。在图谱融合知识的过程中,又发现实体
匹配准确度低、知识融合效率不高等问题。针对这些挑战,本文进行了以下研究
以提升知识图谱质量。采用了融合焦点损失函数和专业词典的实体识别方法,通
过改进传统的命名实体识别模型,提高了实体识别的准确性和鲁棒性。结合图神
经网络和注意力机制,提出了一种新的实体对齐方法,以优化实体匹配过程。通
过引入多种图结构信息,提出了一种新的实体链接方法,提高了实体链接的准确
率。本文具体研究工作如下:
1
()在构建关于机械设备故障图谱的过程中,存在有数据不平衡的问题,为
了在知识抽取任务中取得较好的效果,提出一种融合焦点损失函数的命名实体识
别方法,通过引入平衡因子和调制系数改进交叉熵损失函数,平衡样本分布,并
通过融合领域词汇来进一步提高实体识别效果。
(2)在实体对齐的任务中,以往的图神经网络研究总是丢失关系中的语义信
息,本文通过分析每个实体的临近节点及关联关系所蕴含的关系元语义,构建出
能够充分反映实体关系特异性的向量表示,由此提出了一种结合图神经网络和关
系感知自注意力机制的实体对齐方法,有效提升了实体对齐的精确率。鉴于标注
数据量相对较少的问题,本文还运用实体对齐所具备的双向对称性特征,提出了
一种简洁但高效的双向迭代策略进行改善。
(3)在实体链接任务中,以往的研究往往聚焦于单一特征的探索,本文则提
出了一种融合多特征的实体链接方法,构建的模型融合了多种图结构:实体指称
语义关联图、实体指称层级关系图以及候选实体类型关联图。通过在图神经网络
中结合这三种图特征信息,该模型可以有效学习到候选实体的表示,并由此计算
得出候选实体的排序分数。这一方法显著提升了实体链接算法的性能,为实体链
接任务提供了新的思路和方法。
关键词:知识图谱;机械设备故障;命名实体识别;实体对齐;实体链接
I
目录
目录
第1章绪论1
1.1研究背景和意义1
1.2国内外研究现状分析2
1.2.1知识图谱研究现状2
1.2.2知识融合研究现状4
1.3论文主要内容7
1.4论文结构安排8
210
第章相关理论与技术
2.1知识图谱构建技术10
2.2命名实体识别11
2.3实体对齐11
2.4实体链接12
2.5图神经网络14
2.6本章小结15
第3章面向不平衡机械设备故障的命名实体识别16
3.1引言16
3.2模型结构设计16
3.2.1嵌入层17
3.2.2编码层18
3.2.3解码层19
3.3实验与分析20
3.3.1数据集构建20
3.3.2实验设置与参数设置21
3.3.3评价指标22
3.3.4模型识别结果分析22
3.3.5细粒度结果分析23
3.4本章小结23
第4章结合图神经网络和注意力机制的实体对齐方法25
4.1引言25
4.2RAEAM原理介绍26
IV
西北师范大学硕士学位论文
4.2.1构建相邻实体关系集合26
4.