摘要
摘要
药物间相互作用(Drug-DrugInteraction,DDI)是指同时或先后服用两种及以上的
药物时,这些药物间产生相互作用导致药效发生改变的情况。了解药物间相互作用关
系对于现有药物知识库的更新、生物医药的研发及药物知识的普及具有重要意义。本
文通过对药物关系抽取任务(Drug-DrugInteractionExtraction,DDIE)和药物关系预
测任务(Drug-DrugInteractionPrediction,DDIP)进行研究,完成了DDI关系的识别,
同时,基于前文的算法设计并实现了药物关系查询系统。具体工作内容如下:
(1)对于DDIE任务,针对当前大部分方法未能处理样本误分问题和数据集不
均衡问题,本文提出一种基于知识图谱的药物关系抽取算法,有效缓解了这些问题。
该算法将DDIExtraction2013数据集和DrugBank数据集整合形成药物关系知识图谱,
通过知识图谱嵌入(KnowledgeGraphEmbedding,KGE)方法将图谱中包含的先验知
识融入到模型中,同时提出KGE-MFL损失函数,有效缓解该数据集不均衡的问题。
实验结果表明,本方法在DDIExtraction2013数据集中取得目前最高的F1值,达到
86.24%。
(2)对于DDIP任务,针对当前大部分方法忽略文本特征的问题,本文提出一
种基于BERT和分子结构的药物关系预测算法。该算法融合药物实体的分子特征、文
本特征和相互作用特征来完成DDIP任务,首先通过BERT模型在DDIP任务数据集
微调后,得到包含先验知识的文本特征;然后使用药物SMILES信息结合图神经网络
(GraphNeuralNetworks,GNNs)得到药物分子特征和分子结构间相互作用特征;最
后拼接药物分子特征、文本特征和相互作用特征输入具有门控机制的多层感知机
gMLP中得到分类结果。实验表明,本方法在直推式和归纳式测试集中均取得当
2
前最高ACC值,分别达到97.32%和78.12%。
(3)在前述工作基础上,本文通过系统需求分析、系统设计、系统实现及测试
等步骤,完成药物关系查询系统相关工作,验证了前述研究的现实意义。该系统包含
管理员用户、科研用户和普通用户三种角色,对管理员用户提供用户管理、文献管理
和药物关系展示功能,为科研用户提供药物基础信息、药物关系预测的管理功能,普
通用户则可以查询药物间相互作用信息。
综上所述,本文提出的基于知识图谱的药物关系抽取算法可以从生物医学文本中
I
西北大学硕士学位论文
准确的识别出DDI关系,基于BERT和分子结构的药物关系预测算法能够抽取出药
物分子结构信息,可视化后具有直观的可解释性,最后通过实现药物关系查询系统,
验证了本文工作的有效性,使研究成果更具现实意义。
关键词:自然语言处理,药物相互作用,知识图谱,不均衡问题,药物分子结构
II
ABSTRACT
ABSTRACT
Drug-DrugInteraction(DDI)referstoasituationinwhichtheseinteractionsresultina
changeindrugefficacywhentwoormoredrugsaretakensimultaneouslyorsuccessively.
Understandingtheinteractionbetweendrugsisofgreatsignifica