摘要
解决技术问题是发明创造的目的,问题导向是人们进行技术创新的思维方式之一。
研究面向技术问题的专利推荐方法,可以有效地帮助用户在解决相似技术问题时,快
速获得可借鉴的解决方案。本文以技术问题为主体构建了面向技术问题的专利知识图
谱,并提出了基于专利图谱和用户短行为序列的专利推荐算法。主要研究内容如下:
1
()在分析专利数据的基础上,定义面向技术问题的专利知识图谱框架。该专
利图谱以问题导向的专利推荐为应用目标,确定了专利、技术问题和技术领域为主要
本体以及每个本体在专利图谱中实体与关系的类型。
2
()构建专利图谱的关键技术是技术问题本体知识的抽取,本文提出一种基于
事件抽取的技术问题本体要素抽取算法。其主要流程分为两步:首先,使用技术问题
线索词的统计特征代替事件抽取中的触发词,并利用技术问题句含有负面情感的特点,
采用基于情感分析方法抽取专利中技术问题句。其次,针对现有的事件要素抽取方法
忽略了不同要素之间概念相关性的问题,提出了基于层次特征的技术问题本体要素抽
取模型。在定义技术问题本体要素和上级要素的基础上,通过概念层次注意力机制结
合技术问题要素特征和其上级概念特征。实验结果表明,技术问题句的抽取能够提高
模型召回率,概念层次注意力机制对上级概念特征的利用提高了模型抽取性能。
3
()基于知识图谱和异构超图的专利推荐模型。为了解决专利推荐中用户行为
信息稀疏的问题,本文专利推荐模型以会话推荐模型为基线模型,其与一般会话推荐
利用项目的单一特征不同,利用了专利中的技术问题和技术领域两个特征。专利推荐
模型首先使用基于元路径的随机游走获取专利图谱中专利、技术问题和技术领域节点
的嵌入。然后,将用户短行为序列与专利图谱中节点嵌入相结合构建了用户偏好异构
超图,使用双通道聚合机制提取异构超图中用户的技术问题和技术领域原始偏好。接
着,采用一种协同学习的方法建模了技术问题偏好和技术领域偏好之间的复杂关系,
使两者可以互相丰富语义,更好地表征用户面向技术问题的专利偏好。在本文构建的
专利推荐数据集上的实验结果表明,技术问题偏好和技术领域偏好结合能更好地表征
用户偏好,提高了推荐模型的准确性,推荐模型与基线模型相比取得了更好的效果。
最后,本文通过技术问题抽取模型与人工相结合的方式建立了面向技术问题的专
利图谱;并以基于知识图谱和异构超图的专利推荐算法为核心,设计开发了专利推荐
系统,实现了问题导向的专利推荐。
关键词:技术问题;事件抽取;专利图谱;超图;推荐
I
II
ABSTRACT
Solvingtechnicalissuesisthepurposeofinventionandcreation,andproblem
orientationisoneofthewaysofthinkingforpeopletoconducttechnicalinnovation.The
studyofpatentrecommendationmethodsorientedtotechnicalissuescaneffectivelyhelp
userstoquicklyobtainareferenceablesolutionwhensolvingsimilartechnicalissues.In
thisthesis,weconstructapatentknowledgegraphorientedtotechnicalissuesandpropose
apatentrecommendationalgorithmbasedonthepatentgraphandusershortbehavior
sequences.Themainresearchcontentsareasfollows:
(1)Basedontheanalysisofpatentdomaindata,thepatentknowledgegraph
frameworkfortechnicalissuesisdefin