基于LTSA的半监督多标签传播方法研究
摘要
随着信息化时代和科技的不断发展,数据已经从传统的简单结构和小规模变成了
具有复杂结构和维度,规模庞大的信息载体。多标签学习相较于传统的单标签学习能
处理更加丰富的信息,因此,多标签学习方法已经被广泛应用于机器学习,数据分析,
模式识别等领域。但是在现实世界中,拥有标签的数据往往是少量的,因此,半监督
的多标签学习是十分重要的研究课题。此外,多标签学习中的特征和标签往往拥有复
杂的关系,如何探究特征和标签之间的关系也成为了重要的研究课题。
为了探究标签和特征之间的复杂关系,完成半监督多标签学习下的标签传播,本
文结合局部切空间对齐算法(LTSA),提出了基于半监督多标签信息的LTSA算法
(SSLTSA),并在此基础上提出了基于LTSA的半监督多标签传播算法(SSLTSAMLP),
同时利用监督信息构造超图,结合超图拉普拉斯矩阵指导降维,在对数据特征进行降
维的同时将低维特征空间和标签空间建立起线性映射,完成半监督下的标签传播。
考虑到流形学习只能够刻画数据的局部的流形结构,不能对数据全局结构进行刻
画,本文在基于LTSA的半监督多标签传播算法的基础上融合了子空间低秩表示,提出
了基于LTSA和低秩子空间表示的半监督多标签传播方法(SSLTSALRRMLP),在刻画
数据的流形结构同时完成半监督情况下的标签传播。
本文选取了几个不同的评价指标,将提出的两种方法和其他几种代表性的方法进
行实验比较,验证了本文提出方法在半监督多标签学习中的优越性。
关键词:局部切空间对齐算法;多标签学习;子空间表示;超图学习;半监督学习
基于LTSA的半监督多标签传播方法研究
ABSTRACT
Withthedevelopmentoftheinformationandtechnology,datahaschangedfromthe
traditionalsimplestructureandsmall-scaledataintoalargescaleinformationcarrierwith
complexstructureandhighdimension.Comparedwithtraditionalsinglelabellearning,multi-
labellearningcanprocessricherinformation.Therefore,multi-labellearninghasbeenwidely
usedinmachinelearning,dataanalysis,patternrecognitionandotherfields.However,inthe
realworld,thedatawithlabelsareveryrare,sosemi-supervisedmulti-labellearningisavery
importantresearchtopic.Inaddition,thereisoftenacomplexrelationshipbetweenfeaturesand
labelsinmulti-labellearning,sohowtoexploretherelationshipbetweenfeaturesandlabels
hasalsobecomeanimportantresearchtopic.
Inordertoexplorethecomplexrelationshipbetweenlabelsandfeatures,andcomplete
labelpropagationundersemi-supervisedsituation,thispapercombinedwiththelocaltangent
spacealignmentalgorithm(LTSA),proposedthelocaltangentspacealignm