基于变分自编码器的跨域推荐算法研究
摘要
推荐系统是一种利用机器学习、数据挖掘等技术,根据用户的行为和偏好,自动
为用户推荐相关的信息、商品或服务的系统。随着互联网和移动通信的发展,人们可
以轻松地获取大量的信息和商品。然而,由于数量庞大,用户需要耗费大量的时间和
精力去搜索和筛选,这使得信息和商品的获取变得更具挑战性。为了提高用户的体验
和满意度,推荐系统应运而生,它可以自动过滤出符合用户兴趣和需求的信息和商品。
在短视频APP中,推荐系统可以根据用户的观看历史、点赞、评论等行为,推荐符合
用户喜好的视频,让用户更容易发现感兴趣的内容。在音乐APP中,推荐系统可以根
据用户的收听历史、点赞、评论等信息,推荐符合用户喜好的音乐。
传统的推荐算法存在数据的高稀疏性、无法针对新用户或新物品进行准确推荐,
以及可拓展性方面的不足等问题。这些问题导致了推荐系统存在严重的冷启动问题。
针对这些问题,可以通过添加数据稠密的辅助域来扩充数据稀疏的数据域,缓解数据
稀疏等问题,所以本文引入了跨域推荐算法。跨域推荐算法利用源域的用户潜在兴趣,
进行特征提取并应用于目标域上,可有效提升推荐精度。本文使用变分自编码器提取
用户潜在兴趣,相比于传统的神经网络,变分自编码器不是一个黑盒模型,而且其特
性使得它更容易获取用户的潜在信息,从而提高算法的精度。
本文对提出的推荐算法进行了详细的理论分析和实验研究,并阐述了该方法的实
现原理及其可行性。针对推荐系统存在数据稀疏和冷启动的问题,提出了基于变分自
编码器的融合特征的跨域推荐算法DAVae,并对变分自编码器进行了改进,对其添加
噪声达到了降噪的效果,同时还研究了KL散度的权重对模型性能的影响。为了更好的
提取源域和目标域的用户潜在特征,本文在DaVae的基础上提出了基于VAE-LSTM融
合特征的跨域推荐算法DAVaeLstm。因为LSTM可以更好地处理噪声和不完整的数据,
所以把LSTM模型作为VAE的编码器,用于提取源域和目标域的用户潜在特征。
本文中提出的基于变分自编码器的跨域推荐算法DAVae和DAVaeLstm在推荐性能
方面均优于传统的推荐算法。实验结果表明,该算法可以有效地提高推荐系统的准确
性和鲁棒性,为现代互联网应用的推荐系统提供了一个新的思路和方法。
关键词:跨域推荐;特征提取;变分自编码器;神经网络;冷启动
基于变分自编码器的跨域推荐算法研究
Abstract
Recommendationsystemisasystemthatusesmachinelearning,dataminingandother
technologiestoautomaticallyrecommendrelevantinformation,goodsorservicestousers
accordingtotheirbehaviorsandpreferences.WiththedevelopmentofInternetandmobile
communication,peoplecaneasilygetalotofinformationandgoods.However,duetothe
largenumber,usersneedtospendalotoftimeandenergysearchingandfiltering,which
makestheacquisitionofinformationandgoodsmorechallenging.Inordertoimproveusers
experienceandsatisfaction,therecommendationsystemcomesinto