[Table_PageTop]策略专题报告
目录
1.前言4
2.自然语言处理方法之BERT模型介绍5
3.基于投资者评论文本的情感分析9
3.1.投资者文本数据的获取和预处理9
3.2.基于BERT模型的评论文本分析13
3.3.基于情感词典的评论文本分析18
4.总结28
5.参考文献29
6.风险提示30
请务必阅读正文后的声明及说明2/32
[Table_PageTop]策略专题报告
图表目录
图1:预训练模型架构间的差异5
图2:BERT模型的预训练与微调6
图3:BERT模型的输入7
图4:BERT模型任务:句子对分类8
图5:BERT模型任务:单句分类8
图6:BERT模型任务:问答8
图7:BERT模型任务:单句打标8
图8:东方财富网上证指数吧评论举例9
图9:评论文本的长度分布10
图10:评论文本月度数量分布情况11
图11:不同星期的评论数量占比情况11
图12:不同时点的评论数量占比情况12
图13:BERT模型应用流程13
图14:BERT模型方法之下看多、看空和中性评论的数量关系15
图15:基于评论阅读量加权的情绪得分与上证指数走势16
图16:情绪得分与上证指数当日涨跌幅相关性16
图17:情绪得分与上证指数次日涨跌幅相关性16
图18:情绪得分与上证指数当日成交额相关性17
图19:情绪得分与上证指数次日成交额相关性17
图20:情感词典标注法的分析步骤18
图21:基于积极消极词数的月度情绪指标19
图22:情感词典方法之下看多、看空和中性评论的数量关系20
图23:情感词典方法之下看多、看空和中性评论的百分比20
图24:情绪分歧度指标与上证指数走势21
图25:看空评论占全部评论比例与上证指数走势22
图26:看空看多评论比例与上证指数走势22
图27:看空评论占全部评论比例与上证指数当日涨跌幅相关性23
图28:看空评论占全部评论比例与上证指数次日涨跌幅相关性23
图29:看空看多评论比例与上证指数当日涨跌幅相关性23
图30:看空看多评论比例与上证指数次日涨跌幅相关性23
图31:看空评论占全部评论比例与上证指数当日成交额相关性24
图32:看空评论占全部评论比例与上证指数次日成交额相关性24
图33:看空看多评论比例与上证指数当日成交额相关性24
图34:看空看多评论比例与上证指数次日成交额相关性24
图35:看空评论占全部评论比例与上证指数N日后涨跌幅的平均相关系数25
图36:看空看多比例与上证指数N日后涨跌幅的平均相关系数25
图37:看空评论占全部评论比例与上证指数N日后成交额的平均相关系数25
图38:看空看多评论比例与上证指数N日后成交额的平均相关系数25
图39:基于积极消极词数的情绪指标与上证指数走势26
图40:看空评论占全部评论比例与上证指数走势27
表1:BERT模型准确度14
表2:BERT模型