证券研究报告
金工
多角度改进高频量价选股模型
研究
2025年3月21日│中国内地深度研究
人工智能89:从因子端、模型端、标签端改进高频量价选股模型
随着市场微观结构研究的深入,高频量价数据在量化投资中的重要性日益凸
显。传统的人工挖掘因子和简单模型方法难以充分捕捉高频数据中的复杂规
律。本文从因子端、模型端、标签端三个角度,探讨对前期高频量价模型的
改进:在因子端引入大语言模型生成的分钟线、等量K线和tick因子,以
更全面地捕捉市场信息;在模型端采用Transformer架构,并借鉴
iTransformer和Crossformer模型,通过引入变量间注意力机制,提升对高
改进因子的分层相对净值
频数据的表征能力;在标签端将预测目标从未来10日总收益调整为未来10
日逐日收益序列,以提供更细粒度的投资信号。8第1层第2层
第3层第4层
第5层第6层
第7层第8层
改进方向一:引入大语言模型生成因子6第9层第10层
我们利用大语言模型,分别基于分钟线、等量K线和tick数据各生成1004
个因子。其中,分钟线因子刻画了股票日内收益、价格波动、成交分布、量
价相关性等特征;等量K线因子反映了股票在均匀成交量下的价格趋势、2
价格波动、收益分布等特征;tick因子则捕捉了股票流动性、订单不平衡等
特征。实证结果表明,相比于人工特征集,基于GPT特征集训练的深度学0111111111
000000000
/////////
习因子在多个指标上表现更优,2017年初至2025年2月底的周度RankIC789012345
111222222
000000000
222222222
达11.18%,全A多头年化超额收益为25.51%,在80%成份股和无成份股
约束场景下构建中证1000指数增强组合,年化超额收益分别达到19.08%资料:Wind,研究
和20.67%,信息比率分别为3.26和2.81。
改进方向二:引入变量间注意力
Transformer通过多头注意力捕捉输入序列中不同位置间的依赖关系;
iTransformer创新性地将时间序列维度反转,通过自注意力机制捕捉变量间
的相关性;Crossformer则通过两阶段注意力机制,同时捕