机器学习金融工程月报
目录
1前言1
2GAN_GRU模型简介1
2.1GRU模型基本假设1
2.2GAN模型简介2
2.3GAN特征生成模型构建4
3GAN_GRU因子表现6
4GAN_GRU因子多头组合7
5风险提示8
请务必阅读正文后的重要声明部分
机器学习金融工程月报
图目录
图1:深度学习选股模型结构2
图2:生成对抗网络(GAN)模型示意4
图3:卷积神经网络(CNN)模型示意5
图4:GAN_GRU模型示意5
图5:GAN_GRU因子各行业近期IC表现6
图6:GAN_GRU因子各行业近期多头组合表7
表目录
表1:深度学习选股量价特征表1
表2:GAN_GRU因子历史表现6
表3:2025年5月末模型输出各行业排名第一个股7
表4:因子得分排名前十的个股8
请务必阅读正文后的重要声明部分
机器学习金融工程月报
1前言
本篇,我们基于西南金工前期发布报告《量价时序特征挖掘模型在深度学习因子中的应
用》(2024年7月11日)中提到的GAN_GRU模型,定期更新GAN_GRU因子自2024年
以来表现情况。其中GAN_GRU因子为利用生成式对抗神经网络GAN模型进行量价时序特
征处理后再利用GRU模型进行时序特征编码得到的选股因子。
2GAN_GRU模型简介
2.1GRU模型基本假设
前期报告《量价时序特征挖掘模型在深度学习因子中的应用》中,主要构建了GRU+MLP
的神经网络股票收益预测基本模型,其中模型细节如下:
量价特征:包括收盘价、开盘价、成交量、换手率等在内的18个量价特征。
调仓频率:以月频调仓方式进行预测和回测。
训练与预测方式:
(1)训练数据及输入特征设定:所有个股过去400天内的18个量价特征,每5个交
易日做一次特征采样。特征采样形状为40*18,即利用过去40天的量价特征来预
测未来20个交易日的累计收益。
(2)训练集验证集比例:80%:20%。
(3)数据处理:每次采样的40天内,每个特征在时序上去极值+标准化、每个特征在
个股层面上截面标准化。
(4)模型训练方式:半年滚动训练,即每半年做一次模型训练,并用以未来半年收益
的预测,训练时间点为每年的6月30日及12月31日。
(5)股票筛选方式:选取截面所有股票,剔除ST及上市不足半年的股票。
(6)训练样本筛选方式:剔除label为空值的样本。
(7)超参数:batch_size为截面股票数量、优化器Adam、学习速率1e-4、损失函数
IC、早停轮数10、最大训练轮数50。
表1:深度学习选股量价特征表
特征名称特征助记符特征说明频次
前收盘价PrevClosePrice当日前一天收盘价