基本信息
文件名称:机器学习金融工程月报:机器学习因子选股月报.pdf
文件大小:885.91 KB
总页数:9 页
更新时间:2025-06-03
总字数:约9.87千字
文档摘要

机器学习金融工程月报

目录

1前言1

2GAN_GRU模型简介1

2.1GRU模型基本假设1

2.2GAN模型简介2

2.3GAN特征生成模型构建4

3GAN_GRU因子表现6

4GAN_GRU因子多头组合7

5风险提示8

请务必阅读正文后的重要声明部分

机器学习金融工程月报

图目录

图1:深度学习选股模型结构2

图2:生成对抗网络(GAN)模型示意4

图3:卷积神经网络(CNN)模型示意5

图4:GAN_GRU模型示意5

图5:GAN_GRU因子各行业近期IC表现6

图6:GAN_GRU因子各行业近期多头组合表7

表目录

表1:深度学习选股量价特征表1

表2:GAN_GRU因子历史表现6

表3:2025年5月末模型输出各行业排名第一个股7

表4:因子得分排名前十的个股8

请务必阅读正文后的重要声明部分

机器学习金融工程月报

1前言

本篇,我们基于西南金工前期发布报告《量价时序特征挖掘模型在深度学习因子中的应

用》(2024年7月11日)中提到的GAN_GRU模型,定期更新GAN_GRU因子自2024年

以来表现情况。其中GAN_GRU因子为利用生成式对抗神经网络GAN模型进行量价时序特

征处理后再利用GRU模型进行时序特征编码得到的选股因子。

2GAN_GRU模型简介

2.1GRU模型基本假设

前期报告《量价时序特征挖掘模型在深度学习因子中的应用》中,主要构建了GRU+MLP

的神经网络股票收益预测基本模型,其中模型细节如下:

量价特征:包括收盘价、开盘价、成交量、换手率等在内的18个量价特征。

调仓频率:以月频调仓方式进行预测和回测。

训练与预测方式:

(1)训练数据及输入特征设定:所有个股过去400天内的18个量价特征,每5个交

易日做一次特征采样。特征采样形状为40*18,即利用过去40天的量价特征来预

测未来20个交易日的累计收益。

(2)训练集验证集比例:80%:20%。

(3)数据处理:每次采样的40天内,每个特征在时序上去极值+标准化、每个特征在

个股层面上截面标准化。

(4)模型训练方式:半年滚动训练,即每半年做一次模型训练,并用以未来半年收益

的预测,训练时间点为每年的6月30日及12月31日。

(5)股票筛选方式:选取截面所有股票,剔除ST及上市不足半年的股票。

(6)训练样本筛选方式:剔除label为空值的样本。

(7)超参数:batch_size为截面股票数量、优化器Adam、学习速率1e-4、损失函数

IC、早停轮数10、最大训练轮数50。

表1:深度学习选股量价特征表

特征名称特征助记符特征说明频次

前收盘价PrevClosePrice当日前一天收盘价