五
[Table_StockNameRptType]
金融工程
专题报告
使用深度强化学习解决高维多期环境下的组合配置
——“学海拾珠”系列之二百二十七
报告日期:2025-03-13主要观点:
[Table_RptDate]
[Table_Summary]
本篇是“学海拾珠”系列第二百二十七篇,文献设计了一个先进的
投资组合配置框架,使用卷积神经网络获得资产价格的动态模式,并通
过WaveNet对跨资产依赖性进行建模,结合DRL方法求解多期
Bellman方程,获得最优长期投资组合配置。在不同持有期、风险厌恶
系数、交易成本和不同指数上进行实证测试后,发现该方法较为优越。
回到国内市场,我们也可以应用类似的深度强化学习模型进行组合构
建。
?投资者的长期优化问题
传统的投资组合选择方法通常考虑单期收益。Markovitz(1952)开
创了均值-方差优化模型,是投资组合理论的基础。
文献提出一个基于DRL(含CNN和WaveNet)的投资组合框架来
解决高维多周期环境下的优化问题,所设计的投资组合策略框架主要包
括三个组成部分。首先,采用基于卷积神经网络(CNN)的序列信息来
捕捉每种资产价格中的动态模式。其次,使用WaveNet对投资组合中
[Table_CompanyReport]
相关报告资产之间的交叉依赖性进行建模,这在高维环境中尤为重要。最后,将
1.《风险规避型强化学习模型在投资以上两大部分作为DPG模型的输入来优化投资组合配置,将该方法表
组合优化中的应用——“学海拾珠”示为MP-Adv-DRL-Cor。
系列之二百二十六》
2.《贝塔异象的波动性之谜——“学?实证结果
海拾珠”系列之二百二十五》投资组合的盈利能力随着投资期限的延长而增加,同时年度波动率
3.《ETF的资产配置与再平衡:样本协也上升。风险厌恶系数λ的增加意味着投资者更倾向于选择保守策略以
方差对比EWMA与GARCH模型—降低投资组合风险。这种偏好导致交易频率和投资活动减少,获得高额
—“学海拾珠”系列之二百二十四》年回报和高夏普比率的可能性受到限制。交易成本的存在主要影响投资
4.《市场对投资者情绪的反应——“学组合的盈利能力,而不会增加风险,它还对投资组合的换手率产生重大
海拾珠”系列之二百二十三》影响。在存在交易成本的情况下,投资者在投资机会随时间变化时调整
5.《基于语境的财务信息解读——“学投资组合权重的动机减少。
海拾珠”系列之二百二十二》通常,MP-Adv-DRL-Cor方法的业绩表现优于其他比较方法。对于
6.《跟踪误差的构成成分、中期交易与持有期h=1,交易成本ξ=0.05%和风险厌恶系数λ=0.1的条件下,