证券研究报告正文目录
证券研究报告
引言 4
方法 6
收缩方法 6
文本网络TBN 7
强化学习 9
强化学习的优势 9
RL问题陈述 10
近端策略优化PPO 11
滚动窗口程序 12
实证分析 12
3.1数据 13
最优策略 13
回溯测试 14
回溯测试程序 14
投资组合绩效指标 14
3.3.3基准 15
主要结论 17
其他结果 19
确定性等值收益 19
策略的可解释性 20
模型机制的理解分析 20
矩阵范数 21
面板回归 22
面板向量自回归 23
方差化简 25
5结论 26
风险提示: 27
证券研究报告图表目录
证券研究报告
图表1文章框架 4图表2相关性和基于文本的网络 9图表3强化学习训练 13
图表4样本外投资组合性能 16
图表5不同规格的性能比较 18图表6RL优异表现的描述性统计 18图表7样本外确定性等效回报 19
图表8收缩强度和宏观指标的描述性统计 20
图表9基于文本的矩阵范数和样本相关矩阵 21图表10TBN汇总统计数据--相关面板 22图表11预测回归 22图表12面板数据的向量自回归模型 24图表13脉冲响应 24图表14两个随机分裂的BN组的FROBENIUS范数的时间序列 25
图表15样本外投资组合性能(低方差和高方差TBN组) 26
引言
图表1文章框架
华安证券研究所整理
华安证券研究所整理
资料来源:马科维茨(1952)的开创性著作建立了投资组合选择的均值-方差模型,其应用对估计误差的敏感性已得到公认(Best和Grauer,1991)。特别是在投资组合选择的第一阶段,需要对相关证券收益的未来均值、方差和相关性进行估计。第二阶段以这些估计值为基础,找到最优配置。然而,忽略估计误差会导致样本外绩效不佳(Michaud,1989)。此外,虽然估计误差来自均值向量和协方差矩阵,但众所周知,前者的估计误差更大(Merton,1980)。鉴于这些挑战,研究人员提出了不同的协方差矩阵估计技术,并使用全局最小方差(以下简称GMV)组合研究了这些技术的吸引力,这需要单独估计协方差矩阵(Ledoit和Wolf,2022)。
资料来源:
文献中提出了许多方法来降低投资组合选择中的估计风险。其中,Ledoit和Wolf(2003)的开创性著作提出了一种线性收缩技术,将样本协方差矩阵与收缩目标相结合。缩减技术的原理是在估计值中引入偏差,以换取方差的缩小,即所谓的偏差-方差权衡。在投资组合选择方面,传统观点认为稳健的估计会带来稳健的投
证券研究报告资组合。在这方面,投资组合选择问题可视为协方差矩阵估计值均方误差(MSE)
证券研究报告
的最小化。
一般来说,收缩技术需要两个组成部分。一个是明确定义的收缩目标,另一个是收缩强度。收缩目标的典型候选者是关于协方差矩阵的先验知识。例如,Ledoit
和Wolf(2003)将资本资产定价模型(CAPM)加到收缩目标中,而Ledoit和Wolf(2004a)则利用了其他金融市场特征,如股票收益的平均相关性。此外,Ledoit和Wolf(2004b)提出将单位矩阵作为通用收缩目标,而DeNard(2022)则将这一想法推广到平衡单位矩阵的对角线和非对角线元素。这种分析有助于推导缩减协方差矩阵的渐近分布特性,最终确定最佳和可行的缩减强度。然而,这种分析假设股票收益是独立同分布的(LedoitWolf,2022),尽管有大量证据表明情况恰恰相反(例如,见St?ric?Granger,2005)。
此外,自然语言处理(NLP)领域采用Hoberg和Phillips(2016)提出的所谓基于文本的网络(TBN)来确定协方差矩阵目标。从长远的角度来看,RL使我们能够确定与时间一致的收缩策略,该策略包含了未来由相关资产的新闻所驱动的,
并反映了未来的投资组合再平衡的对冲需求。此外,RL克服了对数据生成过程的任何限制(KolmRitter,2020),这使我们能够纳入替代数据,而这些数据并不一定来自股票收益的相同数据生成函数。
我们的主要实证分析是预测性(样本外),采用了回溯测试程序,并利用了在美国三大证券交易所上市的大量股票数据。我们将CRSP数据库与Hoberg和Phillips(2016)的TBN数据库合并,找到了从1995年到2022年持续存在的430
家公司的股票收益率和TBN数据。我们采用了五年的滚动窗口进行回溯测试,以确定每年年底的最优收缩策略。具体来说,对于每个训练子集,我们都要训练一