基本信息
文件名称:2025《分层强化学习基础理论概述》1800字.docx
文件大小:16.45 KB
总页数:3 页
更新时间:2025-08-05
总字数:约2.05千字
文档摘要

分层强化学习基础理论概述

经典强化学习的算法复杂性随着空间数量的增加而迅速增长,因此研究人员对强化学习应用抽象和其他处理方法,并将强化学习推广到分层强化学习(HierarchicalHeinforcementLearning,HRL)。最主要的复杂问题在分层之后,被分解成一系列的小问题。分层强化学习算法的核心思想是引入抽象机制,将强化学习任务分解到不同的层次,使每个层次的学习任务都能在较低的维度上完成。

经典马尔可夫决策过程模型只考虑了决策的顺序性而忽略决策的时间性。基于马尔可夫决策过程的强化学习都假设动作在单个时间步完成,因而无法处理需要在多个时间步完成的动作。为解决此问题,引入半马尔