基本信息
文件名称:基于自适应高斯噪声和改进信心权重的Model-based强化学习算法研究.pdf
文件大小:3.61 MB
总页数:68 页
更新时间:2026-01-15
总字数:约16.09万字
文档摘要

摘要

基于模型的强化学习(ModelBasedReinforcementLearning,MBRL)方法利用动力学

模型执行动作规划或策略选择,在机器人学习(RobotLearning)领域显示出很大应用潜

力。尽管很多MBRL方法在样本效率和渐进性能方面取得了不错进展,但对于复杂场景

下的高维学习任务,智能体的探索能力及稳定训练能力仍有待增强。针对上述问题,本文

从策略规划和策略优化的角度出发,提出了基于自适应高斯噪声和改进