基于自适应高斯噪声和改进信心权重的Model-based强化学习算法研究.pdf

基本信息

文件名称：基于自适应高斯噪声和改进信心权重的Model-based强化学习算法研究.pdf

文件大小：3.61 MB

总页数：68 页

更新时间：2026-01-15

总字数：约16.09万字

文档摘要

摘要

基于模型的强化学习（ModelBasedReinforcementLearning，MBRL）方法利用动力学

模型执行动作规划或策略选择，在机器人学习（RobotLearning）领域显示出很大应用潜

力。尽管很多MBRL方法在样本效率和渐进性能方面取得了不错进展，但对于复杂场景

下的高维学习任务，智能体的探索能力及稳定训练能力仍有待增强。针对上述问题，本文

从策略规划和策略优化的角度出发，提出了基于自适应高斯噪声和改进