基本信息
文件名称:清华大学《机器学习》ppt课件 14-强化学习1.pptx
文件大小:3.59 MB
总页数:48 页
更新时间:2025-06-25
总字数:约小于1千字
文档摘要

机器学习

MachineLearning

;强化学习的基本问题;1.强化学习的基本结构模型;一个简化的猫抓老鼠游戏;强化学习解决的实际示例;2.马尔可夫决策过程;MDP定义的进一步解释;例:猫和老鼠的例子;状态和返回值;状态值函数(在给定策略下);4.贝尔曼(Bellman)方程;贝尔曼方程证明;第2组形式;第2组方程的导出和关系;第2组方程的导出和关系(续);第2组方程的导出和关系(续);第2组方程的导出和关系(续);5.MDP的最优性;最优策略:OptimalPolicy;求最优策略:FindanOptimalPolicy;6.Bellman最优方程;例:猫和老鼠的例子