清华大学《机器学习》ppt课件 14-强化学习1.pptx

基本信息

文件名称：清华大学《机器学习》ppt课件 14-强化学习1.pptx

文件大小：3.59 MB

总页数：48 页

更新时间：2025-06-25

总字数：约小于1千字

文档摘要

机器学习

MachineLearning

;强化学习的基本问题;1.强化学习的基本结构模型;一个简化的猫抓老鼠游戏;强化学习解决的实际示例;2.马尔可夫决策过程;MDP定义的进一步解释;例：猫和老鼠的例子;状态和返回值;状态值函数（在给定策略下）;4.贝尔曼（Bellman）方程;贝尔曼方程证明;第2组形式;第2组方程的导出和关系;第2组方程的导出和关系（续）;第2组方程的导出和关系（续）;第2组方程的导出和关系（续）;5.MDP的最优性;最优策略：OptimalPolicy;求最优策略：FindanOptimalPolicy;6.Bellman最优方程;例：猫和老鼠的例子