基本信息
文件名称:清华大学《机器学习》ppt课件 15-强化学习2.pptx
文件大小:5.95 MB
总页数:36 页
更新时间:2025-06-25
总字数:约小于1千字
文档摘要

机器学习

MachineLearning

;1.值函数逼近

ValueFunctionApproximation;1.1值函数逼近解大规模MDP问题;值函数逼近的几种类型;1.2值函数逼近的随机梯度方法;特征向量

FeatureVector;线性值函数逼近

LinearValueFunctionApproximation;例:表方法可认为是线性值函数逼近的特例;1.3增量类值函数预测算法;MC-增量类值函数预测算法;TD(0)-增量类值函数预测算法;1.4增量类控制算法;动作-值函数逼近;线性动作-值函数逼近;线性动作-值函数的增量逼近算法;函数逼近情况下的策略改进;1