基本信息
文件名称:2025年大模型强化学习.pdf
文件大小:93.39 KB
总页数:7 页
更新时间:2025-11-19
总字数:约4.14千字
文档摘要

2025年大模型强化学习

考试时间:______分钟总分:______分姓名:______

请根据以下题目要求完成作答:

一、选择题(请将正确选项的字母填入括号内)

1.在大模型强化学习的框架中,通常指代智能体与环境交互所采取的动作的

是?

A.状态

B.动作

C.奖励

D.策略

2.以下哪种方法不属于模型无关的强化学习算法?

A.Q-learnin