基本信息
文件名称:2025年大模型强化学习.pdf
文件大小:93.39 KB
总页数:7 页
更新时间:2025-11-19
总字数:约4.14千字
文档摘要
2025年大模型强化学习
考试时间:______分钟总分:______分姓名:______
请根据以下题目要求完成作答:
一、选择题(请将正确选项的字母填入括号内)
1.在大模型强化学习的框架中,通常指代智能体与环境交互所采取的动作的
是?
A.状态
B.动作
C.奖励
D.策略
2.以下哪种方法不属于模型无关的强化学习算法?
A.Q-learnin