2025年强化学习探索与利用（含答案与解析）.docx - 创享文库

基本信息

文件名称：2025年强化学习探索与利用（含答案与解析）.docx

文件大小：14.36 KB

总页数：9 页

更新时间：2025-09-15

总字数：约5.76千字

文档摘要

2025年强化学习探索与利用（含答案与解析）

一、单选题（共15题）

1.以下哪项技术不属于强化学习中的探索策略？

A.ε-greedy策略

B.蒙特卡洛树搜索

C.线性预测器

D.Q-learning

2.在分布式训练框架中，以下哪种方法可以减少通信开销？

A.数据并行

B.模型并行

C.算子并行

D.独立训练

3.参数高效微调（LoRA）通常用于以下哪个场景？

A.模型压缩

B.模型初始化

C.模型预训练

D.模型评估

4.持续预训练策略中，以下哪个不是常见的预训练任务？

A.机器翻译

B.问答系统

C.图像分类

D.语音识别

5.对抗性攻击防