基本信息
文件名称:2025年强化学习探索与利用(含答案与解析).docx
文件大小:14.36 KB
总页数:9 页
更新时间:2025-09-15
总字数:约5.76千字
文档摘要

2025年强化学习探索与利用(含答案与解析)

一、单选题(共15题)

1.以下哪项技术不属于强化学习中的探索策略?

A.ε-greedy策略

B.蒙特卡洛树搜索

C.线性预测器

D.Q-learning

2.在分布式训练框架中,以下哪种方法可以减少通信开销?

A.数据并行

B.模型并行

C.算子并行

D.独立训练

3.参数高效微调(LoRA)通常用于以下哪个场景?

A.模型压缩

B.模型初始化

C.模型预训练

D.模型评估

4.持续预训练策略中,以下哪个不是常见的预训练任务?

A.机器翻译

B.问答系统

C.图像分类

D.语音识别

5.对抗性攻击防