基本信息
文件名称:2025年强化学习探索与利用(含答案与解析).docx
文件大小:14.36 KB
总页数:9 页
更新时间:2025-09-15
总字数:约5.76千字
文档摘要
2025年强化学习探索与利用(含答案与解析)
一、单选题(共15题)
1.以下哪项技术不属于强化学习中的探索策略?
A.ε-greedy策略
B.蒙特卡洛树搜索
C.线性预测器
D.Q-learning
2.在分布式训练框架中,以下哪种方法可以减少通信开销?
A.数据并行
B.模型并行
C.算子并行
D.独立训练
3.参数高效微调(LoRA)通常用于以下哪个场景?
A.模型压缩
B.模型初始化
C.模型预训练
D.模型评估
4.持续预训练策略中,以下哪个不是常见的预训练任务?
A.机器翻译
B.问答系统
C.图像分类
D.语音识别
5.对抗性攻击防