基本信息
文件名称:2025年强化学习策略评估方法(含答案与解析).docx
文件大小:14.24 KB
总页数:9 页
更新时间:2025-09-09
总字数:约5.77千字
文档摘要
2025年强化学习策略评估方法(含答案与解析)
一、单选题(共15题)
1.以下哪项不是强化学习策略评估的关键指标?
A.收敛速度
B.稳定性
C.偏差
D.用户体验
2.在分布式训练框架中,以下哪种技术可以显著提高训练速度?
A.数据并行
B.模型并行
C.混合并行
D.独立训练
3.参数高效微调(LoRA/QLoRA)主要用于?
A.模型压缩
B.模型加速
C.模型初始化
D.模型训练
4.持续预训练策略中,以下哪项不是常见的预训练方法?
A.自回归语言模型
B.图像识别
C.机器翻译
D.问答系统
5.对抗性攻击防御中,以下哪种方法不是常见的