基本信息
文件名称:2025年强化学习策略评估方法(含答案与解析).docx
文件大小:14.24 KB
总页数:9 页
更新时间:2025-09-09
总字数:约5.77千字
文档摘要

2025年强化学习策略评估方法(含答案与解析)

一、单选题(共15题)

1.以下哪项不是强化学习策略评估的关键指标?

A.收敛速度

B.稳定性

C.偏差

D.用户体验

2.在分布式训练框架中,以下哪种技术可以显著提高训练速度?

A.数据并行

B.模型并行

C.混合并行

D.独立训练

3.参数高效微调(LoRA/QLoRA)主要用于?

A.模型压缩

B.模型加速

C.模型初始化

D.模型训练

4.持续预训练策略中,以下哪项不是常见的预训练方法?

A.自回归语言模型

B.图像识别

C.机器翻译

D.问答系统

5.对抗性攻击防御中,以下哪种方法不是常见的