2025年强化学习策略评估方法（含答案与解析）.docx - 创享文库

基本信息

文件名称：2025年强化学习策略评估方法（含答案与解析）.docx

文件大小：14.24 KB

总页数：9 页

更新时间：2025-09-09

总字数：约5.77千字

文档摘要

2025年强化学习策略评估方法（含答案与解析）

一、单选题（共15题）

1.以下哪项不是强化学习策略评估的关键指标？

A.收敛速度

B.稳定性

C.偏差

D.用户体验

2.在分布式训练框架中，以下哪种技术可以显著提高训练速度？

A.数据并行

B.模型并行

C.混合并行

D.独立训练

3.参数高效微调（LoRA/QLoRA）主要用于？

A.模型压缩

B.模型加速

C.模型初始化

D.模型训练

4.持续预训练策略中，以下哪项不是常见的预训练方法？

A.自回归语言模型

B.图像识别

C.机器翻译

D.问答系统

5.对抗性攻击防御中，以下哪种方法不是常见的