基本信息
文件名称:2025年强化学习策略更新(含答案与解析).docx
文件大小:15.85 KB
总页数:20 页
更新时间:2025-10-22
总字数:约6.72千字
文档摘要
2025年强化学习策略更新(含答案与解析)
一、单选题(共15题)
1.以下哪种技术可以实现强化学习中的持续预训练策略?
A.模型并行策略
B.分布式训练框架
C.持续预训练策略
D.知识蒸馏
2.在强化学习中,用于评估模型性能的常见指标是?
A.评估指标体系(困惑度/准确率)
B.伦理安全风险
C.偏见检测
D.内容安全过滤
3.以下哪种技术可以用于减少梯度消失问题?
A.优化器对比(Adam/SGD)
B.注意力机制变体
C.卷积神经网络改进
D.梯度消失问题解决
4.在分布式训练中,以下哪种技术可以实现模型并行?
A.模型量化(INT8/FP16)