基本信息
文件名称:2025年机器学习工程师强化学习环境设计面试题(含答案与解析).docx
文件大小:16.42 KB
总页数:19 页
更新时间:2025-09-11
总字数:约6.91千字
文档摘要
2025年机器学习工程师强化学习环境设计面试题(含答案与解析)
一、单选题(共15题)
1.在分布式训练框架中,以下哪个选项不是常用的数据同步方法?
A.参数服务器(ParameterServer)方法
B.梯度累积方法
C.环形同步方法
D.深度学习框架自带的同步机制
2.在参数高效微调(LoRA/QLoRA)中,LoRA通常用于:
A.提高模型训练速度
B.在不改变模型架构的情况下进行微调
C.增加模型容量
D.降低模型训练的内存消耗
3.持续预训练策略中,以下哪个方法不是用来持续提升模型性能?
A.数据增强
B.知识蒸馏
C.迁移学习
D.模型结构改进