基本信息
文件名称:2025年大模型微调学习率调度(含答案与解析).docx
文件大小:14.97 KB
总页数:10 页
更新时间:2025-09-09
总字数:约6.78千字
文档摘要
2025年大模型微调学习率调度(含答案与解析)
一、单选题(共15题)
1.以下哪项技术通常用于降低大模型微调过程中的计算资源消耗?
A.分布式训练框架
B.参数高效微调(LoRA/QLoRA)
C.持续预训练策略
D.模型并行策略
2.在大模型微调过程中,为了提高训练效率,通常采用的优化器是?
A.Adam
B.SGD
C.L-BFGS
D.RMSprop
3.为了解决梯度消失问题,以下哪种技术最常用?
A.梯度裁剪
B.梯度累积
C.批标准化
D.模型剪枝
4.在大模型微调中,为了提高模型的泛化能力,以下哪种技术最为关键?
A.特征工程
B.数据增强