基本信息
文件名称:2025年大模型微调学习率调度(含答案与解析).docx
文件大小:14.97 KB
总页数:10 页
更新时间:2025-09-09
总字数:约6.78千字
文档摘要

2025年大模型微调学习率调度(含答案与解析)

一、单选题(共15题)

1.以下哪项技术通常用于降低大模型微调过程中的计算资源消耗?

A.分布式训练框架

B.参数高效微调(LoRA/QLoRA)

C.持续预训练策略

D.模型并行策略

2.在大模型微调过程中,为了提高训练效率,通常采用的优化器是?

A.Adam

B.SGD

C.L-BFGS

D.RMSprop

3.为了解决梯度消失问题,以下哪种技术最常用?

A.梯度裁剪

B.梯度累积

C.批标准化

D.模型剪枝

4.在大模型微调中,为了提高模型的泛化能力,以下哪种技术最为关键?

A.特征工程

B.数据增强