基本信息
文件名称:2025年大模型微调学习率调度(含答案与解析).docx
文件大小:16.65 KB
总页数:24 页
更新时间:2025-10-21
总字数:约8.16千字
文档摘要
2025年大模型微调学习率调度(含答案与解析)
一、单选题(共15题)
1.在大模型微调过程中,以下哪种调度策略能有效提高模型收敛速度?
A.固定学习率调度
B.线性学习率衰减
C.余弦退火学习率衰减
D.自适应学习率衰减
答案:C
解析:余弦退火学习率衰减在预训练模型微调阶段常被采用,它能模拟人类学习过程中的耐心与坚持,通过周期性降低学习率,有助于提高模型的收敛速度和最终性能,参考《深度学习微调技术指南》2025版3.4节。
2.以下哪个不是用于评估预训练大模型性能的关键指标?
A.感知熵
B.准确率
C.F1分数
D.生成能力
答案:D
解析:感知熵、准确率和