2025年大模型微调学习率调度（含答案与解析）.docx

基本信息

文件名称：2025年大模型微调学习率调度（含答案与解析）.docx

文件大小：16.65 KB

总页数：24 页

更新时间：2025-10-21

总字数：约8.16千字

文档摘要

2025年大模型微调学习率调度（含答案与解析）

一、单选题（共15题）

1.在大模型微调过程中，以下哪种调度策略能有效提高模型收敛速度？

A.固定学习率调度

B.线性学习率衰减

C.余弦退火学习率衰减

D.自适应学习率衰减

答案：C

解析：余弦退火学习率衰减在预训练模型微调阶段常被采用，它能模拟人类学习过程中的耐心与坚持，通过周期性降低学习率，有助于提高模型的收敛速度和最终性能，参考《深度学习微调技术指南》2025版3.4节。

2.以下哪个不是用于评估预训练大模型性能的关键指标？

A.感知熵

B.准确率

C.F1分数

D.生成能力

答案：D

解析：感知熵、准确率和