基本信息
文件名称:2026年课件-深度学习与大模型 课件 第8章 大模型的优化-新版.pptx
文件大小:1.95 MB
总页数:10 页
更新时间:2026-01-19
总字数:约2.93千字
文档摘要

第8章大模型的优化

01大模型优化方法

02模型压缩与剪枝

03知识蒸馏与模型加速

04项目实践

大模型优化

大模型优化是指在预训练的大型模型基础上,针对特定任务或数据集进行进一步训练的过程。

预训练模型通常是在大规模无监督数据集上训练的,已经学习到了丰富的语言特征和模式。

优化则是利用这些预训练好的知识,通过在新任务或数据集上进行有限的训练,使模型能够快速适应新的任务需求。

选择大语言模型

深度求索DeepSeek

阿里巴巴通义千问

OpenAI的GPT系列

Meta的LLaMA系列

指定超级参数

学习率(rate)

批量大小

迭代次数