基本信息
文件名称:第16章 大语言模型.pptx
文件大小:732.01 KB
总页数:46 页
更新时间:2025-08-04
总字数:约8.71千字
文档摘要
第16章大语言模型
16.1大语言模型概述
16.2大语言模型的技术脉络
16.3大语言模型的开发与构建
16.4典型大语言模型简介;16.1大语言模型概述
16.1.1什么是大语言模型
?大规模神经语言模型(LargeLanguegeModel,LLM)
?由基本网络模型搭建而成
?百亿以上的参数量
16.1.2为什么要建大语言模型
?ScalingLaw(扩展或缩放法则):模型规模的扩展(增加模型的参数)或数据规模的加大,往往会使模型的性能得到显著提升,进而也使模型在下游任务中表