基本信息
文件名称:第16章 大语言模型.pptx
文件大小:732.01 KB
总页数:46 页
更新时间:2025-08-04
总字数:约8.71千字
文档摘要

第16章大语言模型

16.1大语言模型概述

16.2大语言模型的技术脉络

16.3大语言模型的开发与构建

16.4典型大语言模型简介;16.1大语言模型概述

16.1.1什么是大语言模型

?大规模神经语言模型(LargeLanguegeModel,LLM)

?由基本网络模型搭建而成

?百亿以上的参数量

16.1.2为什么要建大语言模型

?ScalingLaw(扩展或缩放法则):模型规模的扩展(增加模型的参数)或数据规模的加大,往往会使模型的性能得到显著提升,进而也使模型在下游任务中表