基本信息
文件名称:Python大模型基础与智能应用(微课版)课件第6章 大模型基础.pptx
文件大小:2.95 MB
总页数:51 页
更新时间:2025-08-26
总字数:约1.81万字
文档摘要
第6章大模型基础大模型基本认识大模型开发环境Bert大语言模型基础
大模型基本认识第6章大模型通常是指参数数量大、结构复杂的深度神经网络模型,其主要特点为参数数量大、模型结构复杂、计算技术要求高、性能优越大模型的训练主要包括两部分:预训练(Pre-training)和微调(Fine-tuning)预训练是指在大规模的数据集上训练一个通用的模型,这个模型可以捕捉到底层数据的统计规律和语义信息,而不是特定任务的细节微调是在预训练模型的基础上,使用新的任务数据集对模型进行进一步的训练,以使其适应特定任务的要求。微调通常包括冻结预训练模型的某些层级和调整其他层级的权重参数,或者针对特定任务增加输