基本信息
文件名称:大语言模型技术与应用:大语言模型架构PPT教学课件.pptx
文件大小:1.05 MB
总页数:100 页
更新时间:2025-09-14
总字数:约1.51万字
文档摘要
;;大语言模型的底层逻辑包括深度学习架构、训练机制与应用场景等。近年来,通过扩大数据大小和模型大小,大模型取得显著进展,提高了惊人的涌现能力,包括上下文学习(ICL)、指令微调和思维链(CoT)。;尽管大模型在自然语言处理任务中表现出了很好的零样本/少样本推理性能,但它们天生“视而不见”,因为通常只能理解离散文本。尽管如此,研究界还是做出了许多努力来开发有能力的多模态大模型,展示了一些令人惊讶的实用能力,例如基于图像编写网站代码,理解模因(指能通过模仿而被复制的信息或思想,小到一条回答,一段流行歌曲旋律,一首古诗,一个笑话,一幅图片,大到一个习俗,一个节日,一个思想,一个主义)的深层含义,以及