基本信息
文件名称:生成式人工智能基础 课件 第3、4章 大语言模型技术;提示工程与技巧.pptx
文件大小:2.19 MB
总页数:157 页
更新时间:2025-07-03
总字数:约2.27万字
文档摘要
;;本章介绍大语言模型(LLM)及其相关技术的核心原理、应用和挑战。LLM通过深度学习和Transformer架构,能够理解和生成自然语言,它被广泛应用于聊天机器人、翻译、教育、科研等领域,但其训练成本高且易接收数据偏见。本章探讨了LLM的关键技术,如词元标记化、词嵌入、预训练与微调等,解释其如何通过上下文关联和优化算法实现高效的语言处理。;此外,本章还介绍了生成对抗网络(GANs)、变分自编码器(VAEs)和流模型等生成模型的原理与应用,展示它们在图像生成、风格迁移、文本生成等任务中的独特价值。最后,聚焦于LLM的幻觉问题,分析了幻觉的成因以及缓解方法,强调数据质量、训练策略和推理机制对提升