从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例.pptx

基本信息

文件名称：从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例.pptx

文件大小：12.03 MB

总页数：61 页

更新时间：2025-03-23

总字数：约4.36千字

文档摘要

浙江大学DeepSeek系列专题线上公开课（第二季）

从大模型、智能体到复杂AI应用系统的构建

——以产业大脑为例

2025.03杭州;

?大模型推理能力快速提升

?推理模型和思维链(CoT)

?智能体是什么？

?四链融合产业大脑案例;

大模型推理能力快速提升;

快速回望历史——大模型的产生;

OpenAI公司于2022年11月发布ChatGPT，短短三个月内日活跃用户从零增长至超过3000万，标志着对话式AI进入大众应用阶段;

辨别式AI

对现有内容进行分析、分类、判断、预测;

Multi-taskLanguageUnderstandingonMMLU;;

大语言模型易产生幻觉，在数学推理方面表现在推理能力严重不足，体现在简单数值比较错误、多步推理能力弱、推理不一致等;

YannLeCun的批判观点：对纯粹扩大规模方法的根本质疑

MehrdadFarajtabar：LLM本质上是统计模式匹配工具，而非真正的推理系统、下一个词预测框架不足以产生真正的理解;

2023-2024年，推理能力突破性进展：

?OpenAIo1/o3在数学和代码推理任务上的卓越表现

?开源大模型DeepSeek-R1在MATH基准上达到87.2%的准确率;

DeepSeek的“ahamoment”

这种深度推理能力是如何实现的？是单纯的规模扩展结果，还是有其他关键因素？;

1.早期的大模型推理能力不足

2.OpenAI-o系列模型和DeepSeek-R1等胜在推理能力较强;

推理模型和思维链(ChainofThought,CoT);;

o1/o3在回答问题之前先Reasoning，生成一个详细的内部思维链，模拟人类的深思熟虑，逐步分解复杂的问题，提高答案的准确性和深度。;

要知道从玉泉校区到紫金港校区如何最快出行，首先得知道有几种交通路线：

1.89路公交车，共17站，需步行2分钟，共用时50分钟

2.地铁10号线转2号线，这样就是2站+5站，共7站，需步行20分钟，共用时43分钟

3.地铁3号线转7149路公交车，这样就是3站+11站，共14站，需步行11分钟，共用时50分钟

4.还可以……

这样综合看起来，最快的交通方案应该2，共用时43分钟;

桌子上放着50根火柴，丁丁、田田二人轮流每次取走1~3根。规定谁取走最后一根火柴谁输。??果双方采用最佳方法，丁丁先取，那么谁将获胜?;;

s1通过在一个精心构建的小规模数据集上（1000条数据）进行微调，并结合预算强制技术，实现了强大的推理能力和测试时计算扩展性;

LessIsMoreforReasoning

LIMO假说：在预训练阶段已经充分编码领域知识的基础模型中，复杂的推理能力可以通过最少但精确编排的认知过程演示来涌现：

?模型具备丰富预训练知识

?高质量的推理链示范;

1.自动化思维链(CoT)的实现是新一代大模型的精髓之一

2.经过精心设计的少量高质量样本即可实现适用于某个专业领域

的高性能低成本推理模型;

智能体(AIAgent)是什么？;

?大模型除了可以和我聊天、回答问题，到底还能干什么？;;

①用户打开邮箱，手动拷贝邮件内容

②用户将邮件内容拷贝到大模型运行界面的对话框，写提示词：请基于以下邮件内容帮我草拟一封回复

③大模型根据提示词自动生成回复邮件

④用户将大模型生成的回复邮件拷贝至邮箱

⑤用户填写地址、邮件标题，点击发送;

大语言模型（LLM）可以接受输入，可以分析推理、规划任务、输出文字\代码\媒体。然而，其无法像人类一样，拥有运用各种工具与物理世界互动，以及拥有人类的记忆能力。;

第一步：智能体进行任务拆解，首先调用CollectLinks工具从搜索引擎进行搜索并获取Url地址列表

/developer/article/2422923;

?撰写调研报告：调研特斯拉FSD和华为ADS这两个自动驾驶系统;

类

型;;

ThegrowthtrendonthefieldofLLM-basedautonomousagents;

Models，也就是我们熟悉的调用大模型API。

PromptTemplates，在提示词中引入变量以适应用户输入的提示模版。

Chains，对模型的链式调用，以上一个输出为下一个输入的一部分。

Agent，能自主执行链式调用，以及访问外部工具。

Multi-