基本信息
文件名称:从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例.pptx
文件大小:12.03 MB
总页数:61 页
更新时间:2025-03-23
总字数:约4.36千字
文档摘要

浙江大学DeepSeek系列专题线上公开课(第二季)

从大模型、智能体到复杂AI应用系统的构建

——以产业大脑为例

2025.03杭州;

?大模型推理能力快速提升

?推理模型和思维链(CoT)

?智能体是什么?

?四链融合产业大脑案例;

大模型推理能力快速提升;

快速回望历史——大模型的产生;

OpenAI公司于2022年11月发布ChatGPT,短短三个月内日活跃用户从零增长至超过3000万,标志着对话式AI进入大众应用阶段;

辨别式AI

对现有内容进行分析、分类、判断、预测;

Multi-taskLanguageUnderstandingonMMLU;;

大语言模型易产生幻觉,在数学推理方面表现在推理能力严重不足,体现在简单数值比较错误、多步推理能力弱、推理不一致等;

YannLeCun的批判观点:对纯粹扩大规模方法的根本质疑

MehrdadFarajtabar:LLM本质上是统计模式匹配工具,而非真正的推理系统、下一个词预测框架不足以产生真正的理解;

2023-2024年,推理能力突破性进展:

?OpenAIo1/o3在数学和代码推理任务上的卓越表现

?开源大模型DeepSeek-R1在MATH基准上达到87.2%的准确率;

DeepSeek的“ahamoment”

这种深度推理能力是如何实现的?是单纯的规模扩展结果,还是有其他关键因素?;

1.早期的大模型推理能力不足

2.OpenAI-o系列模型和DeepSeek-R1等胜在推理能力较强;

推理模型和思维链(ChainofThought,CoT);;

o1/o3在回答问题之前先Reasoning,生成一个详细的内部思维链,模拟人类的深思熟虑,逐步分解复杂的问题,提高答案的准确性和深度。;

要知道从玉泉校区到紫金港校区如何最快出行,首先得知道有几种交通路线:

1.89路公交车,共17站,需步行2分钟,共用时50分钟

2.地铁10号线转2号线,这样就是2站+5站,共7站,需步行20分钟,共用时43分钟

3.地铁3号线转7149路公交车,这样就是3站+11站,共14站,需步行11分钟,共用时50分钟

4.还可以……

这样综合看起来,最快的交通方案应该2,共用时43分钟;

桌子上放着50根火柴,丁丁、田田二人轮流每次取走1~3根。规定谁取走最后一根火柴谁输。??果双方采用最佳方法,丁丁先取,那么谁将获胜?;;

s1通过在一个精心构建的小规模数据集上(1000条数据)进行微调,并结合预算强制技术,实现了强大的推理能力和测试时计算扩展性;

LessIsMoreforReasoning

LIMO假说:在预训练阶段已经充分编码领域知识的基础模型中,复杂的推理能力可以通过最少但精确编排的认知过程演示来涌现:

?模型具备丰富预训练知识

?高质量的推理链示范;

1.自动化思维链(CoT)的实现是新一代大模型的精髓之一

2.经过精心设计的少量高质量样本即可实现适用于某个专业领域

的高性能低成本推理模型;

智能体(AIAgent)是什么?;

?大模型除了可以和我聊天、回答问题,到底还能干什么?;;

①用户打开邮箱,手动拷贝邮件内容

②用户将邮件内容拷贝到大模型运行界面的对话框,写提示词:请基于以下邮件内容帮我草拟一封回复

③大模型根据提示词自动生成回复邮件

④用户将大模型生成的回复邮件拷贝至邮箱

⑤用户填写地址、邮件标题,点击发送;

大语言模型(LLM)可以接受输入,可以分析推理、规划任务、输出文字\代码\媒体。然而,其无法像人类一样,拥有运用各种工具与物理世界互动,以及拥有人类的记忆能力。;

第一步:智能体进行任务拆解,首先调用CollectLinks工具从搜索引擎进行搜索并获取Url地址列表

/developer/article/2422923;

?撰写调研报告:调研特斯拉FSD和华为ADS这两个自动驾驶系统;

型;;

ThegrowthtrendonthefieldofLLM-basedautonomousagents;

Models,也就是我们熟悉的调用大模型API。

PromptTemplates,在提示词中引入变量以适应用户输入的提示模版。

Chains,对模型的链式调用,以上一个输出为下一个输入的一部分。

Agent,能自主执行链式调用,以及访问外部工具。

Multi-