基本信息
文件名称:人工智能行业MCP协议加速AIAgent生态繁荣.docx
文件大小:507.08 KB
总页数:12 页
更新时间:2025-06-20
总字数:约9.4千字
文档摘要

目录

一、MCP协议重构AIAgent新范式 3

AIAgent是AI发展的第三阶段 3

MCP协议定义工具接口标准 5

二、AIAgent相关应用加速落地 9

科技巨头积极布局AIAgent产品 9

Manus、Operator、Coze等产品布局侧重各不同 11

三、投资建议 13

建议关注 13

行业重点公司一致盈利预测 13

四、风险提示 13

图表目录

图1:OpenAI定义的5个AI发展阶段 3

图2:AIAgent的结构 4

图3:AIAgent的渗透率 5

图4:MCP系统架构 6

图5:传统API技术路线 7

图6:MCP技术路线 7

图7:谷歌A2A开放协议工作原理 8

图8:谷歌A2A与MCP协同工作 8

图9:2020年至2025年2月通用型和专业型AIAgent成熟度份额 11

图10:Manus初始运行界面 11

图11:Manus执行结果界面 11

图12:Operator运行界面 12

图13:Operator应用场景 12

图14:Coze空间介绍 12

表1:工具使用的执行和用例 4

表2:编排层的三种模式 4

表3:各科技巨头平台支持MCP统计 8

表4:AIAgent领域行业动态 9

表5:万得一致盈利预测 13

2

一、MCP协议重构AIAgent新范式

AIAgent是AI发展的第三阶段

根据OpenAI对AI发展的理解和定义,AI水平可分为五大等级:一是聊天机器人(Chatbot),能够用自然语言进行对话;二是推理者,基于推理模型,解决人类级别的智力问题;三是智能体(Agent),能够代表用户采取行动;四是创新者;五是组织。

过去,在ChatGPT等聊天机器人产品推出时,大模型通常采取一次性推理,用户与聊天机器人的交互形式呈现为简单的一问一答。而在推理模型的不断发展之下,AI模型逐渐能够与自己对话,实现内部思考,具备推理能力。当前,随着大模型在交互/认知/泛化/自主等多维度能力持续提升,AI正从推理者转向智能体,逐步具备采取行动及处理任务的能力,智能体产品加速推进。

图1:OpenAI定义的5个AI发展阶段

OpenAI官网,源达信息证券研究所

资料来源:智能体(Agent)是基于大模型(LLM)构建的智能化系统,其核心架构可概括为“核心决策中枢+核心认知架构+工具使用”。

资料来源:

核心决策中枢:AIAgent的核心决策中枢是其模型系统,它可以由一个或多个不同规模的语言模型组成。这些模型具备执行指令驱动的推理能力,能够灵活运用多种逻辑框架,如思维链(Chain-of-Thought)或思维树(Tree-of-Thought)等。

核心认知架构:AIAgent的编排层作为其核心认知架构,通过感知-推理-决策的闭环机制实现智能决策,主要包含三种模式:ReAct模式为语言模型提供结构化思考框架,使其能自主推理并触发行动;思维链(Chain-of-Thought)模式通过中间推理步骤提升决策质量,衍生出自洽性推理、主动提示和多模态思维链等技术分支;思维树(Tree-of-Thought)模式作为进阶形态,支持多路径探索和战略前瞻,特别适合解决复杂问题。

工具使用:AIAgent通过工具实现与外部世界的交互,这些工具主要分为三类:扩展程序(Extensions)、函数(Functions)和数据存储(DataStores)。尽管基础模型在文本和图像生成方面表现出色,但由于无法直接与外界互动,其能力受到限制。工具则弥补了

这一缺陷,使Agent能够访问外部数据和服务,从而执行基础模型单独运行时无法完成的任务。

资料来源:图2:AIAgent的结构

资料来源:

谷歌《Agent》白皮书,源达信息证券研究所

表1:工具使用的执行和用例

扩展

函数调用

数据存储

执行

Agent-Side执行

Client-Side执行

Agent-Side执行

用例

·开发者希望Agent能够控制与API端点的交互

·在利用原生预构建扩展(例如Vertex搜索、代码解释器等)时很有用

·多跳规划和API调用(即Agent的下一个操作取决于前一个操作/API调用的

输出)

·安全或身份验证限制使Agent无法直接调用API

时间限制或操作顺序限制使Agent无法实时调用API.(例如:批处理操作、人工审核等)

未向互联网公开的AP,或

Google系统无法访问的API

·来自预先索引的域和UR的网站内容

·以PDF、Word文档