目录
一、MCP协议重构AIAgent新范式 3
AIAgent是AI发展的第三阶段 3
MCP协议定义工具接口标准 5
二、AIAgent相关应用加速落地 9
科技巨头积极布局AIAgent产品 9
Manus、Operator、Coze等产品布局侧重各不同 11
三、投资建议 13
建议关注 13
行业重点公司一致盈利预测 13
四、风险提示 13
图表目录
图1:OpenAI定义的5个AI发展阶段 3
图2:AIAgent的结构 4
图3:AIAgent的渗透率 5
图4:MCP系统架构 6
图5:传统API技术路线 7
图6:MCP技术路线 7
图7:谷歌A2A开放协议工作原理 8
图8:谷歌A2A与MCP协同工作 8
图9:2020年至2025年2月通用型和专业型AIAgent成熟度份额 11
图10:Manus初始运行界面 11
图11:Manus执行结果界面 11
图12:Operator运行界面 12
图13:Operator应用场景 12
图14:Coze空间介绍 12
表1:工具使用的执行和用例 4
表2:编排层的三种模式 4
表3:各科技巨头平台支持MCP统计 8
表4:AIAgent领域行业动态 9
表5:万得一致盈利预测 13
2
一、MCP协议重构AIAgent新范式
AIAgent是AI发展的第三阶段
根据OpenAI对AI发展的理解和定义,AI水平可分为五大等级:一是聊天机器人(Chatbot),能够用自然语言进行对话;二是推理者,基于推理模型,解决人类级别的智力问题;三是智能体(Agent),能够代表用户采取行动;四是创新者;五是组织。
过去,在ChatGPT等聊天机器人产品推出时,大模型通常采取一次性推理,用户与聊天机器人的交互形式呈现为简单的一问一答。而在推理模型的不断发展之下,AI模型逐渐能够与自己对话,实现内部思考,具备推理能力。当前,随着大模型在交互/认知/泛化/自主等多维度能力持续提升,AI正从推理者转向智能体,逐步具备采取行动及处理任务的能力,智能体产品加速推进。
图1:OpenAI定义的5个AI发展阶段
OpenAI官网,源达信息证券研究所
资料来源:智能体(Agent)是基于大模型(LLM)构建的智能化系统,其核心架构可概括为“核心决策中枢+核心认知架构+工具使用”。
资料来源:
核心决策中枢:AIAgent的核心决策中枢是其模型系统,它可以由一个或多个不同规模的语言模型组成。这些模型具备执行指令驱动的推理能力,能够灵活运用多种逻辑框架,如思维链(Chain-of-Thought)或思维树(Tree-of-Thought)等。
核心认知架构:AIAgent的编排层作为其核心认知架构,通过感知-推理-决策的闭环机制实现智能决策,主要包含三种模式:ReAct模式为语言模型提供结构化思考框架,使其能自主推理并触发行动;思维链(Chain-of-Thought)模式通过中间推理步骤提升决策质量,衍生出自洽性推理、主动提示和多模态思维链等技术分支;思维树(Tree-of-Thought)模式作为进阶形态,支持多路径探索和战略前瞻,特别适合解决复杂问题。
工具使用:AIAgent通过工具实现与外部世界的交互,这些工具主要分为三类:扩展程序(Extensions)、函数(Functions)和数据存储(DataStores)。尽管基础模型在文本和图像生成方面表现出色,但由于无法直接与外界互动,其能力受到限制。工具则弥补了
这一缺陷,使Agent能够访问外部数据和服务,从而执行基础模型单独运行时无法完成的任务。
资料来源:图2:AIAgent的结构
资料来源:
谷歌《Agent》白皮书,源达信息证券研究所
表1:工具使用的执行和用例
扩展
函数调用
数据存储
执行
Agent-Side执行
Client-Side执行
Agent-Side执行
用例
·开发者希望Agent能够控制与API端点的交互
·在利用原生预构建扩展(例如Vertex搜索、代码解释器等)时很有用
·多跳规划和API调用(即Agent的下一个操作取决于前一个操作/API调用的
输出)
·安全或身份验证限制使Agent无法直接调用API
时间限制或操作顺序限制使Agent无法实时调用API.(例如:批处理操作、人工审核等)
未向互联网公开的AP,或
Google系统无法访问的API
·来自预先索引的域和UR的网站内容
·以PDF、Word文档