计算机行业AI动态跟踪系列：国产AI当打之年，Manus新星闪耀，产业与政策持续催化.docx

基本信息

文件名称：计算机行业AI动态跟踪系列：国产AI当打之年，Manus新星闪耀，产业与政策持续催化.docx

文件大小：892.48 KB

总页数：8 页

更新时间：2025-03-17

总字数：约5.16千字

文档摘要

一、应用端：Manus突破通用Agent上限，探索人机协作全新范式

中国AI初创公司Monica.im宣布推出全球首款通用AIAgent产品Manus（早期预览版）。据团队视频介绍，Manus是一个真正自主的AI代理，能够解决各类复杂多变的任务。与传统AI助手不同，Manus（拉丁文寓意为“手”）不仅能提供建议或答案，还能直接交付完整的任务成果，实现AI产品由“脑”至“手”的进阶。根据Manus官网，在GAIA基准测试（评

估通用AI助手解决真实世界问题的能力）中，Manus在所有三个难度级别都实现了新的最先进的（SOTA）性能。图表1 Manus的GAIA评分在三个难度级别均超越OpenAIDeepResearch

anus.im官网，

Manus在官方视频介绍中展示了三个在实际使用场景中所完成的工作案例，并在官网展示了多个用例。

第一个案例为筛选简历，从15份简历中，为强化学习算法工程师职位推荐合适的候选人，并根据其强化学习专业知识对候选人进行排名。Manus展现出了像人类实习生的一面，手动解压缩文件，并逐页浏览每一份简历，同时记录其中的重要信息。在Manus给出的结果中，不仅有自动生成的排名建议，它还会根据工作经验等重要维度，将候选人分为不同等级。

图表2 Manus筛选简历并进行排名

anus.im官网，

在接受到用户更希望以Excel表格的方式呈现后，Manus还能自动将这些内容通过现场编写Python脚本的方式，来生成对应的表格。Manus甚至还能通过记忆能力，在这个实践过程中记录下“用户更喜欢通过表格的方式接受结果”这样的信息，下一次处理类似的任务结果时，会优先使用表格的形式来呈现。

图表3Manus可以记住用户偏好

anus.im官网，

第二个案例为遴选房产，用户希望在纽约购买房产，输入的要求是希望同时有安全的社区环境、低犯罪率、优质的中小学教育资源、每月固定收入情况下能够负担。在这个需求中，ManusAI将复杂任务分解为待办事项列表，包括研究安全社区、识别优质学校、计算预算、搜索房产等。并通过网络搜索，仔细阅读有关纽约最安全社区的文章，收集相关信息。其次，

Manus通过编写一个Python程序，根据用户收入计算可负担的房产预算。结合房地产网站上相关的房价信息，根据预算范围筛选房产列表。最后，Manus会整合所有收集的信息，撰写详细报告，包括社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接，就像一个专业的房地产经纪人一样。

图表4Manus根据用户收入计算可负担的房产预算并在预算范围内筛选房产

anus.im官网，

第三个案例为股票分析，任务为分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性。Manus的操作，与一个真正的股票经纪人非常相似，它先是通过API访问雅虎金融等信息网站，来获取股票历史数据，同时还会交叉验证数

据准确程度，避免被单一信息来源误导，对最终产生结果带来重大影响。Manus用到了编写Python代码、进行数据分析和可视化的能力，同时还引入了金融相关的专业工具进行分析。最终在用户要求下，Manus提供了一个交互式数据可视化网站，向用户反馈其中的因果关系。

图表5 Manus实现股票分析并提供交互式数据可视化

anus.im官网，

图表6 Manus官网提供多个使用案例

anus.im官网，

Agent被定义为能够感知环境、自主决策、执行复杂任务的智能实体。OpenAI应用研究主管LilianWeng提出：Agent=LLM

+记忆+规划技能+工具使用。吴恩达认为Agent应该具备四种主要能力，即：反思（Reflection）、使用工具（Tooluse）、规划（Planning）以及多智能体协同（Multi-agentcollaboration）。复旦NLP团队认为LLM-basedAgent包含三个部分：控制端（Brain）、感知端（Perception）和行动端（Action）。

Agent作为成熟度更高的AI产品，有望加速AI在各行各业的深度应用。产品端来看，2024年10月，智谱推出自主智能体AutoGLM，只需接收简单的文字/语音指令，就可以模拟人类操作手机，自动完成点外卖、编辑评论、淘宝购物、朋友圈

点赞、总结文章生成摘要等日常活动，引发了市场对于Agent的广泛关注。Anthropic发布“ComputerUse”新功能，使Claude能够像人一样使用计算机，包括滚动屏幕、移动光标