基本信息
文件名称:计算机行业AI动态跟踪系列:国产AI当打之年,Manus新星闪耀,产业与政策持续催化.docx
文件大小:892.48 KB
总页数:8 页
更新时间:2025-03-17
总字数:约5.16千字
文档摘要

一、应用端:Manus突破通用Agent上限,探索人机协作全新范式

中国AI初创公司Monica.im宣布推出全球首款通用AIAgent产品Manus(早期预览版)。据团队视频介绍,Manus是一个真正自主的AI代理,能够解决各类复杂多变的任务。与传统AI助手不同,Manus(拉丁文寓意为“手”)不仅能提供建议或答案,还能直接交付完整的任务成果,实现AI产品由“脑”至“手”的进阶。根据Manus官网,在GAIA基准测试(评

估通用AI助手解决真实世界问题的能力)中,Manus在所有三个难度级别都实现了新的最先进的(SOTA)性能。图表1 Manus的GAIA评分在三个难度级别均超越OpenAIDeepResearch

anus.im官网,

Manus在官方视频介绍中展示了三个在实际使用场景中所完成的工作案例,并在官网展示了多个用例。

第一个案例为筛选简历,从15份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据其强化学习专业知识对候选人进行排名。Manus展现出了像人类实习生的一面,手动解压缩文件,并逐页浏览每一份简历,同时记录其中的重要信息。在Manus给出的结果中,不仅有自动生成的排名建议,它还会根据工作经验等重要维度,将候选人分为不同等级。

图表2 Manus筛选简历并进行排名

anus.im官网,

在接受到用户更希望以Excel表格的方式呈现后,Manus还能自动将这些内容通过现场编写Python脚本的方式,来生成对应的表格。Manus甚至还能通过记忆能力,在这个实践过程中记录下“用户更喜欢通过表格的方式接受结果”这样的信息,下一次处理类似的任务结果时,会优先使用表格的形式来呈现。

图表3Manus可以记住用户偏好

anus.im官网,

第二个案例为遴选房产,用户希望在纽约购买房产,输入的要求是希望同时有安全的社区环境、低犯罪率、优质的中小学教育资源、每月固定收入情况下能够负担。在这个需求中,ManusAI将复杂任务分解为待办事项列表,包括研究安全社区、识别优质学校、计算预算、搜索房产等。并通过网络搜索,仔细阅读有关纽约最安全社区的文章,收集相关信息。其次,

Manus通过编写一个Python程序,根据用户收入计算可负担的房产预算。结合房地产网站上相关的房价信息,根据预算范围筛选房产列表。最后,Manus会整合所有收集的信息,撰写详细报告,包括社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接,就像一个专业的房地产经纪人一样。

图表4Manus根据用户收入计算可负担的房产预算并在预算范围内筛选房产

anus.im官网,

第三个案例为股票分析,任务为分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性。Manus的操作,与一个真正的股票经纪人非常相似,它先是通过API访问雅虎金融等信息网站,来获取股票历史数据,同时还会交叉验证数

据准确程度,避免被单一信息来源误导,对最终产生结果带来重大影响。Manus用到了编写Python代码、进行数据分析和可视化的能力,同时还引入了金融相关的专业工具进行分析。最终在用户要求下,Manus提供了一个交互式数据可视化网站,向用户反馈其中的因果关系。

图表5 Manus实现股票分析并提供交互式数据可视化

anus.im官网,

图表6 Manus官网提供多个使用案例

anus.im官网,

Agent被定义为能够感知环境、自主决策、执行复杂任务的智能实体。OpenAI应用研究主管LilianWeng提出:Agent=LLM

+记忆+规划技能+工具使用。吴恩达认为Agent应该具备四种主要能力,即:反思(Reflection)、使用工具(Tooluse)、规划(Planning)以及多智能体协同(Multi-agentcollaboration)。复旦NLP团队认为LLM-basedAgent包含三个部分:控制端(Brain)、感知端(Perception)和行动端(Action)。

Agent作为成熟度更高的AI产品,有望加速AI在各行各业的深度应用。产品端来看,2024年10月,智谱推出自主智能体AutoGLM,只需接收简单的文字/语音指令,就可以模拟人类操作手机,自动完成点外卖、编辑评论、淘宝购物、朋友圈

点赞、总结文章生成摘要等日常活动,引发了市场对于Agent的广泛关注。Anthropic发布“ComputerUse”新功能,使Claude能够像人一样使用计算机,包括滚动屏幕、移动光标