AI Agent的“GPT 时刻”,用户的“万能之手”Manus诞生!
原文:《 AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈! 》
作者:shiyun张勇毅
编辑:靖宇
2025 年是 AI Agent 元年——这句话,在北京时间 3 月 6 日凌晨,得到了应验。
「DeepSeek 之后,又一个科技圈的不眠之夜。」
不少用户在社交媒体上如此点评。
所有人彻夜蹲守,只为该产品的一个使用邀请码——它就是 Monica.im 研发的全球首款 AI Agent 产品「Manus」。
据团队介绍,「Manus」是一个真正自主的 AI 代理,能够解决各类复杂多变的任务。与传统 AI 助手不同,Manus 不仅能提供建议或答案,还能直接交付完整的任务成果。
Manus 的介绍视频只有短短的 4 分钟,却威力惊人|图片来源:Monica.im
正如「Manus」的名字寓意,它在拉丁文里象征着「手」。也就是说,知识不仅要在脑子里,还要能用手执行。这正是 Agent 和 AI Bot(聊天机器人)产品的本质进阶。
Manus 牛在哪里?最直观的是看官方网站展示、以及用户自发展示的使用用例,极客公园部分整理如下:
- 旅行规划:不仅整合旅行信息,还为用户创建定制旅行手册。例如,为用户规划日本四月旅行,提供个性化的旅行建议和详细手册。
- 股票分析:进行深入的股票分析,设计视觉上吸引人的仪表盘展示全面的股票洞察。例如,对特斯拉股票进行深度分析,创建可视化仪表盘。
- 教育内容创建:为中学教师创建视频演示材料,解释动量定理等复杂概念,帮助教师更有效地教学。
- 保险政策比较:创建清晰的保险政策比较表,提供最佳决策建议,帮助用户选择最适合的保险产品。
- 供应商采购:在整个网络中进行深入研究,找到最适合用户需求的供应商,作为真正公平的代理为用户服务。
- 财务报告分析:通过研究和数据分析捕捉市场对特定公司(如亚马逊)的情绪变化,提供过去四个季度的市场情绪分析。
- 创业公司列表整理:访问相关网站识别符合条件的公司,并将其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。
- 在线商店运营分析:分析亚马逊商店销售数据,提供可操作的洞察、详细可视化和定制策略,帮助提升销售业绩。
- 当 Agent 通过一长串思维链和工具调用,最终输出一个无比完整、专业的结果时,用户们开始感叹「真的能帮人类做事了」。
根据官方网站信息,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中,Manus在所有三个难度级别上都取得了新的最先进 (SOTA) 表现。
总结成一句话——Manus 更想做的,是你在数字世界中,字面意义上的「代理人」。而它做到了。
就像你想的一样,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!
01、Manus,你的「数字代理人」
首先,Manus 在体验上与此前 LLM 最大的不同:
它强调直接交付最终结果的能力,而不只是给出一个单纯的「答案」。
Manus 目前采用 Multiple Agent 架构,运行方式与此前 Anthropic 发布的 Computer Use 类似,完全运行在独立虚拟机中。同时可以在虚拟环境中调用各类工具——编写和执行代码、浏览网页、操作应用等,直接交付完整成果。
在官方发布的视频中,介绍了三个 Manus 在实际使用场景中所完成的工作案例:
第一个任务是筛选简历。
从 15 份简历中,为强化学习算法工程师职位推荐合适的候选人,并根据其强化学习专业知识对候选人进行排名。
在这个演示中,你甚至不需要给压缩文件解压、将其中的简历文件一份份手动上传。Manus 这时候就已经展现出了像人类「实习生」的一面,手动解压缩文件,并逐页浏览每一份简历,同时记录其中的重要信息。
Manus 像实习生一样,自动理解「解压老板扔过来的打包文件」这个隐藏指令 | 图片来源:极客公园
在 Manus 给出的结果中,不仅有自动生成的排名建议,它还会根据工作经验等重要维度,将候选人分为不同等级。在接受到用户更希望以 Excel 表格的方式呈现后,Manus 还能自动将这些内容通过现场编写 Python 脚本的方式,来生成对应的表格。
Manus 甚至还能通过记忆能力,在这个实践过程中记录下「用户更喜欢通过表格的方式接受结果」这样的信息,下一次处理类似的任务结果时,会优先使用表格的形式来呈现。
Manus 能记住用户在内容生成流程中的偏好 | 图片来源:极客公园
第二个案例,更为国人量身打造,就是遴选房产。
案例中用户希望在纽约购买房产,输入的要求是希望同时有安全的社区环境、低犯罪率,以及优质的中小学教育资源——当然还包括最重要的预算,足够在每月固定收入的情况下负担的起。
在这个需求中,Manus AI 将复杂任务分解为待办事项列表,包括研究安全社区、识别优质学校、计算预算、搜索房产等。并通过网络搜索,仔细阅读有关纽约最安全社区的文章,收集相关信息。
其次,Manus 通过编写一个 Python 程序,根据用户收入计算可负担的房产预算。结合房地产网站上相关的房价信息,根据预算范围筛选房产列表。
Manus 能够自动搜索、并过滤掉条件不符合用户要求的房源 | 图片来源:极客公园
最后,Manus 会整合所有收集的信息,撰写详细报告,包括社区安全分析、学校质量评估、预算分析、推荐房产列表以及相关资源链接——就像一个专业的房地产经纪人一样。而且由于 Manus 自带「完全基于用户利益考虑」的属性,其使用甚至体验更好。
在最后一个案例中,Manus 展示了对股票价格的分析能力。
案例给出的任务是分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性:众所周知这三支股票之间存在紧密的关联性,但对于新手用户来讲,很难快速将其中的因果关系整理清楚。
而 Manus 的操作,与一个真正的股票经纪人非常相似,它先是通过 API 访问雅虎金融等信息网站,来获取股票历史数据,同时还会交叉验证数据准确程度,避免被单一信息来源误导,对最终产生结果带来重大影响。
在这个案例中,Manus 同样用到了编写 Python 代码、进行数据分析和可视化的能力,同时还引入了金融相关的专业工具进行分析,最终通过数据可视化图表,搭配详尽的综合分析报告的方式,向用户反馈其中的因果关系——真的就像一个金融领域「实习生」做的日常工作。
不仅如此,在 Manus 官网还展示了十多个 Manus 能够使用的场景:直接使用 Manus 帮你整理行程、个性化推荐旅游路线,还能让它学习使用各种复杂工具,来流程化的完成日常工作。
在这个过程中,真正让 Manus 展现出与往常工具不同的,是它的自主规划,来确保执行任务的能力。
自主学习的能力也让 Manus 的工作能力提升逻辑更像是真正的人类——即使现阶段,它可能还无法在某一个特定领域做到专家级别的精通,但已经能看到巨大的潜力。
随着自主学习能力的加入,AI Agent 的泛用性得到了巨大的提升,在用户对 Manus 的实际测试中,你甚至可以做到直接对它描述一个视频画面中的相关内容,Manus 最终能够直接根据对应的信息,跨越平台内容对于搜索引擎的限制,精准找到某个抖音短视频的链接。
由于目前版本的 Manus 完全基于云端异步运行,因此实际上 Manus 的能力并不被你所使用的端侧平台形态或算力等因素限制——用户甚至可以做到在向 Manus 下达指令之后,暂时关闭电脑,当 Manus 执行完成活动结果后,会自动通知你结果。
这个操作逻辑同样非常眼熟——就像一个人下班以后,在微信上喊实习生「文件整理好发我」。只不过,现在,这个实习生是真的可以 7x24 小时的响应你了,并且不用担心他会「整顿职场」。
02、多代理+自查,跑通 AI Agent 流
从上面这些案例,其实不难看出 Manus 真正的杀手锏,并非 Computer Use 中已经出现过的「AI Agent」概念,而是它「模拟人类方式工作方式」的能力。
比起「运行计算」,Manus 的工作逻辑更像是「思考并执行命令」。它并没有做到哪些人类当前真正无法做到的事;这也就是为什么一些已经体验过当前版本 Manus 的用户,将它形容为「一个实习生」。
在 Manus 官网,展示着众多 Manus 能够完成的任务,其中就有一个案例,展示了在 B2B 业务中,如何使用 Manus。快速精准的将你的订货需求,与全球供应商实现精准匹配。
在类似需求的常规产品中,在平台内整合全球供应链企业信息,来帮助用户完成供货商/需求方匹配这件事,是业内通行的逻辑。但这件事在 Manus 的案例中,你能看到完全不同的实现方式。
Manus AI 使用一套名为「Multiple Agent」的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,。来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。
在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过 API 或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务,同时支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。
换言之,通过 Manus 的这套多代理架构,它更像是由多个助理,通过协助的方式,分别完成检索资源、对接、验证信息是否有效等工作,来帮你完成整个工作流程——这实际上不仅像是你招了一个「实习生」,更像是直接当上了一个微缩版的「部门主管」。
在 B2B 业务这个案例中,Manus 通过网页爬虫以及代码编写、执行能力,Manus 会自动在互联网这片汪洋大海中检索,根据你自己的需求,对潜在供应商从产品质量、价格、交货能力等方面,为你匹配到最合适的货源。不仅可以将结论以图表的方式直观呈现在你眼前。还能对这些数据进一步给出更加详细的操作建议。
Manus 完成 B2B 场景下的需求,或许比单一平台的内建工具更好用 | 图片来源:极客公园
至于 Monica 团队到底如何、用何种技术实现的视频效果,根据消息,团队或将在北京时间 3 月 6 日为大家揭晓。
03、「缝合」的极致,就是炸裂
Manus 背后的 Monica.im,到底是家什么公司?
Monica 是一款 All-in-One 的 AI 助手,产品形态从浏览器插件、慢慢拓展至了 App、网页端。主流的使用场景是,当用户在浏览器中点开它的小图标,就能直接使用其接入的各大主流模型。通过对细分场景用户需求的准确理解,Monica 摘到了大模型「低垂的果实」。
其创始人肖弘(昵称小红,英文名 Red)是一位年轻的连续创业者,1992 年生,毕业于华中科技大学。2015 年,他毕业后创业,早期创业不算顺利(如校园社交、二手集市)。2016 年,他创业微信公众号运营者提供编辑与数据分析工具,获得了百万用户、并完成了盈利,最终产品于 2020 年出售给了某独角兽公司。
等到 2022 年大模型浪潮后,他正式创立 Monica,专注海外市场,通过独立开发者产品 ChatGPT for Google,产品快速完成了冷启动。
2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上线的第一时间,Monica 让用户可以获得最新 SOTA 模型。随着接入模型的新进展,Monica 推出的专业搜索、DIY Bot、Artifacts 写小程序、记忆等功能也受到用户喜爱。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的网页里呈现出不同的交互形态和功能,以适配特定场景的用户需求,更新了数百个网页的个性化 AI 体验。
2024 年,Monica 用户数量翻番,达 1000 万。同时,其保持着可观的盈利,在海外同类产品中,位居头部。
Monica 的强劲表现验证了一件事:
套壳到极致,既是 TPF、也是 PMF,最后都通往用户价值。
Monica 首页 | 图片来源:Monica
Manus 或许延续了 Monica 团队这种思路——肖弘接受媒体人张小珺的访谈时表示,产品不能只有聊天机器人一种形态,Agent 会是新增的形态、需要新的产品去承接。
他从 AI 编程产品 cursor 和 Devin 中获得了灵感。据极客公园了解,前者主要是 copilot 模式、后者则是 autopilot 模式,后者更符合人性需求。Agent 也应该像 Devin 一样,面向大众人群、真正由 ai 主导进行执行。但过去的问题是,模型不够聪明。
但基于模型已有能力去做场景的封装服务,或许正是 Monica 团队的优势。肖弘说,目前 Agent 产品团队并不多,因为它需要很多复合能力,比如说团队要搞过 chatbot、AI 编程、浏览器相关(因为都在浏览器上跑)、而且对模型的边界要有不错的感知——今天发展到什么水平,接下来会发展到什么样的水平等等。
「同时拥有这些能力的公司没那么多,而有这些能力的公司,可能手头正在干一个很具体的业务,但我们恰好有同学刚好有时间一起把这件事情做出来。」他说。
为什么是 Monica 做出来了,他总结道,「第一,我觉得我们是比较幸运的。第二,某种程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些时间给创业公司?模型预计能力外溢还能走多远?」
他认为,目前 Agent 还在早期阶段。一是目前 Agent 还在规划阶段,还没到物理世界的执行;二是大模型的能力还在往上发展,一切还不可预料。
「我肯定不知道 Agent,是可以被用这样的方式被出来的,它是一个未知的事情。」他说。
耐人寻味的是,「不知道怎么做 Agent」的 Monica,现在做出了一个让整个 AI 圈感到炸裂的产品。
Manus 可能未必是最终的 AI Agent,但它无疑在 DeepSeek 爆火之后,再次将人们对 AI 的期望拉升了一个数量级。
*头图来源:Monica.im
Galaxy Digital Deposits 600K UNI to Binance & OKX, Totaling 5.26M UNI This Week
Recently, Galaxy Digital has transferred 600K UNI tokens equivalent to $4.37 million to Binance and ...
An In-Depth Look at Outset PR: A Crypto PR Agency Driving the Evolution of the Industry Branding
Outset PR, led by Mike Ermolaev, is transforming crypto branding with transparent, strategic communi...
Block your dates for The Global Blockchain Show 2025 hosted by VAP Group in Riyadh, Saudi Arabia
Join The Global Blockchain Show 2025 in Riyadh on June 23-24! Network with 5,000+ attendees, 200+ sp...