客户端
游戏
无障碍

1

评论

3

4

手机看

微信扫一扫,随时随地看

一周内“日下载量”增长5倍,Browser Use获1700万美元种子资金|AlphaFounders

AI Agent平台ManusDeepSeek之后,另一个病毒式增长,并引爆海外AI社区的中国AI产品。Manus的爆火也带动另一个AI产品实现了爆发式增长,这就是它用来访问和操控互联网的工具Browser Use。

Browser Use能让AI模型更高效和准确的实时与互联网交互,是搭建AI Agent必不可少的工具之一。从2025年3月3日到3月10日,它的日下载量从5000次激增至2.8万次,增长超过五倍;而它在Github也拥有了4.8万星标,是增长最快的开源AI项目之一。

Browser Use是Y Combinator W25批次的一员,它刚刚获得了1700万美元的种子轮融资,由Felicis Ventures领投,A Capital、Nexus Ventures、Y Combinator、Paul Graham(Y Combinator的创始人)、Liquid2、SV Angel、Pioneer Fund等参投。

图片
两位极客4天时间做出MVP,开源后获4.8万星标

Browser Use由Magnus Müller(CEO)和Gregor Zunic在苏黎世联邦理工学院(ETH Zürich)的学生项目孵化器中创立,它也是Y Combinator W25批次的公司。

Magnus Müller和Gregor Zunic是ETH Zürich的校友,Magnus Müller曾为Cambridge CARES 发表过研究成果,老本行就是数据科学,也一直在开发网页自动化工具,而Gregor Zunic是从物理学转到了数据科学行业,他们是两位极客。

图片

Browser Use经历了两次明显的增长。第一次增长,是两位创始人在午餐时做了几次非正式的头脑风暴,然后用了四天时间做出第一个MVP(最小可行产品),发布到了Hacker News(Y Combinator的创业者论坛),然后瞬间登顶第一,经历了一波火箭起飞式增长。这次增长,显然让他们进入了Y Combinator投资人的视野。

第二次,就是因为Manus,一篇关于Manus如何利用Browser Use的帖子在社交媒体X上获得了超过240万次浏览和数百次转发。

这使得Browser Use的日下载量从2025年3月3日的约5000次激增至3月10日的2.8万次,增长超过五倍,十几天后,Browser Use官宣了自己的1700万美元种子轮融资。

从视觉方案到类文本方案,网络任务成功率达到SOTA水平


自2022年11月底ChatGPT发布,人们拥有了第一个实用化的ChatBot类产品,此后涌现了一大批ChatBot类的AI助手,这也成为消费级AI产品的标准产品形式之一。

与此同时,AutoGPT(这个项目已经拥有17万个Github星标)和LangChain等Agent类工具和产品也在萌芽;从2023年下半年到2024年,行业基本公认AI Agent是AI能力在企业领域落地的最佳形式之一,也涌现了一批Agent类商业产品,其中既有各种AI助手发布的类似DeepResearch的产品,也有Writer和Sierra这种垂直类Agent产品。

Agent与ChatBot的关键差别,是它的自动化程度,ChatBot需要多次与人类交互,才能完成复杂任务,而Agent可以只经过一次提示,就能自动完成复杂任务,甚至可以并行地完成多个任务,这对于商业化应用的效率提升是指数级的。

在目前的Agent类产品中,实时从互联网获取信息,并与网页交互(如点击网站菜单、填写表单),是刚需和重要的功能,Browser Use做的就是这件事情。

此前的主流方案,实现这类功能的方式是捕获屏幕截图,然后让多模态模型用视觉能力像人类一样去“看网页”,Anthropic此前发布的“Computer Use”,就采用这种方案。不过这些方法一方面速度慢,另一方面,成本高,且不可靠。

Browser Use的方法则更为聪明,将网站中的按钮和元素分解为AI模型更易消化的“类文本”格式,帮助Agent理解不同选项并自主决策。它能够实现精准地与网页的按钮、下拉菜单、输入框等界面元素互动,也更可靠,避免了基于像素导航的错误。

除此之外,它还能解决以往网页自动化工具没有解决的自动化脚本失效,被网站机器人检测功能发现,网页解析错误以及用户名和密码管理等一系列问题。

经过这些进化,Browser Use在WebVoyager的基准测试中实现了SOTA性能,在586项多样化网络任务中取得了89.1%成功率,对比之下,Computer Use的成功率只有52%。

图片

具体到细分领域的网页成功率,可以看到哪怕复杂的Booking房间或航班订阅,也有80%的成功率。这项测试是使用OpenAI的GPT-4o模型进行,它也可以支持其他的SOTA模型,例如DeepSeek-V3、Gemini-2.0、Qwen 2.5等;随着之后更新更强的模型出现,它的准确率应该会进一步提升。

图片

在应用方面,Browser Use已经能涵盖广泛的现实应用场景,从登录自动化、数据提取到质量测试以及与CRM集成;也包括订一张从苏黎世到北京的机票。

图片
自动在kayak上寻找从苏黎世到北京的航班

与Browser Use同属Y Combinator W25批次的20家早期创业公司都使用Browser Use满足自身产品需求。

从Browser Use在Github发布起,AI社区中的用户就要求Browser Use推出他们产品的托管版本。目前这个托管版本的定价为30美元/月,还有更高价格的企业级版本;而同时它也有免费的本地自托管版本(毕竟采用了宽松的MIT版开源协议)。

在有了合适的商业模式后,Browser Use对自己的定位是为追逐网页Agent热潮的开发者“卖铲子”。

“我们想打造一个基础层,让所有浏览器代理都基于我们的工具构建,在我们看来,到今年底,网页上的Agent数量将超过人类。”Browser Use的联合创始人Gregor Zunic表示。

图片

Agentic AI生态成熟后,AI应用将百花齐放


Agentic AI作为人工智能未来几年的重要发展方向,已经成为行业共识,无论对于应用创业者还是模型厂商。根据研究机构Research and Markets的预测,这个领域到2029年的市场规模将达到420亿美元。德勤预计,到2027年,一半使用人工智能的公司将部署AI Agent。

无论是做模型的,做工具的,还是做应用的公司,都在往这个方向努力。这就引出一个问题,对于做应用和做工具的厂商来说,它们辛苦构建的东西,是否有一天会被模型厂商的某一次更新卷没了?毕竟OpenAI率先推出了模型的Function Calling,也有DeepResearch,Anthropic有Computer Use甚至MCP(Model Context Protocol,模型上下文协议,让AI模型调用工具有了标准协议),Google卷起了1M甚至2M的长上下文窗口(对于模型处理复杂任务有利)。

事实上,无论对于应用公司,还是对于工具公司,模型厂商只会一定程度上对他们造成竞争,但不会吃掉他们。模型厂商可以做通用的应用,例如ChatGPT,但它们无法深入到某个细分行业中去,因为既没有行业积累,也没有精力根据用户的需求去一点一点改善用户体验;所以才会有Harvey或Perplexity这样使用OpenAI模型,却也能壮大成独角兽的应用公司。

同理,模型厂商可以推出MCP和Computer Use这样的工具或标准,但是它无法覆盖所有的需求;像Browser Use这样小巧精干的产品驱动的团队,还是有可能用一个点子,解决一个小的问题,就爆火。这种机会,就很适合中国的产品经理型创业者们。

在Agentic AI领域,可能最终会有几个大的模型厂商和众多工具厂商使用一些较为统一的标准构建出生态,但是在这些生态上,会有为数众多的Agentic App百花齐放,AI应用的创业春天,可能才刚刚到来。

本文由阿尔法公社原创。

更多精彩内容

关于阿尔法公社
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部