融资5亿美元,GitHub前CTO要以软件开发为切入口打造AGI|AlphaFounders

图片

已经不知是今年第几家AI编程公司获得数亿美元融资晋升独角兽了。

Poolside是最新的例子,它获得贝恩资本风投部门(BCV)领投的5亿美元B轮融资,英伟达、DST Global、StepStone、花旗创投及汇丰创投参与了本轮融资,这使它的估值达到30亿美元。在2023年8月,它获得了红点创投等参投的1.26亿美元融资,两轮融资相加,它的累计融资达到6.26亿美元。

图片

Poolside由Jason Warner(GitHub前CTO )和Eiso Kant创立。在众多获得大额融资的AI编程公司中,它是少有的自己训练基础模型,并自研算法的公司,这也是为什么它的一大部分资金将用来打造10000个英伟达GPU规模的AI基础设施。



图片

以软件开发为切入口打造AGI


如果说去年最火的赛道是法律AI,今年在应用方面的融资大户就是AI编程,仅2024年下半年,就有Magic获得了3.2亿美元的融资,Codeium完成了一轮1.5亿美元的融资,Cognition获得1.75亿美元的融资。


根据Polaris市场研究公司的预测,到2032年,AI编程工具市场规模可能达到270亿美元。以目前的发展速度来看,这一预测并不显得过于夸张。

而在这些公司中,Poolside的5亿美元融资仍然是出类拔萃的。这背后的原因,一方面可能是因为Poolside的团队既强大又与业务契合,另一方面是它在技术路线上更接近本质,具有更大的发展潜力,与其他AI编程公司形成了差异化竞争。

图片Jason Warner
在团队方面,世界上第一个AI编程工具GitHub Copilot正是Poolside的创始人Jason Warner担任GitHub CTO期间打造的,他还孵化了Code Search以及GitHub Actions。另一位创始人Eiso Kant则构建了世上最早的编程模型之一,对于AI基础设施的搭建经验丰富。他们对于GitHub Copilot(它的控制权属于微软)的能力显然还不够满意,并且怀抱更大的梦想,所以独立出来创业。

这个梦想就是,以软件开发为切入口打造AGI并实现编程普惠。Jason Warner在一份声明中表示。“我们相信,软件开发将是AI首次达到并超越人类智能水平的广泛能力之一。通过我们的团队、应用研究以及强大的收入引擎,Poolside将把人工智能带入软件开发领域,使世界上任何人都能够进行编程。”

目前,编程仍然是一个高门槛的技术,一个经过训练的开发者,需要对数学,对编程语言,对数据结构等等有一定的了解,这就使得开发者的人数相对很少。很多具有创意的人无法突破这一门槛,也就无法发挥本来可以发挥的生产力。随着AI在软件开发方面能力的日益增强,未来十年,可能大多数人都有可能创造复杂的软件,而无需掌握编程技能。

试想一下,艺术家可以构想出一款视频游戏,医生可以为患者定制一个应用程序,基因组学研究人员可以创建高级分析的数据管道,教育者可以为孩子特定的学习风格设计定制产品,然后这些构想将以比今天快上千倍的速度变为现实。

加入了强化学习算法的编程基础大模型

在技术上,AI编程工具有Copilot,IDE工具等多个变种,而他们大多数采用的是OpenAI或Anthropic这些顶尖AI实验室的闭源大模型。

OpenAI或Anthropic在今年的新版模型和产品中,也在不断提升和强调模型的编码能力,例如OpenAI的O1模型和Canvas界面。以至于刚刚获得6000万美元融资的Cursor创始团队成员表示,如果GitHub Copilot整合了OpenAI的O1模型,那么它们就要倒闭了。

对于以软件开发为切入口打造AGI这个愿景,Poolside的计划分三步走:

第一步,通过打造最强大的软件开发AI,协助开发者构建软件(这是目前大多数AI编程软件正在做的事)。

第二步,通过使AI主导、人类协助的交互成为构建软件的新范式,允许任何人开发软件(编程普惠)。

第三步,将这些能力推广至所有其他领域(AGI)。

Poolside认为,随着时间的推移,人机交互将从人类主导、AI辅助转变为AI主导、人类辅助。

Poolside在技术上与那些使用第三方模型并搭建工具/界面的公司最大的差异化竞争点在于,它们是自己训练模型,而且拥有自己的模型训练算法。

其实打造编程专用AI模型,对于很多科技大厂来说,并不是新鲜事,几乎每一家大厂/AI实验室在发布新模型版本时,都会发布相应的编程专用版本,典型的就是Qwen-Coder系列和Code Llama系列,不过这些模型大多是在各个基座模型的基础上经过微调而成。

Poolside之所以要打造自己的编程基础模型,是因为它们想要突破现有AI编程工具在编程能力上的局限,并且它们认为仅靠基于通用基础模型进行微调无法成功。根据AI模型能力发展的规律,重大能力是在基础模型训练中涌现的,并在微调过程中被准确化和实用化。模型的规模也特别重要,这也是它们要打造万卡集群的原因。

在打造编程基础大模型时,Poolside研发了自己的算法:基于代码执行反馈的强化学习(RLCEF)。它们的模型在130,000个真实世界代码库中探索数百万任务的解决方案,并通过每次尝试的执行反馈来改进自己。自Alpha Go之后,OpenAI的O1再次证明了强化学习对AI性能提升的巨大潜力,而Poolside也许将证明强化学习在AI编程领域也有用武之地。

图片

通用模型和专有模型之争,在AI应用领域由来已久,不过因为成本原因,目前大部分AI应用公司仍然使用外部基础模型,而打造专有模型的通常是一些专业性很强,并且专业模型能够带来显著收益的行业,例如DeepMind的AlphaFold(刚刚获得诺奖)。


目前Poolside的基础模型和产品都暂时没有向公众问世,它只是向投资者展示了一款演示代码生成产品的试用版本,也许是因为这个产品足够强,才能让它获得如此多的融资。

从它的官网透露出的有限信息来看,它的编程基础模型叫malibu,是从头训练的编码大模型。Poolside可以在这个模型的基础上用企业客户的数据进行微调(实在编码基础模型上微调,不是在通用模型上微调),并接入企业客户的私有代码库。

它们的产品形态目前也是用自然语言互动的编码助手,可以与企业客户的现有工作流无缝衔接。

既有自己的模型,又有懂行业的创始人,它的产品就很可能拥有比使用第三方模型的产品更强的能力和灵活性(对于企业用户来说就是更好的隐私保护和可控性)。

Poolside表示,它的早期客户和合作伙伴正在严苛的环境中对产品进行压力测试,这些客户都是有着数千甚至数万名开发者的大型企业,它们对隐私和安全有着最高标准,并拥有数十年的复杂数据历史。不过,具体客户名单并未公开披露。

图片

为什么今年火的是AI编程?


正如ScaleAI的创始人Alex所说,从长期看,单纯以API方式卖模型能力并不是一个好生意,好生意在模型的上下游,而我们从生成式AI浪潮的开端,就坚定支持AI应用。


那么为什么去年在AI应用比较火的赛道是AI法律和AI营销,今年企业级AI和AI编程获得了如此多的融资?一个关键的内在因素就是盈利潜力。目前虽然有许多人工智能公司在解决市场中的不同领域问题,但很少有公司具有明确的盈利模式。


AI编程就恰恰具有比较明确的盈利模式,因为这是一个明确而巨大的需求。对于IT公司和科技公司,最大的生产力之一就是开发人员的编程能力,而AI编程工具可以明确的辅助开发人员提升能力,可以直接提升公司的竞争力。而且编程有约束条件,有性能指标和基准测试,编程工具或编程基础模型的能力是可量化的,而且在量化指标的上提升是可以直接作用于业务的。

只是,目前在AI创业赛道中,具有这种特征的还比较少,所以在2022年-2024年,AI的投资热潮还集中在模型端和基础设施,以及少部分盈利前景明确的赛道。

随着模型能力的不断增强,AI基础设施成本的降低,人们对AI能做什么,能做好什么有了更明确的认识,更丰富的经验,那么AI Native的应用公司就有可能出现,AI应用的春天总会到来。


本文由阿尔法公社原创。