Demis Hassabis:Agent才刚刚开始,AI下一步是创造虚拟细胞

问AI · Agent技术如何突破持续学习短板?
图片


AGI 2030年就来,DeepMind掌门人说还差这几件事

Demis Hassabis的职业轨迹,放在任何地方都算得上离奇。

他从小是国际象棋神童,17岁写出第一款爆款游戏《主题公园》,之后回去读博,研究的是海马体和记忆系统在大脑中的工作机制,2010年创立DeepMind,目标只有一个:解决智能问题。

此后,AlphaGo击败围棋世界冠军,AlphaFold攻克困扰生物学界50年的蛋白质结构预测难题,并把成果免费开放给全球所有科学家。这项工作让他在2024年拿到诺贝尔化学奖。

现在他掌管Google DeepMind,带着Gemini继续往AGI推进。

刚刚他在YC的How to Build the Future现场节目上接受了Garry Tan的专访,从AGI缺什么、Agent为什么还不够好、AI能不能真正创造,一直讲到给创业者的建议。

哈萨比斯:我们距离实现AGI,或许还差一两个关键突破丨Y Combinator

以下是核心内容。


AGI还缺什么

当前的主流路线,大规模预训练、RLHF、思维链,Hassabis认为这些技术已经走了很长的路,他不相信几年后会有人说这条路走错了。

但他也认为顶上可能还差一两样东西,尚未解决的问题包括:持续学习、长程推理,以及记忆的某些方面。

他给了一个大概50/50的判断:现有技术通过持续创新能否自己扩展到AGI,还是说还需要一两个真正的大突破,两种可能性差不多各占一半。

他个人的AGI时间线是2030年左右。


记忆问题没有真正解决

Hassabis的博士研究就是海马体如何将新知识整合进已有知识库,他认为大脑在这件事上做得极好,尤其是在REM睡眠期间反复回放重要情节从而完成学习,这是一种经验回放机制,DeepMind早在2013年训练Atari游戏的DQN时就借鉴了这个原理。

但他认为现在的AI记忆处理方式还是"胶带粘合",把所有东西塞进上下文窗口,这个方法很粗糙。

上下文窗口相当于工作记忆,人类的工作记忆大概能存七位数字,AI已经有了百万乃至千万级别的token窗口,大得多了。但问题是现在把什么都往里塞,包括不重要的、错误的信息。而且就算全部存下来,找到当下决策真正需要的那条信息,本身也有代价,这个代价不可忽视。

如果是实时视频输入,一百万token大约只是20分钟的内容,如果要让系统理解一个月的生活上下文,这个窗口根本不够。他认为记忆这个方向有很大的创新空间。


AlphaGo怎么影响Gemini

DeepMind从一开始做的就是Agent系统,从Atari到AlphaGo到AlphaStar,都是可以主动完成目标、做出决策、制定计划的系统,只是当时限定在游戏里让问题更可控。

最近这些年的工作,是把这套能力迁移到语言和世界模型上。

Hassabis认为,今天所有主流模型里的思维模式和思维链推理,在某种意义上是AlphaGo当年探索过的东西重新回来了。他们也在以更通用的方式重新审视蒙特卡洛搜索和其他增强强化学习的方法,他认为这些想法对今天的基础模型依然高度相关。

强化学习仍然被低估,这是他的判断。


小模型为什么越来越强

Hassabis说,建造前沿大模型是必须的,但他们真正的优势在于把这些能力快速蒸馏进越来越小的模型里。Google有十几个十亿级用户产品,搜索、地图、YouTube都要用Gemini,这要求极快的响应速度、极低的成本和极低的延迟,这个内部需求倒逼了蒸馏技术的持续进化。

他看不到蒸馏的理论极限在哪里,他的假设是:今天的前沿大模型,半年到一年后就会在小模型上出现类似的能力,Gemma 4系列就是这个方向的产物。

他提到机器人进了你家,你会希望跑一个本地的高效小模型,处理所有音视频数据全在本地,只在必要时才调用云端的大模型,这对隐私和安全都是更好的解法。


Agent还没到,但快了

有人认为Agent被过度炒作,Hassabis不这么看,他认为只是刚刚开始。

要达到AGI,就必须有一个能主动解决问题的系统,Agent就是那条路,这一点从一开始就清楚。

但他坦率地说,现在大家都还在实验阶段,过去两个月才开始找到真正有价值的使用场景,技术也才刚刚好到能真正发挥作用,而不是一个好看的演示。

他举了一个例子,他17岁花了六个月写出《主题公园》,现在用AI工具半小时就能做出原型,这本身很令人震惊。但他也指出,为什么还没有人用这些工具做出一款卖出一千万份的爆款游戏?按理说这已经是可能的了,但还没发生,说明有什么东西还缺。

他预计再过六到十二个月,这个状态会改变。

持续学习是Agent最大的短板。现在的模型是无状态的,无法适应你所在的具体上下文,这是Agent做不到真正"点火就跑"的核心原因。


推理还差在哪

他认为当前的推理方式还是相对粗糙的,有很大的改进空间。

他喜欢和Gemini下国际象棋,因为棋局思考过程是可验证的,可以直接看到模型的思维链是否走偏了。他观察到一个现象:模型有时发现某步棋是败着,但找不到更好的选择,然后还是走了那步棋。一个精确的推理系统不应该出现这种情况。

这就是他说的"锯齿状智能",一方面能解出IMO金牌题,另一方面又会在某种特定提问方式下犯基础数学错误。他认为可能还差一两个调整,但这些调整还没有发生,问题也因此还在。

AI对自身思维过程的内省,他觉得某些东西还缺。


AI能不能真正创造

他以围棋举了一个例子。AlphaGo的第二局第37手棋,是人类棋手从来没有想到过的落点,当时全球顶级棋手都认为这是错误,但这一手改变了比赛走向。

Hassabis说,这当然令人印象深刻,但还不够,他想要的系统是:给它一个高层次描述,比如一个五分钟能学会规则但要花多少个人生才能掌握的游戏,美观,可以在一个下午里玩,然后系统能发明出围棋这样的东西。

他认为今天的系统还做不到这件事,差距在于创造性,真正意义上超出已知范围的东西。

他也留了一个开口,也许不是系统本身不行,而是使用方式还不对,如果有一个足够富有创造力的人,整天整夜地摸索这些工具,把自己的创意灵魂注入其中,也许会做出真正令人惊讶的东西。


开源与Gemma

Hassabis对开源是真心支持的,AlphaFold当年免费开放就是一个证明,科学研究成果至今仍在顶级期刊发表。

Gemma 4系列推出两周半,下载量达到4000万次。他认为西方科技栈在开源上需要有代表性选手,目前开源领域中国模型表现突出,他们希望Gemma在同等规模下具备竞争力。

策略上,他们决定把面向Android、眼镜、机器人的端侧模型做成完全开放,理由是一旦部署在这些表面上就已经暴露了,不如彻底开放。这对他们战略上也说得通,边端模型和开放模式在这个层级上统一了。


Gemini从一开始就是多模态

Gemini从设计阶段就是多模态的,而不是后来加进去的,这让初期比单纯做文本更难,但他认为长期收益正在显现。

世界模型、机器人、数字助手,都需要理解物理世界,理解你所处的环境,这正是多模态系统的优势所在。Waymo已经在用Gemini,他们也把这条路继续下去。


推理成本降低意味着什么

有人问推理成本接近零的时候会发生什么。

Hassabis不认为推理会真正变成零成本,他提到Jevons悖论,历史上能源越便宜用量往往越大。他的判断是,无论推理成本降到多低,人们都会用光所有能用的算力,数百万个Agent并行工作、集成推理结果,这些场景会把所有算力消耗掉。

长期来看,如果材料科学解决了核聚变、超导或者高效电池,能源成本可能接近于零,但芯片的物理制造成本还在,未来几十年算力仍然会存在分配问题。


从AlphaFold到虚拟细胞

生物领域,Alpha 3已经把预测范围从蛋白质扩展到更广泛的生物分子。

DeepMind衍生出去的Isomorphic Labs正在尝试覆盖整个药物发现流程,他说很快会有重大进展可以公布。

他提到的更远目标是虚拟细胞,一个完整运作的细胞仿真,可以对它进行扰动,观察输出,生成合成数据,跳过大量实验步骤。他估计完整的虚拟细胞大概还需要十年。

现在他们从细胞核开始,因为它相对独立,可以近似处理进出该系统的输入输出。另一个卡点是数据,要对活体细胞做纳米分辨率的实时成像而不破坏细胞,目前还做不到,这是这个领域的硬件障碍之一。


AI与科学:下一个AlphaFold级别的突破在哪

Hassabis说,材料科学、药物发现、气候模型、数学,这些领域他都非常看好,但他认为现在大家都处在接近"AlphaFold一号时刻"的位置,有非常有希望的结果,但还没有真正解决该领域的核心难题。他预计未来两年内会有很多话题可以讲。

他用来判断一个领域是否适合AlphaFold式突破的标准是:问题具有庞大的组合搜索空间,没有蛮力或特殊算法能解决它;有清晰的目标函数,可以做梯度下降;有足够的数据或模拟器可以生成大量分布内的合成数据。满足这三点,他认为现有方法就能走很远,找到那根藏在干草堆里的针。

药物发现符合这个框架,某个化合物存在于自然界,它能治愈某种疾病,问题只是如何高效地找到它。AlphaFold第一次证明了这类系统可以完成这样的搜索。


AI能做真正的科学发现吗

他的判断是:接近,但还没到。

他们在做Co-Scientist这样的系统,也有AlphaEvolve这类算法,能在Gemini基础之上走得更远。他说自己还没有看到任何一个系统做出真正意义上的重大发现,这是他的个人判断。

他认为关键缺口在于创造性,真正超出已知范围的那种,不只是模式匹配或者外推,而是类比推理,这些系统目前还不具备,或者没有被正确地使用。

他举了一个"爱因斯坦测试"的概念,用1901年的知识训练一个系统,然后看它能不能在1905年自己推导出狭义相对论和光电效应。他认为可以用这个测试来持续验证系统的进展,一旦通过,就意味着系统真正能发明出全新的东西。

还有一个他认为更难的层次,不只是解决一个千禧年数学难题,而是提出一组新的千禧年难题,被顶尖数学家认为同样深刻,值得花一辈子去研究。他认为我们还不知道怎么做到这件事,但他不认为这是魔法,终究是可解的。


给创业者的建议

他说,创业者现在如果开始一个深科技方向,通常是十年的旅程,而他对AGI的时间线是2030年左右,这意味着AGI很可能会在旅程中途到来。这不一定是坏事,但必须认真考虑进去,包括你的系统能否利用AGI,AGI会对你的技术做什么。

他认为AGI出现后,最可能的形态不是一个巨大的统一系统,而是通用模型(比如Gemini)把AlphaFold这类专业系统当工具来调用。把所有蛋白质数据塞进Gemini没有意义,单独的专业系统更合理,通用模型负责使用和调度。

他给出的择业原则是:深难问题和浅显问题在某种意义上难度差不多,只是困难的地方不同。既然生命短暂,不如把力气用在真正有分量的事情上,那种如果你不在就不会有人去做的事。

他的另一个建议是跨学科方向,AI和材料科学、医学等深层实体科学的交叉,这是在他看来最难被下一次模型更新"淹没"的领域,也是他个人一直偏爱深科技的原因。

他自己的例子是,他从很年轻的时候就决定AI是他认为最重要的事,然后一直做,不管有没有人相信,不管在哪里。他说即使DeepMind是在某个小车库里还没有起色,他还是会继续工作在这个方向上。

 


--end--


最后记得⭐️我,每天都在更新:如果觉得文章还不错的话可以点赞转发推荐评论

/...@作者:你说的完全正确(YAR师)