图片来源:YouTube
Z Highlights:
在Scale AI发布的对AI模型评估新标准《Humanities' Last Exam》下,中国最先进的AI模型DeepSeek表现最为出色,基本上与美国最好的模型o1不相上下。
高阶AI能力将催生突破性应用场景,用户会愿意为这些增强功能支付溢价;而基础性应用需求,或将更多由开源模型及轻量化方案满足。
中美AI竞争愈发激烈,美国应释放政策与基建能量以主导全球AI竞赛。
Alenandr Wang对AGI的定义:强大的AI系统能够像你我一样使用计算机,并且能够使用计算机的所有工具,基本上可以成为一个最具能力的远程工作者。
中美AI竞赛:技术突破VS芯片管制
主持人:Scale AI创始人兼首席执行官Alexander Wang首次出现在节目中。他的公司提供准确标注的数据以供其他公司训练他们的AI工具。早在2022年,他就成为了世界上最年轻的白手起家的亿万富翁。
Alexandr Wang:谢谢你们邀请我来参加这个节目。
主持人:我想直接进入我们刚刚在镜头外讨论的话题,即中美双方在人工智能领域的差距,因为你们有一些非常惊人的数据,这些数据可能会让部分观众感到震惊。
Alexandr Wang:首先,美国和中国之间的人工智能竞赛和人工智能战争是当今最重要的问题之一。我们在周二的《华盛顿邮报》上刊登了一整版广告,声明美国必须赢得人工智能战争。中美之间在人工智能领域的这场相对竞争是至关重要的。
今天,我们发布了《Humanities' Last Exam》,这是我们为AI Model制定的一项新的评估基准。我们邀请了数学、物理、生物、化学教授提供他们认为与其近期研究相关的、最难的问题,目的是对这些模型进行真正的考验,可以说目前没有任何模型能在这个测试中得分超过10%。但我们发现中国最先进的AI实验室DeepSeek的模型表现最为出色,基本上与美国最好的模型o1不相上下。
主持人:我们一直以来都认为美国在人工智能方面遥遥领先于中国,这很大程度上是因为我们拥有NVIDIA的GPU和芯片等资源,而这些东西中国似乎没有。我这周不断听到来自中国AI企业的高管们的言论,他们说,“我们已经非常接近顶尖的水平了。而且我们是在戴着镣铐跳舞。我们的算法更优秀,实际上我们可以找到比美国更好的方法,甚至以更节能的方式实现AGI,因为我们不需要这些超级强大的芯片。”他们说的对吗?
Alexandr Wang:有两件事正在发生,首先,确实在很长一段时间内,美国一直处于领先地位。至少在过去十年内情况一直是这样的。话虽如此,但就在圣诞节那天,也就是大约一个月前,DeepSeek发布了一个模型。顺便说一句,这很有象征意义,中国实验室在圣诞节当天发布了一个震撼世界的模型,而我们其他人还在庆祝节日。这个模型的发布引起了巨大的轰动。然后他们紧接着发布了他们的推理模型DeepSeek R1,这是我们评估后认为在排行榜上名列前茅的模型。现实情况是既是又不是。所以中国实验室拥有的H100比人们想象的要多。
主持人:这些是性能最强大的NVIDIA芯片,而他们本不应该拥有这些芯片。
Alexandr Wang:据我了解,DeepSeek拥有大约50000个H100,但他们显然不能公开谈论这一点,因为这违反了美国实施的出口管制。他们拥有的芯片确实比其他人预期的要多,但从长远来看,他们将会受到我们实施的芯片控制和出口管制的制约。
AI模型混战:评估基准之争到万亿市场爆发
主持人:我的意思是你如何与所有人合作。我不知道这样是否公平,但你如何对这些大语言模型进行排名,谁最终会成为赢家?还是它们都很接近,最终会变得同质化?
Alexandr Wang:这是我们现在看到的一个有趣的现象,实际上我们专门研究这个领域。我们在Alignment Labs进行了SEAL 评估、安全评估,这些评估涵盖了多个不同的维度。我们评估了数学能力、编码能力、多语言能力以及推理能力等多个维度,包括工具使用和Agent能力。
我们看到的是,不同的模型在不同方面表现出差异化。因此,很难对所有模型进行明确的排名。例如,OpenAI的模型在推理方面非常出色,而Anthropic的模型可能在代码方面表现更好。模型的多样性使得它们各有优势。话虽如此,总体来看,这个领域的竞争正变得更加激烈,而不是减弱。
主持人:我不断听到这里的商界大佬们说,他们都在尝试使用OpenAI,或尝试使用Anthropic的Claude模型,或者他们在试用Gemini等等。然后他们还会去使用Llama。他们会找到一些开源版本,试图接近其他模型的效果,因为这些模型的价格有所差异。你认为这是未来趋势吗?就像Linux World一样?
Alexandr Wang:这确实是一条发展路径。但最终,这取决于你的应用场景所需的能力和智能水平。最终我们会看到的是,我们与所有领先的实验室,包括OpenAI、Google DeepMind、Meta等,继续推动前沿,拓展边界。那么,考虑到我们作为一个行业已经没有更多的公开可用的数据,我们如何利用数据呢?我们又如何生成新的数据来继续推动前沿技术?我们的观点是,高阶AI能力将催生突破性应用场景,用户会愿意为这些增强功能支付溢价;而基础性应用需求,或将更多由开源模型及轻量化方案满足。
主持人:我们整个上午都在谈论Stargate,以及Sam Altman和Elon Musk在Twitter上关于他们到底有1000亿美元还是5000亿美元的争论。Satya Nadella昨天就坐在你的椅子上说他有800亿美元。他的钱是实实在在的。他还去Twitter发了帖子。你对这一切有什么看法?你认识所有这些参与者。
Alexandr Wang:反正很多事情都在Twitter上发生。所以我不确定我有没有X,但有一点是非常真实的,不管Stargate作为一个项目具体如何,美国将需要大量的计算能力和基础设施。这实际上是我们写给特朗普政府的一封信中的内容,关于如何确保美国保持领先地位的建议。其中之一就是关于基础设施的。我们需要释放美国的能量来推动这场AI领域的繁荣。显然我们现在正在看到这一点,除了Stargate项目之外,许多主要的AI公司和大型云计算公司都将寻求建造巨大的数据中心。
主持人:我之所以问这个问题,是因为不同的公司都在做这件事,你最终认为我们需要五、六、七家公司都在尝试构建前沿模型吗?或者说,一直以来都有传言,如果Lena Khan没有联邦贸易委员会(FTC)任职,Amazon会不会已经想收购Anthropic了,或者Microsoft会不会已经收购OpenAI,又或者会不会其中某些公司已经这样做了,这样可能就不会有这么多公司像现在这样彼此竞争了。也许你认为竞争是好事,我只是不知道长期来看,最终会有多少这样的模型存在。
Alexandr Wang:我的看法是,实际上这可能会成为有史以来最伟大的市场或行业之一。假设现在基于LLM的收入大约在100亿到200亿美元之间。如果你相信我们实际上正在朝着超级智能或AGI(人工通用智能)的方向发展,那么可以合理地推断,这个市场的收入将达到一万亿美元或更多。如果你看到的市场将从100亿美元增长到一万亿美元,谁知道需要多少年,我倾向于认为这是在较少的几年内实现。大约是2到4年内。
主持人:2到4年达到AGI。你对AGI的定义是什么?
Alexandr Wang:显然AGI有很多定义。而AGI的定义是,强大的AI系统能够像你我一样使用计算机,并且能够使用计算机的所有工具,基本上可以成为一个最具能力的远程工作者。
原视频:Scale AI CEO Alexandr Wang on U.S.-China AI race:We need to unleash U.S. energy to enable AI boom
https://www.youtube.com/watch?v=x9Ekl9Izd38&t=325s
编译:Jiateng Ma