访谈Sam Altman：他再次阐述对一个人AI公司的定义以及GPT系列规划

AI深度研究员

2024-11-09 10:04发布于上海

（关注公众号并设为🌟标，获取最新人工智能资讯和产品）

——我们从一开始就说过，我们会追求 AGI，而在当时的领域里，这种说法是不被允许的，因为这听起来简直像是疯狂的想法。我记得当时你们因此受到了大量的批评
——对一个年轻的创业者来说，这种信任是非常特别且鼓舞人心的。当然这确实很重要，但直到后来我才意识到，参与创业活动最宝贵的是那群志同道合的人
——人们容易认为，只要做的是 AI，商业法则就不适用了。实际上，即使使用 AI，你仍然需要建立竞争壁垒和优势。虽然可以借助新技术迅速增长，但不能忘记必须创造真实的价值。

在科技界,很少有人能像Sam Altman那样对未来产生如此深远的影响。作为OpenAI的首席执行官,Altman带领团队在机器学习、生成式人工智能以及大语言模型(LLMs)等领域取得了突破性进展。这些模型现已达到博士学位级别的推理能力,但这仅仅是开始。在最新发表的文章中,Altman大胆预测:距离通用人工智能(AGI)的实现,可能只剩下几千天的时间。

在近期与Y Combinator总裁兼首席执行官Garry Tan的对话中,Altman回顾了OpenAI的发展历程。"与DeepMind等竞争对手相比,我们的资源确实很有限,"Altman坦言,"但我们选择了一个明确的目标并始终专注于此。这种专注最终成为了我们的制胜法宝。"他指出,即便在今天,很多人仍然低估了对单一目标保持坚定信念的价值。

为了更好地理解AGI的发展路径,Altman提出了一个清晰的分级框架:

第一级:聊天机器人
第二级:推理系统(如今年早些时候发布的o1)
第三级:能够独立执行长期任务的"代理人",可以与环境互动、寻求人类帮助并开展协作
第四级:具备科学家般探索和理解能力的创新者
第五级:能在组织层面实现类似效能的强大系统

"AGI这个术语确实被过度使用了,不同人对它的理解也各不相同,"他说,"但通过这个框架,我们可以更清晰地看到发展的阶梯。特别值得注意的是,第三级'代理人'的实现可能会比我们预期的来得更快。"

文稿整理

主持人： 我们今天有一份特别的礼物带给大家。感谢 Sam Altman 的到来！

Sam Altman： 谢谢。这其实是YC“如何构建未来”系列的重启，所以很高兴回到我多年前开始的这个系列。

谈AI创业时机

主持人： 这真是个疯狂的想法，我很高兴这个系列被重启了。让我们来聊聊你最新的文章《智能时代》(The Intelligence Age)。你觉得现在是创立科技公司的最佳时机吗？

Sam Altman： 至少可以说是目前为止最好的时机，希望未来还会有更好的时机。我认为，每次主要的技术革命，你都能做一些比以前更多的事情。我也希望未来的公司会更加令人惊叹并且影响深远。所以，是的，我认为这是迄今为止的最佳时机。

主持人： 在你的文章中，你提到 ASI（超级智能）可能距离我们只有几千天。那可是个很惊人的表述。

Sam Altman： 也许吧，这是我们的希望、猜测或者怎么样的。过去三年我们取得的进展持续下去的话，我们可能在三年、六年或九年后（九年大约是3500天）会拥有一个非常有能力的系统。即使是像 A1 这样的系统，已经能够在特定的任务上表现得非常出色。我们离进步的极限还很远。

主持人： 这篇文章几乎是我见过最乐观的科技预测了。你还提到我们可能会解决气候问题，建立太空殖民地，发现所有的物理学规律，拥有近乎无限的智能和丰富的能源。

Sam Altman： 我确实认为所有这些事情，甚至更多我们无法想象的事情，可能离我们并不遥远。Y Combinator 一直让我喜欢的一点就是它鼓励一种略显不切实际的科技乐观主义，以及一种相信“你能搞定这些事”的信念。在一个经常告诉人们“你做不到”的世界里，YC 鼓励创业者想得更大一些，这是一种特别的力量。充裕的能源似乎是一个非常重要的因素。如果我们实现能源充裕，这将会释放出巨大的潜力，不仅是知识工作，甚至是实际的物理工作都可以被解锁。这些是我们需要的两大关键投入。如果我们能获得真正充裕的智能和能源，我们将能够在世界上实现非常多的事情，无论是提出更好的想法还是在现实世界中实现它们。丰富的能源将是一个巨大的解锁。

主持人：那么，你觉得如果我们无法实现无限的能源，会发生什么？

Sam Altman： 太阳能加储能的发展轨迹已经很好了，即使我们没有取得大的核能突破，我们也会“还可以”。不过，毫无疑问，降低能源成本、增加能源充裕度对生活质量有着非常直接的影响，最终，我们会解决所有物理学的问题，只是时间问题。

谈管理YC岁月

主持人： 听说在你还在斯坦福上学时，Paul Graham 带你进入 YC，能谈谈那个经历吗？

Sam Altman： 是的，当时我还是斯坦福的大一新生，他对我说“YY（第一届 YC 孵化项目）将来还会有，你可以等下一次。”我回答他说，“我是大二了，而且我准备参加。”这些事情有点带有传奇色彩了，不过我当时确实这么说了。我并不认为自己是一个不可一世的人，实际上有很多方面我并不是。不过，我确实有点觉得，很多事情并不一定非得按它们的既定方式来，所以我会从第一性原理出发去做我认为合适的事情。YC 给了我很多这种信念。我对 YC 最在意的一点是，YC 就像是一个充满各种怪人的集合，他们都有一种“我就是要做自己的事”的态度。我觉得可以自由地尝试各种事情，这种精神对我来说非常重要。在 YC，我们遇到了一群相信自己可以做成事情的人。当时我在思考到底是什么让 YC 如此特别。我以为是因为这里有一个非常了不起的人在告诉你“我相信你能做到”，对一个年轻的创业者来说，这种信任是非常特别且鼓舞人心的。当然这确实很重要，但直到后来我才意识到，YC 最宝贵的是那群志同道合的人。

我给年轻人的最大建议之一，就是尽早找到这样一个志同道合的群体，这对我个人来说非常重要。我以前以为自己可以独自搞定一切，但与激励人的同行在一起真的非常有价值。很有趣的是，我们俩都曾在斯坦福待过。实际上我没有完成学业，但选择退学去追求更大的回报。不过，即使斯坦福是一个充满特质的社区，YC 仍然让我感到更强烈的冲击力。

主持人： 我也是这样认为的。我喜欢斯坦福，但我在那儿并没有感到被一群让我想要变得更好、更有野心的人所包围。在那里，大家似乎都在竞争谁能拿到哪个投行的实习，而这并没有激励到我。这让我很容易决定不再回去继续上学，特别是在体验了 YC 的氛围之后。

Sam Altman：：我非常喜欢卡尔·荣格的一句名言：“世界会问你是谁，如果你不知道，世界会告诉你。” 这句话似乎在强调要尽早明确自己想成为谁以及想和谁在一起，这很重要。我的一个体会就是，没有人能完全免于同伴压力，所以唯一能做的就是找到好的同伴。

主持人： 你后来创建了 Loopt 公司，并将其出售，接着去了 Green Dot，之后我们在 YC 一起工作了。谈谈 YC Research 的早期日子吧。我记得你带来了许多创新的实验，特别是在 AI 方面。

Sam Altman： 我一直觉得最酷的“退休工作”就是管理一个研究实验室。最开始谈到 YC Research 时，并不仅限于 AI，而是支持各种不同的努力。当时我也并不能确定 AI 会成为主流方向。我们尝试了很多不太成功的项目。那时我读了几本关于 Xerox PARC 和 Bell Labs 的书，硅谷的很多人都意识到我们需要重新建立优秀的研究实验室。我觉得这会很酷，也与 YC 有些相似之处，即你会将资本分配给聪明人，有时会成功，有时不会，但我想尝试一下。

谈建立OpenAI团队

主持人： 确实，2014 年末到 2015 年初，超级智能的讨论很热门，DeepMind 也有一些令人印象深刻的成果。你是如何组建 YC Research 和 OpenAI 的初始团队的？

Sam Altman： 我记得在早期 Greg Brockman 就加入了。回想起来，这种情景就像电影中的片段，仿佛我们在找人加入团队。我听说 Ilia 非常聪明，看了他的视频之后，我决定要见见他。我给他发了邮件，但他没有回复，所以我去参加了他演讲的会议，我们见面了。然后我们开始频繁交流。Greg 我也稍微认识一点，来自早期的 Stripe。

主持人： 你们最初的对话是怎样的？

Sam Altman： 我说我喜欢他对 AI 的想法，想要创建一个实验室。从一开始我们就说要追求 AGI，而在当时的领域里这几乎是禁忌的，因为这听起来像是疯狂的想法。这样的表达立刻吸引了许多有潜力的年轻人，同时也引来了那些对我们有偏见的“平庸的年长者”的鄙视，可能这就是一种很好的信号。我们像是一群不羁的年轻人，而我当时算是年纪最大的了，也才 30 岁左右。这些人看着我们，好像在说“这些不懂世事的年轻人在胡说八道”。但是，那些被这个想法吸引的人，可能也是当初像我一样“我是大二，我要来了”的那种人。我们逐一去拜访、结识，逐渐地组成了一个团队。这个过程持续了大约九个月。2016 年 1 月初，当大家从假期回来，我们在 Greg 的公寓聚集，也就十来个人，大家坐在一起，感觉我们完成了一件巨大的事情，终于开始了。然后我们问：“接下来该做什么呢？”这让我想起了创业者辛苦筹集资金的过程，以为已经取得了很大的成就，但坐下来后才意识到，这只是一个开始。不是庆祝的时候，而是起跑的发令枪刚刚响起。

主持人： 我理解，当你们意识到要解决什么问题时，一切才刚刚开始。

Sam Altman： 没错，这个过程非常艰难，但我对 Ilia 的表现特别印象深刻。其实，所有早期的团队成员都清楚，我们的想法从一开始就有很多曲折，但大方向上我们的初衷是非常正确的。当时，我们在 Greg 的公寓里，用翻页纸或白板把这些想法写在上面。然后我们去做了一些其他的事情，有些成功了，有些没有，但最终我们得到了现在的这个系统。回头看，从那里到这里，我们经历了那么多的波折，这一切显得既疯狂又不可思议。

主持人： 当时的翻页纸上是否就已经包括深度学习的内容了？

Sam Altman： 是的，更具体地说，我们的目标之一是构建一个大型的无监督模型，然后解决强化学习（RL）。我记得在早期的一次会议上，设定了三个目标：学习如何进行无监督学习，解决 RL 问题，并保持团队人数不超过 120 人。不过第三个目标显然没有实现，但前两个目标的方向非常准确。

主持人： 另一个重要的想法是规模化，这在当时是很有争议的。有很多人批评你们，认为这种做法几乎是异端邪说。

Sam Altman： 没错，我们的核心信念是深度学习有效，而且随着规模的扩大会变得更好。我们当时还不知道规模化会带来多么可预测的改善，这种认识是在几年后才逐渐得到的数据支持。人们早就知道，神经网络越大，效果越好，但当时的“宗教般的信念”是，这种进步不会持久。很多领域的权威都认为我们错了，甚至认为我们这种信念是有害的，可能会引发新的 AI 冬天。当时的批评声音很大。我们的信念似乎是一种极端的坚持。我们对所看到的结果非常坚定，相信它会不断改善。规模化的损失率结果出现后，尽管有些违反直觉，但我们还是继续推行这种方法。我们当时感觉，好像学习过程是某种非常重要的涌现现象，即便我们无法完全理解其中的细节，但我们知道这背后有着非常根本的机制。

主持人： 你们当时的资源比 DeepMind 少得多，所以只能选择一个方向专注推进，这是典型的创业公司精神。

Sam Altman： 我们不知道自己不知道什么，但知道有一件事有效，所以我们决定专注于此。其他的一些团队可能试图在多个方面超越自己，而我们只是选择了眼前的这条路并持续推进。规模的特性确实是很有趣的。我发现，不仅对创业公司，对于深度学习模型以及其他很多事情来说，规模化都有着涌现的特性。很多人低估了这一点。如果某件事情随着规模的扩大而变得更好，那就应该继续放大它。大多数人认为“少即是多”，但我们认为“多即是多”。即便我们当时还不知名，我们也有一支非常有才华的研究团队，他们能够在这一方向上推动。当时我们还面临获得计算资源的难题，而业界的一些前辈批评你们过度消耗资源，认为这可能会导致 AI 冬天，甚至是某种道德上的失误。他们的意思是，我们在这个方向上投入了过多资源，而这些资源应该分配给多个项目。大多数人不理解在一个目标上投注极端信念的价值。我们当时说，我们有证据表明这个方向是正确的，所以决定集中资源，而不是分散在多个方向上。

谈信念和坚持

主持人： 在 YC 的很多成功创业公司中，也能看到这种坚定信念的影子。面对外界的反对声音，如果自己看不出理由，那就坚持做下去。

Sam Altman： 没错。YC 让我理解到，没有所谓的“成年人”在掌控一切、知道所有答案。你只能快速迭代，找到自己的方向。理解这一点对我来说是一个重要的解锁，让我意识到坚持信念的重要性，但前提是要在获得数据后调整方向。

主持人： 这也是一种专注力的体现。你们必须做出选择，优先级本身就提高了成功的概率。

Sam Altman： 我希望能告诉你，我们一开始就知道会发生什么，并直接想到语言模型，但事实显然不是这样。OpenAI 的发展历程中，我们尝试了许多不同的方向，但并不是直接走向最终成功的。如果当时就知道现在的结果，我们可以极大地加快进展。

主持人： 确实，当时没人知道语言模型会成为关键。你们开始时还在研究机器人和游戏中的智能体，后来才发展到 GPT-3。

Sam Altman： 在 GPT-1 之前，已经出现了一个关于正负情感的关键洞察。当时 Alec Radford 的一个研究成果可能叫《无监督情感分析》，他是个非常出色的天才。Alec 做了令人难以置信的工作，他注意到在生成亚马逊评论的过程中，有一个神经元在正负情感之间切换。我认为其他研究人员可能会把这个发现炒作得更厉害一些，但 Alec 比较低调，所以人们花了一段时间才完全意识到这个发现的重要性。然后他开发了 GPT-1，接着其他人将它扩展成 GPT-2。这个发现是基于一种惊人的洞察，虽然当时无监督学习的效果并不明显，但他发现了这个神经元在情感上的奇妙表现，这最终引领了 GPT 系列的诞生。

主持人： CaseText 的 Jake Heller 是 YC 校友之一，他获得了 GPT-3、3.5 和 4 的使用权限。他描述 GPT-4 的出现是个重要的突破，因为 3.5 还会产生幻觉，无法在法律环境中使用。但有了 GPT-4，如果将提示切得足够小，就能实现他想要的效果。他还围绕这个模型构建了大量的测试用例，最终以 6.5 亿美元的价格出售了公司。我记得他曾经和我们聊过这个话题。

Sam Altman： GPT-4 是我们第一次真正觉得自己手上有了一个伟大的产品。刚开始尝试把 GPT-3 推向创业者时，大家会觉得它很酷，演示效果也很惊人，但除了版权工作外，没有多少人用它创建伟大的商业模式。到了 3.5，尤其是在 YC 的创业公司中，人们的兴趣开始增加，不再是我们推销时的“上坡路”。而到了 GPT-4，市场反应就变成了“你们有多少 GPU 可以卖给我们？”这是非常不同的情景，让我们意识到这确实是一个好产品。所以是用户反馈让你们真正意识到这个模型的价值。我们内部测试的时候都对它印象深刻，尤其是我们自己尝试使用它的时候。它能押韵、讲笑话，虽然只是些小幽默，但很有趣。不过，直到把它交到用户手中，你才会知道它是否真的成功。自己总是对自己的工作过于满意，真正的考验是用户的反馈。

谈首次创业

主持人： 想稍微转换一下话题。在创建这个非凡的 AI 实验室之前，你在 19 岁时以 Loopt 公司开始了创业。Loopt 实际上是朋友位置共享服务，可能比 Apple 的“查找朋友”早了 15 年。是什么吸引你去做这个想法的？

Sam Altman： 当时我对手机很感兴趣，想做点和手机相关的东西。那时移动设备刚刚起步，距离 iPhone 的问世还有几年，但我意识到随身携带计算设备是个大事。当时的手机真的只是个“电话”。我还记得我第一部能上网的手机，是个文字为主的浏览器，非常慢，只能勉强查邮件，但我一下子被迷住了。这不是个电话，而是我们可以随身携带的计算机。

主持人： 这就是我们小时候的电脑，而现在竟然随身携带小小的黑镜，这在当时是无法想象的。

Sam Altman： 从那时起我就对技术的未来充满好奇。尽管我们当时没有 App Store，iPhone 也还没出现，但能够经历平台变革并看清这种转变的过程，对我来说是一次很宝贵的经历。虽然我只是旁观者，但亲历这个过程让我学到了很多。

主持人： 你后来卖掉了公司，这大概是你第一次管理团队，进行企业销售吧？

Sam Altman： 那段经历确实让我学到了很多，尽管公司并不算成功，找不到产品市场契合点，也没能获得逃逸速度（指公司增长突破点），但它提供了非常丰富的经验。Paul Graham 说过一句话，“二十多岁总是充满学习的历程，只是你不知道未来要做什么。”这句话深深影响了我。在 19、20 岁时经历平台转变，后来这也为我接下来的事业奠定了基础。随着时间的流逝，我们都变老了，现在是 18、20 岁的年轻人决定他们的职业发展了。但那些公司很可能会错过这波浪潮，因为所有伟大的事情正在发生。令人惊讶的是，一些亿万级公司的创始人甚至没有意识到 AI 的发展正在改变世界。我对此非常兴奋，因为这个世界在 AI 方面还处于一种令人震惊的“沉睡”状态。而 YC 的创始人则不同，他们充满了干劲，觉得自己可以快速实现一些了不起的事情。

主持人： 这让我想起当年 Facebook 差点错过了移动互联网，因为他们擅长开发网页软件。最后不得不通过收购 Instagram 和 WhatsApp 等方式赶上这个浪潮。平台的转变通常是由那些没有先入之见的年轻人引领的，这真是很有意思的现象。你、Elon、Bezos 等许多知名创业者都从软件公司起步，然后逐渐在硬科技领域取得了成就。你认为如果人们一开始就想从事最前沿的硬科技，是不是应该直接投入？还是说先解决“金钱问题”，然后再投入到下一步会更有帮助？

Sam Altman： 这是个有趣的问题。的确，能够自己为 OpenAI 写下早期支票很有帮助，这在一开始很难指望别人去做。Elon 后来以更大规模加入，我们非常感激，而其他人也接着支持。能为一些项目提供资金是一件很棒的事，但回想起来，我觉得当年做 Loopt 时有点浪费时间，虽然不后悔，但如果可以重来，我会选一个更好的项目。

主持人： 如果有时光胶囊，你会对 19 岁在斯坦福的自己说些什么？

Sam Altman： 这很难说。AI 一直是我最想做的事，当时我也在学校的 AI 实验室学习。只是那个时候，大家都说“不要做神经网络，我们尝试过，行不通”。我想我可以选择一个更有前景的方向，但一切都还算不错。确实有很多人致力于开发技术以改善他人的生活。我经常想到那些制造我第一个电脑的人，虽然我不认识他们，但我对他们充满感激。他们当时工作非常辛苦，但这些努力为我和许多其他人带来了巨大改变。

主持人： 今年对 OpenAI 来说是个重要的年份，但也有些“戏剧性”的事件。你如何看待过去的这些变化和团队的调整？

Sam Altman： 我们有点像在两年内快速经历了一个中型甚至大型科技公司通常需要十年才能经历的发展过程。ChatGPT 还不到两岁，随着公司规模的增长，团队管理也面临挑战。每个公司在不同阶段需要不同的团队，特别是从 0 到 1 阶段的人才未必适合 1 到 10 或 10 到 100 的发展阶段。我们犯了不少错误，也做对了一些事情，未来可能会有更多变化。我希望接下来会是个相对平静的阶段，但也许未来还会有动态变化的时期。

谈OpenAI工作模式

主持人： 你觉得 OpenAI 现在的工作模式如何？从产品的质量和推进速度来看，简直达到了世界级。

Sam Altman： 这是我第一次觉得我们真的知道该做什么。要实现 AGI 仍然需要大量工作，还有一些未知的挑战，但我们大致知道该怎么走，虽然这将耗时且困难，但非常令人兴奋。我们的研究路径、基础设施路径都很清晰，产品方向也逐渐明朗。以前我们是纯粹的研究实验室，很难坚定地执行某个方向，但如今大家齐心协力，进展速度变得更快。

主持人： 最近我们在 YC 举办了o1 黑客松活动，看到许多令人印象深刻的创新。有个团队是 CAD/CAM 初创公司，他们在黑客松上通过迭代改进，让一个不可飞的机翼模型实现了实际的升力。

Sam Altman： 没错，我之前告诉别人从第二阶段到第三阶段的跃升很快，但从第三阶段到第四阶段会需要一些更大的新想法。那个演示和其他一些项目让我意识到，利用现有的模型通过创新的方式也可以实现巨大进步。Camper 已经构建了 CAD/CAM 的底层软件，而语言模型作为接口使得它们能够使用这些工具，甚至可以生成代码来创建和组合自己的工具。语言模型不仅可以编写代码，还能为自己创建工具，这简直是个疯狂的想法。我认为事情的发展速度会比人们预期的还要快。现在真是个激动人心的时代。你提到“发现物理学的全部”，我也曾想成为一名物理学家，但自己没有足够的天赋，最后只能以另一种方式做出贡献。我真的相信，有人最终会用这些技术来解决所有的物理学问题，能在有生之年见证这一切让我非常激动。很高兴能看到我们达到第四阶段，期待那个人是谁。

主持人： 你可以简单谈谈第三、四、五阶段吗？

Sam Altman： 我们意识到“AGI”这个词被严重滥用了，大家的理解都不一样。我们试图大致理清顺序：第一级是聊天机器人，第二级是推理系统，我们认为今年早些时候的 o1 发布就达到了这个水平。第三级是“代理人”，可以独立执行长期任务，比如多次与环境互动，必要时向人求助，协同工作等等。我认为我们会比预期更快实现这个阶段。第四级是创新者，比如科学家，具备探索未知现象并深入理解的能力。第五级是能够在公司或整个组织规模上实现类似效果，那将是一个非常强大的存在。

主持人： 这听起来有些像分形。就像你在达到第二级时所做的事情，会与第五级有所呼应。多个代理人互相纠错并协同工作，这听起来就像一个微型的组织。你认为会有那些仅由少数人甚至一个人管理的公司吗？这些公司每年赚取数十亿收入？

Sam Altman： 是的，我也有这样的感觉。这是创业者的好时机。想象一下，一个人加上一万个 GPU，非常强大。

主持人： Sam，有什么建议给那些刚开始或准备创业的人吗？

Sam Altman： 紧抓这个技术趋势吧。我们离饱和点还很远，模型会变得越来越强大，速度也非常快。作为创业者，使用这项技术能做的事情与之前完全不同。即使是那些已经成立几年的创业公司，现在都在季度规划周期，而大公司甚至在十年规划周期。你的速度、专注、信念，以及对快速技术变革的响应能力，就是创业公司的最大优势，尤其是在当下。所以我建议一定要用 AI 做点什么，并充分利用你看到新事物的能力，立即构建它，而不是将其纳入季度规划。

主持人： 新的技术平台出现时，人们容易认为，只要做的是 AI，商业法则就不适用了。实际上，即使使用 AI，你仍然需要建立竞争壁垒和优势。虽然可以借助新技术迅速增长，但不能忘记必须创造真实的价值。

Sam Altman： 确实，现在每个人都能构建一个令人惊叹的演示，但创建一个成功的商业模式才是真正的目标。规则依然适用，只是比以往更快更好地完成，但最终还是要建立一个实际的商业。

主持人： 你对 2025 年有什么期待？

Sam Altman： AGI，对这个非常期待。还有…我即将迎接一个孩子，比以往任何时候都更兴奋。这会彻底改变我的生活，迫不及待了。

主持人： 祝我们能为我们的孩子，乃至全世界打造一个更美好的未来。非常感谢你，Sam，今天聊得很愉快。

Sam Altman： 谢谢。

素材来源官方媒体/网络新闻

查看原图 599K