奥特曼新年反思OpenAI过往，剑指超级智能｜动察

动点科技

2025-01-06 18:47发布于中国香港动点科技官方账号

“我们现在开始将目标转向超越这一点，转向真正意义上的超级智能。”

文｜动点科技

作者｜黄尘

排版｜恩惠

本文预计阅读时长13分钟

在经历了2023年的“宫变”后，屹立不倒的奥特曼，逐渐将这家全球领先的AI公司朝着自己希冀的方向腾挪。今年，在他的带领下，OpenAI完成了66亿美元的融资，公司估值飙升至1570亿美元。

去年年底，OpenAI正式宣布其 2025 年将转型为营利性公司。在2015年该公司成立之初，其组织架构主要由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。这种混合结构使得OpenAI能够在保持其非营利性使命的同时，也吸引风险投资和进行商业化运作。

《纽约时报》报道称，OpenAI预计其2024年的收入将达到37亿美元，这一数字到2025年将升至116亿美元。然而，在支付运营成本、工资和管理费用后，OpenAI预计今年将亏损约50亿美元。其中，最大的成本是在最大投资者微软处的算力支出，OpenAI的产品由微软的云服务托管。

另一方面，微软和OpenAI在业务上的竞争也在加剧，关系变得日益微妙，外界翘首以盼的GPT-5也未面世。而在当地时间1月1日，华盛顿邮报报道称，OpenAI曾经的联合创始人马斯克在圣诞节后几天加大了对OpenAI的法律攻势。

OpenAI 2024大事记

2月15日，OpenAI发布了 Sora 模型（正式版于当年12月发布），可以根据用户输入的文本描述，生成一段视频内容。该模型可以深度模拟真实物理世界，标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。

Sora 会严格根据用户输入的提示词，可以制作长达一分钟的视频，保持较高的视觉质量。对于任何需要制作视频的艺术家、电影制片人或学生来说，这都带来了无限可能。

此外 OpenAI 还邀请了一支专业的创意人士测试，用于反馈其在专业环境中的实用性。OpenAI 计划根据这些反馈意见改进 Sora，确保它能有效满足用户的需求。演示视频非常超现实。

5月14日，OpenAI 宣布推出最新旗舰生成式 AI 模型 GPT-4o，最大亮点在于其语音交互模式采用了新技术。GPT-4o 则采用了全新的技术，让聊天机器人对话的响应速度大幅提升。

发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后，GPT-4o 几乎可以即时回应，并通过文本转语音功能进行朗读，让对话感觉更加自然逼真。另一个演示展示了 GPT-4o 根据要求调整说话时语气，GPT-4o 可以根据指令改变声音，从夸张戏剧到冰冷机械，展现了出色的可塑性。最后，演示还展示了 GPT-4o 的唱歌功能。

以往，OpenAI 发布新版 ChatGPT 模型时，通常会将其置于付费墙之内。不过这次 GPT-4o 将免费提供给所有用户，付费用户则可以享受五倍的调用额度。

此外，OpenAI 还发布了桌面版的 ChatGPT 和新的用户界面。

6月，OpenAI推出CriticGPT，旨在找出ChatGPT代码输出错误，并辅助改进。它具备智能错误捕获能力，能深入分析ChatGPT代码输出并指出其中错误，同时能提高评估效率。该模型的发布标志着RLHF（基于人类反馈的强化学习）领域取得了重大进步。

7月30日，OpenAI 宣布向部分 ChatGPT Plus 用户开放 GPT-4o 的语音模式，并将于今年秋季逐步推广至所有 ChatGPT Plus 订阅用户。

根据此前曝光的信息，GPT-3.5 模型的平均语音反馈延迟为 2.8 秒，而 GPT-4 模型的延迟为 5.4 秒，因此在语音交流方面不太优秀，而即将推出的 GPT-4o 可以极大地缩短延迟时间，近乎无缝对话。

GPT-4o 语音模式具有快速反应、声音堪比真人等特征，OpenAI 更称 GPT-4o 语音模式可以感知语音中的情感语调，包括悲伤、兴奋或歌唱。

9月，OpenAI发布了o1系列模型。OpenAI o1 是经过强化学习训练来执行复杂推理任务的新型语言模型，该系列模型通过模仿人类的推理过程，能够在回答前进行更深入的思考，从而处理更复杂的问题。o1在物理、化学和生物学等复杂任务的基准测试中表现突出，甚至可与博士生媲美。

12月6日凌晨，OpenAI如预期一样带来了推理大模型o1的满血版本和进阶模式，以及每月收费高达200美元（约合人民币1450元）的ChatGPT Pro订阅服务。

o1模型最初以o1预览版的形式在9月上线。这类模型的特征是，在回答用户提问时不是“脱口而出”，而是形成一个类似人类思维方式的内部思维链条，从而明显提高在回答专业问题时的准确性。OpenAI表示，与预览版本相比，现在的o1模型“思维已经被训练得更加简洁”（大概快50%），同时在回答困难现实问题时，出现重大错误的概率减少了34%。

结束语

2024年仍是OpenAI在积极探索的一年，取得了不少成绩，也依旧是业界最受关注的企业。尽管面临着诸多挑战，但OpenAI仍然对未来发展充满信心。他们计划继续加大在AI技术研发方面的投入，推动AI技术在更多领域的应用和落地。同时，OpenAI也在积极探索新的商业模式和营收渠道，以实现可持续发展。

以下是奥特曼今日对外发布的反思信具体内容：

ChatGPT的第二个生日仅过去一个多月，现在我们已经进入了能够进行复杂推理的新模型时代。新年总是让人反思，我想分享一下到目前为止我的一些个人想法，以及我在此过程中学到的一些东西。

随着我们越来越接近通用人工智能（AGI），现在似乎是审视我们公司进展的重要时刻。我们还有很多需要了解的东西，还有很多未知之处，而且现在还为时尚早。但我们比刚开始时了解得更多了。

我们大约在九年前成立了OpenAI，因为我们相信AGI是可能实现的，并且它可能是人类历史上最有影响力的技术。我们想弄清楚如何构建它，并使其广泛受益；我们很兴奋能够尝试在历史上留下印记。我们的雄心壮志非常高，我们同样相信这项工作可能会以同样非凡的方式造福社会。

当时，很少有人关心，如果有人关心，那主要是因为他们认为我们没有成功的机会。

2022年，OpenAI是一个安静的研究实验室，当时正在研究一个暂时被称为“与GPT-3.5聊天”的项目。（我们在研究方面比在命名方面更擅长。）我们观察到人们使用我们API的游乐场功能，并知道开发者们非常喜欢与模型交谈。我们认为围绕这种体验构建一个演示将向人们展示关于未来的一些重要事情，并帮助我们使我们的模型更好、更安全。

我们最终幸运地将其命名为ChatGPT，并于2022年11月30日推出。

我们一直都知道，从理论上讲，总有一天我们会达到一个临界点，人工智能革命将被启动。但我们不知道这个时刻会是什么时候。令我们惊讶的是，结果竟然是这个。

ChatGPT的推出引发了一个我们公司、我们行业乃至整个世界都从未见过的增长曲线。我们终于看到了我们一直希望从人工智能中获得的巨大好处，而且我们可以看到很快还会有更多好处到来。

一路走来并不轻松。道路并不平坦，前方迷雾重重。

在过去的两年中，我们不得不从头开始围绕这项新技术构建整个公司。除了通过实践之外，没有办法培训人们，当技术类别是全新的时候，根本没有人可以告诉你应该怎么做。

以如此高速度在如此少的培训下构建公司是一个混乱的过程。通常是一步向前、一步后退（有时是一步向前、两步后退）。在进行过程中纠正错误，但当你在做原创工作时，真的没有任何手册或路标。在未知水域以高速度前进是一种不可思议的体验，但对所有参与者来说也是极具压力的。冲突和误解无处不在。

这些年来是我迄今为止生活中最有价值、最有趣、最好、最有趣、最令人疲惫、压力最大、尤其是最后两年最不愉快的年份。压倒性的感受是感激；我知道有一天我会在我们的农场退休，看着植物生长，有点无聊，会回想起我小时候梦想的工作是多么酷。我尽量记得在任何给定的周五，到下午1点为止已经有七件事情出错。

一年多前的一个周五，那天出乎意料的是我在视频通话中被解雇，挂断电话后，董事会立即发表了一篇关于此事的博客文章。我当时在拉斯维加斯的一家酒店房间里。那种感觉，几乎无法解释，就像一个做错的梦。

在没有预警的情况下公开被解雇引发了充满混乱的一些时刻。最奇怪的部分是“战争迷雾”。我们没有人能够得到来龙去脉的满意答案。

在我看来，整个事件是我们所有人（包括我自己）治理上的一个重大失败。回顾过去，我当然希望我当时能卓尔不凡，我希望今天我是一个更好、更有思想的领导者。

我还学到了拥有一个具有多样化观点和广泛经验的董事会在管理一系列复杂挑战时的重要性。良好的治理需要大量的信任和信誉。我很欣赏这么多人共同努力，为OpenAI建立了一个更强大的治理系统，使我们能够追求我们的使命，确保AGI造福全人类。

我最大的收获是我要感激的东西太多，我要感谢的人也太多：感谢所有在OpenAI工作并选择花时间和精力去追求这个梦想的人，感谢在危机时刻帮助我们的朋友，感谢支持我们并信任我们帮助他们成功我们的合作伙伴和客户，以及在我生活中向我展示他们关心的人。

我们都以更团结和积极的方式回到了工作中，我为我们自那时以来的专注感到非常自豪。我们做了一些我们最好的研究。我们的每周活跃用户从大约1亿增长到超过3亿。最重要的是，我们继续将技术推向世界，人们似乎真的喜欢这些技术，并且解决了真正的问题。

九年前，我们真的不知道我们最终会变成什么样子；即使现在，我们也只是有点知道。人工智能的发展经历了许多曲折，我们预计未来还会有更多。

有些曲折是令人愉快的；有些是艰难的。看着一连串的研究奇迹发生是很有趣的，许多怀疑者变成了真正的信徒。我们也看到一些同事分道扬镳，成为了竞争对手。随着团队规模的扩大，团队往往会更替，OpenAI的规模增长得非常快。我认为这在一定程度上是不可避免的——初创公司通常在每个新的重大规模水平上都会看到很多人员流动，在OpenAI，数字每几个月都会增长几个数量级。过去两年就像一家正常公司的十年。当任何公司增长和演变得如此之快时，利益自然会分歧。当任何一家在重要行业的领先公司时，有很多人出于各种原因攻击它，尤其是当他们试图与之竞争时。

我们的愿景不会改变；我们的策略将继续演变。例如，当我们开始时，我们没有意识到我们会不得不建立一家产品公司；我们认为我们只是要做出色的研究。我们也没有意识到我们会需要如此疯狂的大量资金。现在有一些我们几年前不理解的新事物需要我们去构建，未来也会有一些我们现在几乎无法想象的新事物。

我们为迄今为止在研究和部署方面的记录感到自豪，并致力于继续推进我们在安全和利益共享方面的思考。我们继续相信，使人工智能系统安全的最佳方式是通过迭代和逐步地将其推向世界，让社会有时间适应并与技术共同演变，从经验中学习，并继续使技术更安全。我们相信在安全和对齐研究方面成为世界领导者的重要性，并用现实世界应用的反馈来指导这项研究。

我们现在有信心知道如何构建我们传统理解的AGI。我们相信，在2025年，我们可能会看到第一批人工智能代理“加入劳动力队伍”，并实质性地改变公司的产出。我们继续相信，将出色的工具逐步交给人们，将带来伟大、广泛分布的结果。

我们现在开始将目标转向超越这一点，转向真正意义上的超级智能。我们喜欢我们目前的产品，但我们在这里是为了辉煌的未来。有了超级智能，我们可以做任何其他事情。超级智能工具可以极大地加速科学发现和创新，远远超出我们自己所能做的事情，从而极大地增加丰富和繁荣。

这听起来现在像是科幻小说，甚至谈论它都有点疯狂。没关系——我们曾经到达，我们将再次抵达。对此我们相当有信心，在未来几年，每个人都会明白我们心之所向，并且认识到在行动时要非常谨慎，同时仍然将最大化惠及全人类，这是很关键。鉴于我们工作的潜能，OpenAI 定当不凡。

能够参与这项工作是多么幸运和谦卑。

- - - - - - - - END - - - - - - - -

互动话题

您认为OpenAI能以当前的计划更进一步吗？

查看原图 12K