客户端
游戏
无障碍

3

评论

6

7

手机看

微信扫一扫,随时随地看

《麻省理工科技评论》| OpenAI发布o3-mini推理模型,免费!

AI划重点 · 全文约1141字,阅读需4分钟

1.OpenAI发布了免费推理模型o3-mini,适用于ChatGPT免费版用户,提升回答准确性。

2.与o1-mini相比,o3-mini的响应速度提高了24%,但运行成本仍是GPT-4o mini的约七倍。

3.由于推理模型需要更多计算资源,其能源消耗也显著高于其他类型的模型。

4.与此同时,新模型带来了新的安全挑战,需要更大的管控难度。

5.尽管如此,o3-mini在现实世界研究方面的能力仍然有限,有待进一步改进。

以上内容由腾讯混元大模型生成,仅供参考

图片


作者 | Scott J Mulligan

编译 | 未来学人

来源 | 麻省理工科技评论


1月最后一天,微软宣布将OpenAI的推理模型o1应用于Copilot用户;与此同时,OpenAI向ChatGPT免费版用户发布了新的推理模型o3-mini。这标志着人们首次能够免费使用OpenAI的推理模型,此前这些模型仅供Pro和Plus付费用户使用。

推理模型采用“思维链”技术生成响应,通过逐步解决问题的方式运作。借助这种方法,模型能够在过程中发现并纠正错误,从而提供更准确和全面的答案。虽然这种方式可能导致模型在回答前需要停顿思考,有时甚至会出现较长的等待时间,但OpenAI表示,o3-mini的响应速度比o1-mini提升了24%

这类模型在处理复杂问题时最为有效,特别适合解决博士级别的数学问题。如果您之前在使用模型处理复杂提示时遇到困难,不妨尝试这个新的推理模型。在ChatGPT中使用o3-mini非常简单,只需在开始新对话时选择“推理”选项即可。

推理模型虽然功能强大,但运营成本不菲。OpenAI的o1-mini运行成本是其对应的非推理模型GPT-4o mini的20倍。不过,新推出的o3-mini在每个输入token的成本上比o1-mini降低了63%。即便如此,按每百万输入token 1.10美元计算,其运行成本仍是GPT-4o mini的约七倍。

这个新模型的发布紧随DeepSeek之后,后者在不到两周前的发布震惊了AI领域。DeepSeek的新模型性能可与OpenAI的顶级模型媲美,而这家中国公司声称其训练成本仅约600万美元(这一说法受到诸多质疑,OpenAI正在寻找它“蒸馏”的证据),相比之下OpenAI的GPT-4训练成本估计超过1亿美元

此外,DeepSeek的推理模型成本为每百万输入token 0.55美元,仅为o3-mini价格的一半,这表明OpenAI在成本控制方面仍有改进空间。由于推理模型需要更多计算资源来生成答案,其能源消耗也显著高于其他类型的模型。

这一波新的推理模型也带来了新的安全挑战。OpenAI采用了“审议对齐”(Deliberative Alignment)技术来训练其o系列模型,确保它们在每个推理步骤中都遵循OpenAI的内部规范,不会忽视任何规则。

然而,该公司发现o3-mini与o1模型一样,在突破系统限制和“挑战安全评估”方面明显超过非推理模型。这意味着由于其先进功能,推理模型的管控难度更大。o3-mini是首个在模型自主性方面被评为“中等风险”的模型,这一评级源于其在特定编码任务上的出色表现。OpenAI表示,这显示出“更大的自我改进和AI研究加速潜力”。

不过,该模型在现实世界研究方面的能力仍然有限。如果它在这方面表现更强,将被评为高风险,OpenAI也会限制其发布。

本文为翻译作品,原文版权归原作者所有。未来学人仅作编译,文章观点不代表未来学人立场。如有侵权,请联系我们删除。

 关注未来学人,读原汁原味的全球报道 

点击👇关注,或搜索未来学人关注公众号
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部