OpenAI宣布o3降价80% 推出最强大模型o3-pro

AI划重点 · 全文约3651字,阅读需11分钟

1.OpenAI宣布对旗舰推理模型o3进行80%的大幅降价,输入和输出token的费用均下调。

2.同时,OpenAI推出其迄今最强大的AI模型o3-pro,取代原有的o1-pro模型。

3.o3-pro在主流AI基准测试中表现亮眼,如在数学能力的AIME 2024测试中超越谷歌顶级模型Gemini 2.5 Pro。

4.除此之外,o3-pro具备工具调用能力,可实现网络搜索、文件解析、视觉输入推理等功能。

5.然而,o3-pro的响应速度通常慢于o1-pro,且存在其他限制,如临时对话功能暂时禁用、不支持图像生成等。

以上内容由腾讯混元大模型生成,仅供参考

图片

当地时间6月10日消息,OpenAI宣布对旗舰推理模型o3进行大幅度降价,输入和输出token的费用均下调80%。同时,OpenAI宣布推出其迄今最强大的AI模型o3-pro。该模型是OpenAI今年4月发布的思维链模型o3的升级版。与传统AI模型不同,思维链模型通过逐步推理解答问题,使其在物理、数学和编程等领域表现更为可靠。

图片

从6月10日起,o3-pro将面向ChatGPT Pro和Team(团队版)用户开放,取代原有的o1-pro模型。OpenAI表示,Enterprise(企业版)和Edu(教育版)用户将在下周获得访问权限。o3-pro已于当地时间6月10日下午同步上线OpenAI开发者API平台。

o3-pro定价为每百万输入token收费20美元,每百万输出token收费80美元。输入token指注入模型的文本单元,输出token指模型基于输入生成的内容。百万输入token约等于75万单词,篇幅略超过《战争与和平》。

“在专家评估中,评审者一致认为o3-pro在所有测试类别中都优于o3版,尤其在科学、教育、编程、商业和写作辅助等关键领域表现突出,”OpenAI在更新日志中写道,“评审者还特别认可o3-pro在表述清晰度、内容全面性、指令遵循度和答案准确性方面的提升。”

OpenAI内部测试显示,o3-pro在主流AI基准测试中成绩亮眼:在评估数学能力的AIME 2024测试中,其表现超越谷歌顶级模型Gemini 2.5 Pro;在测试博士级科学知识的GPQA Diamond评估中,同样优于Anthropic最新发布的Claude 4 Opus模型。据OpenAI介绍,o3-pro具备工具调用能力,可实现网络搜索、文件解析、视觉输入推理、Python代码运行、基于记忆功能的个性化响应等。

不过该模型也存在缺点:响应速度通常慢于o1-pro。o3-pro还存在其他限制:因OpenAI正在解决“技术问题”,ChatGPT中的临时对话功能暂时禁用;不支持图像生成;亦无法兼容OpenAI的AI工作区功能Canvas。

奥特曼在X平台宣布‌降价

图片

在OpenAI官宣o3降价之前,该公司首席执行官山姆·奥特曼(Sam Altman)在X平台发帖确认了此次变更,强调新定价旨在鼓励更广泛的实验探索。同时,奥特曼也提到了o3-pro的发布事宜。他写道:“我们将o3的价格下调了80%!!很兴奋想看看大家现在能用它做些什么。相信你们也会对o3-pro的性能定价感到满意 :)”

OpenAI在今年4月推出o3模型。该模型在编程、数学、科学以及视觉理解等方面表现显著提升,大部分性能已略超过谷歌推理模型Gemini 2.5 Pro。尽管o3模型的API价格相对较高,但其性能和功能也更为强大‌。上市之初,o3模型的收费标准为每百万输入token 10美元,每百万输出token为40美元。

现在,使用o3模型的成本为每百万输入token 2美元,每百万输出token为8美元。如果用户输入的信息是“缓存”(即已存储且与之前提供的内容完全相同)的,则可额外享受每百万输入/输出0.5美元的折扣。

此次降价使得o3模型成为寻求高级推理能力的开发者们更易获取的选择,并使OpenAI在定价上与谷歌DeepMind的Gemini 2.5 Pro、Anthropic的Claude Opus 4以及DeepSeek的推理套件等竞品模型展开更直接的竞争。

开发者和早期采用者雷·费尔南多(Ray Fernando)在X的帖子中庆祝了这次降价,他写道:“LFG!”(意为“开干吧!” / “冲啊!”)。这种情绪反映了开发者们日益增长的热情,他们希望扩大项目规模,同时不被高昂的模型访问成本所阻碍。

与其他竞品推理模型的价格对比‌

此次价格调整正值模型提供商在性能和价格上展开更激烈竞争之际。与其他领先的推理模型进行比较,可以看出此举的重大意义:

--‌谷歌DeepMind开发的Gemini 2.5 Pro(预览版)‌根据提示大小不同,每百万输入token在1.25至2.50美元之间,每百万输出token在10至15美元之间。虽然它与谷歌搜索的集成提供了额外功能,但该服务本身也有成本——前1500次请求免费,之后每千次请求收费35美元。

--‌Anthropic主推的Claude Opus 4‌(被定位为针对复杂任务优化的模型)是该组中最昂贵的,每百万输入token为15 美元,每百万输入token为75美元。提示缓存读取和写入服务分别收费1.50美元和 18.75美元,不过用户可以通过批量处理解锁50%的折扣。

--‌DeepSeek的模型‌,特别是DeepSeek-Reasoner和DeepSeek-Chat,以极具侵略性的低价策略压低了市场同类产品的售价。每百万输入token的价格根据缓存情况和一天中的时段在0.07美元至0.55美元之间浮动,每百万输入token则在1.10美元至2.19美元之间。非高峰时段的折扣价更低,缓存输入最低可达0.035美元。

此外,独立的第三方AI模型比较和研究机构Artificial Analysis把o3纳入其各项任务的基准测试套件中运行。结果显示,使用o3完成所有测试的成本为390美元,使用Gemini 2.5 Pro的成本为971美元,使用Claude 4 Sonnet的成本为342美元。

为开发者缩小成本与智能之间的鸿沟‌

OpenAI的定价举措不仅缩小了与DeepSeek等超低成本模型的差距,还对Claude Opus和Gemini Pro等高价产品构成了降价压力。

与Claude或Gemini不同,OpenAI的o3还提供‌弹性模式(flex mode)‌用于同步处理,每百万输入token收费5美元,每百万输出token收费20美元。这为开发者根据工作负载类型更灵活地控制计算成本和延迟提供了选择。

通过大幅降低最先进推理模型的成本,OpenAI向生成式AI领域发出了一个更广泛的信号:‌顶级性能正迅速变得更加经济实惠,开发者如今拥有了越来越多可行且具备经济可扩展性的选择。‌

微软将不再是唯一合作伙伴

知情人士当日还透露,为满足快速增长的算力需求,OpenAI计划采用谷歌母公司Alphabet旗下的谷歌云服务。这一出人意料的合作标志着人工智能领域两大主要竞争对手关系的转变。

据悉,双方的合作谈判已持续数月,并于今年5月最终敲定。此举凸显了训练和部署先进人工智能模型所需的海量算力正深刻重塑行业竞争态势。这也是OpenAI寻求减少对主要支持者微软依赖的最新举措。此前,微软的Azure云服务曾是OpenAI数据中心基础设施的独家提供商。

消息人士称,谷歌云部门将为OpenAI现有的基础设施提供额外的算力,用于训练和运行其人工智能模型,这对谷歌云业务而言是一次胜利。与此同时,OpenAI的聊天机器人ChatGPT被视为谷歌搜索核心业务多年来面临的最大挑战。谷歌高管近期曾表示,人工智能领域的竞赛可能并非“赢家通吃”。截至目前,OpenAI、谷歌和微软均拒绝就此事置评。

自2022年底ChatGPT问世以来,OpenAI对算力的需求激增,这些算力既要用于训练大型语言模型,也需支撑模型运行推理,以满足用户使用需求。OpenAI在6月9日表示,截至目前,该公司年化营收已飙升至 100亿美元,在人工智能应用蓬勃发展的背景下,公司有望实现全年目标。

今年年初,OpenAI已采取多项措施拓展算力来源并降低对外部供应商的依赖,包括与软银和甲骨文合作推进价值5000亿美元的“星际之门”(Stargate)基础设施项目,并与CoreWeave签署了价值数十亿美元的算力协议。此外,今年2月有消息称,该公司计划今年完成其首款自研人工智能芯片的设计。与谷歌的合作是这一系列举措的最新延续。目前,OpenAI与微软也正在就修订数十亿美元投资的条款进行谈判,包括微软未来在OpenAI中的股权比例。

对谷歌而言,此项交易正值其扩大自研芯片—张量处理单元(TPU)—外部应用范围之际,这些芯片以往主要供谷歌内部使用。谷歌此前已利用其TPU技术赢得了包括科技巨头苹果以及Anthropic、Safe Superintelligence等客户。把OpenAI纳入客户名单,进一步体现了谷歌依托其从硬件(TPU)到软件的全栈人工智能技术,加速云业务的增长。

谷歌云2024年营收达430亿美元,占Alphabet总营收的12%。该部门已将自身定位为“算力资源的中立仲裁者”,旨在超越亚马逊和微软,成为众多算力需求巨大、运营成本高昂的人工智能初创公司的首选云服务提供商。

然而,此项合作也使谷歌面临复杂的平衡挑战。Alphabet预计今年与人工智能相关的资本支出将高达750亿美元,市场迫切期待看到这些投资的财务回报。与此同时,谷歌还需在竞争性人工智能服务和反垄断监管的压力下维持其利润水平。谷歌的DeepMind人工智能部门也在直接与OpenAI和Anthropic竞争,角逐尖端模型的开发和消费级应用的整合。

向OpenAI等外部客户提供算力,客观上会消耗谷歌自身的芯片供应,同时增强了其竞争对手的实力。这使得Alphabet首席执行官桑达尔・皮查伊(Sundar Pichai)在调配有限的算力资源时面临更大难题,他需要在谷歌的企业云服务部门与内部消费级人工智能研发需求之间做出权衡。谷歌首席财务官阿尼特・阿什克纳齐(Anat Ashkenazi)早在今年4月就曾向分析师表示,公司今年第一季度已难以满足所有云客户的需求。

尽管ChatGPT在用户规模上大幅领先于谷歌的同类产品,且分析师预测其可能侵蚀谷歌在搜索市场的主导份额,但皮查伊此前已对OpenAI将取代谷歌核心业务地位的担忧予以否认。(文/腾讯科技特约编译 无忌)