1.OpenAI正式推出GPT-4.1系列,以大幅降价和性能升级挑战竞争对手Anthropic、Google和xAI等。
2.GPT-4.1基础版输入每百万标记仅需2美元,输出8美元,mini和nano版本价格更低至0.40美元和0.10美元。
3.与此同时,OpenAI提供高达75%的缓存折扣,鼓励开发者优化提示重用。
4.GPT-4.1在SWE-bench编码基准测试中胜率达到54.6%,上下文窗口扩展能力达到100万标记。
5.OpenAI将逐步淘汰最昂贵的GPT-4.5模型,开发者需在7月14日前完成迁移至更具性价比的GPT-4.1。
以上内容由腾讯混元大模型生成,仅供参考
本文共1601字
自从OpenAI完成史上最高一轮融资以来,关于OpenAI下一代大模型即将发布的传闻不断。
如今,靴子终于落地。OpenAI这次没有让大家等太久,正式推出了备受期待的GPT-4.1系列。
4月14日,OpenAI正式推出GPT-4.1模型系列,以大幅降价和性能升级向Anthropic、Google和xAI等竞争对手发起全面挑战。这一动作不仅重新定义了生成式AI的性价比,更可能重塑整个行业的竞争格局。
价格下调75%,GPT-4.1直击竞争对手命门
GPT-4.1的定价策略堪称一场“价格革命”。基础版输入每百万标记仅需2美元,输出8美元;而mini和nano版本更是将价格压低至0.40美元和0.10美元,几乎以“白菜价”吸引开发者和企业。
此外,OpenAI还提供了高达75%的缓存折扣,鼓励开发者优化提示重用,尤其在迭代编码和对话代理中表现突出。
相比之下,竞争对手的定价显得昂贵得多。Anthropic的Claude 3.7 Sonnet输入成本高达3美元,Gemini 2.5 Pro在超过200k标记时输入成本翻倍至2.5美元,而xAI的Grok-3输入成本也达到3美元。
GPT-4.1的价格优势直接削弱了这些模型的市场竞争力,尤其对预算有限的初创企业和小型团队来说,这种性价比几乎无法拒绝。
性能升级:编码能力与上下文窗口的双重突破
GPT-4.1不仅在价格上占据优势,其性能提升同样令人瞩目。
在SWE-bench编码基准测试中,GPT-4.1的胜率达到了54.6%,相比前代GPT-4o有了显著提升。
实际测试中,GPT-4.1在54.9%的情况下击败了Anthropic的Claude 3.7 Sonnet,主要得益于更少的误报和更精确的代码建议。
更令人惊讶的是其上下文窗口的扩展能力。GPT-4.1能够处理高达100万标记的内容,相当于一次性处理约75万字——这比《战争与和平》的篇幅还要长。
这种能力使其在处理复杂文档和长视频内容时表现尤为出色。在Video-MME测试中,GPT-4.1在“长视频、无字幕”类别中达到了72%的准确率,展现了其多模态能力的进一步提升。
竞争对手的困境:营销与实际能力的落差
在GPT-4.1的冲击下,竞争对手的压力显而易见。
Anthropic的Claude系列虽然在功率和成本之间找到了平衡,但GPT-4.1的定价优势让其市场地位岌岌可危。
Google的Gemini则因复杂的分层定价结构和缺乏自动计费关闭功能,被开发者批评为“财务噩梦”。尤其是Gemini 2.5 Pro,其对长输入和输出的额外收费可能导致成本迅速失控。
xAI的Grok系列则因营销与实际能力的落差而备受质疑。尽管埃隆·马斯克宣称Grok 3能够处理100万标记,但实际API仅支持131k标记,这一差距引发了用户的广泛批评。
对于开发者而言,这种不透明性无疑削弱了Grok的吸引力。
GPT-4.5将被淘汰,GPT-4.1接棒未来
与此同时,OpenAI宣布将逐步淘汰其最昂贵的GPT-4.5模型。
这款模型因高昂的运行成本(输入每百万标记75美元,输出150美元)而备受争议。OpenAI表示,GPT-4.1在关键领域的表现与GPT-4.5相当甚至更优,且成本大幅降低。
开发者需在7月14日前完成迁移,转向更具性价比的GPT-4.1。值得注意的是,GPT-4.5并不会从ChatGPT中消失,它仍以研究预览的形式向付费用户开放。
OpenAI的这一策略显然是为了集中资源开发下一代模型,同时为GPT-4.1的推广铺平道路。
推理模型:AI从工具到创新引擎
GPT-4.1的发布只是OpenAI战略布局的一部分。
更令人兴奋的是其即将推出的推理模型,这些模型能够跨领域整合知识,提出创新想法。
测试显示,这些模型可以设计科学实验、提出新材料或药物的解决方案,甚至帮助科学家评估环境影响。
例如,阿贡国家实验室的分子生物学家Sarah Owens利用推理模型设计了一项研究,探索生态统计技术在病原体检测中的应用。她表示,这一过程如果依赖传统方法可能需要数天时间,而AI仅需几分钟便完成了设计。
同样,化学家Massimiliano Delferro利用推理模型设计了塑料废物回收实验,大幅缩短了研究周期。
OpenAI总裁Greg Brockman指出,推理模型的潜力在于将科学家的效率提升10倍甚至100倍。
这些模型不仅能够提出假设,还能通过访问模拟器或机器人代理加速验证过程。例如,在激光能量输出的建议中,推理模型可以快速生成参数,而科学家只需通过模拟器验证其可行性。
AI的未来
随着GPT-4.1的发布和推理模型的崛起,人工智能正在从工具向创新引擎转变。
价格战的展开让开发者和企业迎来了更低成本和更高效率的时代,而推理能力的提升则为科学、工程和商业领域带来了前所未有的机遇。
OpenAI的这一系列动作不仅重新定义了AI模型的性价比,更为行业的未来发展指明了方向。
在这场竞争中,谁能在价格、性能和创新能力之间找到最佳平衡,谁就将引领下一个AI时代的浪潮。
- 热门视频 -