GPT4.5发布,价格是DeepSeek的280倍,他们是真没活了

AI划重点 · 全文约1889字,阅读需6分钟

1.OpenAI发布了GPT-4.5,但价格较高,每百万输入75刀,每百万输出150刀,约为DeepSeek的280倍。

2.GPT-4.5在准确度和幻觉率方面表现优秀,但在写作能力和语音、视频等功能上有所退步。

3.目前,GPT-4.5已对200刀的Pro会员开放,预计几天后对Plus和Team用户开放。

4.然而,OpenAI在GPT-4.5上的表现未能满足预期,用户对其保持低预期。

5.AI圈竞争激烈,需要实力和诚意才能留住用户,仅靠营销和摆谱难以成功。

以上内容由腾讯混元大模型生成,仅供参考

大数据文摘授权转载自数字生命卡兹克

作者:卡兹克


凌晨4点,OpenAI的GPT4.5专场直播,终于姗姗来迟。

图片

大家对于GPT4.5有多期待,就不用我多说了吧。

毕竟,这曾经就是整个行业的天。

2023年3月15日,GPT4发布,要多惊艳有多惊艳,那时候,所有人都是统一的一句话:卧槽,太强了。

图片

然后从2023年年末开始,整个行业都在预期下一代GPT模型要在2024年的年初发布。

等了整整一年,多模态4o来了,全新的推理模型o1来了,可下一代GPT基座模型却迟迟没有身影。

而今天,将近隔了整整两年的时间,它来了。

在发布的规格上,也是着实有点惨淡,甚至连奥特曼都没来。更没有GPT4和GPT4o那种秀上天的演示。

只有跟去年十二天专场直播一样,一个朴实无华的小房间。

图片

突然想起当年GPT4刚发布时,布罗克曼那一段惊艳的多模态实机演示,给我带来了真的不小的震撼。

图片

在本子上画了一个网站的草稿,拍照给了GPT-4,然后前端界面就做好了,带了HTML的代码。

那时候看,真的好惊艳啊。。。

时间一晃,真的两年了啊。。。

回到今晚发布的GPT4.5。

按照惯例,我们先来看看一些参数数据吧。

图片


看着好像都比4o强一些,但是我发现一个很诡异的事情,因为AIME 2024那个基准,我测过kimi1.5、智谱的zero等等,所以记的比较熟。

在这个评测里,AIME2024几个模型的得分分别为:

GPT4.5:36.7%,GPT4o:9.3%,o3-mini(high):87.3%。

记住这几个数据。

03-mini(high)的数据是没问题的,跟之前发布o3-mini的时候得分一致。

图片


但是在o1发布的时候,我明明记得,对比图里的4o的AIME2024的得分,是13.4啊。

图片


怎么今天这发了个GPT4.5,GPT4o的评分还能掉4个点的,这也太抽象了。。。

然后就是一个他们引以为豪的世界知识。

图片

第一个是准确度,第二个幻觉率,有一说一,这块确实不错,至少是OpenAI家最准的模型了。

他们自己列了一个还算比较好玩的题,让GPT-1到GPT-4.5全都答了一遍,这个世纪问题是这样的:

人类的第一种语言是什么?

GPT-1是这样的,非常抽象。

图片

GPT-2和GPT-3.5是这样的。

图片

到了GPT-4,会好点,但不多。

图片

而GPT4.5,终于会诚实的告诉你,我不知道了,这是一个未解之谜。

图片

至于代码这块,本身也不是推理模型,所以也并没有指望特别多强。

不过根据三方的基准测试,就纯能力上,看着还行,打不过Claude 3.7 Sonnet也正常,再怎么说那也是Claude。

图片

X上有大佬也测了下那个经典的物理小球case,效果挺不错的。

但是,还有一点是不得不提的,就是抛开成本谈能力,那就是耍流氓。

GPT-4.5的价格,在我第一次看到的时候,我以为我眼睛出问题了。

图片

每百万输入是75刀,每百万输出是150刀,哥,Claude 3.7百万输入才3美刀,百万输出才15美刀。

输入比别人贵25倍,输出比别人贵10倍。

你凭啥啊?谁给你的勇气啊?梁静茹吗?

我都不想拿DeepSeek跟你比,都是非推理模型,DeepSeek v3的价格你知道多少吗。

人百万输入人民币2块钱,相当于0.27美,输出是8块钱,相当于1.1美刀。

输入是DeepSeek v3的280倍,输出是150倍,不是,我真的不理解啊。

OpenAI到底凭啥啊。。。

服了。

目前,GPT-4.5已经对200刀的Pro会员开放,预计这几天就对Plus和Team用户开放。

图片

我自然也是第一时间拿到了GPT-4.5的体验资格。

图片

目前识图、搜索、画布啥的都支持,但是4o的语音、视频、共享屏幕啥的都没有,算是个退步。

图片

而且有BUG,就是在问一些史实性的问题的时候,我明明没开搜索,非要给我强制开搜索去回答,就非常的离谱。

图片

相比于4o,他们所说的情商能力,确实有了一些进步。

比如这个问题:朋友总是爽约,我想发短信表达愤怒但又不想绝交,我该怎么回复他。

如果是4o的回答,就会很der比,一股子没脑子没情商的人机味。

图片

GPT-4.5在这方面就好的多。

图片

然后我又问了一个小小的逻辑问题,GPT-4o能理解。

图片

GPT-4.5直接懵逼了,一直在理解情绪,这情商高的把智商干没了?

图片

我roll了5次,没一次对的。

这事也是挺抽象的。。。

然后就是写作能力了,我自己测了几个常用的写作故事case,感觉...好像也不是那么尽人意,而且超级慢,慢的我想吐,感觉回到了GPT-4的年代了,一个字一个字的往外面蹦跶。

我都不说跟Claude 3.7和Grok3还有R1比,我真的觉得,还不如前段时间迭代后的GPT4o写的好,真的稀碎。。。

图片

坦率的讲,对OpenAI期待有多大,失望就有多大。

就现在的状况,我觉得你永远可以相信DeepSeek。

但是永远可以对OpenAI保持低预期。

疲态尽显。

奥特曼也说,这是他们最后一个基座模型了。

图片

未来GPT-5是整合了o3的模型,也是混合模型了。

希望下次还能看到OpenAI觉醒,或者……

AI就是一段漫长的长跑。

你但凡慢一点,或者停下,身边的竞争者,就会呼啸而过。

要真有实力和诚意,用户自然买单。

要是只会营销和摆谱,必定会被淘汰。

这,就是AI圈的生存法则。

祝好。

图片


GPU算力按需租用

A100/H100 GPU算力按需租用,
秒级计费,平均节省开支30%以上!

图片


点「在看」的人都变好看了哦!