一上线就翻车,OpenAI到底咋了

全文2027字,阅读约需6分钟,帮我划重点

划重点

01OpenAI发布了基于GPT-4o模型的一个微调版本,提供了AI搜索功能。

02然而,用户反馈称OpenAI的AI搜索功能表现不佳,存在幻觉和引用问题。

03与此同时,OpenAI还更新了一个Chrome插件,可直接在浏览器URL栏中搜索。

04与免费选手Kimi和Perplexity相比,ChatGPT在直观和方便上表现尚可,但在准确性和深度方面仍有不足。

05尽管如此,OpenAI在音乐、图像和3D模型生成等领域也有新动作,但尚未公开发布。

以上内容由腾讯混元大模型生成,仅供参考

OpenAI 的故事告诉我们,不要内斗,不要打架。

2024 年都快结束了, OpenAI 的 AI 搜索终于在昨晚姗姗来迟。

背后是基于 GPT-4o 模型的一个微调版本。现在充值用户,还有部分内测到的免费用户,已经可以抢先用上了。

隔壁江江这波被内测到了,大家现在也可以点开看看,自己piao到了没。有搜索功能的账号的输入框前面,会多出一个圆球的 Search 标志。

图片

这玩意一上线,奥特曼这边乐观得不行:

铁子们,俺最喜欢的功能闪亮登场了,过去几周我天天用。

图片

尽管他很兴奋,但大家好像这次不太买这个 AI 巨头的账了。

汽车撞墙你知道拐了,大鼻涕流嘴里你想起来甩了。别人 AI 搜索都迭代 800 回,你 OpenAI 知道要来劲了。

而且,这回急了忙慌上线,很多人猜是又是为了压谷歌的热度。

因为几乎前后脚,隔壁谷歌给 Gemini API 新增了一个 “ 搜索锚定 ” 的功能。大致能力就是减少幻觉,获取消息更及时,然后回答更有深度。

图片

但它更新了啥不重要,重要的是 OpenAI 一搅局,已经没人关心谷歌到底干了啥。

与此同时, OpenAI 还偷偷更新了一个 Chrome 插件。安装之后,咱们在浏览器的 URL 栏里问问题,就会直接跳转到 ChatGPT 里搜索了。

撬流量撬到人家里来了。谷歌:你礼貌吗?

图片

不过,世超观察了一下大家反应,意外地发现,很多人上手后的第一感觉,却是 OpenAI 这玩意蠢得让人发笑

在网上随便翻一翻,就能找到各种它被免费的 AI 搜索工具吊打的吐槽。。。

图片

那么财力雄厚,坐拥各家 AI 网站会员的世超,就带大家看看 OpenAI 的乐子,啊不是,水平。我还顺便找了 kimi 和 perplexity 两个免费选手,跟它简单比划一下。

这回 OpenAI 官方说自己能搜天气、新闻还有股价这些。

我就试着搜了一下杭州天气,结果 ChatGPT 显示得确实挺精准的。而且,做了小组件,小表格一拉,看起来比隔壁 kimi 直观得多。

左:ChatGPT 右:Kimi

图片

在直观和方便上,ChatGPT 做的还可以。

和 Kimi 一样, ChatGPT 也会把句子的相关来源标注出来,并以侧边栏的形式,显示在右侧。鼠标移动到引用的位置,还会自动弹出出来源的方框。

图片

看到这,你可能觉得那 OpenAI 这玩意不错啊,那大伙骂什么呢?

别急,咱们继续。

世超我接着问它了一些有点时效性的问题:果子这周发了什么产品。

这回 ChatGPT 没一个讲的是对的,给我的每个产品都是去年发布的。哪怕去果子官网随手抓一把,都不至于全错吧。

图片

点开它给的原文链接,文章标题下面大大地写着 “ 2023 年 10 月 30 日。 ”

图片

而之所以它会错误的抓取,世超猜了一下,估计是因为页面底下有最新消息的相关推荐,导致 AI 错误抓取了。

图片

但这件事其实没那么难解决,像 Kimi 这边答得就挺精准的,最新的 iMac 和 Mac mini 都提到了。

虽然也有小瑕疵,它给出第二个结果 iPad Pro 是今年 5 月份发布的。但在 OpenAI 的衬托下,显得格外机灵,格外聪明。

图片

抓取时间不准还算好的,有些时候,它的回答和关联的网站是错位的。

让它找点科技新闻看看,但点进给出的原文链接,发现给的链接里根本没有它引用的信息。。。

图片

问到一些比较抽象问题,比如:中国现在万圣节活动和国外有啥不一样

Kimi 能精准报出本不该和万圣节这三个字联系在一起的名字,比如安陵容,观音菩萨。ChatGPT 给的答案,就完全没 get 到我的用意。

左:ChatGPT 右:Kimi

图片

当然了, ChatGPT 并不是没有赢过。比如中国万圣节这个问题,后面我又问了一遍, ChatGPT 就可以给出正确的答案。

而且有时候,它的抓取比 Kimi 精准。像:差评君有哪些有意思的梗。

ChatGPT 就能说出 925 ( 虽然解释错了 )、 Debug the world,还报出了世超的大名,但 Kimi 则就说对了个 slogan 。

左:ChatGPT 右:Kimi

图片

而且,反复测试中,世超发现 ChaGPT 英文搜索结果会比中文搜索更全面一点。但跟免费 AI 搜索鼻祖 Perplexity 对比的时候,还是会觉得差点意思。

比如同样问一个冷门的概念 “ 业余无线电 ” ,对于定义的解释上, Perplexity 形容它是 “ 一项爱好和志愿公共服务,个人用专门的非商业用途的无线电进行交流。 ”

但是, ChatGPT 却只说这是一种把人、电子设备还有通信结合在一起的流行爱好和服务。也没错,但就是解释的不够好理解。

左:ChatGPT 右:Perplexity

图片

几轮测试看下来, ChatGPT 虽然偶尔会出现幻觉和引用问题,但基本上能算一个合格的 AI 搜索工具。

它只是比较无聊。

如果再早几个月发,可能还有点嚼头。现在掏出来,实在食之无味了。更别说有些人放出的什么 “ 杀死谷歌 ” 的屁话。

如果非要说有啥有意思的,不如看看奥特曼这次随机抖落的其他消息。

比如 OpenAI 今年估计又要发新版本模型了,而且也不叫 GPT-5 。

这题我已经会抢答了,赌 5 毛叫 GPT-4 abcd 之类的。

图片

除此之外呢,高管们也在网上跟小报记者一样,四处公布新动向。

目前收集到的消息来看, OpenAI 一边宫斗的同时,一边在捣鼓它的音乐、图像和 3D 模型生成模型,而且估计很快就能见到。

但到底啥时候愿意发,具体没说。

估计得等谷歌放点东西出来,它才会火急火燎地跑出来截胡( 不是 )

不过,说实话吧,这几个领域就和这次的 AI 搜索一样,现在公开可用到的模型和应用都在疯狂迭代了。说视频生成,几个人还会提到 Sora 的名号呢。

这次的 AI 搜索,也是平平无奇到我都差点水写不出一整篇的量来。

在如此这般的情况下, OpenAI 要不端点狠活出来,大家以后就真不关心你了。

图片

图片