o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%

全文1024字,阅读约需3分钟,帮我划重点

划重点

01网友们发现OpenAI的o1模型具有图像理解能力,可在模型选项中选择ChatGPT 4o mini上传图片进行测试。

02o1图像理解的推理速度令人惊讶,如分析海底光纤通信电缆地图,准确给出电缆横跨大洋连接不同大陆和地区的信息。

03除此之外,o1还新增了一个名为"Reasoning"的新工具,可在4o+canvas中点击/唤醒。

04OpenAI伦敦开发者日上首次揭秘了未来完整版o1的五大能力,包括函数调用、开发者message、流式传输、结构化输出和图像理解。

05然而,OpenAI战略营销主管表示,OpenAI的步伐和品发布时间表正在加快。

以上内容由腾讯混元大模型生成,仅供参考

图片  新智元报道  

编辑:桃子

【新智元导读】完整版o1图像理解能力,被提前「放出」了?网友曝出o1能够识图,进行推理总结。现在,o1多模态一大波试用已经铺屏全网。

o1图像理解,可用了?!

图片

一大早,网友们纷纷晒出,自己获得了o1图像理解新功能。一大波测试,简直惊掉下巴。

图片
图片

小编测试了下,确实可用。仅需在模型选项中,选择ChatGPT 4o mini(非绝对),上传图片就可以了。

图片

还有人解释了下原理,这一功能没有定向模型,有时还会切换。

图片

几天前,OpenAI伦敦开发者日上,首次揭秘了未来完整版o1的五大能力,其中就包括:

函数调用、开发者message、流式传输、结构化输出、图像理解。

图片

据称,这并非官方发布,可能是OpenAI底层微服务崩溃了,还没来得及修补。因为它本来打算作为内部私有服务使用。

图片

先不管啥原因,直接用就完了。

现在,一大波o1图像理解测试,已经全网刷屏了。

图片

o1最强图像理解,「解禁」了


自称是获得o1图像理解第一人,分享的一张聊天截图,让模型去分析。

o1解释道,「图片是聊天对话的截图,可以看到名为Bing的Al发送的两条信息」。

图片

经过一番测试,他认为这就是完整版o1。

图片

大咖歸藏(guizang.ai)用高中奥数测试一番,发现o1竟然答对了。

图片
图片

另一个有趣的案例。

图片

一位网友表示,o1图像理解的推理速度,简直让人难以置信。

比如,分析一张海底光纤通信电缆地图,它通过多步思考准确给出,这些电缆横跨大洋,连接着世界上不同的大陆和地区。

图片

不过遗憾的是,它还没有完全做好超越图像,实现全多模态理解的准备。

比如,网友上传了一个mp4视频,o1还无法读取。

图片

还有网友直接给o1上了推理图形题,经过48秒的思考,最终给出了解答。

图片

描述图片是什么,o1给出了一个完美解释。

图片

再让它分析一张南瓜灯的图片,也准确答出了。

图片

在另外一些简单视觉难题上,o1还是有困难。

图片
图片

推理新工具


除了图像理解能力,o1还新增了一个「Reasoning」新工具。

网友发现,在4o+canvas在,点击/就可以唤醒工具栏菜单,其中就包含了这个推理新工具。

图片
图片

不过需要注意的是,这个工具使用要通过以下的步骤:

图片

- 在4o+canvas中附加文档

- 不要通过下拉菜单切换到o1-preview,否则会清除文件

- 输入/reson

- 按回车键

o2在研究生级别基准取得105%分?


更具玩味的是,Sam Altman还出来恶搞。

他发文表示,我听说,o2已经在GPQA上取得105%的成绩。(注意是小写字母)

图片

紧接着,事情又来了反转,他表示算错了。要说这波营销,还的是奥特曼本尊。

图片

评论区的网友纷纷追问道,o2什么时候放出?还有的人认为,OpenAI的更新实在是太慢了,早已急不可待。

图片
图片

不过,近日OpenAI的战略营销主管在采访中介绍了,OpenAI的步伐和品发布时间表正在加快。

这么看来,相较于以前,确实加速了不少。

图片