新智元报道
编辑:桃子
【新智元导读】完整版o1图像理解能力,被提前「放出」了?网友曝出o1能够识图,进行推理总结。现在,o1多模态一大波试用已经铺屏全网。
o1图像理解,可用了?!
一大早,网友们纷纷晒出,自己获得了o1图像理解新功能。一大波测试,简直惊掉下巴。
小编测试了下,确实可用。仅需在模型选项中,选择ChatGPT 4o mini(非绝对),上传图片就可以了。
还有人解释了下原理,这一功能没有定向模型,有时还会切换。
几天前,OpenAI伦敦开发者日上,首次揭秘了未来完整版o1的五大能力,其中就包括:
函数调用、开发者message、流式传输、结构化输出、图像理解。
据称,这并非官方发布,可能是OpenAI底层微服务崩溃了,还没来得及修补。因为它本来打算作为内部私有服务使用。
先不管啥原因,直接用就完了。
现在,一大波o1图像理解测试,已经全网刷屏了。
o1最强图像理解,「解禁」了
自称是获得o1图像理解第一人,分享的一张聊天截图,让模型去分析。
o1解释道,「图片是聊天对话的截图,可以看到名为Bing的Al发送的两条信息」。
经过一番测试,他认为这就是完整版o1。
大咖歸藏(guizang.ai)用高中奥数测试一番,发现o1竟然答对了。
另一个有趣的案例。
一位网友表示,o1图像理解的推理速度,简直让人难以置信。
比如,分析一张海底光纤通信电缆地图,它通过多步思考准确给出,这些电缆横跨大洋,连接着世界上不同的大陆和地区。
不过遗憾的是,它还没有完全做好超越图像,实现全多模态理解的准备。
比如,网友上传了一个mp4视频,o1还无法读取。
还有网友直接给o1上了推理图形题,经过48秒的思考,最终给出了解答。
描述图片是什么,o1给出了一个完美解释。
再让它分析一张南瓜灯的图片,也准确答出了。
在另外一些简单视觉难题上,o1还是有困难。
推理新工具
除了图像理解能力,o1还新增了一个「Reasoning」新工具。
网友发现,在4o+canvas在,点击/就可以唤醒工具栏菜单,其中就包含了这个推理新工具。
不过需要注意的是,这个工具使用要通过以下的步骤:
- 在4o+canvas中附加文档
- 不要通过下拉菜单切换到o1-preview,否则会清除文件
- 输入/reson
- 按回车键
o2在研究生级别基准取得105%分?
更具玩味的是,Sam Altman还出来恶搞。
他发文表示,我听说,o2已经在GPQA上取得105%的成绩。(注意是小写字母)
紧接着,事情又来了反转,他表示算错了。要说这波营销,还的是奥特曼本尊。
评论区的网友纷纷追问道,o2什么时候放出?还有的人认为,OpenAI的更新实在是太慢了,早已急不可待。
不过,近日OpenAI的战略营销主管在采访中介绍了,OpenAI的步伐和品发布时间表正在加快。
这么看来,相较于以前,确实加速了不少。