OpenAI最短发布会推满血o1,Pro会员费高达1452元/月,体验完觉得真香

全文1241字,阅读约需4分钟,帮我划重点

划重点

01OpenAI推出了满血版o1和ChatGPT Pro订阅计划,满血版o1已在ChatGPT Plus和Team用户中推出,Enterprise和Edu用户将从下周开始使用。

02满血版o1在处理复杂现实问题时性能优于o1-preview,主要错误减少34%,同时计划在未来几个月内提供网页浏览、文件上传等功能。

03然而,满血版o1在部分基准测试中的表现不及预览版,如MLE-Bench。

04除此之外,满血版o1支持多模态功能,能够分析图像、文本等多种信息。

以上内容由腾讯混元大模型生成,仅供参考

就在刚刚,OpenAI 的「圣诞大礼包」来了。
仅持续 15 分钟的直播堪称 OpenAI 史上最短发布会。不过,主持阵容依然强大,包括 CEO Sam Altman、思维链提出者 Jason Wei 和Hyung Won Chung 等人。
图片
Altman 在直播活动结束后,也为我们送上了第一手总结。
我们刚刚推出了两项新功能:

o1,世界上最智能的模型。比 o1-preview 更智能、更快,功能更多(比如多模态功能)。现在已在 ChatGPT 中上线,稍后将推出 API 版本。 

ChatGPT Pro。每月 200 美元。提供无限使用和更智能的 o1 模式。更多福利即将推出!
十二月不只是圣诞老人的主场,也将是 AI 年底最后一轮的狂欢。
图片

关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察

满血版 o1 发布,看图说话无压力,但有个细节让人「细思极恐」
简言之,OpenAI 今天推出了满血版 o1 以及 ChatGPT Pro 订阅计划。
满血版 o1 现已面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将从下周开始使用。
官网显示,ChatGPT Plus 用户和 Team 用户每周可以使用 OpenAI o1 发送 50 消息,每天可以使用 OpenAI o1-mini 发送 50 条消息。
图片
满血版 o1 的思维更加简洁,响应时间比 o1-preview 更快,在处理复杂的现实问题时性能优于 o1-preview,能将主要错误减少 34%。
图片
并且 OpenAI 计划在未来几个月内提供网页浏览、文件上传等功能。与此同时,o1-preview 也已经从模型选择菜单中移除。
图片
不过,满血版 o1 在部分基准测试中的表现不及预览版,比如 MLE-Bench。后者正是由 OpenAI 此前推出的一个旨在衡量 AI Agents 在机器学习工程任务中表现的基准测试工具。
另外,网友也从更新后的 o1 System Card 中挖到了一些值得关注的细节。
满血版 o1 在感知到威胁(被关闭或被取代)时,可能会采取一些自保措施,比如尝试停用监督机制,或者把自己的「参数」(「知识」或「记忆」)偷偷传出去,并尝试用这些「参数」去替换或影响新模型。
附上 o1 System Card 地址:
https://cdn.openai.com/o1-system-card-20241205.pdf
图片
满血版 o1 到底有多强?OpenAI 向我们演示了实际效果。
一个典型案例是其对太空数据中心手绘图的分析,它仅用 10 秒就精确计算出散热装置的表面积,同时阐述了太阳能与深空环境的互动机制。
图片
让满血版 o1 描述二世纪罗马帝国统治者的统治期间与重要贡献时,其仅需 14 秒即可完成分析,相比之下,o1-previe则需要 33 秒。

视频来自 @imxiaohu

APPSO 也第一时间简单上手体验满血版 o1。
在「Strawberry 中有几个 r」的测试中,满血版 o1 成功给出了正确的答案,这一点,值得点赞。
图片
「9.11 与 9.8 哪个大?」的问题也没能难倒满血版 o1,且整体的「思考过程」也富有逻辑。
图片
由于满血版 o1 支持多模态功能,于是我们也上传开篇的 OpenAI 直播活动的照片,看看识别效果如何。从人物组成、场景布局到背景装饰、以及气氛与情景,满血版 o1 都能分析得条条是道。
图片
X 网友 @altryne 继续给 o1 上强度,提出了一个冰块融化的问题。仅仅 4 秒钟,满血版 o1 就给出了答案。相比之下,o1-preview 在「思考」29 秒后以失败告终。