OpenAI 12天发布会 Day3: Sora 深夜炸场,生成,创作,导演统统拿下

图片


OpenAI 12天发布会 Day3 ,Sora正式上线了,深夜炸场,这次终于不再鸽了

Sam Altman 认为sora目前还处于早期阶段——可以将其视为“视频领域的 GPT-1”——但他已经觉得它的内容流非常吸引人了,虽然目前的版本并不完美,但我们期待用户创造出令人惊叹的作品。”

图片

我给大家划划重点,分享一些Day3的细节

创意与推动AGI

Sora 是 OpenAI 为视频创作从零打造的产品,其核心目标包括:

  1. 1. 赋能创意:Sam Altman 表示,OpenAI 一直致力于为创意人士开发工具,而 Sora 的推出标志着 AI 在人类共创领域迈出了一大步


  2. 2. 超越文本限制:视频作为一种重要的交互媒介,可以让 AI 系统更深入地理解世界并呈现动态内容。通过 Sora,OpenAI 希望改变计算机与人类互动的方式


  3. 3. 推动 AGI 发展:视频生成和理解是通用人工智能(AGI)蓝图的重要组成部分,Sora 提供了 AI 学习和应用复杂场景的全新环境

Sora正式版功能亮点

Sora全新UI长这样

图片
图片

Sora 提供了一系列功能丰富的创作工具,包括但不限于:

文本生成视频:用户只需输入简单的文本描述,即可生成动态视频,例如韩国小姐姐吃面,Sora 能生成一段符合描述的短视频

图片

图像扩展:通过上传图片或已有视频,用户可以延展场景、添加动作

时间线编辑(Storyboard):用户可以像导演一样,通过时间线规划多个场景,定义角色动作和场景细节,并实时预览生成的效果

图片
图片

风格和场景重塑(Remix & Loop):Remix 功能支持对已有视频进行内容或风格的重塑,而 Loop 功能则能无缝衔接视频开头和结尾,创建完美循环

图片
图片

高分辨率与多变长视频:支持从 480p 到 1080p 的分辨率,视频时长可在 5 到 20 秒之间自由设定,满足各种创作需求

图片

此外,Sora 还包括一项称为“Blend”的高级功能,可以将两个视频融合成一个全新的场景,为创意提供更多可能性

图片

视频简介

订阅与适用范围

Sora 对拥有 OpenAI Plus 和 Pro 账户的用开放:

Plus 用户:每月可生成 50 个视频

Pro 用户:每月享有 500 次快速生成(或更少次高分辨率生成),以及无限次慢速生成。

目前,Sora 已在美国及多数国家上线,但暂未对欧洲及英国地区开放,团队正在努力解决相关限制问题。访问:sora.com

开发背后的努力

Sora 的研发是 OpenAI 的一项长期投入。自今年二月推出初版模型以来,研究团队对其进行了大规模优化,最终推出了性能更强、速度更快的升级版本——Sora Turbo。这款模型具备生成视频、图像动画、视频样式转换及时间延展等多种能力

产品团队仅由5 至 6 名 工程师组成,但在数月内完成了从模型到产品的开发工作,展示了惊人的执行力。此外,OpenAI 在内容安全与滥用防范方面也投入了大量资源,采取了较为保守的初期策略,以平衡创造自由与内容安全

Sora限制:

目前部署的 Sora 版本存在许多局限性。它常常生成不符合现实的物理效果,并且在处理长时间的复杂动作时会遇到困难。尽管 Sora Turbo 的速度比今年二月的预览版快了许多,OpenAI仍在努力让这项技术对所有人都更加经济实惠

OpenAI选择在现在推出视频生成技术,是为了让社会有时间探索其可能性,并共同制定规范和安全措施,确保这一领域在未来发展的过程中能得到负责任的使用。
所有由 Sora 生成的视频都附带 C2PA 元数据,以标识视频来自 Sora,提供透明性并验证来源。虽然这些措施并不完美,但已经添加了默认的可见水印等保护措施,并开发了一款内部搜索工具,利用生成内容的技术属性来帮助验证视频是否来自 Sora

个人感觉就吃面视频来说Sora不如Kling,哈哈哈


⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~