👦🏻 作者: 一涛
🥷 编辑: Koji
🧑🎨 排版: NCon
这两年 AI 的能力越来越强了,甚至有点溢出的感觉。
图片、视频、音乐、代码,每个方向上都有好几个工具在卷。单点能力上,它们已经能很好地满足大多数需求了。
但如果你想交付一个完整的作品,比如从零开始做一部动画短片,你会发现自己还是在不同工具之间不停地跳转,没完没了地复制粘贴:用这个工具写剧本、用那个工具出图、再去另一个生成视频。
相比于 AI 的单点生成能力,这种碎片化的工作流才是更大的问题。
下一代创作软件比的不是模型能力,而是谁能把完整的创作流程跑通。 能让 Agent 从接到目标开始,一路协作推进到交付成品的系统,才是真正的竞争力。
OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」,面向创作工作的 Agent 操作系统。
如果要用一个更直觉的说法来理解它,OmniWork 就像是一个「知乎专家团队(全干版)」:你可以把完整的创作目标交给它、由多个 AI 专家协同推进到交付的系统。
我们用 OmniWork 跑了 3 个任务,跟大家分享一下实际体验。
进入 OmniWork,第一感觉是轻。整个产品在浏览器里直接运行,不需要本地部署任何东西,打开网页就能用。
左边栏是四个核心入口:New Task(新建任务)、Autowork(自动化任务)、Experts Market(专家市场)、Skills(技能库)。
打开 Experts Market,你看到的是一排排「专家」,Film Production Director、Music Producer、Game Art Director、Visual Design Director
每个 Expert 都有明确的职能定位和一组挂载的 Skills。
这跟通用工具是完全不同的思路。每个 Expert 更像是一个有明确岗位职责的专业角色。它只干它擅长的事,但在那个方向上比通用模型深得多。
我们做的第一件事是一个跟工作直接相关的任务。因为最近在关注 AI 短剧和漫剧赛道,所以想快速摸清过去一周各平台上什么内容最火、创作者在用什么工具、讨论热度集中在哪些话题。
把需求丢给了 Trending Content Monitor:
它调用了 youtube-tiktok-trend-analysis、x-reddit-trend-analysis 和 web-search 三个 Skill。
大概几分钟之后,OmniWork 就交付了一份完整的可视化报告。
内容层面,最有价值的是两个维度。
一是工具分布,这种结构化的信息整理确实比自己零散刷信息流更高效。
二是新创作者的发现。报告里提到的几个账号我们之前没关注过,顺着线索去看确实找到了一些有意思的内容。
当然,报告里的具体播放量数据没法逐条核实,这类 AI 生成的调研报告目前还是适合当作方向性参考,而不是可以直接引用的数据源。但作为一份两分钟内交付的行业速览,这个信息密度已经够用了。自己做同样的调研,少说要花半天。
OmniWork 的 Autowork 功能可以把这类调研任务设成定时执行。设好频率和交付格式,它会在后台自动跑,定期把结果推给你。相当于雇了一个 7×24 在线的行业情报员。
盯完赛道趋势之后,我们想试一个更重的任务——用 OmniWork 从零做一部动画短片。
这次找的是 Film Production Director。点开这个 Expert 的详情页,它挂载了 16 个 Skills,覆盖从角色设计到分镜到视频生成到后期合成的完整链路:影视工作流程、编剧、分镜画师、三视图合成师、视频生成、视频后期剪辑师……
首先给一句指令:
然后它自己跑起来了。整个制作流水线分四个阶段:
Phase 1:角色三视图生成。 基于给的原画,生成了穿山甲的正面、侧面、背面三视图,用于后续视频生成时保持角色一致性。
Phase 2:分镜脚本创作。 自动构建了一个五幕叙事结构(独行、困境、转机、筑巢、归宿),写了完整的分镜脚本。
Phase 3:五段视频逐段生成。 它使用首尾帧链接技术,每一段的末帧都作为下一段的起始参考帧,保持了段落之间的画面连贯性。
Phase 4:最终合成。 五段视频加上片名字卡,合成为一部完整短片。
最终交付的《穿山甲归途》全长 68 秒,1080p 画质,吉卜力风格的治愈画风。 片头有字卡,片尾有收束,全片配了背景音乐。
画面层面,穿山甲的形象在五个场景中保持了角色一致性,没有出现常见的 AI 视频「变脸」问题。
清晨森林里的光影是柔和的暖色调,暴雨场景切到冷灰色,雨后转机的画面又回到暖调,情绪节奏跟色调变化是配合的。
叙事层面,五幕结构是一个完整的故事弧线,起承转合都有,不是五段随机画面拼在一起。最后月光下穿山甲蜷缩入睡那个镜头,配合音乐的渐弱收束,作为短片结尾是成立的。
也有一些可以感知到的 AI 痕迹。 穿山甲的肢体动作在某些帧里有轻微的「漂移感」,不够扎实;五段视频之间的场景切换虽然用了帧链接,仔细看还是能察觉到风格的微妙跳跃。
不过考虑到整个制作过程是「一句话指令、零人工干预、一个半小时出片」,这个完成度已经远超预期。
而且全程只跟 Film Production Director 一个专家交互,就实现了一套完整的动画制作流水线。从开始到输出完整视频,都是系统自主完成决策,无需人工辅助。
有一个细节我们觉得很有意思。 任务完成后,系统弹出一个提示:「Omni wants to turn this task into a skill」,问要不要把这次穿山甲动画短片的完整制作流程沉淀为一个可复用的 Skill。
点了 Sounds good 之后,下次再做类似的动画短片,系统可以直接调用这个 Skill,不用重新摸索流程,个人的知识资产就这么沉淀下来了。
做完动画短片,我们顺手给穿山甲加了一个「番外篇」,用 OmniWork 做一个横版跑酷小游戏,让穿山甲延续短片里的归途故事,一路躲避毒蛇、蝎子、猎人陷阱,最终回到家。
这次的任务跟 Case 2 有一个本质区别:做动画短片只需要一个 Expert(导演),但做游戏则需要多个 Expert 协作。
我们在 Experts Market 里「聘请」了一个专业游戏团队:
•Game Design Director:负责玩法设计、关卡节奏、GDD 编写
•Game Art Director:负责角色立绘、Spritesheet 资产和场景美术
•Game Dev Director:负责 HTML5 代码实现
•Game Test Director:负责 QA 验证
Prompt 词:
这次能明显看到多个 Expert 在接力工作。
•Game-Design-Director 和 Game-Art-Director 并行启动,一个写 GDD 游戏设计文档,一个产出 15 套 8-bit 像素风格美术资产;
•两边交付后 Game-Dev-Director 接手,用 Phaser 3 引擎把设计和素材整合成可运行的 HTML5 游戏;
•最后 Game-Test-Director 做 QA 验收,找到两个 Bug 并直接修复。
最终交付的是一个完整可玩的跑酷游戏。穿山甲在森林中自动奔跑,有明显的纵深感。左上角三颗红心显示生命值,右上角实时计分。前方地面上蹲着蝎子,需要跳跃躲避。最后一关跑到洞穴门口即可通关,跟短片结尾呼应。
美术精度跟专业独立游戏当然有差距,毕竟一个精美的游戏就是需要投入大量的人力完成的。但 OmniWork 在半小时内就产出了一个可以完整验证的 Demo,这种效率和完成度是令人印象深刻的。
如果说 Case 2 展示的是「一个专家调用多个工具」的纵向深度,Case 3 展示的就是「多个专家接力协作」的横向广度。
这才是 OmniWork「知乎专家团队(全干版)」定位的完整形态:任务简单时它是一个全能专家,任务复杂时它变成一支有分工、有工序的团队。
做完这 3 个测试,产品之外,我们觉得有几个行业层面的变化值得聊聊。
【1】从「资产生成」到「成品交付」,AI 创作工具的交付单位正在升级。
过去一年大家的注意力都在模型能力上,视频更逼真了、音乐更好听了、代码更准了。
在 OmniWork 里,给了一句话和一张图,系统就可以自己拆解任务、调度流水线、处理衔接,最后交出来一部带完整叙事和配乐的成片。整个过程里没有碰过任何一个单点工具。
创作工具的交付单位从「一张图」「一段视频」升级到了「一个完整作品」。这个变化一旦成立,创作者的生态会发生结构性的变化。
【2】AI 创作工具的下一个壁垒,可能不在模型层,而在经验层。
通用大模型会越来越强,单纯的能力封装很容易被追平。OmniWork 的思路是把真人专家的经验结构化写进 Agent,再通过 Skill 沉淀不断积累。
据我们所知,OmniWork 已经跟上戏文化、上音人工智能音乐疗愈实验室合作,像专家市场里的「导演」「音乐制作人」背后,都是真人专家的经验注入。
再加上 Skill 的沉淀机制,每完成一个复杂任务,系统就把工作流提炼为新的 Skill,下次可以直接调用。这个「经验层」如果能越滚越厚,就是别人很难复制的东西。
【3】「创作软件」和「创作服务」的边界正在模糊
过去软件就是软件,服务就是服务。Premiere 是工具,你得自己会用;找外包是服务,别人帮你干但很贵。
OmniWork 有意思的地方在于它处在这两者的中间地带:它是一个软件产品,但用起来的体验更像是在跟一个服务团队下需求。你不需要学会怎么操作每个功能,你只需要说清楚你要什么。
如果要用一句话概括 OmniWork 的定位,「AI 知乎专家(全干版)」可能是最直白的说法。它确实在描述一种新品类:有专家服务的交付能力,但以软件的价格和速度运行。 7×24 在线、即时响应、持续记住你的偏好,这些是真人专家物理上做不到的。
当然,AI 专家的判断力和真人顶级专家之间还有差距,但对大量「找不到专家、找不起专家」的创作者来说,这个差距已经被效率和成本优势覆盖了。
当执行层面的门槛被工具抹平,创作者的核心工作就从「怎么实现」退回到了「做什么」和「做成什么样」。
到了这一步,真正稀缺的就是品味了。选什么题材、要什么调性、在哪里收束,这些判断 AI 替不了你。
OmniWork 目前还在内测阶段,我们手上有几个邀请码,感兴趣的可以在评论区评论。
如果你写过类似文章:《实测 PixVerse C1》、《实测 LibTV》,请联系 zeo0811@gmail.com ,邮件内容请包括:① 个人介绍、② 你写过的 AI 评测文章。
我们会提供有竞争力的稿酬。期待与你一起观察与记录 AI 时代 🎪