AI 视频生成也有 Skills了,@ 一下就能调用整个好莱坞剧组
爱范儿
2026-01-29 18:52
发布于广东
爱范儿官方账号
Claude Skills
最近在社交媒体上刷屏。它让 AI 从会聊天变成会干活。把专业能力打包成模块,用户只用斜杠 / 一下就能选择对应的 Skills。
想做数据分析?/DataAnalyst。想写代码?/Coding Expert。AI 不再是猜我们想要什么的黑盒,变成了一个按需加载的工具箱。
这个模块化的思路,现在也来到了 AI 视频生成领域。
Vidu 新上线的主体社区,把运镜、特效、氛围、表演、构图、叙事、风格、场景、招式等等,这八大类型打包成「主体库」,我们只需要在输入框里 @ 一下,就能调用。
在参考生视频中,输入 @,会自动弹出选择框,我们可以直接找到需要的主体
想要推镜头?@镜头库。想要赛博朋克氛围?@氛围库。想要粒子特效?@特效库。
我们甚至可以像 Claude Skills 那样叠加使用:@镜头 + @氛围 + @特效 + 角色图,一次性搞定导演、摄影师、特效师、美术指导的活儿。
以前都说 AI 要抢走好莱坞演员的饭碗,现在 Vidu 直接给每个创作者配了一个 AI 好莱坞制片厂。演员、导演、摄像全部都是 AI,只要我们 @ 一下。
这也是全球第一个 AI 视频主体社区,一个可分享、可交易、可互动的主体社区。
🔗 体验地址:https://www.vidu.cn
Vidu API:http://platform.vidu.cn/
APPSO 第一时间拿到了
Vidu 主体社区
的测试资格,把里面的
8 大主体类型
都体验了一遍,我们一起来看看它的实际表现如何。
还有给大家也准备了福利,登录 vidu.cn,
输入邀请码:APPSON
,注册即送 500 积分,快一起来体验吧
AI 终于学会了「演戏」
在传统 AI 视频中,最难描述的就是画面感。稍微多写几个形容词,AI 就容易产生幻觉。尤其是人物表情的僵硬,简直就是 AI 视频的硬伤。
Vidu 主体社区的
表演和表情库
,把这些复杂的情绪描述和动作设计,都做到了标准化。现在包括癫狂大笑、惊恐、悲伤、欢快等
表演和表情主体
,能够直接生成对应角色的表情和情绪状态;还有双人对打、群像对峙、浪漫依恋等
招式主体
,更是把角色的具体动作都安排好了。
一键
@表情
,我们甚至不需要用多余的提示词,就能完美复刻主体社区里面各种表情。同时,还能兼顾到视频的完整统一性。
我们输入一张小丑的图片,使用
癫狂大笑
这一主体,既让小丑有更丰富的表情和动作,同时小丑的模样也没有被改变,整体画面的气氛也保持在恐怖惊悚中。
该图片疑似AI生成
组合公式:
@雷暴
不止的
@城市废墟
,
@图1
站在街道上,正对着镜头作出
@癫狂大笑
,结合剧烈的
@急摇镜头
,营造出强烈的
@恐怖惊悚氛围
能笑,当然也能哭,使用
@夸张大眼哭哭
这个主体,就可以直接让画面里的角色,哭得撕心裂肺。这些表情和表演主体,能真的让 AI 视频里的角色「活」过来。
该图片疑似AI生成
组合公式:
@图1
站在镜子前,镜子里显示着她展现出
@夸张大眼哭哭
的表情,结合强烈的
@悲伤氛围
,她的哭泣越来越悲痛,同时使用
@侧逆光
,显示她的轮廓和镜子中清晰的哭泣表情。
不只表情控制准确,动作上,有了主体库的预设,我们可以轻轻松松地就让角色放大招。不只是角色的动作,就连视频特效,我们也是直接@主体社区 里面的对应主体,就自动添加上。
我们先在招式里面,选了一个
@百花缭乱
的分身。
该图片疑似AI生成
组合公式:
@角色3
使用
@百花缭乱分身
效果还是很不错的,即使是比较复杂的
@冰雨术
、锁链等招式,Vidu 也基本上都能驾驭得很好。
该图片疑似AI生成
组合公式:
@剑圣
使用
@冰雨术
攻击
@苍玄
,冰雨快要掉到
@苍玄
身上时,
@苍玄
快速使用
@金钟罩
来抵抗攻击
这些招式和特效,对于短剧漫剧创作者来说,简直是最佳利器。
不同的主体也能多个叠加组合,Vidu 就能给我一个精彩的玄幻武打大片。
该图片疑似AI生成
组合公式:
@星野仙尊
面向
@鬼怪
打出
@降龙十八掌
,场景是
@战场
,
@智能运镜
近距离的双人对打,行云流水的动作也能复刻黑客帝国了。
该图片疑似AI生成
@ 几下就能出片,我也能做百万运镜了
解决了人物的表情和动作,接着就是画面的设计。
能控制视角,掌握观众的眼睛的镜头,是视频内容呈现当之无愧的重要部分。其中的
运镜和构图
,
运镜
能决定摄影机的运动方式,向来就是电影镜头语言的基础;而
构图
更是决定了画面的
景别和视角
。
在 Vidu 主体社区,
景别
包括特写、全景、鸟瞰、360 度展示等,
构图
也有群像对峙、三分构图、荷兰角构图等,
镜头
则更加丰富,包含推镜头、摇镜头、环绕镜头、
探针镜头
等多种运镜方式。
我们先是从主体库里,按照人物+风格+场景+氛围+运镜的方式,随机选择了一组提示词,中间甚至没有太多的连接词,用来把这些主体连起来。最后一次性呈现出来的效果,也很有好莱坞大片的风格。
该图片疑似AI生成
组合公式:
@紧张压抑氛围
,
@小李子
站在
@停车场
,镜头先
@360度展示
,再拉远到
@全景展示
空荡荡的停车场
其中小李子就是我们自己创建的主体,上传 1-3 张图片,选择对应的声音,然后确定风格和提示词,就能得到一个可以重复使用的人物主体。
配合
@360度展示
的环绕,进一步凸显紧张压抑的氛围,到镜头拉远,使用
@全景展示
,把这种视觉冲击力做到更强;短短五秒,充满了戏剧张力。
除了在这种封闭空间的运镜,Vidu 主体社区的镜头配置方案,在露天的无限空间里,表现同样优秀。
该图片疑似AI生成
组合公式:
@背后视角@活力少女
坐在摩天大楼边缘,
@无人机拉远
,
@全景展现@南京城市天际线
和
@敬畏崇高氛围
此外,Vidu 主体社区还提供了像
@探针镜头
这样的特殊镜头轨迹,很难用自然语言描述清楚摄像机的运动路径,现在直接直接调用主体就能帮我们快速实现微距穿梭。
组合公式:
@郑开开@科幻风格@太空舱场景@科技感氛围@探针镜头
很多 AI 视频往往画质很美,动起来很假。Vidu 主体社区新增的丰富运镜,确实比以往我们输入提示词,告诉 AI 摄像机如何运动,角色如何运动,要可控和容易得多。它对那些专业镜头语言的理解,还是比较准确。
继续测试它对运镜和景别的理解能力。推镜头是最基础的电影镜头之一,从远景缓慢推进到近景,制造情绪递进感。我们先用传统方式写提示词,「Elean 在医院对面,天在下雨,镜头推进到她的脸部,然后镜头拉远,从空中鸟瞰」。
先不说这个用提示词实现的运镜如何,没有参考主体的纯文生视频有诸多不可控,例如画面的风格是否过于超现实,主体的展示是否符合情境等,我们生成了好几次,单纯用提示词的效果,几乎都把握不好这个推进到鸟瞰的速度和效果。
提示词版本,鸟瞰运镜下,人物都消失了,不能保持在画面中心
使用 Vidu 主体库,我们还可以直接选择主体社区中,已经有的人物形象,来生成视频。
同时
@镜头库
选择「
镜头推进
」,加上简单的场景描述。第一次生成就出片了,从推进到拉远,再到鸟瞰镜头,自然过渡。
该图片疑似AI生成
组合公式:
@Elean
在
@医院
对面,天在下雨,
@镜头推进
到她的脸部,然后再
@镜头拉远
的
@鸟瞰运镜
这个对比很能说明问题,传统 AI 视频生成的「理解力」是飘忽的,同一个提示词每次生成都像开盲盒。而主体库相当于把这些专业概念做了标准化封装,模型不用再去猜我们想要什么效果。
不只是好看,让故事更有「代入感」
除此之外,在主体库中里面的
氛围、风格和场景
,决定了整个视频的味道。
具体来说,
场景
能决定视频的空间环境,
风格
决定视频的整体美术风格,
氛围
则是给画面的情感色彩带来了新的故事。Vidu 主体社区也提供了包括太空舱、医院、森林、咖啡店、豪华宴会厅等场景,科幻、悬疑、赛博朋克、古风等风格,以及紧张压抑、欢快、悲伤、浪漫依恋、科技感等氛围。
我们直接把一个豪华的高级宴会厅,变成一出阴森恐怖的惊悚片,配合左右摇晃的运镜,营造出从人物视角观察环境的效果,增强身临其境感。
该图片疑似AI生成
组合公式:
@豪华宴会厅
变成
@恐怖惊悚的氛围
,采用
@左右摇晃
的运镜,整体是
@悬疑电影风格
能通过环境的灯光来展现氛围变化,Vidu 主体社区的其他氛围,还能结合人物表情来呈现。
还能让
@小李子
和
@梦露
,加一个
@浪漫依恋氛围
。Vidu 最后生成的视频光影效果很好,当全景的时候,是用比较暗的下雨天氛围,而自动推进到两个人脸部时,画面又自动提亮了。
该图片疑似AI生成
测试公式:
@群像对峙@小李子
和
@梦露@浪漫依恋氛围
,背景是
@咖啡店
通过对这些不同分类的主体进行测试,让我确认了一件事,多主体组合不是简单的「功能堆叠」,Vidu 在底层做了某种协调机制,让不同主体之间能互相配合。
这种协同感,是传统 AI 视频生成最缺少的。我们在提示词里写再多细节,模型也很难同时从里面理解到,镜头、氛围、特效的平衡。
更惊喜的是,我们不仅能直接引用主体库,来生成视频;Vidu 这次还把这些主体,做成了一个可以分享、互动和交易的社区。
用户可以上传自己设计的主体
我们每个人都可以设计和上传自己的主体,同时使用其他的主体,在创作和使用的过程中,
Vidu 设置了资产变现模式,每一个主体都是可交易的
。
配合前两天刚刚更新的
Vidu Agent 1.0 和 Vidu
Q2 参考生 Pro
模型
,一方面有更自动化的工作流,开箱即用,实现一键成片,灵活性与便捷性完美平衡的 Agent;全新升级后的功能,支持上传背景音乐、删减旁白、Storyboard 编辑,内置多语言,多音色,多模特,多场景的海量素材库等。
另一方面则是更强大的基座模型,能直接复刻不同视频效果的 Q2 参考生 Pro。
AI 视频生成这条路,Vidu 算是越走越明白了。
从「抽卡」到「搭乐高」
这一圈实测下来,我对 Vidu 主体社区也有了一个更清晰的判断,它除了是一个更好的工具,能帮助我们更好地生成 AI 视频,它更想要改变整个生成的工作模式。
传统 AI 视频生成是「
抽卡模式
」
,我们写一堆提示词,祈祷模型能理解,然后赌概率。运气好抽到 SSR,运气不好全是垃圾。这种模式的问题是,创作过程不可控,专业门槛以另一种形式(说的就是提示词工程)依然存在。
而 Vidu 主体社区是「
乐高模式
」
,把专业元素拆解成标准化的模块,我们只需要选择、组合,然后生成。这种模式的核心优势是可控性,在选择主体时,我们就大体上知道会有什么效果,而不是单纯碰运气。
这个转变对谁最有价值?自媒体、短剧漫剧创作者、电商营销团队、中小企业主,他们需要批量产出有质感的视频内容,但没有专业团队和高昂预算。主体库对他们来说,相当于花小钱雇了一个「虚拟剧组」。
复杂的视频制作流程
那些独立创作者、设计师、广告从业者也会受益。主体库可以补齐他们的短板,不用从零学 AE 就能搞定酷炫的镜头和特效。
放到更大的行业背景下看,
Vidu 主体社区让 AI 视频生成进入了「工业化阶段」的一个标志。
过去一年,AI 视频生成的主战场是谁的模型更强——可灵、Runway、Sora、Veo 都在比拼画面质量、时长、一致性。但技术到了一定阶段,竞争维度会转向「怎么生成」,也就是
工作流、可控性、复用性。
这种转变,其实和 Claude Skills 的逻辑是如出一辙的。Skills 的价值不在于让 Claude 变得更聪明,而在于让它的能力变得可预期、可调用、可组合。用户不再需要猜测「这次它会不会理解我的意思」,而是明确知道「我调用了这个 Skill,它就会按这个方式工作」。
Claude 提供的 Skills 选择,不同的 Skill 能直接解决对应的问题
Vidu 主体库做的也是同样的事情。它把视频生成从「抽卡游戏」变成了「精准指令」。这种确定性,才是真正降低门槛的关键。
对于真正有想法、有审美、有叙事能力的创作者来说,这其实是好事。他们终于不用被技术门槛卡住,可以把精力集中在真正重要的部分。
换句话说,Vidu 全新的主体社区,它能帮我们实现一个完美的推镜头,但不能帮我们决定这个推镜头,应该出现在故事的哪个节点、推进速度应该配合什么样的情绪节奏、这个镜头和前后镜头如何形成叙事张力。
上下滑动查看更多内容,主体社区包含的部分主体
这些决策,依然需要我们人类创作者的判断力和审美。
当然,它现在还有一些可以进步的空间,8 秒限制、主体库覆盖度,但这些都是可以迭代优化的。
更重要的是,Vidu 主体社区开了一个头,证明了「标准化 + 可组合」这条路是走得通的。