作者|冰拿铁
编辑|星奈
媒体|AI大模型工场
全球视频大模型激战正酣,榜单排名你追我赶。2025将近过半,行业战况如何,谁是新晋顶流?
6月18日,MiniMax投下一颗重磅炸弹:AI视频生成工具Hailuo 02上线,在关键的弯道完成了一次漂亮的“加速超车”,带来了一系列炫酷的演示demo:喷火的龙、钻圈的狮、后空翻的熊……让网友直呼“666”,感慨Hailuo 02上演“全球顶级杂技秀”!
比视觉效果更炸裂的,是随之公布的硬核数据、排名:
在Artificial Analysis Video Arena Leaderboard最新排名中,图像生视频栏目下,Hailuo 02排名第2,以83分的绝对优势领先谷歌Veo 3、快手可灵,让人感慨新王诞生;同时,Hailuo 02成本效率刷新世界纪录,定价第一梯队最低!
此前,Hailuo 02就曾在社交媒体上被A16Z合伙人点赞,什么实力无需多言:
在我看来,Hailuo 02的这次“低调突袭”,诠释了什么叫人狠话不多:其用顶尖的技术实力和普惠的价格,在巨头环伺的战场多维领先,为中国AI视频刻下了一个崭新的里程碑,让我们在全球竞技场再下一城。
接下来,我们一起上手试试吧!
01、实测Hailuo 02:能“演杂技”的大模型,极端复杂物理表现带师!
Hailuo 02更新上线的几小时内,社交平台上已经炸开了锅。MiniMax官方放出的一系列“杂技”Demo视频,直接拉满了用户的期待值。有网友看过狮子钻火圈等Demo赞叹:“这光影,这火星,太真实了,极端复杂物理表现绝了!”
动物杂技这么6,人类体操肯定也能胜任!我们输入了这样的demo:
“一名体操运动员在明亮的场馆内,身着紧身体操服,迅速助跑,用力踏板,身体腾空而起,在空中完成一个完美的空翻转体动作,稳稳落地,动作流畅且充满力量感。镜头快速捕捉她的精彩瞬间,展现出体操运动的高难度与美感。”
效果可见,海螺完美理解了“充满力量感”与“动作流畅”的含义:“力量感”体现在助跑的冲刺速度、踏板的坚实有力;“流畅感”则体现在动作过渡的丝滑、轨迹的圆润、落地冲击力处理的从容。
更难得的是,Hailuo 02没有让力量感变成僵硬的肌肉堆砌,也没有让流畅感沦为轻飘飘,它中找到了那份独属于顶尖运动员的那份刚柔并济,呈现出令人信服的物理规律,背后是对复杂运动轨迹和动力学的理解。
让我想起了作家卡尔维诺在《看不见的城市》中,区分了两种“轻”:一种是羽毛的轻,一种是鸟的轻。随风飘荡是假的轻,而凭风高飞,才是真的轻,轻盈而充实。如今,AI也能理解这么复杂的东西了!
上难度,输入“机械人体在城市空中的悬浮平台间跳跃,镜头跟随他向后拉远,机械人体踩在一个悬浮平台上,随即又向下个平台跳去,不断向画面靠近”,表现同样惊艳!
可见,整个视频节奏无比紧凑,镜头运动与机械体跳跃动作严丝合缝,产生强烈的速度感和视觉冲击力,画面中踏板在被踩中时刻的下坠晃动,体现了超绝的重力感应,机器人主角的伸展、摆动过程中,每个关节的震荡都是自然合理的,展现了对高速运动物体与复杂动态镜头进行实时协同生成的能力,不是单纯的角色运动加背景拖拽,而是空间关系、相对运动、镜头感知的精密配合。
对比同样一家头部厂商的产品,效果则没有那么丝滑,“五毛特效”和塑料感的味道浓厚,以及忽略重力的“拔地腾空”,背后反映的其实是指令理解的深度差异,以及材质、物理映射力与氛围的多重鸿沟。
对比之下,我也悟了,Hailuo 02本次能“秀”到业界和用户的,并非仅仅是能生成复杂动作,而是它将这些极端物理情境下的动作表现得如此丝滑、“合理”且充满细节美感。
这不禁让我想起早期视频模型常见的那种僵硬、生疏和“伪人感”,如今头号玩家不断努力下,已经和最初的效果有了天壤之别,向“理解真实世界物理规则”迈进了一大步,这种逼真的呈现,已经触碰到了高质量商业级视频制作的边线,精准狙击着内容生产深水区最顽固的痛点!
不止于此,在我最关心的指令遵循能力上,Hailuo 02的表现也是一绝。
02、“演杂技”之外:Hailuo 02是细节狂魔,指令遵循能力一绝
为什么我说指令遵循能力很重要?
常用视频生成模型的朋友都知道,用户用复杂、精细的语言描述心中所想,却往往对牛弹琴,模型经常“听不懂”或“做不准”,生成结果与预期南辕北辙。用户需要花费大量时间调整提示词或反复尝试,严重阻碍创作效率和创意的流畅表达。
而Hailuo 02的指令遵循能力让我甚为欣慰。输入“中世纪骑士在暴雨城堡庭院单膝跪地,突然抬头拔剑,镜头从俯拍急拉至面部特写,背景雷声轰鸣,悲壮史诗感。”
结果可见,Hailuo 02能将激烈的动作、细微的情感和宏大的氛围一并爆发式呈现,理解我说的“悲壮史诗感”“中世纪骑士”“从俯拍急拉至面部特写”等关键词,呈现出电影工业级视听语言的精准执行能力。这是AI视频生成从“看”世界走向“理解”世界物理规则的关键里程碑。
同时,运镜也值得称道,“镜头从俯拍急拉至面部特写”完美遵循。
此外,Hailuo 02还是个细节狂魔,既擅长捕捉自然伟力、剧烈动态,也精于捕捉和再现生命细微的、静谧的美好。
输入“暴风雨中,巨浪猛烈撞击黑色礁石,浪花飞溅,乌云缝隙透出金色夕阳。”
如我所愿,Hailuo 02复现了自然界中最具冲击力的动态美学,在极端表现、超大规模场景模拟以及动态光照等效果集成方面的一梯队实力,电影特效降本增效有救了!
再输入“一只布偶猫趴在窗台,阳光中眯眼打哈欠,尾巴轻摆。”
可见Hailuo 02理解“慵懒”这种状态,表情和肌肉纹理自然,还有伴随呼吸的腹部起伏,将“慵懒”通过生物细微的动作和打哈欠的生理反应精准传达,毛发模拟与渲染能力很强,精准传达“温暖治愈向”情感共鸣。
真,心有猛虎,细嗅蔷薇!
大家还记不记得,在《哪吒之魔童降世》路演采访中,饺子导演分享了一件趣事,电影中有一场申公豹变身成豹子头的特效画面,他找外包公司的特效师磨了两个月,但始终达不到预期效果。最终,这位特效师因压力过大选择离职。然而,新找到的外包公司恰好就是他的新东家。无奈之下,特效师又花了数月时间完成了这个只有几秒钟的特效镜头。
那么,MiniMax特效能力如何?
输入指令“阴云笼罩的破败巨型工厂突发剧烈爆炸,橙红色火球急速膨胀,冲击波撕裂钢铁结构,慢镜头飞溅金属碎片与碎石,浓密黑烟呈环形扩散;烟尘中骤然亮起一对猩红机械眼,巨大机械巨龙轮廓破烟而出,液压关节发出低沉轰鸣;烟尘稍散,高细节机械巨龙全身亮相——冰冷厚重的金属装甲覆盖复杂齿轮,背部能量管散发蓝光,生锈液压关节带动巨躯站立,低角度仰视镜头突显其压迫感,背景是持续崩塌燃烧的工厂废墟。”
重点考察几个特效:爆炸火球规模感、碎片物理飞溅、动态烟尘透光效果、机械体金属质感与油污锈迹、能量光效与环境持续破坏。结果可见,爆炸后的火光与黑烟的时间衔接流畅,运动轨迹自然,还有汽车左右摆尾的滞顿感,用细节拉满的特效. 构建出一个大片现场。
如今,AI已经发展到可以构建可信且动态的视觉奇观,这不仅解构了高成本、高风险、低效率的传统制作流程,更将视觉表达的想象力缰绳握在自己手里,从“预算”和“技术实现不了”中进一步解放!
03、“炫技”背后的台下十年功:中国大模型更进一步!
除了技术实力强大外,成本与效率也是Hailuo 02此次的王牌,相比前代Hailuo,02版本并非小修小补,而是在架构层面进行了重构,设计了更高效的DiT架构。训练成本却没有飙升,效率却是惊人的:训练和推理效率各自提升了2.5倍,模型参数规模提升3倍、训练数据量翻了4倍!
去年以来,MiniMax就被称为国货之光,如今更是一周内多弹连发,从发布全球首个开源大规模混合架构的推理模型MiniMax-M1,到上线视频生成能力登顶全球第二的Hailuo 02,绝非偶然爆发,而是其在底层架构上长期深耕厚积薄发的必然结果。
MiniMax正以惊人的爆发力和持久的耐力,推动着整个国内视频生成大模型的赛道加速向前,如今,Hailuo 02展现的,已不仅是某个单点技术的突破,而是标志着AI视频生成正式迈入了新的阶段,从早期的“能看”到如今的“专业可用、成本可控”,从简单的场景复现到对复杂物理规则和叙事的理解与表达,有望大大拓展AI在影视创作、游戏开发、广告营销、虚拟体验等领域的想象空间和应用深度。
大道不孤,众行致远。不只是MiniMax,上文提到的榜单中,图生视频TOP5,中国模型傲据四席,是一个强有力的信号:
在我看来,这标志着中国在AI视频生成这一前沿的技术领域,已形成强大的集群优势和创新高地。并以创新架构、优质效果、成本控制能力多管齐下,向全球展示了中国AI公司解决复杂问题、引领技术前沿的决心和能力。
由此,在技术深度与产品落地能力上,中国大模型公司不仅可以跻身第一阵营,更具备定义技术高度、刷新行业基准的能量。期待未来,以Hailuo 02为代表的“中国力量”,能在AI时代的星辰大海中,上演更宏大、更精彩的剧目!