6个维度测评可灵1.5模型,效果不输Sora,太惊艳啦!

作者子川 

来源AI 先锋官


近日,AI视频生成领域的大魔王,可灵迎来重磅升级。
快手发布了最新文生视频模型可灵1.5模型。
据官方报告:

可灵1.5模型,在画质质量、动态质量、美学表现、运动合理性以及语义理解等方面均有显著提升。最大亮点是能直接生成1080P影视级视频。

从河里蹦出来的威震天,大家看过没?

再来一个怪物毁灭城市。

好像有点不错呀。
那不得来测一测!!!
图片
由于可灵本来就很牛×了,咱就得给这位大魔王不一样的待遇。
本次测评将从AI拟人化、物理定律、运镜轨迹、人物连续性、卡通视频风格、数字理解6个维度进行测评。
为了增加可灵对语义理解方面的测评,测评的提示词都极其简单且都是文生视频。

1.AI拟人化:

提示词:一只柴犬手里拿着报纸,它正坐在沙发上看报纸。

从视频中可看到,可灵1.5模型生成的效果不错。小狗真就把报纸摊开,津津有味的看了起来。
唯一美中不足的就是小狗的脚趾有点长。。。
2.物理定律:
提示词:一个女孩正在将一杯牛奶倒入另一个杯子里。
生成的效果非常不错,小女孩完美的把杯子里面的牛奶倒入另外一个杯子。没有出现倒不进,甚至倒空的场景。

3.运镜轨迹:

提示词:两只蝴蝶停落在花朵上,视频画面由远到近不断的放大。

图片
这次可灵这位老司机就翻车啦,并没有清楚的描绘出视频画面由远到近的运镜规则,而是定格在蝴蝶的近景上,再切换到其他的场景。

4.人物连续性:

提示词:女孩正在吃西瓜,吃完西瓜后,开心的笑了。

此次生成的视频完全遵循了提示词,小女孩吃完西瓜后开心的笑了,脸部也没有一点崩的迹象。

5.卡通视频风格:

提示词:视频生成卡通形象,一只企鹅正在大海里游泳。

这个卡通企鹅在海里游泳效果还不错,不仅有企鹅,还有其他的卡通动物。

6.数字理解:

提示词:2位男士和3位女士在同一个超市里购买鸡蛋。

从视频上不难看出,5个人,少了一位男士,多了一个女士,鸡蛋也变成鸵鸟蛋。。。
抽了三次卡(经费有限,还望见谅),可灵对数字的理解方面生成的视频效果都不算太好。
通过6个维度对可灵进行测试,可灵在运动轨迹和数字理解方面稍微差点意思。
不过在AI拟人性、物理定律、人物一致性、视频卡通风格方面,表现都还不错。
插播一嘴,1080P影视级视频真不是吹的。
图片
目前国外网友都已经玩疯了,把服务器给挤爆了。
图片
据报道,在快手内部测试,可灵1.5版本相较于可灵1.0版本整体效果提升 95%。
测评到这,已经忍不住拿可灵和Sora掰掰手腕啦!
废话不多说,测试走起!

图片

先来一个经典的场景:一个时髦的女人走在东京的街道上。

Sora:
图片

可灵:

场景2:一群纸飞机在茂密的丛林中飞舞,像候鸟一样在树木之间穿梭。

Sora:

图片
可灵:

场景3:毛茸茸的矮个子怪物跪在融化的红烛旁。
Sora:
图片

可灵:

先说结论:可灵牛牛牛叉

本来对可灵不抱太大的希望的,直到视频生成出来的那一刻。

无论从视频输出的质量还是对文字的理解,可灵的效果真的太给力啦!

除了第二个视频效果较差以外,其他两个视频效果已经可以堪比Sora!仿佛看到AI视频商业化的时代正在面向更多普通人。
特别说明:第二个视频提示词较短

图片


 .END.
往期文章回顾