6个维度测评可灵1.5模型，效果不输Sora，太惊艳啦！

AI先锋官官方

2024-09-21 21:40发布于北京

作者｜子川

来源｜AI 先锋官

近日，AI视频生成领域的大魔王,可灵迎来重磅升级。

快手发布了最新文生视频模型可灵1.5模型。

据官方报告：

可灵1.5模型，在画质质量、动态质量、美学表现、运动合理性以及语义理解等方面均有显著提升。最大亮点是能直接生成1080P影视级视频。

从河里蹦出来的威震天，大家看过没？

再来一个怪物毁灭城市。

好像有点不错呀。

那不得来测一测！！！

由于可灵本来就很牛×了，咱就得给这位大魔王不一样的待遇。

本次测评将从AI拟人化、物理定律、运镜轨迹、人物连续性、卡通视频风格、数字理解6个维度进行测评。

为了增加可灵对语义理解方面的测评，测评的提示词都极其简单且都是文生视频。

1.AI拟人化：

提示词：一只柴犬手里拿着报纸，它正坐在沙发上看报纸。

从视频中可看到，可灵1.5模型生成的效果不错。小狗真就把报纸摊开，津津有味的看了起来。

唯一美中不足的就是小狗的脚趾有点长。。。

2.物理定律：

提示词：一个女孩正在将一杯牛奶倒入另一个杯子里。

生成的效果非常不错，小女孩完美的把杯子里面的牛奶倒入另外一个杯子。没有出现倒不进，甚至倒空的场景。

3.运镜轨迹：

提示词：两只蝴蝶停落在花朵上，视频画面由远到近不断的放大。

这次可灵这位老司机就翻车啦，并没有清楚的描绘出视频画面由远到近的运镜规则，而是定格在蝴蝶的近景上,再切换到其他的场景。

4.人物连续性：

提示词：女孩正在吃西瓜，吃完西瓜后，开心的笑了。

此次生成的视频完全遵循了提示词，小女孩吃完西瓜后开心的笑了，脸部也没有一点崩的迹象。

5.卡通视频风格：

提示词：视频生成卡通形象，一只企鹅正在大海里游泳。

这个卡通企鹅在海里游泳效果还不错，不仅有企鹅，还有其他的卡通动物。

6.数字理解：

提示词：2位男士和3位女士在同一个超市里购买鸡蛋。

从视频上不难看出，5个人，少了一位男士，多了一个女士，鸡蛋也变成鸵鸟蛋。。。

抽了三次卡（经费有限，还望见谅），可灵对数字的理解方面生成的视频效果都不算太好。

通过6个维度对可灵进行测试，可灵在运动轨迹和数字理解方面稍微差点意思。

不过在AI拟人性、物理定律、人物一致性、视频卡通风格方面，表现都还不错。

插播一嘴，1080P影视级视频真不是吹的。

目前国外网友都已经玩疯了，把服务器给挤爆了。

据报道，在快手内部测试，可灵1.5版本相较于可灵1.0版本整体效果提升 95%。

测评到这，已经忍不住拿可灵和Sora掰掰手腕啦！

废话不多说，测试走起！

先来一个经典的场景：一个时髦的女人走在东京的街道上。

Sora：

可灵：

场景2：一群纸飞机在茂密的丛林中飞舞，像候鸟一样在树木之间穿梭。

Sora：

可灵：

场景3：毛茸茸的矮个子怪物跪在融化的红烛旁。

Sora：

可灵：

先说结论：可灵牛牛牛叉！

本来对可灵不抱太大的希望的，直到视频生成出来的那一刻。

无论从视频输出的质量还是对文字的理解，可灵的效果真的太给力啦！

除了第二个视频效果较差以外，其他两个视频效果已经可以堪比Sora！仿佛看到AI视频商业化的时代正在面向更多普通人。

特别说明：第二个视频提示词较短

.END.

往期文章回顾

查看原图 33K