这样一张照片,是实拍还是AI生成?
2024最火AI爆款可灵,年末又卷了一波:
旗下文生图模型——可图,完成了1.5版本升级,分分钟生成平面大片。
还推出了“AI模特”等全新功能。
搭配AI换装(原AI试衣),奇迹暖暖的快乐谁又懂了(doge)。
不得不说,上线半年,可灵AI不仅在视频生成赛道上引领全球风潮,产品体验也越来越全面。
实际上,AI视频被引爆的这一年,虽然笑在最前的是OpenAI的Sora,但论笑到最后笑得最好,可能非可灵AI莫属。
在2024这一年里,可灵率先成为了全球首个用户可用的视频生成大模型,并且在短短6个月已经历10余次迭代——平均每个月有两次以上新动作。
AI视频领域,都是被可灵AI支配的一年。
可灵AI上新「年末大礼包」
总结之前,我们还是先拆个箱,康康可灵AI准备的年终礼物,顺带实测一波~
第一样就是全新上线的可图1.5图像模型。
这次主打「画面质量」和「人像美感」再上新台阶。
话不多说,我们打开可灵AI中文官网,点进AI图片页面,并切换到最新可图1.5模型。
第一关当然是人像生成。为了上难度,我们特意丢给它一大堆摄影专业名词:
一位身着红色长裙的舞者,背对镜头,头微微侧转至四分之三角度,柔和的聚光灯(暖光)洒在她的侧脸上,凸显出精致的轮廓。她的裙摆随风轻扬,周围是飘散的红色花瓣,仿佛在空中翩翩起舞。背景是一片深邃的黑暗,只有几束冷光从侧面投射,形成强烈的冷暖对比。舞者的手腕上戴着一串金色的手链,反射出微弱的光芒。大光圈拍摄,花瓣在空气中呈现出动态模糊的效果,仿佛时间在这一刻凝固。
OMG,效果一出来,确实令人惊艳。(更像写真而不是一眼AI)
擦亮双眼又仔细对照一遍提示词,几乎100%还原了。
而且可以看到,整体构图和光影很协调,画面真实自然,很像大家生活中拍的艺术写真。
五个字:美就完事了!
当然除了人像,我们也进一步考察了可图1.5对更丰富的细节层次的掌控程度。
一座古老的江南水镇,夜幕降临,青石板路被细雨打湿,映出朦胧的倒影。一艘乌篷船静静停靠在石桥边,船篷上覆盖着斑驳的茅草,船内摆放着竹制茶几和青瓷茶具,透出古朴的韵味。船头悬挂着一盏纸灯笼,散发出柔和的红光,与水面上的倒影交相辉映。
很好,画面感这不就来了。看来江南水镇、青石板、乌篷船……这一连串细节也难不倒它,不仅色彩还原自然,而且层次感丰富。
一连串试玩下来,先给可图1.5的“审美能力”盖个章。
对了悄咪咪透露,以上生图过程都是免费的,新用户送了366个积分,一张图竟然只消耗1积分。(玩的时候还惊了一下,一下子可以免费生成几百张大片)
与此同时,我们也测了一波“AI模特”功能,目前主要看到电商&创意营销以及网友整活两种玩法。
先说整体印象,第一次接触这个功能就发现操作非常简单,几乎人人都能立马上手。
以电商场景举例,我们可以直接选想要的模特类型(包括性别、年龄、肤色),并自由添加描述。
这里要插一句,如果不知道如何描述,还能点击“推荐尝试”,直接用模板或照着模板改。
多次尝试后发现“AI模特”出图非常稳定,搭配“AI换装”后,感觉非常有希望取代需要店家花钱的真人实拍。
这还不算完,我们再叠一个buff——可灵图生视频能力。
让模特转身,展示身上服装搭配。
可以看到,商品展示不用进棚就能分分钟“拍摄”完成。
这下,从模特生成到商品动态视频展示一站式搞定,直接省下了团队、设备、摄影棚和后期剪辑的成本。
顺便一提,可灵AI这次还新增了尾帧生成能力,并升级了对口型功能。
前者指可灵1.5模型(图生视频)高品质模式下,已支持仅使用尾帧向前生成5秒或10秒的视频(类似只给一个大结局,AI猜前情)。
后者指为了使人物配音更加生动自然,新增10款高品质音色,并加入了7种不同情感的选择(包括高兴、悲伤、愤怒等)。
看完上述新功能,网友们想要整活的心也是拦不住了。
好家伙!马斯克也爱上了东北大花。(bushi
皮衣老黄变身“皮草老黄”可还行。
总之大家已经在期待可灵AI的2025年了。
6个月迭代10余次,可灵AI的“爆款”之路
可灵AI这波可以说是从年中卷到了年末。
从市场的角度观察,尽管在2024年率先掀起视频生成模型革新浪潮的,是OpenAI的Sora。
但若要论2024年AI视频生成领域的最大赢家,可灵AI却是当仁不让的答案。
根据官方数据,7月份,可灵AI上线1个月,就有“超50万人申请,开放给超30万用户使用,生成超700万条短视频”。
截至12月10日,可灵AI用户量已经超过600万,累计生成超6500万个视频和超1.75亿张图片。
国内,从微信指数来看,在6月份可灵AI正式发布之后,2024年下半年可灵AI热度已经压过了Sora,仅在OpenAI“双12”期间,Sora终于落地兑现之时被短暂反超。
海外,根据Similarweb数据,截至9月24日,可灵AI总访问量已达3370万次。11月份最新数据则显示, 可灵AI单月总访问量超过900万,超过Runway的700万和Pika的500万,是视频生成应用中当之无愧的“当红炸子鸡”。
此前,Stability AI前CEO Emad Mostaque也曾感叹:中国AI视频生成这次已经遥遥领先。
事实上,尽管发布晚了4个月,可灵AI却是第一个真正做到让视频生成新范式大饼落地、人人可用的AI视频生成产品,也从一开始就奠定了最前沿技术实实在在产品化、商业化的基调:
6月6日,文生视频功能“上线即可用”。
7月6日,WAIC 2024上,可灵AI Web端在千呼万唤中火速上线,现场氛围被认为“可能是本届WAIC上欢呼最多的一场发布”。
7月底,可灵AI全面开放内测,并面向全球上线会员体系。到了8月23日,OpenAPI也上线推出,开启B端合作。
在2024年第三季度业绩电话会上,快手CEO程一笑透露:
目前可灵AI的商业化单月流水超千万人民币,进展符合我们的预期,未来我们还将探索更多元的变现模式,我们有信心在明年实现可灵收入规模的快速增长。
所以,回顾过去6个月,可灵AI“爆款”之路如何进阶?核心关键词已经逐渐清晰:
快速、可用。
具体可以分为几个方面来看。
产品功能
首先,是产品功能的快速完善,和产品矩阵的稳步搭建。
6月6日发布即上线,可灵AI就支持生成2分钟、30fps的视频,并且支持多种宽高比。
15天之后,可灵AI正式推出“图生视频”功能,并发布业内领先的“视频续写”功能。
值得一提的是,图生视频功能拥有很强的逼近世界运行规律的能力,还表现出了很强的泛化能力。
比如水墨画这样的数据其实在可灵训练过程中接触非常少,但加上简单的提示词,可灵就能让水墨画中的动物自然、真实地运动起来。
7月6日,可灵AI Web端上线,进一步把视频生成、图像生成和编辑服务一站式化。
7月下旬,英文Web端KingAI.com面向全球发布,也标志着可灵成为首个全球用户可用的真实影像级视频生成大模型。
时间来到9月份,可灵AI依然更新不断:
“运动笔刷”功能上线即爆火,在等社交平台上刷屏。
△图源:@Ror_Fly
还推出了“对口型”等功能。
11月,可灵AI推出独立APP,形成多端跨平台产品矩阵。
同时继续在功能上解决AI视频生成痛点:AI定制模型(人脸模型)上线,攻克人物一致性难题。
基础模型能力
从技术角度值得关注的是,支撑产品快速进化的,是可灵AI团队坚实的基础模型能力。
6月上线的版本,是基于可灵1.0模型。Web端上线时,就已迎来基础模型的升级,包括画质提升:
生成时长扩展到一次10s,以及首尾帧控制和镜头控制等可控性升级。
9月19日,也就是可灵上线第3个月,可灵1.5模型推出。在快手内部测评中,1.5版本相比于1.0,整体效果提升了95%。
具体而言,相较于可灵1.0,可灵1.5模型在提示词理解、物理规律、画面动态质量上均有提升。
且就在12月19日,可灵基座模型再次升级,1.6版本模型现已上线。
3个月左右一个大版本更新的同时,从可灵AI团队公开发表的一系列论文中,也可以一窥其技术积累。
比如和中科大、北京大学联合发表的《Towards Precise Scaling Laws for Video Diffusion Transformers》,探索了Scaling Law在视频生成模型中的准确建模,率先提出新的Scaling Law,以实现视频扩散模型中,对模型大小和最佳超参数的准确预测和计算。
其可控人像视频生成框架LivePortrait,已经在GitHub上积累13.4k标星。
内容生态
可灵AI还通过内容生态的构建,实力“破圈”,面向更广大受众证明了视频生成的价值和影响力。
国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》,就是由可灵AI提供深度技术支持的。
这部AIGC短剧在快手星芒短剧播出后,反响热烈,截至7月27日,正片5集播放量超过5200万,全网话题曝光量超4.3亿,同时还登上全平台热搜21个,收获德塔文短剧景气指数top1。
最近,可灵AI还联合贾樟柯、李少红等9位知名导演,首映了一系列可灵生成的电影短片。几位首次接触AI视频生成的导演,都纷纷给出好评。
值得一提的是,在自身面向C端、B端推进商业化的同时。可灵AI也正在为创作者提供商业变现的渠道。比如10月18日,可灵AI启动了首期“未来合伙人计划”,在业内率先推出了一站式AIGC生态合作平台。
随着全球基础大模型竞争格局初定,包括视频生成在内的大模型应用,已经成为产业界关注的焦点。
不少业内人士认为,在新一轮的竞争中,已经在移动互联网时代证明产品能力和工程能力的中国团队,具备很强的竞争优势。
在视频生成领域,以可灵为代表的国产大模型后来居上,引领全球风潮,就是一个例证。
2025年,可以预见到的是AI应用的进一步深耕和爆发。
而AI视频生成作为商业化进展最快的方向之一,更加值得期待。
在这个进程中,不画饼的团队,值得更多的赞赏和鼓励。