“留给我们的唯有一条路,那就是希巴拉克的道路……”这首由Suno AI创作、于今年元旦上传到B站的歌曲《奥奇坎金曲》成了爆款,目前播放量已达180万,也让向来“低调”的AI作曲在人们面前“秀了一把肌肉”。
Midjourney、Suno、Sora分别是AI绘画、AI音乐和AI视频的代表软件,分别发布于2022年3月、2023年12月和2024年2月。随着这些现象级工具的出现,AI正快速渗透到越来越多艺术创作领域。有意思的是,三者的大众影响力大相径庭,Sora发布对人们的冲击力最大,而抵制AI绘画的呼声则最高。
“小步快跑”之下,AI艺术创作究竟有哪些进步?哪种艺术创作最不容易被AI取代?AI艺术创作是否还有更多可能性?记者就此采访了相关专家和玩家。
一曲成名,“无名之辈”有了主题曲
今年元旦,米哈游旗下开放世界冒险游戏《原神》发布5.3版本《炽烈的还魂诗》,来自提瓦特大陆纳塔地区的“火神”玛薇卡和来自至冬地区的愚人众执行官“队长”迎来高光时刻。
《原神》纳塔新版本“火神”玛薇卡。 米哈游提供
“火神”“队长”都是原神团队用多个版本铺垫的人物,拥有大量台词和动画演出,甚至有自己的主题曲。令人意外的是,一个并未过多着墨、甚至没有形象的角色,通过一首极具传唱度的AI二创歌曲而火了起来,它就是“蛇王”奥奇坎。
奥奇坎的故事零星散落在开放世界的各处文本中,需要玩家探索获得,将文本输入音乐生成模型Suno AI并选择相应曲风,一次可生成两首歌曲。在朗朗上口的旋律加持下,奥奇坎的故事很快被传播开来,并拥有了不输于“火神”和“队长”的人气。
歌曲的“破圈”能力不容小觑:《原神》2022年出圈歌曲《神女劈观》的B站播放量已近3600万;米哈游另一款旗舰作品《崩坏星穹铁道》上个版本匹诺康尼的主题曲《不眠之夜》的B站播放量已达4300多万;而今年上线的《绝区零》,米哈游甚至会给每个出场角色专门定制歌曲。
《原神》剧情图。米哈游提供
奥奇坎的“传播奇迹”让众多网友在探索原神大世界时有了更多乐趣。有人注意到,三年前《原神》的璃月版本,有一个与奥奇坎经历相似的角色若陀龙王留下了大量文本。珠玉在前,或许若陀龙王由玩家二创的主题曲也已在路上。
有手就行,AI艺术创作已超人类平均值
AI作曲真的有手就行?上海温哥华电影学院3D动画系主任、AI创作“发烧友”徐一然现场演示了用Suno AI作曲的全过程。最简单的操作只需两步:文本填入对话框,点击开始即可,一次能生成两首歌曲。如果想要生成更有个性的歌曲,可将文本按照前奏、主歌、副歌、桥段、尾奏等作曲格式标注好,在提示词中写明需求,比如用什么乐曲、表达什么样的情感等,并选好曲风。
Suno AI最新V4版本界面截图。
去年底,Suno AI发布了全新版本,带来了两个非常实用的功能。一是可以“定向创作”,也就是用户可上传音频,比如随口哼出的一段旋律,在基础上,AI可以续写补全为一首完整的歌,不限时长。二是可以指定声音作为唱歌者,比如在《奥奇坎金曲》中,UP主就上传了自己的声音,而后续翻唱者则发布了各自声音的翻唱版本。
与Suno AI的迭代策略相似,Midjourney也在以小步快跑的方式更新。“现在AI绘画已经很少出现多个指头的情况了,用户也可选中局部画面进行生成。”徐一然说。
相比之下,去年被视为AIGC(生成式人工智能)领域“王炸”的Sora却掉队了,如今AI文生视频模型的头把交椅已被快手旗下的“可灵”稳稳占据。自去年下半年起,Midjourney+可灵几乎是外网视频生成的标配。徐一然说,相较于Sora,可灵在清晰度、文本理解能力和视频长度方面实现超越。更重要的是,可灵已拿出商用产品,而Sora磨磨蹭蹭一年半后才推出面向公众的版本,市场早已被瓜分。
AI生成图。徐一然提供
徐一然曾用可灵生成过一个女孩手推玻璃罩的场景,可灵已经能意识到当女孩的手接触到玻璃时会产生“凸透镜效应”,因此画面上的手看上去变大了。Sora引以为豪的2分钟生成视频长度也被突破,可灵上个版本已可实现无限延续,不过目前画面仍难以保持统一。徐一然预测,以当下的速度发展下去,可灵再迭代两三个版本,就能解决画面统一的问题。
事实上,互联网上已经有越来越多的可灵生成视频占据人们的眼球,目前最火的是“小猫做饭”和“手办动了”两类,观众甚至意识不到它们是由AI生成,而把它们当成是某类动画。而就大多数AI生成艺术作品的质量来看,已超人类平均水平。
回归文字,艺术领域开疆拓土仍需靠人
同为AI艺术创作,大众的接受度却高低有别,其中接受度最低的是AI绘图。《游戏研究》编辑、游戏主创王安础注意到,2022年底曾发生过一场关于AI创作的大规模讨论,主要是由于AI绘画引起的。去年,不少游戏因疑似使用AI绘画而陷入争议,但被质疑的厂家一律选择以沉默回应。
网友指出游戏疑似使用AI绘图。
AI作曲虽存在争议,但赞赏的声音也很多。古风歌曲爱好者兔美表示,以前她根本接触不到好的作曲编曲,而且花钱请人作曲的成本很高,尽管她有作词能力,但成曲寥寥。有了AI作曲工具后,她可以生成很多作品,而且效果不差。
对于AI视频,人们似乎从一开始就接受了它的存在。业内专家曾这样评价Sora:往小了说,是文生视频技术突破了一个数量级,可直接应用于短视频、广告等行业;往大了说,它提供了理解、重建和模拟这个世界的可能性。
为什么会同为AI艺术创作,接受度却不相同?王安础看来,主要是由于受众基数不同以及不同艺术形式的创作门槛不同。简单来说,受众基数越小、创作门槛越高、人们的接受度越高。
贾樟柯用可灵创作的第一支AI电影截图。
B站UP主“孙工普拉斯”则从创作灵感出发提供了另一个观察视角。绘画事实上是个体力活儿,从古至今,创作一幅画作少则几天,多则几年,而绘画的“神来之笔”大多是在绘画的过程中产生的,大量雷同的AI作品并不能给画师提供灵感,反而压低了他们的收入。
音乐则不一样,它的灵感大多源于创作之前。比如创作出《云宫讯音》的许镜清,是听到一帮民工敲饭盒“丁零当啷”的声音后才有了灵感,于是很快写下了经典之声。因此,当作曲家枯坐案台毫无灵感时,听听AI创作,或许能从各种音符的拼接组合中找到灵感,写下属于自己的作品。因此,作为提升生产力的工具,AI作曲无论在专业人士还是普通人群中的接受度都更高。
《奥奇坎金曲》播放量已达180万。
在科学界,爱因斯坦曾有个一个比喻:顶尖科学家是游走在人类认知边界的人,当他们向外探出一小步,人们认知的直径就扩大一点。在徐一然看来,艺术家则是游走在人类精神认知边界的人,AI能够达到人类艺术的平均水准,但开疆拓土永远要靠人。
有趣的是,当AI让艺术创作变得“有手就行”,一项人人都会却总是被忽略不计的能力却愈发凸显出其重要性,那就是文字功底。对Suno AI来说,歌曲好坏的胜负手变成了歌词,那些优美、押韵的文字大概率能一键生成一首好听的歌。而当遇到不那么好的文字时,甚至AI都会“吞”掉一部分来保持乐曲的整体和谐。