“我用AI回答你的问题吧。”清华大学新闻学院、人工智能学院教授沈阳在面对南方周末记者采访时回应。人机共生已成为他的工作生活方式。
2023年下半年开始,沈阳迷上了AI创作,他用AI写诗、写小说、绘画、写歌。有了AI,即使是他这种“小白”也能拓宽人生的可能性。
机缘巧合下,国内一档原创音乐的综艺节目邀请沈阳参与录制。为上节目,他和团队专门创作了AI作品《逆风》,可惜最终没有被歌手选中。多名歌手表示,AI作品“没有灵魂”,但AI跑出的歌手声音与歌曲的匹配度,让他们惊叹。
AI已引起整个音乐行业的注意。2024年3月,海外音乐大模型Suno发布,不少音乐人尝试使用AI生成歌曲后,直呼惊艳。
24岁的昌伦越(网名“概念黁”)是短视频平台小有名气的音乐达人,他发了一则短视频分享用Suno生成歌曲的感受。虽然整首歌结构有些怪,“但总有一两句很抓耳的旋律”。
中国科技公司也在研发生成式AI音乐,如腾讯音乐娱乐集团(TME)的琴乐大模型、网易天音、抖音豆包、趣丸科技的天谱乐、昆仑万维的天工SkyMusic等。
网易CEO丁磊曾在2023中国数字音乐产业大会上作出判断,“人工智能在未来一至两年内,大概率会成为音乐行业的标配”。
人做一两天,AI十几秒
随着Suno爆火,80后唱作人宋宝宇很快加入AI大军。他曾以歌手身份发过专辑,更多时候是音乐制作人,与众多一线艺人合作。
他将自己创作的影视配乐《伴你月落星沉》词作上传到Suno,输入曲风描述,十几秒就生成了两首歌。再依次输入流行、R&B、摇滚、嘻哈等曲风类型后,他一下子得到了八首歌。
有些歌曲片段听起来竟然还不错,“平时做首歌或demo(录音样带),通常要几天时间,最快也得一天,赶工的话质量还会受影响。”
《伴你月落星沉》经过宋宝宇工作室与各环节制作人反复调整修改而成。这也是大部分音乐作品的必经之路:先是词曲创作,再找人编曲,再请乐手录入乐器,请歌手录制人声,最后由混音师混音制成歌曲母带。
“可能吭哧吭哧做了一个月的东西,反而不如AI三分钟做出来的,还能批量生产。”宋宝宇看到一些音乐人的焦虑,当AI作品大规模灌入市场,受众习惯这类音乐,个性化的作品也许会慢慢无人问津。
即使没有AI音乐,这种现象也已经存在。深层原因是,当前流行音乐市场已经不同于往日,“以前是我写什么,你听什么,现在是你听什么,我写什么”。
宋宝宇的音乐工作室会接到一些制作案,有些案子不需要个性与创意,客户已有明确想法。有的客户更愿意做老歌翻唱,或做迎合市场口味且已有热度的歌。不管是音乐平台还是买了歌的版权公司,比起冷启动的原创,花钱做这两类歌的回报更高。
接受采访的前两天,宋宝宇打开Apple Music2024音乐榜单,中国区TOP50中有40首歌来自周杰伦,现在一打开短视频平台,听到的新歌就像“不是周杰伦唱的‘周杰伦’”。
受众爱听周杰伦、林俊杰,市场上就会有一帮人专门去写成周杰伦、林俊杰。“这样套路化地复制歌曲,AI比他们还擅长”。
没“人味儿”
沈阳提出,AI创作的两大方向,一是人机共生,二是人机优生。前者是帮助“小白”降低表达门槛,后者是帮助有能力的创作者优化内容。
但受访的多数音乐人认为,目前AI真正能辅助创作的部分不多,甚至有人不希望AI过度介入。
2001年出生的新生代音乐人惟风,是一家音乐厂牌的签约词曲作者,负责原创歌曲制作。他也尝试过用AI作曲、编曲,整体感觉是“可有可无”。
他说,AI的确可以迅速生成框架型编曲,但这种框架只会重复过去的套路,最多中游水平。想要更好的效果,还得靠人来重新编排。AI作词还很初级,不具备人类的情感表达能力。
惟风举了个例子,方文山写“冷咖啡离开了杯垫”,下一句写“我忍住的情绪在很后面”。AI会怎么接呢?它改成了:“在冷咖啡离开了杯垫的瞬间,回忆涌上心头,仿佛时间停滞了片刻。窗外雨点轻轻拍打,思绪在空气中飘荡,忧伤和温柔交织成画。”
“AI写词要么堆砌意象,要么过度扣题,缺乏文学意义上的逻辑与情感的流动。”惟风说。
同样,人类也无法通过下达准确的指令,让AI理解真实的需求。那些“可意会不可言传”“难以量化”的部分,宋宝宇形容为“人味儿”。
在音乐制作时,“难以量化”的时刻很多。一些歌手、艺人会用“热烈一点”“气势还不够”“不够悲伤”等说法跟音乐人描述需求。混音环节里,宋宝宇需要拿给各制作方听,反复打磨整体或局部音量响度,“必须人来手工细调,才能确保大家听到的是舒服的”。
“未来AI应该也能总结出几种‘热烈’的模板,但还是很难能直接理解人的具体需求,使用起来效率不如人高。”宋宝宇说。
抖音音乐人粉太狼因翻唱走红,2024年开始自己写歌,音乐人朋友认为“用AI创作,会浪费个人天赋”。她暂时没有使用AI。昌伦越考虑使用AI生成旋律找灵感,或翻唱demo听效果。
多名业内人士表示,当前AI技术更多介入的是人声部分。
一首歌做完后,音乐制作人需要先找人唱一遍,做成demo才能拿给艺人。“我们自己或身边人也能唱,考虑到歌曲风格、特质,也需要花钱请更适合的音色。”宋宝宇说。
Demo帮唱歌手的价格几百到几千元不等,AI做声音建模虽也可能付出一定成本,但能贴合需求。“即使不能作为发行级,用AI唱demo对表达歌曲大致样貌是有帮助的”。
宋宝宇相信,未来AI在演唱上的技术还能继续突破。他在短视频上常能刷到一些快速学唱的内容,在歌词上标注强弱重音、轻声叹气,“其实也跟调教AI差不多”。
不过即使AI演唱能做到“像人”,受访者也普遍表示很难真正有“人味儿”。
“听众更愿意听到真实的东西,这才打动人。”金队长(网名:金队长教唱歌)毕业于星海音乐学院,他的学生不乏专业歌手。他提到,真人演唱受到情绪、情感影响,肉嗓表达的缺陷反而会带来特别的感觉,AI太过稳定反而没有生机。
说唱是昌伦越擅长的领域,AI很难达到说唱独特的演唱氛围,“每个rapper都有个性化的腔调(flow)”。这跟市面的AI翻唱不同,AI翻唱的原歌手本就有腔调,只是把他的音色换成另一个人而已。
预测爆款
每天,都有十万量级的歌曲涌入音乐平台的曲库,demo更有几百万首。凭借人力,在海量的曲库中淘出优质歌曲,效率很低,AI则能解决这个问题。
“让AI算法理解音乐,对我们平台很重要。”TME技术副总裁、天琴实验室负责人周文江对南方周末记者说,过去互联网音乐平台主要依靠专业的内容运营团队来做,现在AI能够理解一首歌的类型、风格、品质好坏,再精准推荐给用户。
TME天琴实验室的前身是TME多媒体研发中心,研究前沿技术,为旗下多个音乐平台用户提供优质视听体验,比如听歌识曲、音质优化。
2019年后,在AI技术支持下,天琴实验室推出一项以音乐品质预测为主要功能的工具,即Predictive Model(PDM)技术。经过AI演算,平台得以辨识一首未被市场验证过的demo是否动听或有爆款潜质。
该技术应用在TME旗下音乐平台优质歌曲的挖掘和宣推上,也在TME旗下音乐人创作平台落地。这一平台有大量的词曲作者上传作品,PDM技术会给这些作品预测打分,对比市面上爆款歌曲特征,预测其可能的流行度。“高分demo很多唱片公司抢着要。”周文江说。
“AI的判断有一定合理性,但不能说放之四海皆准。”惟风之前有首歌在PDM评级为S(特级),也没有人买,最后推给朋友才卖掉。
AI算法真的能抓住爆款吗?
2023年,惟风一首词作《会开花的云》在短视频平台意外爆火,登上酷狗、抖音热歌榜,各音乐平台均达到百万量级收藏,但却曾是个没人要的“废案”。
这首歌火了以后,惟风总结经验,一是旋律抓耳,二是歌词指向性不明,受众范围广。也有人模仿它,却连热榜前十都进不去。AI肯定也能把热歌规律总结出来,但“最多保持(作品)数据的可观性,产生不了真正的爆歌”。
2024年年中,昌伦越发布了一则颇带讽刺意味的短视频,套用热歌公式、教学创作能爆火的口水歌,视频里创作了一首名为《Social Media》的歌。
“‘口水歌’旋律上得洗脑,给人似曾相识的感觉;歌词要能引起共鸣,特别是伤感情歌或网络热点。”昌伦越的试验成功了,教学视频获得393.2万次点赞,仅一分多钟的《Social Media》吸引五千多人互动,平台播放量达2.3亿。
在宋宝宇看来,不管是平台还是音乐人都要去拥抱用户需求,这是不可逆的趋势。AI和大数据对音乐价值判断,一定程度上就是基于对人性的判断。“既然是你听什么、我做什么,那肯定是好预测的。”
人人都能写歌
周文江介绍,对成熟的音乐厂牌而言,在原有创作体系中引入AI将是一个缓慢而谨慎的过程,但已有一些音乐人开始用AI辅助其创作。
2024年4月,TME与上海民族乐团合作打造一台AI民乐音乐会,这也是琴乐大模型的舞台首秀。琴乐大模型由天琴实验室和腾讯AI Lab共同研发。
“目前业内公认顶尖AI音乐生成技术只有60分的创作水平。”周文江说,考虑到要达到音乐会演奏级的要求,采用由琴乐大模型创作片段、上海民族乐团二次创作的办法。合作中,周文江发现AI的确在帮助音乐人启发灵感或整理素材阶段能提升效率。
相对于流行音乐,民乐的演奏时间更长,加上演奏者的不同习惯和风格,复杂度更高,对AI带来更多的挑战。
宋宝宇期待AI技术能更实用,起到创作流程细节优化的作用。比如录音师常常要处理几百个有待调整的音乐素材,AI能自动替换优质素材或自动对齐人声。
曾任《中国新声代》第六季音乐总监的吴欣舟(网名:乐感音乐吴老师)提到,AI辅助创作的价值在于帮助音乐人实现想法,“AI要能做到听到一首歌,就能准确地将和弦写出来”。
受访者普遍认为,AI生成技术只是工具,不足以取代优秀的音乐创作者,AI生成技术的另一发展方向应是服务普通用户实现自我表达。
“就像有了数码相机,普通人按下快门就能记录生活,摄影不再属于专业摄影师。”周文江希望生成AI音乐也能成为普通人的一种生活方式。
TME旗下音乐平台已上线AI帮唱和AI歌声功能,有用户表示“我唱不上去的高音靠AI安慰”。TME还与王力宏签约,开发AI力宏,这是首位获官方授权的“全AI”歌手。
冬至,一位地产学者在朋友圈发布了他的第一首AI作品。这位学者今年60岁,年轻时爱好写诗,“有感而发,写了首词交给AI帮助谱曲,自己喜欢就好”。他对南方周末记者说,写诗与写歌不同,歌更能宣泄情绪,感染他人。
当每个人都使用AI生成作品,随之而来的是AI侵权风险。
2024年4月,两百多名国际乐坛知名音乐人签署联名信,要求停止使用AI侵犯人类艺术家权利,承诺不开发与之相关的音乐生成技术。
“生成式AI音乐是有涉嫌侵犯著作权风险的。”前腾讯音乐法务顾问、广东知恒律师事务所股权高级合伙人、律师孙聪向南方周末记者介绍,AI音乐大模型要使用海量现有音乐作品训练学习,难以保证所有数据来源合规,但一些大型音乐平台在与版权方的合作协议中,通常会包含相关的权利授予,规避其未来发展AI大模型的侵权风险。
孙聪查阅多家AI平台的用户协议,通常来说,协议会规定用户输入文字产生的图片或音乐版权归用户,但不得侵犯第三方的合法权益,平台仅是UGC(用户生成内容)平台,只要接到权利人投诉,根据“避风港原则”及时下架侵权链接即可不承担连带侵权责任。若是个人用户基于学习研究或欣赏的非商业目的使用别人已发表作品,构成合理使用行为,可不经过著作权人许可。
关于用户使用AI生成的作品如何界定版权,还没有明确法律规定。孙聪介绍,美国、日本目前暂时拒绝AI作品的版权登记,但国内的“AI绘画侵权第一案”中,法院认为用户输入文字,是基于用户智力投入直接产生,能体现用户个性化表达,构成著作权保护的美术作品。
生成式AI音乐这两年才发展,目前还没有相关司法判例,法院对于AI侵权案也采取审慎态度。“AI绘画侵权第一案,法院最后只判赔500元,是著作权侵权法定赔偿的最低额度。”孙聪说。