还记得那个让全网炸锅的“AI孙燕姿”吗? 一夜之间,那个独特的声线唱着周杰伦、唱着王心凌,甚至唱着摇滚,席卷了各大音乐平台。 有人听得热泪盈眶,感慨“青春回来了”;也有人怒斥这是对歌手版权的亵渎,是技术的“鬼魅”。 这场狂欢与争议的漩涡中心,不过是某人用开源AI模型,花了几个小时“训练”出来的成果。 它像一颗投入湖面的石子,激起的涟漪至今未平。 而当时很多人没意识到的是,这根本不是石子,而是第一块被推倒的多米诺骨牌。
“AI孙燕姿”背后那个叫So-VITS-SVC的开源项目,在技术圈里早已不是秘密。 它的逻辑并不复杂:收集目标歌手足够清晰的音频素材,丢给模型进行训练,最终得到一个能模拟其音色、唱腔的“声纹模型”。
之后,你想让这个声音唱什么,只需提供任何一首歌的伴奏和旋律指引,它就能“唱”出来。
整个过程,从数据准备到最终生成,在消费级显卡上,可能只需要几个小时。 成本呢? 几乎可以忽略不计。 这技术的门槛,低得可怕。
门槛低,意味着什么?
意味着人人都可以成为“制作人”。
一时间,B站、抖音、网易云音乐上,“AI歌手”翻唱的作品呈爆炸式增长。 不仅仅是孙燕姿,周杰伦、陈奕迅、邓紫棋……几乎所有你能想到的流行歌手,都有了他们的“AI分身”。 这些作品的质量参差不齐,有的还带着明显的电音和拼接感,但其中顶尖的那些,已经到了足以“以假乱真”的地步,让不少粉丝都难以分辨。 这引发了一场前所未有的伦理与法律地震:这算创作吗? 这侵犯了什么?
歌手的声音,难道就这样变成了一串可以随意复制、修改、拼接的数据?
争议的焦点首先砸向了“版权”。 歌手的声音,或者说“声音肖像权”,在法律上一直是个模糊地带。 传统的模仿秀需要真人付出劳动,而AI的模仿是纯粹的数字化复制。 2023年,国内已有音乐平台开始下架未经授权的AI歌手作品,但下架的速度远远赶不上上传的速度。 平台方也很头疼,识别技术还在追赶生成技术。 更棘手的是,很多创作者用的是“音色融合”技术,即用一个歌手的音色去唱,但调整了部分参数,让它听起来“像”但又“不完全像”。 这就在原创和侵权之间,划出了一片巨大的灰色沼泽。
如果说模仿明星还只是“娱乐”,那么这项技术对音乐产业基层的冲击,才是真正深远的。 想象一下,一个影视项目需要一首贴合的插曲,预算有限。 过去,他们可能需要聘请作曲、作词、编曲,再邀请歌手进棚录制,周期长、成本高。 现在,他们完全可以购买一个成熟的“AI歌手”模型服务,或者直接定制一个虚拟歌手的音色,输入曲谱,几分钟内就能得到数版不同情感表达的演唱小样。 效率的提升是颠覆性的。 这对那些依靠演唱demo、和声、小样录制为生的职业歌手和棚虫来说,几乎是降维打击。
行业里已经出现了真实的案例。 一些游戏公司和动漫制作方,开始尝试使用AI生成角色歌曲。 他们不再需要协调歌手那排得满满的档期,不再需要支付高昂的录制费用,甚至可以在后期根据反馈随时调整演唱的细节——比如“第二句再悲伤一点,尾音拖长0.3秒”。 这种控制力和灵活性,是真人录制难以企及的。
虽然目前顶级的商业项目为了品质和口碑,仍会首选真人巨星,但中腰部及以下的市场,正在被快速渗透。
这股风潮也吹到了音乐创作本身。
很多独立音乐人开始兴奋地拥抱这项技术。
他们没钱请心仪的歌手,但现在,他们可以“拥有”一个近似的声音。 他们用AI生成人声部分,再进行精修和混音,完成自己的作品。 这极大地降低了创作的门槛,激发了表达欲。 网络上涌现出一大批署名“AI某某某”的原创歌曲,其中不乏旋律抓耳、制作精良的作品。 这算不算音乐民主化的一种体现? 反对者则认为,这稀释了“演唱”作为一门艺术的价值,当声音可以无限量产,情感和技巧的独特性何在?
技术的双刃剑效应在这里赤裸呈现。 一方面,它赋予了普通人前所未有的创作工具;另一方面,它也在解构和重塑“歌手”这个职业的定义。 未来的歌手,或许不再仅仅比拼嗓子和唱功,更要比拼其声音数据的“版权价值”和不可替代的“人格魅力”。 声音可以克隆,但站在舞台上的鲜活个体、与观众的情感联结、以及每一次现场演唱的即兴与瑕疵,这些暂时还无法被复制。 这或许会成为真人歌手最后的“护城河”。
围绕AI翻唱的争论,还牵扯出一个更根本的哲学问题:我们听歌,到底在听什么? 是听那副独一无二的嗓子,还是听嗓音背后那个人的情感、经历与故事? 当AI用泰勒·斯威夫特的音色唱出一首伤感情歌,听众被打动,这份感动是真实的吗? 如果答案是肯定的,那么艺术创作中“人”的主体性,又该置于何地?
这个问题没有标准答案,但每一个被AI歌声触动的人,都在用耳朵投票,参与这场关于艺术本质的大讨论。
法律的反应总是慢技术半拍。
全球范围内,针对AI生成声音的立法都处于探索阶段。
2024年,美国田纳西州率先通过了《确保声音、图像和 likeness 安全法案》,旨在保护艺术家免受AI模仿的侵害。 中国相关行业协会也多次发声,呼吁加快立法进程。 但具体如何界定侵权、如何取证、如何执行,仍是难题。 尤其是当技术普及到个人用户层面,执法的成本将高到难以想象。 很可能,最终形成的是一种动态的平衡:商业用途被严格监管,而个人非营利的“玩票”行为,则存在于默许的灰色空间。
音乐流媒体平台此刻正站在十字路口。 它们既是AI歌曲传播的主要渠道,也是传统音乐版权的守门人。 它们被迫成为“裁判”。 平台需要开发更精准的AI识别技术,从海量上传中筛出可能侵权的作品;同时,它们也在试探性地与一些技术方、版权方合作,探索合法的AI音乐商业模式。 比如,推出官方的“AI歌手”功能,让用户可以使用平台授权的歌手音色进行创作,并分享收益。 这或许是一条出路,将野蛮生长的地下技术,纳入可控的商业框架。
从“AI孙燕姿”爆火到现在,不过两年左右的时间。 这场由技术引发的海啸,已经彻底改变了音乐产业的潮汐方向。 它撕开了口子,让我们看到了一种新的可能:音乐制作将变得越来越“去中心化”,越来越“数字化”。 声音作为一种元素,将被像颜料一样拆解、调和、使用。 在这个过程中,旧的秩序在崩塌,新的规则在泥泞中摸索建立。 每一个听众,每一次播放,每一次争论,都在无形中塑造着未来音乐的样貌。
这场实验远未结束,它才刚刚开始,而我们都身处实验室中。