谷歌不断向音乐领域发起挑战,人人都能创作音乐的时代似乎离我们更近了一步。
12月14日,谷歌推出AI音乐创作工具“MusicFX”,用户仅用几句话就能生成原创音乐作品。
谷歌在介绍中指出,这款名为“MusicFX”的创作工具融合了谷歌此前发布的MusicLM模型与DeepMind的水印技术SynthID,以便事后识别是否由AI制作,在一定程度上可以解决创作者对于版权问题的担忧。
分析人士认为,MusicFX 的出现也将成为 AI 领域的一个重要里程碑,为音乐家、制作人和音乐爱好者尝试和创作各种音乐开辟了新的可能性:
MusicFX 为音乐创作者提供了丰富的音效和声音素材,用户可以创作各种类型的音乐,同时支持音高、节奏和音量的调节,并添加混响、回声等效果。无论你想营造舒缓的氛围,还是冒险紧张的氛围,MusicFX 都能满足你。
目前 MusicFX 仍需通过谷歌的 AI Test Kitchen 进行访问,该平台旨在让用户尽早体验其最新的 AI 技术,并提供早期反馈。这种协作方式可以帮助谷歌改进其技术并遵守道德标准。
媒体分析认为美国听音乐软件,MusicFX 的推出不仅将为音乐生成提供新的工具,也代表了 AI 发展的一种趋势。用户在帮助企业改进和塑造人工智能方面的作用越来越重要。通过早期让用户参与,谷歌不仅增强了技术,还积极应对了潜在的道德问题。
此外,MusicFX的出现或许会降低音乐创作的门槛,让更多没有接受过专业音乐训练的爱好者能够参与其中。
然而,MusicFX 的出现并非毫无争议。有人认为美国听音乐软件,如何解决 AI 生成内容对版权、所有权和音乐原创性的影响,目前仍无答案。谷歌决定在 AI 生成的音乐中使用水印,表明了他们对这些问题的关注,但这个问题并没有得到解决。AI 生成的内容是原创的吗?
对于接下来的计划,谷歌表示,他们将继续根据用户的反馈改进 MusicFX。MusicFX 有可能重新定义创作音乐和与音乐互动的方式。AI Test Kitchen 或将成为未来 AI 发展的典范。这种方式可以推动人工智能发展进入一个责任新时代,在这个时代,技术与社会价值观和规范齐头并进。
MusicLM 有多强大?
今年年初,Google MusicLM 上线,它可以根据文字、图片自动生成音乐,而且音乐风格多样,基本上你想听什么音乐都可以自动生成。
MusicLM 是一个基于文本的音频生成模型,可以根据文本描述生成高保真音乐。该模型采用分层的序列到序列方法,能够在几分钟内生成一致的音乐。
MusicLM 使用三种模型提取音频表示作为条件自回归音乐生成的输入:SoundStream、w2v-BERT 和 MuLan。
其中AudioLM模型可以视为MusicLM的前身,MusicLM采用了AudioLM的多阶段自回归建模作为生成条件,可以通过文字描述生成频率为24kHz的音乐,并维持这个频率几分钟。
相比之下,MusicLM 拥有更多的训练数据。为了解决该任务评估数据不足的问题,研究团队推出了第一个专门针对文本-音乐生成任务的评估数据 MusicCaps。MusicCaps 由专业人士共同打造,涵盖 5500 个音乐-文本对。在此基础上,谷歌用 28 万小时的音乐数据集训练了 MusicLM。
但此前有媒体分析称,MusicLM 肯定不是完美的,或者说距离完美还相当远。部分样本仍存在质量问题,而且 MusicLM 虽然在技术上可以生成人声,包括完整的和声,但仍有很大的改进空间。大部分“歌词”也是蹩脚的英语或纯粹的胡言乱语,再由合成人声唱出来,听起来就像是奇怪的“混合”。
人工智能生成音乐的版权风险:它是原创的吗?
AI跟人类一样,偶尔也会偷懒,直接抄袭这些素材,版权该如何保护?
在一项实验中,谷歌研究人员发现,系统生成的音乐中约有 1% 是直接抄袭自其训练歌曲。这个问题足以让研究人员不愿过早发布 MusicLM。此外,将收集的素材用于 AI 学习本身是否涉及侵犯版权?
事实上,相关案例早已有之,2020年,美国说唱歌手Jay-Z的唱片公司就对YouTube频道Vocal Synthesis提出版权警告,理由是该频道使用AI创作歌曲,例如Jay-Z翻唱的Billy Joel的《We Didn't Start the Fire》。
美国音乐出版商协会的 Eric Sunray 撰写的白皮书指出,MusicLM 等人工智能音乐生成器“从训练数据库中吸收作品中的连贯音频”,侵犯了美国版权法规定的复制权。
此外,AI生成的音乐虽然“原创”,但听上去往往像是不同音乐家作品的混合,有抄袭甚至伪造的嫌疑。
因此,谷歌利用DeepMind的水印技术SynthID来生成ID,体现了其对版权问题的重视。谷歌表示,所有生成的歌曲都带有人耳无法听到的数字水印,不会影响音乐的效果。这主要是通过将音频波转换为二维可视化来实现的。即使对数字水印进行添加噪音、音质压缩、音频速度调整等破坏性操作,歌曲中的水印依然可以被检测到。
不过,也有分析指出,谷歌虽然加了水印证明音乐是AI创作的,但仍未能解决根本问题:AI系统生成的音乐算原创作品吗?能与“人工音乐”相抗衡吗?
伴随着关注与争议,或许在不久的将来,这些问题都会有明确的答案。