文章来源:华尔街见闻

8月2日周三,Meta推出一款新的面向音频和音乐的名为AudioCraft的生成式AI工具,该工具可以帮助用户根据文本提示创作音乐和音频。

这款AI工具将AudioGen、EnCodec和MusicGen三种模型或技术融为一体,可用文本内容生成高质量、近乎真人创作的音频和音乐。

其中,MusicGen接受过Meta拥有的和特别授权的音乐训练,可以从文本提示生成音乐;AudioGen接受过公共音效训练,可从文本提示生成音频,比如模拟狗叫或脚步声;再加上EnCodec编解码器的改进版本,用户可以更高效率地生成更高质量的音乐。

Meta称,AudioCraft系列模型能够产生具有长期一致性的高质量音频,并且易于使用:

Meta指出,AudioCraft适用于音乐、声音、音频文件的压缩和生成。因为它很容易构建和重用,所以想要构建更好的声音生成器、压缩算法或音乐生成器的人可以在同一个代码库中完成这一切,并在其他人所做的基础上进行构建。

Meta称:

所有Facebook用户都可以安装AudioCraft,Meta特别邀请研究人员和音乐专业人士使用这一工具:

Meta于2022年10月推出了其第一个版本的EnCodec,作为一种AI工具,用于在不损失音质的情况下压缩和解压缩音频文件,以便用户快速轻松地共享音频文档。其目的是提高所有音频文件的质量,而不仅仅是音乐文件。当时,它特别针对提高语音通话和语音消息的质量,特别是在网络连接不佳等不利情况下。此后该模型不断发展,如今与AudioGen和SoundGen一起推出,作为一种工具,帮助合成声音和音乐在实际播放时显得更为真实。

虽然一些艺术家已经采用人工智能生成工具来获得更多创造力,但其他艺术家却对侵犯版权持批评态度。

推荐内容