这家前身为 Facebook 的科技巨头刚刚推出了 Meta AudioCraft AI 音乐生成器。
这个开源平台是用于音频和音乐生成的开创性人工智能工具套件,允许内容创作者制作 高品质音效 和 音乐 只需输入 文字描述。 有了 AudioCraft,就有可能 虚拟管弦乐队、环境音景、 和 朗朗上口的旋律 几乎是无限的。
AudioCraft 套件包含三个核心组件:
- 音频生成器: 该工具擅长生成各种音频效果和音景。 从狗叫声到木地板上的脚步声,AudioGen 可以轻松打造逼真的音频体验。

- 音乐生成器: MusicGen 专为音乐生成而定制,可以根据文本提示创作旋律和完整的音乐作品。 无论是带有热带打击乐的流行舞曲还是动人的钢琴曲,MusicGen 都可以将任何音乐创意变为现实。
- 编码解码器: EnCodec 是一种基于神经网络的音频压缩编解码器,可以以最少的伪影改进音乐生成。 通过高保真压缩和重建音频信号,EnCodec 成为 AudioCraft 音频生成功能的重要支柱。

Meta 对开源计划的承诺在 MIT 许可证下发布的 AudioCraft 中得到了体现。 此举旨在使人工智能音频工具民主化,为研究人员和从业者提供可访问的资源来实验和突破生成音频技术的界限。
Meta AudioCraft AI 音乐生成器的潜力和伦理考虑
尽管生成式人工智能模型在图像和文本合成方面取得了令人印象深刻的进步,但音频生成却落后了。 虽然 OpenAI 的 Jukebox 和 Google 的 MusicLM 等项目已经出现,但 AudioCraft 代表了在 简单性、可访问性、 和 潜在的应用。
Meta 关注的领域之一是 数据的道德使用 用于训练模型。 为了解决对潜在偏见和滥用的担忧,Meta 指出 MusicGen 在包含 20,000 小时音乐的多样化数据集上进行了训练,该数据集由 Meta 拥有或专门授权用于研究目的。 这 透明度 和 开放性 旨在帮助研究界解决潜在偏见并促进负责任的人工智能实践。 以下是 Meta 分享的一些示例:
文字提示:风呼啸而过
文本提示:警报器和嗡嗡作响的发动机接近并通过
文本提示:流行舞曲,带有朗朗上口的旋律、热带打击乐和欢快的节奏,非常适合海滩
文本提示:大地色调、环保意识、尤克里里琴注入、和谐、轻松、随和、有机乐器、柔和的律动
现在使用 AudioCraft 向公众开放, 开源开发者可以探索 整合的可能性, 使未来能够创建易于使用的生成音频工具。 梅塔的奉献精神 透明度 和 责任 在人工智能研究中,Meta AudioCraft 人工智能音乐生成器被定位为强大的工具 音乐家、游戏开发者、内容创作者、 和 企业 寻求增强他们的创意资产和经验。

音频生成的未来
随着生成式人工智能的发展,其潜力 更快的迭代 和 反馈 在创作过程的早期阶段变得越来越令人兴奋。 从 大型游戏开发商 打造沉浸式虚拟世界 业余音乐家 寻求灵感,Meta AudioCraft AI 音乐生成器承诺 彻底改变人机交互格局 通过听觉和多模式界面。
随着它的发布,该公司希望看到 Meta AudioCraft AI 音乐生成器的创新应用激增。 从丰富的睡前故事阅读和身临其境的音效到类似于合成器的新颖乐器, 创造性的可能性似乎是无限的。 随着研究社区建立在 AudioCraft 的基础上,它可能会迎来人工智能驱动的音频生成的新时代,改变我们在数字时代制作和体验音频和音乐的方式。
特色图片来源: 元





