Google 的新生成媒体模型令人惊叹：Veo、Imagen 3 等

谷歌展示了其在高效媒体技术方面的最新进展。该公司推出了 Veo 和 Imagen 3 模型，提高了视频和图像创作的标准，令创意界兴奋不已。

该公司还分享了使用 Music AI Sandbox 创建的新演示录音。谷歌这些创新的目标是通过扩大人工智能在创作过程中的作用来增强艺术家和创作者的能力。

近年来，人工智能技术彻底改变了艺术和创造力。新模型丰富了艺术家和创作者的视野，同时也不断突破技术世界的界限。在此背景下，人工智能支持的视频和视觉制作工具打开了音乐领域的新大门，创造出高质量的内容。这是新型号！

Google 的 Veo 提供什么？

谷歌正在通过其下一代视频创作模型 Veo 提高人工智能驱动的媒体制作的门槛。 Veo 以其制作高清、持久的视频、准确反映用户创意愿景的能力而脱颖而出。 Veo 能够理解电影术语并创建一致的镜头，因此变得不可或缺，尤其是对于电影制作人和数字内容制作人而言。

Veo 在视频制作的增强控制和质量方面从竞争对手中脱颖而出。 OpenAI 的 Sora 已成为视频制作领域的强大竞争对手。然而，在 Veo 和 Sora 之间确实很难做出选择。两种模型都可以制作精彩的视频。

另一方面，Veo 理解电影术语，并能以最佳方式解释用户的命令。例如，详细命令如“游戏中时光倒流“ 或者 ”空中拍摄” 允许模型生成高分辨率且逼真的视频。

Google 与电影制片人 Donald Glover 及其创意工作室 Gilga 的合作清楚地展示了 Veo 在电影制作过程中的优势。 Glover 有机会在自己的电影项目中使用 Veo 来探索该模型的功能。这次合作是谷歌通过让创意人员参与这一过程来推进技术发展战略的一部分。得益于 Veo 对电影的独特理解，Glover 能够制作出最准确地反映他的创意愿景的视频。

谷歌强调，Veo 的模型在学习理解视频内容、创建高分辨率图像以及模拟现实世界的物理运动方面已经证明了自己。因此，在理解电影术语、创建逼真的图像和提供创意控制方面，Veo 被定位为 OpenAI 的 Sora 的强大竞争对手。

这是图像 3

图 3 是另一个最大化文本视觉再现的 AI 模型。该模型可提供逼真的图像，与以前的版本相比，视觉错误更少。例如，它可以获得狼的详细肖像或具有所需细节和色调的图书馆入口的宏伟照片。 Image 3 的功能可用于从广告到艺术制作的各种应用。

这是 Google 用于 Wolf 图像的提示和结果：

提示：一只光滑的狼的特写镜头庄严地栖息在灰色背景前，细节丰富，隔离在一张平面库存照片上，在高分辨率照片中具有超现实的颜色分级。

谷歌推出新的生成媒体模型和工具：Veo、Imagen 3 等 — Imagen 3 是一种 AI 模型，可生成视觉错误较少的逼真图像（图片来源）

图书馆照片的提示和结果：

提示：雄伟的图书馆入口照片，上面刻有“中央图书馆”的石碑。

音乐中的人工智能

作为与音乐社区合作的一部分，谷歌推出了 Music AI Sandbox。这套工具允许用户从头开始创建新的乐器部分并以不同的方式转换音频。这些工具扩大了人工智能在音乐制作中的作用，并与格莱美获奖音乐家 Wyclef Jean、词曲作家 Justin Tranter 和电子音乐家 Marc Rebillet 合作使用。

三位艺术家在他们的 YouTube 频道上分享了使用 Music AI Sandbox 创建的新演示，展示了人工智能在音乐制作过程中的可能性。

另一方面，SynthID 等数字工具被用来确保在技术开发和部署过程中遵守安全和道德标准。这意味着该技术可用于进行各种安全测试、应用过滤器或添加数字水印。

人工智能继续在视频、视觉和音乐制作领域带来突破性的创新。借助 Veo 和 Imagen 3 等模型，内容制作正在以以前难以想象的方式发展。 Music AI Sandbox 等工具可以帮助艺术家丰富他们的作品。负责任地开发和使用这些技术可以最大限度地发挥其在社会中的创造潜力，同时保持道德标准。这是技术和艺术进步的一大进步。

Adobe 与 YouTube 合作开发 Premiere 移动 Shorts 空间

特色图片来源：Google

Source: Google 的新生成媒体模型令人惊叹：Veo、Imagen 3 等