Google 宣布为使用 Vertex AI 的 Google Cloud 客户提供其视频生成模型 Veo 的私人预览版。该公告允许 Quora 和 Mondelez International 等公司利用这项人工智能技术进行创意和营销。
Veo 于 4 月推出,可以生成高清视频,包括各种帧速率下长达 6 秒的 1080p 剪辑。用户可以通过提供图像和提示来创建视频,从而使模型能够捕捉不同的视觉和电影风格。谷歌云产品管理高级总监 Warren Barkley 强调,对 API 的漫长等待是因为增强了企业准备模型。
该模型擅长生成爆炸等特定效果,并理解基本物理概念。它还可以执行屏蔽编辑,允许用户修改视频中的特定区域。尽管 Veo 具有多种功能,但它仍表现出当前生成式 AI 的典型不一致之处,例如消失的物体和不切实际的物理行为,导致其使用存在潜在限制。
Veo 和 Imagen 3:它们提供什么
谷歌推出了 Veo 和 Imagen 3,这是一种生成图像模型,旨在根据文本提示生成最高质量的图像。这两种模型都将提供给 Vertex AI 客户,Imagen 3 将于下周广泛使用。已经开始使用这些工具的公司包括 Oreo 和 Cadbury,并强调其商业应用。
以下视频提示: 美丽的日落、柔和的光线、温暖的色彩,一个孤独的牛仔骑着马穿过开阔的平原。
(视频:谷歌)
以下视频提示: 空中拍摄的一座灯塔高高地矗立在岩石悬崖上,它的灯塔穿过黎明,海浪拍打着下面的岩石
(视频:谷歌)
巴克利指出,生成式人工智能正在推动业务转型,86% 的企业报告收入增长。他表示,谷歌致力于推进生成式人工智能技术,这一点在他们最新的 Veo 和 Imagen 3 产品中就可见一斑。
为了解决潜在的滥用问题,两种模型都将采取保护措施来防止有害内容的生成。此外,所有输出都将带有数字水印,包括 Google DeepMind 的 SynthID,它嵌入了隐形标记以打击错误信息和错误归因。谷歌坚称,它不会使用客户数据来训练其模型,而是专注于公开可用的数据集。
自 Veo 首次发布以来,增强企业功能一直是首要任务。该模型是使用大量高质量视频样本进行训练的,但有关特定训练数据源的详细信息仍未公开。巴克利承认,虽然某些数据可能包含 YouTube 内容,但它是根据谷歌与内容创作者的协议运作的。
谷歌的主动方法还解决了与生成人工智能相关的知识产权风险。 Veo 将提供提示级过滤器来阻止暴力和露骨内容,巴克利表示 Veo 输出将附带赔偿政策,以保护用户免受版权侵权索赔。
随着 Veo 逐渐集成到更多 Google 产品中,该模型于 5 月份通过 Google 实验室进行了试用,并于 9 月份宣布作为 YouTube Shorts 的一部分。然而,谷歌在生成人工智能领域面临着来自 OpenAI 和 Adobe 等公司的竞争,这些公司很快就与各种工作室和创意机构建立了合作伙伴关系。
特色图片来源:Google DeepMind
谷歌的新人工智能工具正在永远改变视频和图像创作的帖子首先出现在 TechBriefly 上。
Source: 谷歌的新人工智能工具正在永远改变视频和图像创作
