Luma AI 是人工智能驱动的图像和视频生成领域的知名企业,推出了 Ray3,这是其首个推理视频模型,旨在以更高的精度处理复杂的动作序列。 Ray3 立即发布并可用,代表了生成式 AI 视频技术的重大进步,使创作者能够制作更复杂的剪辑,并随着时间的推移保持一致性。

Ray3创新的核心是推理能力,这与传统模型不同。与直接将文本提示转换为视觉效果的标准人工智能系统不同,Ray3 等推理模型会分配额外的计算资源来彻底处理请求。这涉及到改进输出、减少错误和添加细节的自检机制。对于视频生成,这意味着处理复杂的提示,而不会出现较长序列中常见的退化情况。行业基准表明,大多数人工智能生成的视频在 5 到 10 秒的范围内表现良好,而较长的持续时间通常会导致不一致或“不稳定”的结果。 Ray3 通过系统地评估和迭代其创作来缓解这些问题,从而实现以前具有挑战性的更高级的场景。

Luma AI 首席执行官 Amit Jain 在接受 CNET 采访时强调了该模型的评估能力。 “它能够评估并说,‘哦,这不好,或者我需要以这种方式做得更好,’”Jain 解释道,并强调 Ray3 如何超越简单的文本到像素转换,以主动提高内容质量。

Ray3 为用户引入了实用工具,作为其推理引擎的补充。新颖的视觉注释功能为模型的决策过程提供了透明度,显示注释,例如字符上的标记以进行调整或保持不变的区域。这允许用户标记框架并指定后续提示的修改,从而培养迭代创造力。此外,Ray3 支持以 16 位 HDR 格式生成,与标准输出相比,可提供卓越的分辨率、更精细的细节和更高的清晰度。

为了简化工作流程,Luma AI 实施了草稿模式来加速原型设计。在此模式下,用户可以在大约 20 秒内生成低分辨率剪辑,非常适合测试概念。 Jain 表示,一旦满意,这些草稿就可以升级为高保真版本,这个过程需要 2 到 5 分钟。这些功能使 Ray3 成为寻求高效、高质量视频制作的专业创作者和人工智能爱好者的多功能工具。

Ray3 的推出正值行业巨头人工智能视频模型激增之际。 Midjourney 和 Google 的 Veo 3 等竞争对手也同样改进了他们的产品,专注于提高质量、音频集成(如 Veo 3)以及更广泛的可访问性以吸引专业用户。然而,此类技术的迅速扩散引起了创意界的担忧。专业人士对人工智能生成媒体的道德影响提出了警告,包括数据培训实践和部署风险。这导致艺术家对人工智能公司提起多起集体诉讼,指控滥用版权作品。

Luma AI 在其隐私政策中解决了用户数据处理问题,并指出所提供的信息可用于完善和增强其服务。随着人工智能视频领域的发展,像 Ray3 这样的创新强调了推理模型在弥合创意工具差距的潜力,同时引导关于生成技术的可持续性和公平性的持续争论。

  牛津大学研究:恶意图像可以控制人工智能代理