Luma AI推出Ray3推理视频模型

Luma AI 是人工智能驱动的图像和视频生成领域的知名企业，推出了 Ray3，这是其首个推理视频模型，旨在以更高的精度处理复杂的动作序列。 Ray3 立即发布并可用，代表了生成式 AI 视频技术的重大进步，使创作者能够制作更复杂的剪辑，并随着时间的推移保持一致性。

Ray3创新的核心是推理能力，这与传统模型不同。与直接将文本提示转换为视觉效果的标准人工智能系统不同，Ray3 等推理模型会分配额外的计算资源来彻底处理请求。这涉及到改进输出、减少错误和添加细节的自检机制。对于视频生成，这意味着处理复杂的提示，而不会出现较长序列中常见的退化情况。行业基准表明，大多数人工智能生成的视频在 5 到 10 秒的范围内表现良好，而较长的持续时间通常会导致不一致或“不稳定”的结果。 Ray3 通过系统地评估和迭代其创作来缓解这些问题，从而实现以前具有挑战性的更高级的场景。

Luma AI 首席执行官 Amit Jain 在接受 CNET 采访时强调了该模型的评估能力。 “它能够评估并说，‘哦，这不好，或者我需要以这种方式做得更好，’”Jain 解释道，并强调 Ray3 如何超越简单的文本到像素转换，以主动提高内容质量。

Ray3 为用户引入了实用工具，作为其推理引擎的补充。新颖的视觉注释功能为模型的决策过程提供了透明度，显示注释，例如字符上的标记以进行调整或保持不变的区域。这允许用户标记框架并指定后续提示的修改，从而培养迭代创造力。此外，Ray3 支持以 16 位 HDR 格式生成，与标准输出相比，可提供卓越的分辨率、更精细的细节和更高的清晰度。

为了简化工作流程，Luma AI 实施了草稿模式来加速原型设计。在此模式下，用户可以在大约 20 秒内生成低分辨率剪辑，非常适合测试概念。 Jain 表示，一旦满意，这些草稿就可以升级为高保真版本，这个过程需要 2 到 5 分钟。这些功能使 Ray3 成为寻求高效、高质量视频制作的专业创作者和人工智能爱好者的多功能工具。

Ray3 的推出正值行业巨头人工智能视频模型激增之际。 Midjourney 和 Google 的 Veo 3 等竞争对手也同样改进了他们的产品，专注于提高质量、音频集成（如 Veo 3）以及更广泛的可访问性以吸引专业用户。然而，此类技术的迅速扩散引起了创意界的担忧。专业人士对人工智能生成媒体的道德影响提出了警告，包括数据培训实践和部署风险。这导致艺术家对人工智能公司提起多起集体诉讼，指控滥用版权作品。

Luma AI 在其隐私政策中解决了用户数据处理问题，并指出所提供的信息可用于完善和增强其服务。随着人工智能视频领域的发展，像 Ray3 这样的创新强调了推理模型在弥合创意工具差距的潜力，同时引导关于生成技术的可持续性和公平性的持续争论。

研究发现，人工智能系统反映了人类的信任，但运作时存在明显的偏见

Luma AI推出Ray3推理视频模型

Related Stories

谷歌推出 Video Remix，供人工智能用户在几秒钟内转换剪辑

亚马逊计划推出更强大的 Alexa 助手与 AI 代理竞争

ChatGPT Voice 获得全双工 GPT-Live 模型

人类支持的研究测试了人工智能模型的模块化访问控制