谷歌推出 Project Genie 用于构建交互式世界

Google 于 2026 年 1 月 29 日针对美国 18 岁或以上的 Google AI Ultra 用户推出了 Project Genie。这个实验研究原型位于 Google 实验室，允许用户使用文本提示和图像创建、探索和重新混合交互式世界。该网络应用程序由 Genie 3 世界模型、Nano Banana Pro 和 Gemini 提供支持。

Project Genie 基于 Genie 3 构建，Genie 3 是一个于 2025 年 8 月预览的通用世界模型。Genie 3 生成多样化的交互式环境。值得信赖的测试人员之前用它创造了各种世界。该原型提供了对该技术的实践访问，重点是沉浸式世界的创建。

世界模型模拟环境动态，预测演化和行为的影响。 Google DeepMind 为国际象棋和围棋等游戏开发了代理。 Project Genie 致力于开发能够处理通用人工智能现实世界多样性的系统。

该原型具有三个核心功能。世界草图使用户能够用文本和生成或上传的图像进行提示，以构建一个生动的、可扩展的环境。用户创建角色并定义探索模式，例如步行、骑行、飞行或驾驶。与 Nano Banana Pro 集成可以进行预览和微调。用户选择第一人称或第三人称视角。

世界探索使环境变得可导航。当用户移动时，Project Genie 根据操作实时生成前方路径。相机视图在遍历过程中进行调整。

世界重新混合让用户可以在现有世界的基础上进行构建。他们访问精选世界的画廊或使用随机发生器来获取灵感，然后修改提示。用户下载他们的世界和探索的视频。

Diego Rivas，谷歌 DeepMind 产品经理； Elliot Breece，Google 实验室产品经理；和 Google 创意实验室总监 Suzanne Chambers 为该项目做出了贡献。

Genie 3 为原型提供动力，作为早期研究模型。已知的限制包括世界可能与提示、图像或现实世界的物理不完全匹配，缺乏完全的真实感。角色有时会抗拒控制或表现出更高的延迟。世代上限为 60 秒。

8 月份发布的 Genie 3 的一些功能，例如在探索过程中改变世界的提示事件，在这个原型中仍然不可用。有关限制和更新的详细信息显示在专门的 Google 页面上。

Access 面向 18 岁及以上的美国 Google AI Ultra 用户推出，并计划扩展到其他地区。谷歌寻求这些高级人工智能用户的反馈，以了解人工智能研究和生成媒体中的应用。该公司打算随着时间的推移扩大对 Project Genie 及其世界建设技术的访问。

Project Genie 负责任地运作，作为造福人类的通用人工智能系统努力的一部分。它源于与值得信赖的测试人员的合作，现在已扩展到订阅者。

<小时/>

精选图片来源

谷歌推出 Project Genie 用于构建交互式世界

Related Stories

埃隆·马斯克表示 X 将向用户发送有关更正帖子的信息

谷歌推出 Video Remix，供人工智能用户在几秒钟内转换剪辑

亚马逊计划推出更强大的 Alexa 助手与 AI 代理竞争

Galaxy Z Flip 8 泄露显示三种颜色选择