Google 于 2026 年 1 月 29 日针对美国 18 岁或以上的 Google AI Ultra 用户推出了 Project Genie。这个实验研究原型位于 Google 实验室,允许用户使用文本提示和图像创建、探索和重新混合交互式世界。该网络应用程序由 Genie 3 世界模型、Nano Banana Pro 和 Gemini 提供支持。
Project Genie 基于 Genie 3 构建,Genie 3 是一个于 2025 年 8 月预览的通用世界模型。Genie 3 生成多样化的交互式环境。值得信赖的测试人员之前用它创造了各种世界。该原型提供了对该技术的实践访问,重点是沉浸式世界的创建。
世界模型模拟环境动态,预测演化和行为的影响。 Google DeepMind 为国际象棋和围棋等游戏开发了代理。 Project Genie 致力于开发能够处理通用人工智能现实世界多样性的系统。
该原型具有三个核心功能。世界草图使用户能够用文本和生成或上传的图像进行提示,以构建一个生动的、可扩展的环境。用户创建角色并定义探索模式,例如步行、骑行、飞行或驾驶。与 Nano Banana Pro 集成可以进行预览和微调。用户选择第一人称或第三人称视角。
世界探索使环境变得可导航。当用户移动时,Project Genie 根据操作实时生成前方路径。相机视图在遍历过程中进行调整。
世界重新混合让用户可以在现有世界的基础上进行构建。他们访问精选世界的画廊或使用随机发生器来获取灵感,然后修改提示。用户下载他们的世界和探索的视频。
Diego Rivas,谷歌 DeepMind 产品经理; Elliot Breece,Google 实验室产品经理;和 Google 创意实验室总监 Suzanne Chambers 为该项目做出了贡献。
Genie 3 为原型提供动力,作为早期研究模型。已知的限制包括世界可能与提示、图像或现实世界的物理不完全匹配,缺乏完全的真实感。角色有时会抗拒控制或表现出更高的延迟。世代上限为 60 秒。
8 月份发布的 Genie 3 的一些功能,例如在探索过程中改变世界的提示事件,在这个原型中仍然不可用。有关限制和更新的详细信息显示在专门的 Google 页面上。
Access 面向 18 岁及以上的美国 Google AI Ultra 用户推出,并计划扩展到其他地区。谷歌寻求这些高级人工智能用户的反馈,以了解人工智能研究和生成媒体中的应用。该公司打算随着时间的推移扩大对 Project Genie 及其世界建设技术的访问。
Project Genie 负责任地运作,作为造福人类的通用人工智能系统努力的一部分。它源于与值得信赖的测试人员的合作,现在已扩展到订阅者。
<小时/>







