Deepmind 通过前沿安全框架详细介绍 AGI 安全

Ars Technica 于 2025 年 9 月发表的一篇文章，题为“DeepMind AI 安全报告探讨了错位 AI 的危险”，涵盖了 Google DeepMind 对人工智能安全的研究和观点。该报告特别关注通用人工智能（AGI）以及人工智能系统失调所带来的风险，其中人工智能的目标与人类价值观或意图相冲突。

本文概述了 DeepMind 负责任的人工智能开发方法，强调了对技术安全、风险评估以及整个人工智能社区协作以管理潜在风险的承诺。该策略特别关注强大的通用人工智能系统可能出现的危险。这项工作的核心部分是 DeepMind 的前沿安全框架，该协议旨在主动识别和减轻与前沿人工智能模型相关的严重风险。

DeepMind 内部的治理机构也很详细，包括责任与安全委员会和 AGI 安全委员会。这些小组负责监督研究和开发，以解决与先进人工智能技术相关的道德、技术和安全风险。