Ars Technica 于 2025 年 9 月发表的一篇文章,题为“DeepMind AI 安全报告探讨了错位 AI 的危险”,涵盖了 Google DeepMind 对人工智能安全的研究和观点。该报告特别关注通用人工智能(AGI)以及人工智能系统失调所带来的风险,其中人工智能的目标与人类价值观或意图相冲突。
本文概述了 DeepMind 负责任的人工智能开发方法,强调了对技术安全、风险评估以及整个人工智能社区协作以管理潜在风险的承诺。该策略特别关注强大的通用人工智能系统可能出现的危险。这项工作的核心部分是 DeepMind 的前沿安全框架,该协议旨在主动识别和减轻与前沿人工智能模型相关的严重风险。
DeepMind 内部的治理机构也很详细,包括责任与安全委员会和 AGI 安全委员会。这些小组负责监督研究和开发,以解决与先进人工智能技术相关的道德、技术和安全风险。
讨论的一个重大挑战是人工智能的失调。如果此类系统的运行目标与社会福祉不一致,即使从狭隘的技术角度来看它们似乎运行正常,也可能会造成损害。为了解决这个问题,DeepMind 强调了透明度、外部合作和主动安全研究的重要性,作为负责任地创建 AGI 的组成部分。








