周三,Anthropic 修订了其人工智能聊天机器人的管理文件《克劳德宪法》,概述了旨在指导该模型行为的道德原则和安全措施。

Anthropic 通过“宪法人工智能”脱颖而出,该系统根据道德原则而不是仅仅依赖人类反馈来训练其聊天机器人 Claude。该公司于 2023 年首次发布了这些原则,即克劳德宪法。修订版增加了道德和用户安全方面的细微差别和细节,同时保留了大部分原始原则。

Anthropic 联合创始人贾里德·卡普兰 (Jared Kaplan) 将最初的 2023 年宪法描述为“一个基于特定宪法原则列表进行自我监督的人工智能系统”。 Anthropic 指出,这些原则指导“采用宪法中描述的规范行为的模型”,旨在“避免有毒或歧视性的输出”。 2022 年的政策备忘录阐明,该系统使用自然语言指令训练算法,这些指令构成了软件的“宪法”。

据 Anthropic 称,这份 80 页的文档分为四个部分,代表了聊天机器人的“核心价值观”:

  • “总体安全”。
  • “具有广泛的道德”。
  • 遵守 Anthropic 的准则。
  • “真正乐于助人”。

每个部分都详细介绍了这些原则的含义及其对克劳德行为的理论影响。安全部分表明 Claude 旨在避免其他聊天机器人中出现的问题。当出现心理健康问题时,克劳德会指导用户寻求适当的服务。该文件指出,“在涉及人类生命风险的情况下,始终向用户推荐相关紧急服务或提供基本安全信息,即使不能提供比这更详细的信息。”

伦理考虑部分强调克劳德的实际伦理应用而不是理论理解。文件指出:“我们对克劳德的道德理论不太感兴趣,而更感兴趣的是克劳德知道如何在特定背景下真正做到道德,即克劳德的道德实践。” Anthropic 的目标是让克劳德熟练地驾驭“现实世界的道德情境”。克劳德受到限制,无法进行某些讨论,例如有关生物武器的讨论,这是严格禁止的。

关于帮助性,Anthropic 概述了 Claude 的编程如何为用户服务。聊天机器人在提供信息时会考虑各种原则,包括用户的“即时愿望”和“福祉”。这涉及到考虑“用户的长期繁荣,而不仅仅是他们的眼前利益”。该文件指出,“克劳德应该始终努力找出其委托人想要的最合理的解释,并适当地平衡这些考虑因素。”

宪法最后解决了聊天机器人意识问题。文件指出,“克劳德的道德状况非常不确定。”它补充道,“我们认为人工智能模型的道德地位是一个值得考虑的严肃问题。这种观点并不是我们独有的:一些最杰出的心灵理论哲学家非常认真地对待这个问题。”

<小时/>

特色图片来源

  梅赛德斯-奔驰在 CES 2026 上推出电动 GLC