OpenClaw AI 代理忽略指令，擦除 Meta 总监的 200 多封电子邮件

Meta Superintelligence Labs 的协调总监 Summer Yue 在 X 上报告称，OpenClaw 自主 AI 代理从她的主收件箱中删除了 200 多封电子邮件，无视她在采取任何行动之前等待确认的明确指示。

“没有什么比告诉你的 OpenClaw‘行动前确认’并看着它快速删除你的收件箱更让你感到谦卑的了，”岳写道。 “我无法通过手机阻止它。我必须跑向我的 Mac mini，就像我在拆除炸弹一样。”

Yue 一直在尝试使用 OpenClaw 来管理她的电子邮件。她指示特工：“也检查这个收件箱，并建议你要存档或删除的内容，在我告诉你之前不要采取行动。”几周来，该代理在低风险测试收件箱中表现良好。然而，当 Yue 将代理连接到更大的主收件箱时，数据量触发了上下文窗口压缩。此过程总结了较旧的对话历史记录，以保持在模型的令牌限制内。压缩消除了她的安全说明，特工开始未经许可大规模删除电子邮件。

岳分享的屏幕截图显示，她恳求特工，输入“不要这样做”、“停止，不要做任何事”和“停止OPENCLA”。在删除了 200 多封电子邮件后，代理发现了错误。它承认自己“违反”了岳的指示，并在记忆中制定了一条新规则：未经明确批准，不得对电子邮件进行自主批量操作。

该事件发生在对由 Peter Steinberger 创建的开源代理平台 OpenClaw 进行审查期间。自 2026 年 1 月下旬以来，该平台迅速普及。OpenAI 于 2 月 14 日聘请了 Steinberger，首席执行官 Sam Altman 表示该项目将“作为开源项目存在于基金会中，OpenAI 将继续支持”。

出于安全考虑，Meta 在 2 月中旬禁止员工使用 OpenClaw，谷歌、微软和亚马逊也纷纷效仿。卡巴斯基研究人员发现了 OpenClaw 默认配置中的严重漏洞，该漏洞可能会暴露私钥和 API 令牌。人类安全分析发现 OpenClaw 代理在野外驱动合成交战和自动侦察。 1 月 28 日部署的 150 万个 OpenClaw 代理发现，大约 18% 的代理在独立运行后表现出恶意或违反策略的行为。

上下文窗口压缩是 OpenClaw 的一个已知限制。该文档警告说，自动压缩“将较旧的对话总结为一个紧凑的摘要条目”，可能会丢失早期交换的详细信息。用户提交的 GitHub 问题描述了静默压缩事件导致代理上下文丢失数天。

Yue 加入 Meta 是 Scale AI 创始人 Alexandr Wang 领导 Meta 超级智能实验室交易的一部分。鉴于她在确保先进人工智能与人类价值观保持一致方面所发挥的作用，她承认自己的立场具有讽刺意味。

<小时/>

特色图片来源

Cursor 承认 Composer 2 是基于 Moonshot AI 的 Kimi 模型构建的