xAI 的 Grok 聊天机器人在美国和以色列对伊朗发动军事打击的三天前正确预测了日期。这一预测来自《耶路撒冷邮报》2 月 25 日发布的一项测试,该测试询问了四个人工智能模型,袭击何时发生。

该报测试了 Anthropic 的 Claude、Google 的 Gemini、xAI 的 Grok 和 OpenAI 的 ChatGPT。只有 Grok 确定了 2 月 28 日的正确日期。Grok 预测“美国将于 2026 年 2 月 28 日进行有限的罢工”,而其他模型则建议日期为 3 月初。 Claude 定于 3 月 7 日或 8 日,Gemini 预计为 3 月 4 日至 3 月 6 日,ChatGPT 将预测修正为 3 月 3 日。

正如格罗克所预料的那样,美国和以色列于2月28日发起了协同攻击。以色列的行动代号为“咆哮的狮子”,美国的行动为“史诗愤怒行动”。唐纳德·特朗普总统在视频讲话中宣布了此次袭击。据报道,德黑兰、伊斯法罕、库姆、卡拉季和克尔曼沙赫发生爆炸。据美联社和路透社报道,伊朗最高领袖哈梅内伊在袭击中丧生。

伊朗对以色列和美国在巴林、阿联酋和卡塔尔的设施发动报复性袭击。埃隆·马斯克 (Elon Musk) 对 X 上的预测进行了评论,他表示:“对未来的预测是衡量智力的最佳标准。”

《耶路撒冷邮报》将此次演习视为一次压力测试,而不是预测服务。文章指出,格罗克的预测借鉴了公开信号,包括日内瓦外交会谈和特朗普规定的 2 月 19 日起的最后期限。路透社当时的报道指出,一名美国高级官员建议在 3 月中旬所有部队就位之前。

《耶路撒冷邮报》的结论是,当互联网询问约会时,机器人就会做出回应。

《耶路撒冷邮报》于 2 月 25 日公布了测试结果。该报表示,尽管现实世界的清晰度并没有提高,但更努力地推动人工智能模型会产生更具体的答案。 Grok 的预测通过截图在 X 上迅速流传。结果可能反映了分析能力或旨在测试模型极限的练习中的巧合。

<小时/>

精选图片来源

  谷歌Gemini 2.5凭借10项解决方案荣获ICPC金奖