现在,大多数搜索引擎默认都具有人工智能生成的概述,这引发了人们对准确性的担忧并减少了点击流量。尽管测试表明谷歌的人工智能概述在很大程度上是可靠的,但大量的查询导致每天数以百万计的错误。

据《纽约时报》报道,大约十分之一的谷歌人工智能搜索概述包含虚假信息。 Google 每年处理约 5 万亿条查询,理论上每小时会让用户面临超过 5700 万个不准确的答案,每分钟接近 100 万个。

这些统计数据来自人工智能初创公司 Oumi 的分析,该公司检查了 4,326 条搜索,以评估谷歌人工智能助手 Gemini 的准确性。 Oumi 报告称,Gemini 版本 2 在 10 月份 85% 的时间内提供了准确的概述。到 2 月份,改进版本 Gemini 3 将准确率提高到 91%。

然而,Oumi 的分析依赖于人工智能工具,这也可能会引入错误。此外,当相隔数秒重复查询时,谷歌有时会为同一查询生成不同的人工智能概述。

谷歌发言人批评了 Oumi 测试,称其存在缺陷且不能代表实际的搜索行为。 Google 的内部评估表明,Gemini 3 在独立于 Google 搜索运行时,有 28% 的时间会产生幻觉。

采购方面也存在重大问题。谷歌的目标是通过相关链接来支持其人工智能概述;然而,其中许多链接并不能支持双子座的主张。 2 月更新后,AI 概述与其引用来源之间的差异从 Gemini 2 的 37% 增加到 Gemini 3 的 56%。

研究人员强调了人工智能概述容易被操纵的弱点;其中一个例子涉及一名 BBC 记者,谷歌第二天又重复了他的虚假说法。谷歌和其他人工智能公司在其免责声明中都承认该技术的不可靠本质。

<小时/>

精选图片来源

  Anthropic 承诺为人工智能驱动的电网升级提供 100% 的资金