由英国广播公司 (BBC) 牵头、欧洲广播联盟 (EBU) 协调的新研究表明,人工智能助手始终会歪曲各种语言和地区的新闻内容。这项广泛的研究在 EBU 新闻大会上启动,涉及 18 个国家的 22 个公共服务媒体组织,评估了四种领先人工智能工具(ChatGPT、Copilot、Gemini 和 Perplexity)生成的 3,000 多个回复。
该研究发现了重大的系统性问题,45% 的人工智能生成的答案都存在重大问题。值得注意的是,31% 的回复存在严重的来源缺陷,包括归因缺失或不正确,而 20% 的回复则存在重大准确性问题,例如过时的信息和幻觉。 Gemini 被认为是最不可靠的工具,76% 的回复都显示出重大问题。
这种误传至关重要,因为人工智能助手越来越多地取代传统搜索引擎来进行新闻消费。根据路透社研究所的《2025 年数字新闻报告》,7% 的在线新闻消费者依赖人工智能获取新闻,这一数字在 25 岁以下的个人中上升至 15%。EBU 媒体总监 Jean Philip De Tender 强调,这些调查结果表明存在破坏公众对新闻来源信任的系统性问题。
BBC 生成人工智能项目总监 Peter Archer 承认人工智能令人兴奋,但强调了信任所提供信息的必要性。他指出,人工智能工具的改进仍然不足以解决重大问题。
研究团队发布了人工智能助理工具包中的新闻完整性,旨在针对已确定的挑战开发解决方案,重点提高响应准确性并增强用户的媒体素养。此外,EBU 及其成员呼吁欧盟和国家监管机构执行有关信息完整性和数字服务的现有法律,同时倡导对人工智能工具进行持续独立监控。
这项研究以 BBC 2025 年 2 月发布的早期研究为基础,证实这些问题在不同语言和市场中都存在。参与的广播公司包括来自加拿大、德国、意大利和英国等国家的组织。
BBC 在另一份报告中表示,许多英国成年人相信人工智能能够生成准确的新闻摘要,其中三分之一的人对人工智能的准确性表示信心,而在 35 岁以下的成年人中,这一数字上升到近一半。人们对公众对人工智能新闻摘要的看法以及人工智能产生的不准确问题可能错误地归咎于新闻提供商表示担忧,这可能会对新闻实体的信任产生负面影响。
<小时/>








