Reddit 正在推动与谷歌加强合作关系,旨在获得更多用户并增加收入,以换取更多地访问其用于人工智能训练的宝贵数据。据彭博社报道,这一事态发展突显了人工智能时代内容平台和科技巨头之间持续存在的紧张关系,其中数据许可交易必须在货币化与保留网站流量和参与度之间取得平衡。

大约 18 个月前,Reddit 与 Google 签署了初步数据共享协议,每年价值约 6000 万美元。现在,这家社交媒体平台正在重返谈判,寻求在谷歌人工智能基础设施中占据更重要的地位。据彭博社援引未透露姓名的高管的话称,Reddit 希望谷歌实施引导用户(他们经常通过人工智能工具从 Reddit 内容中获得答案)回到该平台的机制。目标是鼓励这些用户发布新内容,从而生成新数据来推动人工智能模型,同时促进 Reddit 的社区活动。

除了用户重定向之外,Reddit 还主张为其数据提供更高的补偿。该公司正在探索未来许可协议的动态定价模型,不仅与谷歌,还与 OpenAI 等实体。在这个拟议的系统下,付款将根据内容的效用以及与人工智能生成的响应的相关性而有所不同,从而确保对 Reddit 的贡献进行更公平的评估。

高管们认为,现有的交易条款低估了 Reddit 数据集的价值,该数据集因其真实性和结构而在网络环境中脱颖而出,而网络环境经常因低质量“垃圾”内容而受到批评。 Reddit 的帖子以来自真实用户的真实、坦诚的讨论为特色,按主题组织到论坛中,并通过社区驱动的投票系统而不是不透明的算法进行排名。这种人工策划的品质使其对寻求可靠训练数据的人工智能开发人员极具吸引力。

数据凸显了 Reddit 在 AI 领域的突出地位:它是 Perplexity 和 Google 的 AI Overviews 等工具最常被引用的来源。用户流行的搜索策略是将“reddit”附加到 Google 查询中,以产生更准确、更有洞察力的结果,进一步证明该平台的影响力。

这次谈判体现了人工智能许可中一个更广泛的悖论:像 Reddit 这样的内容提供商提供了训练高级模型的基本数据,但这些相同的模型有可能将流量从原始来源转移出去。通过要求包括用户保留策略和财务收益在内的条款,Reddit 的目标是在人工智能驱动的搜索和摘要工具的兴起中维持其生态系统的活力。

这些谈判反映出人工智能数据交易市场日趋成熟,平台对于保护其长期生存能力越来越自信。随着人工智能的不断发展,这种安排可能会为科技公司如何补偿内容创作者并与内容创作者合作奠定先例。

  Intellexa Predator 间谍软件案提交希腊法院