Reddit、雅虎支持 AI 训练数据的 RSL 标准

引入了新的许可标准“真正简单许可”(RSL)，使网络出版商能够定义人工智能系统开发人员可以使用其内容的条款。该倡议旨在为人工智能公司建立一个框架，以补偿出版商使用其数据训练人工智能模型。

周三，包括 Reddit、Yahoo、Medium、Quora 和 People Inc. 在内的知名组织宣布支持 RSL 标准（一种开放内容许可协议）。该标准允许发布者指定机器人应如何付费来抓取其网站上的人工智能训练数据，其目标是共同影响人工智能公司采用该框架。

RSL 标准扩展了现有的 robots.txt 协议，该协议历来允许发布商指示网络爬虫可以访问和不能访问其网站的哪些部分。 RSL 通过使网站能够在其 robots.txt 文件中包含许可和版税条款来增强这一点。这些术语还可以嵌入在线书籍、视频和培训数据集中，允许出版商为其使用寻求补偿。

RSL Collective 是一个新成立的权利组织，是 RSL 标准的背后支持者。该组织由Really Simple Syndicate (RSS) 标准的共同创建者、CardSpring 前首席执行官Eckart Walther 和IAC Publishing 和Ask.com 前首席执行官Doug Leeds 领导。 Walther 表示：“我们的目标是为网络创建一个新的、可扩展的商业模式。RSL 采用了一些早期的 RSS 想法，为整个互联网创建了一个新的层，在该层中定义了许可权和补偿权。”

RSL 标准支持各种许可模式，包括免费选项。网站所有者可以通过 RSL 标准要求 AI 公司支付订阅费或按爬行付费，每次 AI 机器人爬行网站时都会收取费用。此外，还可以实施按推理付费，这样当人工智能模型引用其工作来生成响应时，站点就可以获得补偿。出于其他目的（例如存档或搜索引擎收录）而爬行网站的机器人可以照常继续。

包括 Vox Media（The Verge 的母公司）、新闻集团（《华尔街日报》的所有者）和《纽约时报》在内的多家媒体公司已经与 OpenAI 和亚马逊等人工智能公司建立了许可协议。 RSL Collective 旨在简化这一流程，使任何网站所有者或创建者都能获得其工作成果的报酬，而无需单独协商交易。

RSL 的成功取决于主要行业参与者，尤其是人工智能公司的采用。人工智能模型构建者面临着无视网站 robots.txt 文件的指控，目前还没有直接的方法可以在没有他们合作的情况下跟踪推理费用。 RSL Collective 依靠主要网络出版商的集体影响力来提高采用该标准的吸引力。利兹表示，“我们的工作是走出去，让一大群人说这符合你的利益，既高效，因为你可以同时与每个人谈判，又合法，因为如果你不这样做，你就同时侵犯了所有人。”

与 Cloudflare 的“按抓取付费”等系统不同，RSL 标准本身无法阻止机器人访问网站。 RSL Collective 正在与内容交付网络 Fastly 合作，根据网站是否同意许可内容来控制 AI 机器人对网站的访问。利兹将 Fastly 描述为“俱乐部门口的保镖，除非有正确的 ID，否则他们不会让人们进入。RSL 正在颁发 ID。所以我们说，‘嘿，你已经同意许可此内容’，Fastly 说，‘来吧，用你的 ID 进行检查。’”不使用 Fastly 的出版商仍然可以要求 AI 公司许可他们的内容，但在更多提供商开发出解决方案之前，将无法阻止 AI 爬虫。

利兹认为，RSL Collective 可以合法执行许可，并表示“集体权利组织的所有参与者都参与任何侵权行为的执行”，从而分摊了法律成本。他将该系统与现有的数字版权组织进行了比较，例如音乐版权组织 ASCAP，该组织向其成员收取和分配许可费。虽然传统的音乐许可受益于版权保护的强有力的法律先例，但未经授权的抓取和使用媒体来训练人工智能系统仍然处于法律灰色地带。主要人工智能参与者目前面临来自 Reddit、Getty Images 和各种在线出版商等实体的诉讼。

Leeds 和 Walther 表示：“一直存在这样的问题：机器人是否同意了它们看不到的条款。RSL 从根本上改变了这一点，让爬虫在访问网站之前就知道这些条款是什么。”

利兹希望该系统能够创建一种直观的驾照导航方式从事人工智能培训工作的 Sing 表示，“我们所做的并不是重新发明轮子或发明轮子，我们只是将它们带到一个以前不存在的地方。它们以前不存在的原因是因为它们没有我们可以构建的标准。这就是 RSL 标准如此重要的原因：它提供了基础设施，然后创建在所有其他媒体行业中尚未出现的东西。”

RSL Collective 可供出版商和创作者免费加入。 O’Reilly、wikiHow 和 Ziff Davis（IGN 所有者）等其他主要品牌也加入了该组织。

与卡巴里诺赌场发生问题时的联系

Reddit、雅虎支持 AI 训练数据的 RSL 标准

Related Stories

埃隆·马斯克表示 X 将向用户发送有关更正帖子的信息

Galaxy Z Flip 8 泄露显示三种颜色选择

DuckDuckGo 为其浏览器带来了 YouTube 广告拦截功能

Meta 更新了 AI 眼镜，如果隐私 LED 被篡改，摄像头将被禁用