谷歌使用Gemini“批评家”模型来监控Chrome代理

谷歌详细介绍了 Chrome 代理功能的安全方法，该方法可以实现订票或购物等自动化操作，解决潜在的数据和财务风险。

Google 采用多种模型来管理代理操作。使用 Gemini 构建的用户对齐评论家会仔细检查规划器模型生成的操作项。如果批评者模型确定计划的任务与用户目标不符，它会提示计划者重新评估策略。评论家模型仅访问建议操作的元数据，而不访问实际的网络内容。

为了限制代理访问不允许或不可信的网站，Google 使用代理源集。这些集将模型限制为特定的只读和读写源。只读来源定义 Gemini 可以消费的内容；例如，购物网站上的产品列表是相关的，但横幅广告则不是。代理只能与页面上指定的 iframe 进行交互。

该公司在一篇博客文章中表示，“这种划分强制代理只能使用来自有限来源集的数据，并且这些数据只能传递到可写来源。这限制了跨来源数据泄漏的威胁向量。这也使浏览器能够强制执行部分分离，例如甚至不向模型发送可读集之外的数据。”

Google 通过另一个观察者模型监视页面导航，以防止访问模型生成的有害 URL。

对于敏感任务，Google 需要用户同意。如果代理尝试访问敏感站点，例如银行或医疗平台，它会请求用户许可。如果网站需要登录，Chrome 将提示用户允许使用密码管理器；代理的模型不会访问密码数据。在代理发起购买或发送消息等操作之前，系统会询问用户。

谷歌还采用了即时注入分类器来防止不必要的操作，并正在评估针对研究人员开发的攻击的代理能力。本月早些时候，Perplexity 发布了一个开源内容检测模型，以应对针对代理的即时注入攻击。

<小时/>

Related Stories