谷歌详细介绍了 Chrome 代理功能的安全方法,该方法可以实现订票或购物等自动化操作,解决潜在的数据和财务风险。
Google 采用多种模型来管理代理操作。使用 Gemini 构建的用户对齐评论家会仔细检查规划器模型生成的操作项。如果批评者模型确定计划的任务与用户目标不符,它会提示计划者重新评估策略。评论家模型仅访问建议操作的元数据,而不访问实际的网络内容。
为了限制代理访问不允许或不可信的网站,Google 使用代理源集。这些集将模型限制为特定的只读和读写源。只读来源定义 Gemini 可以消费的内容;例如,购物网站上的产品列表是相关的,但横幅广告则不是。代理只能与页面上指定的 iframe 进行交互。
该公司在一篇博客文章中表示,“这种划分强制代理只能使用来自有限来源集的数据,并且这些数据只能传递到可写来源。这限制了跨来源数据泄漏的威胁向量。这也使浏览器能够强制执行部分分离,例如甚至不向模型发送可读集之外的数据。”
Google 通过另一个观察者模型监视页面导航,以防止访问模型生成的有害 URL。
对于敏感任务,Google 需要用户同意。如果代理尝试访问敏感站点,例如银行或医疗平台,它会请求用户许可。如果网站需要登录,Chrome 将提示用户允许使用密码管理器;代理的模型不会访问密码数据。在代理发起购买或发送消息等操作之前,系统会询问用户。
谷歌还采用了即时注入分类器来防止不必要的操作,并正在评估针对研究人员开发的攻击的代理能力。本月早些时候,Perplexity 发布了一个开源内容检测模型,以应对针对代理的即时注入攻击。
<小时/>







