人工智能开发者利用独特的数字‘金丝雀令牌’检测并追踪数据泄露

技术
人工智能开发者利用独特的数字‘金丝雀令牌’检测并追踪数据泄露

为了保护知识产权免受非法抓取,人工智能开发者在数据集中嵌入了独特的数字‘金丝雀令牌’(特定文本串),以追踪并证实数据泄露行为。

OpenAI 和 Anthropic 等顶尖人工智能实验室正在部署‘金丝雀令牌’。这些令牌由自然语言中不存在的独特 n-gram 组成,用于识别其专利模型是否被逆向工程。这些数字签名充当了无声警报。如果竞争对手的模型开始生成这些特定的字符串,就提供了该模型使用窃取数据进行训练的无可辩驳的证据。随着竞争对手试图通过自动爬虫提交数十亿次模拟人类的查询来突破‘数据护城河’,这种防御机制变得至关重要。

故事还有更多内容 — 打开应用继续阅读。

在应用中继续阅读
还有1个段落 · 再加2题测验
在应用中打开

获得完整体验

下载每日知识