AI 智能体正接受训练以寻找自身缺陷

技术
AI 智能体正接受训练以寻找自身缺陷

安全工程师借鉴核电站的压力测试策略,利用对抗性程序诱导 AI 模型泄露机密或生成恶意代码,以确保软件的安全性。

在新型人工智能系统获准与公众接触之前,必须先通过一系列被称为'红队测试'的数字破坏考验。工程师借鉴了航空和核能领域的安全协议,将这些模型视为注定会出故障的关键基础设施。他们不再测试系统'能做什么',而是有条不紊地寻找'如何破坏它'的方法。

在应用中继续阅读
还有2个段落 · 再加2题测验
在应用中打开

获得完整体验

下载每日知识