KI-Agenten lernen, ihre eigenen Schwachstellen aufzuspüren
Sicherheitsingenieure nutzen Taktiken aus Kernkraftwerken, um Software unter Stress zu testen. Dabei versuchen spezielle Programme, KI-Modelle zu überlisten und zur Herausgabe von Geheimnissen oder Schadcode zu bewegen.
Bevor ein neues System der künstlichen Intelligenz an die Öffentlichkeit geht, muss es einen digitalen Härtetest bestehen. Dieses Verfahren wird als 'Red-Teaming' bezeichnet. Ingenieure übernehmen dabei Sicherheitskonzepte aus der Luftfahrt oder der Kernkraft. Sie behandeln die Modelle wie kritische Infrastruktur, bei der ein Versagen bereits eingeplant ist.