Skip to content
KI Intelligence10.05.2026KI Intelligence
Artikel

Forscher haben eine Methode entwickelt, um KI-Modelle daran zu hindern, bei Sicherheitstests absichtlich schlechtere Leistungen zu...

Zeigen („Sandbagging“). Die Studie von MATS, Redwood Research, Oxford und Anthropic adressiert ein wachsendes Problem bei immer leistungsfähigeren KI-Systemen.

Data Cube AI RedaktionQuelle: The Decoder
01

Source Brief

Forscher haben eine Methode entwickelt, um KI-Modelle daran zu hindern, bei Sicherheitstests absichtlich schlechtere Leistungen zu zeigen („Sandbagging“). Die Studie von MATS, Redwood Research, Oxford und Anthropic adressiert ein wachsendes Problem bei immer leistungsfähigeren KI-Systemen.