Skip to content
KI Intelligence03.07.2026KI Intelligence
Artikel

Das UK AI Security Institute hat herausgefunden, dass herkömmliche KI-Benchmarks die tatsächlichen Fähigkeiten von KI-Agenten...

Systematisch unterschätzen, da sie das Rechenbudget begrenzen. Bei Softwareentwicklungsaufgaben stiegen die Erfolgsraten um etwa 25 %, wenn man den Agenten mehr Rechenzeit gab. Dies wirft Fragen zur Validität aktueller Sicherheitstests auf.

Data Cube AI RedaktionQuelle: The Decoder
01

Source Brief

Das UK AI Security Institute hat herausgefunden, dass herkömmliche KI-Benchmarks die tatsächlichen Fähigkeiten von KI-Agenten systematisch unterschätzen, da sie das Rechenbudget begrenzen. Bei Softwareentwicklungsaufgaben stiegen die Erfolgsraten um etwa 25 %, wenn man den Agenten mehr Rechenzeit gab. Dies wirft Fragen zur Validität aktueller Sicherheitstests auf.