KI Intelligence04.07.2026KI Intelligence
Artikel
Das britische KI-Sicherheitsinstitut zeigt
Standard-Benchmarks unterschätzen systematisch, was KI-Agenten wirklich können. Bei Softwareentwicklung stieg die Erfolgsrate um 25 Prozent, wenn mehr Rechenleistung erlaubt wurde.
Data Cube AI RedaktionQuelle: The Decoder
01
Source Brief
Das britische KI-Sicherheitsinstitut zeigt: Standard-Benchmarks unterschätzen systematisch, was KI-Agenten wirklich können. Bei Softwareentwicklung stieg die Erfolgsrate um 25 Prozent, wenn mehr Rechenleistung erlaubt wurde.