Skip to content
KI Intelligence04.07.2026KI Intelligence
Artikel

Das britische KI-Sicherheitsinstitut zeigt

Standard-Benchmarks unterschätzen systematisch, was KI-Agenten wirklich können. Bei Softwareentwicklung stieg die Erfolgsrate um 25 Prozent, wenn mehr Rechenleistung erlaubt wurde.

Data Cube AI RedaktionQuelle: The Decoder
01

Source Brief

Das britische KI-Sicherheitsinstitut zeigt: Standard-Benchmarks unterschätzen systematisch, was KI-Agenten wirklich können. Bei Softwareentwicklung stieg die Erfolgsrate um 25 Prozent, wenn mehr Rechenleistung erlaubt wurde.