KI Intelligence11.03.2026KI Intelligence
Artikel
Eine neue Studie findet heraus, dass etwa die Hälfte der von KI geschriebenen Codes, die einen gängigen Industrietest bestehen...
Von echten Entwicklern abgelehnt werden würde. Die Forschung von METR zeigt eine erhebliche Lücke zwischen automatisierten Benchmarks und der praktischen Codequalität, die in realen Projekten erwartet wird.
Data Cube AI RedaktionQuelle: The Decoder
01
Source Brief
Eine neue Studie findet heraus, dass etwa die Hälfte der von KI geschriebenen Codes, die einen gängigen Industrietest bestehen, von echten Entwicklern abgelehnt werden würde. Die Forschung von METR zeigt eine erhebliche Lücke zwischen automatisierten Benchmarks und der praktischen Codequalität, die in realen Projekten erwartet wird.
02