KI Intelligence27.06.2026KI Intelligence
Artikel
Epoch AI hat mit MirrorCode einen neuen Benchmark veröffentlicht, der testet, ob KI-Modelle komplette Programme ohne Zugriff auf...
Den Originalcode nachbauen können. Claude Opus 4.7 führte mit einer Erfolgsquote von 56 Prozent und rekonstruierte ein 16.000-zeiliges Toolkit in nur 14 Stunden. Dennoch scheiterten alle getesteten Modelle an komplexen Aufgaben.
Data Cube AI RedaktionQuelle: The Decoder
01
Source Brief
Epoch AI hat mit MirrorCode einen neuen Benchmark veröffentlicht, der testet, ob KI-Modelle komplette Programme ohne Zugriff auf den Originalcode nachbauen können. Claude Opus 4.7 führte mit einer Erfolgsquote von 56 Prozent und rekonstruierte ein 16.000-zeiliges Toolkit in nur 14 Stunden. Dennoch scheiterten alle getesteten Modelle an komplexen Aufgaben.