Skip to content
KI Intelligence27.06.2026KI Intelligence
Artikel

Epoch AI hat mit MirrorCode einen neuen Benchmark veröffentlicht, der testet, ob KI-Modelle komplette Programme ohne Zugriff auf...

Den Originalcode nachbauen können. Claude Opus 4.7 führte mit einer Erfolgsquote von 56 Prozent und rekonstruierte ein 16.000-zeiliges Toolkit in nur 14 Stunden. Dennoch scheiterten alle getesteten Modelle an komplexen Aufgaben.

Data Cube AI RedaktionQuelle: The Decoder
01

Source Brief

Epoch AI hat mit MirrorCode einen neuen Benchmark veröffentlicht, der testet, ob KI-Modelle komplette Programme ohne Zugriff auf den Originalcode nachbauen können. Claude Opus 4.7 führte mit einer Erfolgsquote von 56 Prozent und rekonstruierte ein 16.000-zeiliges Toolkit in nur 14 Stunden. Dennoch scheiterten alle getesteten Modelle an komplexen Aufgaben.