Skip to content
Intelligence IAJun 27, 2026Intelligence IA
Article

Le nouveau benchmark MirrorCode d'Epoch AI teste si les modèles d'IA peuvent recréer des programmes complets sans accès au code original.

Claude Opus 4.7 arrive en tête avec un taux de résolution de 56 %, reconstruisant une boîte à outils de 16 000 lignes en seulement 14 heures. Cependant, tous les modèles testés échouent encore sur les tâches complexes.

Redaction Data Cube AISource: The Decoder
01

Brief source

Le nouveau benchmark MirrorCode d'Epoch AI teste si les modèles d'IA peuvent recréer des programmes complets sans accès au code original. Claude Opus 4.7 arrive en tête avec un taux de résolution de 56 %, reconstruisant une boîte à outils de 16 000 lignes en seulement 14 heures. Cependant, tous les modèles testés échouent encore sur les tâches complexes.