Skip to content
Inteligencia IAJun 27, 2026Inteligencia IA
Articulo

El nuevo benchmark MirrorCode de Epoch AI prueba si los modelos de IA pueden recrear programas completos sin acceso al código original.

Claude Opus 4.7 lidera con una tasa de resolución del 56%, reconstruyendo un kit de herramientas de 16,000 líneas en solo 14 horas. Sin embargo, todos los modelos probados aún fallan en tareas complejas.

Redaccion Data Cube AIFuente: The Decoder
01

Resumen fuente

El nuevo benchmark MirrorCode de Epoch AI prueba si los modelos de IA pueden recrear programas completos sin acceso al código original. Claude Opus 4.7 lidera con una tasa de resolución del 56%, reconstruyendo un kit de herramientas de 16,000 líneas en solo 14 horas. Sin embargo, todos los modelos probados aún fallan en tareas complejas.