Inteligencia IAJun 27, 2026Inteligencia IA
Articulo
El nuevo benchmark MirrorCode de Epoch AI prueba si los modelos de IA pueden recrear programas completos sin acceso al código original.
Claude Opus 4.7 lidera con una tasa de resolución del 56%, reconstruyendo un kit de herramientas de 16,000 líneas en solo 14 horas. Sin embargo, todos los modelos probados aún fallan en tareas complejas.
Redaccion Data Cube AIFuente: The Decoder
01
Resumen fuente
El nuevo benchmark MirrorCode de Epoch AI prueba si los modelos de IA pueden recrear programas completos sin acceso al código original. Claude Opus 4.7 lidera con una tasa de resolución del 56%, reconstruyendo un kit de herramientas de 16,000 líneas en solo 14 horas. Sin embargo, todos los modelos probados aún fallan en tareas complejas.