Skip to content
AI 인텔리전스Jun 27, 2026AI 인텔리전스
기사

Epoch AI의 새로운 MirrorCode 벤치마크는 AI 모델이 원본 코드에 접근하지 않고 완전한 프로그램을 재현할 수 있는지 테스트합니다.

Claude Opus 4.7은 56%의 해결률을 보이며, 단 14시간 만에 16,000줄 규모의 툴킷을 재구축합니다. 그러나 테스트된 모든 모델은 여전히 복잡한 작업에서 실패합니다.

Data Cube AI 편집팀출처: The Decoder
01

출처 브리프

Epoch AI의 새로운 MirrorCode 벤치마크는 AI 모델이 원본 코드에 접근하지 않고 완전한 프로그램을 재현할 수 있는지 테스트합니다. Claude Opus 4.7은 56%의 해결률을 보이며, 단 14시간 만에 16,000줄 규모의 툴킷을 재구축합니다. 그러나 테스트된 모든 모델은 여전히 복잡한 작업에서 실패합니다.