Skip to content
AI情报Jun 27, 2026AI情报
文章

Epoch AI 的新 MirrorCode 基准测试旨在检测 AI 模型是否能在不访问原始代码的情况下重新创建完整程序。Claude Opus 4.7 以 56% 的解决率领先,仅用 14 小时就重建了一个...

行的工具包。然而,所有测试模型在复杂任务上仍然失败。

Data Cube AI 编辑部来源: The Decoder
01

来源简报

Epoch AI 的新 MirrorCode 基准测试旨在检测 AI 模型是否能在不访问原始代码的情况下重新创建完整程序。Claude Opus 4.7 以 56% 的解决率领先,仅用 14 小时就重建了一个 16,000 行的工具包。然而,所有测试模型在复杂任务上仍然失败。