AI情报Jun 27, 2026AI情报文章Epoch AI 的新 MirrorCode 基准测试旨在检测 AI 模型是否能在不访问原始代码的情况下重新创建完整程序。Claude Opus 4.7 以 56% 的解决率领先,仅用 14 小时就重建了一个...行的工具包。然而,所有测试模型在复杂任务上仍然失败。Data Cube AI 编辑部2026年6月26日来源: The Decoder01来源简报Epoch AI 的新 MirrorCode 基准测试旨在检测 AI 模型是否能在不访问原始代码的情况下重新创建完整程序。Claude Opus 4.7 以 56% 的解决率领先,仅用 14 小时就重建了一个 16,000 行的工具包。然而,所有测试模型在复杂任务上仍然失败。02相关话题研究与开发AI 基准代码生成研究查看本期