Skip to content
AI情报Jun 11, 2026AI情报
文章

Claude Fable 5 在编码基准测试中仅达到中等水平,批评者指出数据泄漏可能导致早期得分被夸大。这引发了对 AI 评估方法可靠性的质疑。

Data Cube AI 编辑部来源: Hacker News
01

来源简报

Claude Fable 5 在编码基准测试中仅达到中等水平,批评者指出数据泄漏可能导致早期得分被夸大。这引发了对 AI 评估方法可靠性的质疑。