AI情报Jun 11, 2026AI情报
文章
Claude Fable 5 在编码基准测试中仅达到中等水平,批评者指出数据泄漏可能导致早期得分被夸大。这引发了对 AI 评估方法可靠性的质疑。
Data Cube AI 编辑部来源: Hacker News
01
来源简报
Claude Fable 5 在编码基准测试中仅达到中等水平,批评者指出数据泄漏可能导致早期得分被夸大。这引发了对 AI 评估方法可靠性的质疑。
Claude Fable 5 在编码基准测试中仅达到中等水平,批评者指出数据泄漏可能导致早期得分被夸大。这引发了对 AI 评估方法可靠性的质疑。