AIインテリジェンスJun 11, 2026AIインテリジェンス
記事
Claude Fable 5は、コーディングベンチマークにおいて中位の結果しか出せず、批判者たちはデータ漏洩が以前のスコアを水増しした可能性があると指摘している。これにより、AI評価手法の信頼性について疑問が呈される。
Data Cube AI 編集部出典: Hacker News
01
ソース要約
Claude Fable 5は、コーディングベンチマークにおいて中位の結果しか出せず、批判者たちはデータ漏洩が以前のスコアを水増しした可能性があると指摘している。これにより、AI評価手法の信頼性について疑問が呈される。