Skip to content
Intelligence IAJun 11, 2026Intelligence IA
Article

Claude Fable 5 n'a obtenu que des résultats intermédiaires aux benchmarks de codage, et les critiques suggèrent que une fuite de...

Données pourrait avoir gonflé les scores précédents. Cela soulève des questions sur la fiabilité des méthodes d'évaluation de l'IA.

Redaction Data Cube AISource: Hacker News
01

Brief source

Claude Fable 5 n'a obtenu que des résultats intermédiaires aux benchmarks de codage, et les critiques suggèrent que une fuite de données pourrait avoir gonflé les scores précédents. Cela soulève des questions sur la fiabilité des méthodes d'évaluation de l'IA.