Intelligence IAJun 11, 2026Intelligence IA
Article
Claude Fable 5 n'a obtenu que des résultats intermédiaires aux benchmarks de codage, et les critiques suggèrent que une fuite de...
Données pourrait avoir gonflé les scores précédents. Cela soulève des questions sur la fiabilité des méthodes d'évaluation de l'IA.
Redaction Data Cube AISource: Hacker News
01
Brief source
Claude Fable 5 n'a obtenu que des résultats intermédiaires aux benchmarks de codage, et les critiques suggèrent que une fuite de données pourrait avoir gonflé les scores précédents. Cela soulève des questions sur la fiabilité des méthodes d'évaluation de l'IA.