Intelligence IAMar 11, 2026Intelligence IA
Article
Une nouvelle étude révèle que près de la moitié du code écrit par IA qui réussit un benchmark industriel populaire serait rejeté...
Par des développeurs réels. Des recherches de METR révèlent un écart significatif entre les benchmarks automatisés et la qualité de code pratique attendue dans les projets du monde réel.
Redaction Data Cube AISource: The Decoder
01
Brief source
Une nouvelle étude révèle que près de la moitié du code écrit par IA qui réussit un benchmark industriel populaire serait rejeté par des développeurs réels. Des recherches de METR révèlent un écart significatif entre les benchmarks automatisés et la qualité de code pratique attendue dans les projets du monde réel.