Skip to content
Inteligencia IAMar 11, 2026Inteligencia IA
Artigo

Um novo estudo descobre que cerca da metade do código escrito por IA que passa em um popular benchmark da indústria seria...

Rejeitada por desenvolvedores reais. Pesquisas da METR revelam uma lacuna significativa entre benchmarks automatizados e a qualidade de código prática esperada em projetos do mundo real.

Editorial Data Cube AIFonte: The Decoder
01

Brief da fonte

Um novo estudo descobre que cerca da metade do código escrito por IA que passa em um popular benchmark da indústria seria rejeitada por desenvolvedores reais. Pesquisas da METR revelam uma lacuna significativa entre benchmarks automatizados e a qualidade de código prática esperada em projetos do mundo real.