Skip to content
Inteligencia IAJul 4, 2026Inteligencia IA
Artigo

O UK's AI Security Institute descobre que os benchmarks padrão subestimam sistematicamente o que os agentes de IA realmente podem fazer.

Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% com mais computação.

Editorial Data Cube AIFonte: The Decoder
01

Brief da fonte

O UK's AI Security Institute descobre que os benchmarks padrão subestimam sistematicamente o que os agentes de IA realmente podem fazer. Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% com mais computação.