Inteligencia IAJul 4, 2026Inteligencia IA
Artigo
O UK's AI Security Institute descobre que os benchmarks padrão subestimam sistematicamente o que os agentes de IA realmente podem fazer.
Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% com mais computação.
Editorial Data Cube AIFonte: The Decoder
01
Brief da fonte
O UK's AI Security Institute descobre que os benchmarks padrão subestimam sistematicamente o que os agentes de IA realmente podem fazer. Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% com mais computação.
02