Skip to content
Inteligencia IAJul 3, 2026Inteligencia IA
Artigo

O Instituto de Segurança de IA do UK descobriu que os benchmarks padrão de IA subestimam sistematicamente as capacidades reais dos...

Agentes de IA ao limitar os orçamentos de computação. Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% quando os agentes receberam mais tempo de computação. Isso levanta questões sobre a validade dos testes de segurança atuais.

Editorial Data Cube AIFonte: The Decoder
01

Brief da fonte

O Instituto de Segurança de IA do UK descobriu que os benchmarks padrão de IA subestimam sistematicamente as capacidades reais dos agentes de IA ao limitar os orçamentos de computação. Em tarefas de engenharia de software, as taxas de sucesso aumentaram cerca de 25% quando os agentes receberam mais tempo de computação. Isso levanta questões sobre a validade dos testes de segurança atuais.