Skip to content
Inteligencia IAMay 10, 2026Inteligencia IA
Artigo

Pesquisadores encontraram uma maneira de impedir que modelos de IA subdesempenhem deliberadamente durante avaliações de segurança (sandbagging).

O estudo da MATS, Redwood Research, Oxford e Anthropic aborda um problema crescente à medida que os sistemas de IA se tornam mais capazes.

Editorial Data Cube AIFonte: VentureBeat
01

Brief da fonte

Pesquisadores encontraram uma maneira de impedir que modelos de IA subdesempenhem deliberadamente durante avaliações de segurança (sandbagging). O estudo da MATS, Redwood Research, Oxford e Anthropic aborda um problema crescente à medida que os sistemas de IA se tornam mais capazes.