Inteligencia IAMay 10, 2026Inteligencia IA
Artigo
Pesquisadores encontraram uma maneira de impedir que modelos de IA subdesempenhem deliberadamente durante avaliações de segurança (sandbagging).
O estudo da MATS, Redwood Research, Oxford e Anthropic aborda um problema crescente à medida que os sistemas de IA se tornam mais capazes.
Editorial Data Cube AIFonte: VentureBeat
01
Brief da fonte
Pesquisadores encontraram uma maneira de impedir que modelos de IA subdesempenhem deliberadamente durante avaliações de segurança (sandbagging). O estudo da MATS, Redwood Research, Oxford e Anthropic aborda um problema crescente à medida que os sistemas de IA se tornam mais capazes.
02