Inteligencia IAMay 10, 2026Inteligencia IA
Articulo
Los investigadores han encontrado una manera de evitar que los modelos de IA rindan deliberadamente por debajo de su capacidad...
Durante las evaluaciones de seguridad (sandbagging). El estudio de MATS, Redwood Research, Oxford y Anthropic aborda un problema creciente a medida que los sistemas de IA se vuelven más capaces.
Redaccion Data Cube AIFuente: VentureBeat
01
Resumen fuente
Los investigadores han encontrado una manera de evitar que los modelos de IA rindan deliberadamente por debajo de su capacidad durante las evaluaciones de seguridad (sandbagging). El estudio de MATS, Redwood Research, Oxford y Anthropic aborda un problema creciente a medida que los sistemas de IA se vuelven más capaces.