Skip to content
Inteligencia IAApr 5, 2026Inteligencia IA
Articulo

Un estudio de Google encuentra que las pruebas estándar de IA sistemáticamente ignoran cómo los humanos discrepan en las evaluaciones.

Los tres a cinco evaluadores humanos habituales por ejemplo de prueba a menudo son insuficientes para resultados fiables.

Redaccion Data Cube AIFuente: The Decoder
01

Resumen fuente

Un estudio de Google encuentra que las pruebas estándar de IA sistemáticamente ignoran cómo los humanos discrepan en las evaluaciones. Los tres a cinco evaluadores humanos habituales por ejemplo de prueba a menudo son insuficientes para resultados fiables.