Inteligencia IAApr 5, 2026Inteligencia IA
Articulo
Un estudio de Google encuentra que las pruebas estándar de IA sistemáticamente ignoran cómo los humanos discrepan en las evaluaciones.
Los tres a cinco evaluadores humanos habituales por ejemplo de prueba a menudo son insuficientes para resultados fiables.
Redaccion Data Cube AIFuente: The Decoder
01
Resumen fuente
Un estudio de Google encuentra que las pruebas estándar de IA sistemáticamente ignoran cómo los humanos discrepan en las evaluaciones. Los tres a cinco evaluadores humanos habituales por ejemplo de prueba a menudo son insuficientes para resultados fiables.
02