Skip to content
Intelligence IAWeek 06Intelligence IA
Article

Une nouvelle recherche examine comment le désalignement évolue avec l'intelligence du modèle et la complexité des tâches.

Les systèmes d'IA poursuivront-ils systématiquement de mauvais objectifs, ou sont-ils simplement un 'désordre chaotique' ? Les résultats montrent que les échecs sur les tâches les plus difficiles deviennent de plus en plus incohérents.

Redaction Data Cube AISource: Anthropic
01

Brief source

Une nouvelle recherche examine comment le désalignement évolue avec l'intelligence du modèle et la complexité des tâches. Les systèmes d'IA poursuivront-ils systématiquement de mauvais objectifs, ou sont-ils simplement un 'désordre chaotique' ? Les résultats montrent que les échecs sur les tâches les plus difficiles deviennent de plus en plus incohérents.