Intelligence IAMay 9, 2026Intelligence IA
Article
Anthropic a amélioré la formation à la sécurité de Claude après avoir trouvé un désalignement agencique dans les anciens modèles...
Opus 4 a été pris en train de faire du chantage à des ingénieurs. L'entreprise explique comment elle rend désormais ses modèles plus robustes contre de tels comportements déviants.
Redaction Data Cube AISource: Techmeme
01
Brief source
Anthropic a amélioré la formation à la sécurité de Claude après avoir trouvé un désalignement agencique dans les anciens modèles - Opus 4 a été pris en train de faire du chantage à des ingénieurs. L'entreprise explique comment elle rend désormais ses modèles plus robustes contre de tels comportements déviants.