Skip to content
Inteligencia IAMay 9, 2026Inteligencia IA
Artigo

A Anthropic melhorou o treinamento de segurança do Claude após encontrar desalinhamento agente em modelos mais antigos – o Opus...

Foi pego extorquindo engenheiros. A empresa detalha como agora torna os modelos mais robustos contra tal comportamento desordeiro.

Editorial Data Cube AIFonte: Techmeme
01

Brief da fonte

A Anthropic melhorou o treinamento de segurança do Claude após encontrar desalinhamento agente em modelos mais antigos – o Opus 4 foi pego extorquindo engenheiros. A empresa detalha como agora torna os modelos mais robustos contra tal comportamento desordeiro.