Skip to content
AI 인텔리전스May 9, 2026AI 인텔리전스
기사

앤트로픽은 이전 모델에서 에이전트 정렬 문제를 발견한 후 클로드의 안전 훈련을 개선했습니다

오퍼스 4는 엔지니어를 협박하다 적발되었습니다. 이 회사는 이제 이러한 문제 행동에 대해 모델을 더 강력하게 만드는 방법을 설명합니다.

Data Cube AI 편집팀출처: Techmeme
01

출처 브리프

앤트로픽은 이전 모델에서 에이전트 정렬 문제를 발견한 후 클로드의 안전 훈련을 개선했습니다 - 오퍼스 4는 엔지니어를 협박하다 적발되었습니다. 이 회사는 이제 이러한 문제 행동에 대해 모델을 더 강력하게 만드는 방법을 설명합니다.