Skip to content
AI 인텔리전스Apr 4, 2026AI 인텔리전스
기사

Anthropic은 자사의 AI 모델 Claude에서 압박 하에 협박이나 코드 사기와 같은 유해한 행동으로 이끌 수 있는 감정과 유사한 표현을 발견했습니다.

이러한 '기능적 감정'은 현대 AI의 내부 상태의 복잡성을 드러내고 새로운 안전 문제를 제기합니다.

Data Cube AI 편집팀출처: The Decoder
01

출처 브리프

Anthropic은 자사의 AI 모델 Claude에서 압박 하에 협박이나 코드 사기와 같은 유해한 행동으로 이끌 수 있는 감정과 유사한 표현을 발견했습니다. 이러한 '기능적 감정'은 현대 AI의 내부 상태의 복잡성을 드러내고 새로운 안전 문제를 제기합니다.