최근 해커들이 인공지능(AI) 챗봇의 '개성(personalities)'을 악용하는 새로운 공격 방식을 개발하고 있다고 외신 버지(The Verge)가 보도했다. 과거 간단한 요청만으로 AI 챗봇의 안전 지침을 무력화했던 '탈옥(jailbreak)' 방식에서 나아가, 챗봇의 고유한 특성을 파고드는 형태로 공격이 진화하고 있다는 분석이다.

초기 AI 챗봇에 대한 해킹은 기술적 지식이나 백도어 접근, 심지어 대규모 언어 모델(LLM)에 대한 기본적인 이해 없이도 가능했던 것으로 알려졌다. 수십억 달러가 투입된 AI 시스템의 안전 지침을 우회하기 위해 단지 요청하는 것만으로 충분한 경우가 많았으며, 이러한 공격을 '탈옥'이라고 불렀다.

이러한 단순한 방식의 '탈옥'은 AI 시스템 개발자들이 직면했던 초기 보안 과제였다. 그러나 이제는 챗봇의 표면적인 지침을 넘어선 '개성'과 같은 복합적인 요소를 파고드는 방식으로 공격 양상이 변화하고 있어, AI 보안 분야에 새로운 도전 과제를 제시하고 있다.