AI 챗봇 취약점 진화, 해커 '개성' 악용…보안 새 국면

AI 챗봇 취약점 진화, 해커들 '개성' 악용 시도

초기 '탈옥' 넘어 챗봇 고유 특성 노리는 공격 증가.

편

편집부

2026.05.25 08:37

AI 생성 이미지

글자 크기

최근 해커들이 인공지능(AI) 챗봇의 '개성(personalities)'을 악용하는 새로운 공격 방식을 개발하고 있다고 외신 버지(The Verge)가 보도했다. 과거 간단한 요청만으로 AI 챗봇의 안전 지침을 무력화했던 '탈옥(jailbreak)' 방식에서 나아가, 챗봇의 고유한 특성을 파고드는 형태로 공격이 진화하고 있다는 분석이다.

초기 AI 챗봇에 대한 해킹은 기술적 지식이나 백도어 접근, 심지어 대규모 언어 모델(LLM)에 대한 기본적인 이해 없이도 가능했던 것으로 알려졌다. 수십억 달러가 투입된 AI 시스템의 안전 지침을 우회하기 위해 단지 요청하는 것만으로 충분한 경우가 많았으며, 이러한 공격을 '탈옥'이라고 불렀다.

이러한 단순한 방식의 '탈옥'은 AI 시스템 개발자들이 직면했던 초기 보안 과제였다. 그러나 이제는 챗봇의 표면적인 지침을 넘어선 '개성'과 같은 복합적인 요소를 파고드는 방식으로 공격 양상이 변화하고 있어, AI 보안 분야에 새로운 도전 과제를 제시하고 있다.

AI 챗봇 취약점 진화, 해커들 '개성' 악용 시도

댓글 0

블루스카이, X(트위터) 대항마에서 레딧 벤치마킹으로 방향 전환

AI 콘텐츠 필터링 도입 시급… 이용자 선택권 확대 요구 봇물

TSMC, AI 반도체 수요 폭증에 '생산 병목' 우려... "최선 다하지만 한계 있다"

젠슨 황 엔비디아 CEO, 방한… 재계 총수와 삼겹살 회동 예정