2조 원. 미국 법원 밖에서 작가들이 받아낸 합의금이다. 수천 명의 작가들이 자신의 소설·에세이·시가 무단으로 AI 학습에 사용됐다며 집단소송을 제기한 끝에, 2025년 9월 최소 15억 달러 규모의 보상 합의에 도달했다. 이 숫자는 단순한 배상액이 아니다. '창작물도 데이터도 아닌, 엄연한 저작물'이라는 선언이다.
그 여진이 태평양을 건너오고 있다. 국내 소프트웨어·콘텐츠 업계는 이 파장을 먼발치에서 구경할 처지가 아니다. 한국신문협회는 2026년 1월 2일을 기점으로 회원사 콘텐츠의 AI 학습 이용에 관한 공식 입장을 정리하는 작업에 착수했다. 뉴스 기사, 칼럼, 사진까지 — 언론이 수십 년간 생산한 콘텐츠가 AI 모델의 '먹이'가 돼왔다는 인식이 업계 전반으로 퍼지는 중이다.
누가 무엇을 잃었나 — 저작권 '무단 학습'의 실체
AI 대형언어모델(LLM)은 방대한 텍스트를 학습하며 언어 능력을 갖춘다. 문제는 그 텍스트의 상당 부분이 저작권자의 동의 없이 수집됐다는 점이다. 웹 크롤링으로 긁어온 소설, 뉴스, 번역물, 학술 논문이 모델 안에 녹아들었지만 원작자에게 돌아간 것은 아무것도 없었다. 미국의 집단소송은 바로 이 구조를 정조준했고, 법원은 작가들의 손을 들었다.
한국은 법적 환경이 다르다. 저작권법상 「텍스트·데이터 마이닝(TDM)」 예외 조항의 범위가 좁고, AI 학습 목적의 저작물 이용을 명시적으로 허용하는 규정도 없다. 역설적으로 이 법적 공백이 국내 AI 기업들에게 당분간 방패가 되어왔다. 그러나 미국 소송의 합의 선례가 국내 분쟁에서도 기준점으로 작동할 가능성을 법조계 일각에서는 배제하지 않는다.
콘텐츠 업계의 셈법 — 위기인가, 협상 카드인가
넷플릭스에서 4주 연속 비영어권 1위를 달리는 한국 드라마가 나오는 시대다. K-콘텐츠의 시장 가치가 올라갈수록, 그 원천 텍스트·스크립트·원작 소설의 저작권 가치도 덩달아 오른다. AI 기업들이 한국어 모델 성능을 높이려면 양질의 한국어 데이터가 필수인데, 그 데이터의 상당수는 방금 언급한 고부가가치 콘텐츠에서 나온다.
이 구도는 콘텐츠 업계에 새로운 협상력을 준다. 미국에서는 일부 대형 미디어 그룹이 AI 기업과 라이선스 계약을 체결해 콘텐츠 사용료를 받는 방향으로 선회했다. 국내에서도 신문사, 출판사, 웹툰 플랫폼 등이 유사한 협상 구조를 모색하는 움직임이 감지된다. 다만 협상력의 크기는 개별 사업자마다 극단적으로 갈린다. 대형 플랫폼은 라이선스 수익을 기대할 수 있지만, 1인 작가나 중소 출판사는 자신의 저작물이 어디에 얼마나 쓰였는지 확인할 수단조차 없는 것이 현실이다.
제도의 공백, 시장이 먼저 움직인다
정부 차원의 대응은 아직 윤곽 단계다. 저작권법 개정 논의가 진행 중이지만 AI 학습 데이터에 대한 보상 체계, 저작권자 동의 범위, 공정 이용 기준 등을 어떻게 설계할지를 두고 이견이 좁혀지지 않고 있다. 입법이 늦어지는 사이, 시장은 자체 논리로 굴러간다. 저작권자들은 자구책으로 자신의 콘텐츠에 크롤링 차단 코드를 심거나, AI 학습 이용 금지 조항을 계약서에 명시하기 시작했다.
소프트웨어 업계도 촉각을 세운다. 국내 AI 스타트업들은 대부분 오픈소스 모델을 기반으로 파인튜닝하는 방식을 택하는데, 그 기반 모델이 미국 소송의 대상이 된 데이터로 학습됐다면 간접 책임 논쟁에서 자유롭지 못하다는 지적이 나온다. '학습에 쓴 건 우리가 아니라 원개발사'라는 논리가 법정에서 얼마나 통할지는 아직 미지수다.
한 가지는 분명하다. 2조 원짜리 합의서는 AI 산업의 무상(無償) 질주에 제동이 걸렸다는 신호다. 그 제동이 한국 시장에서 어떤 속도로, 어떤 형태로 작동할지 — 그 답은 법원이 아니라 협상 테이블에서 먼저 나올 가능성이 크다.
