구글(Google)이 검색 서비스 이용자들의 데이터를 인공지능 모델 학습에 활용하는 새로운 기능을 전개하고 있다. 앞으로 수개월에 걸쳐 단계적으로 진행될 예정인 이번 변경사항은 사용자의 검색 기록 데이터 처리 방식을 근본적으로 바꾸게 된다.

구글은 역이미지 검색을 위해 업로드한 사진부터 구글 번역기(Google Translate)의 음성 데이터에 이르기까지 모든 미디어 파일을 계정에 저장한 뒤 AI 모델 개선에 활용할 계획이다. 문제는 이 기능이 기본값으로 활성화되어 있다는 점이다. 사용자가 이전에 구글의 '웹 및 앱 활동'과 '검색 맞춤설정' 토글을 비활성화한 경우를 제외하고는 모두 기본 활성 상태로 설정된다.

이용자들이 이 기능을 거부하려면 구글 계정의 '내 활동' 페이지에 접속해 '검색 서비스 기록(Search Services History)' 탭을 선택한 후, 「AI 훈련을 위해 모든 업로드된 미디어 저장」이라는 항목의 체크박스를 해제해야 한다. 구글 대변인 데이비스 톰슨(Davis Thompson)은 이 기능이 「사용자가 더욱 관련성 높은 검색 결과를 얻고 시각 및 음성 검색을 포함한 과거 검색을 다시 방문할 수 있도록 돕는다」고 설명했다.

특히 주의할 점은 한 번 미디어 데이터가 AI 학습에 사용되면 원래대로 돌릴 수 없다는 것이다. 구글은 설정을 비활성화할 때 「저장된 미디어가 AI 모델 훈련에 사용된 경우, 사용자 계정에서 분리되며 최대 4년간 훈련 데이터로 보관된다」고 명시했다. 따라서 전문가들은 가능한 한 빨리 이 기능을 비활성화할 것을 권고하고 있다.

구글이 새롭게 수집하는 데이터에는 구글 렌즈(Google Lens) 이미지, 검색 라이브(Search Live)나 번역 말하기 연습의 음성 녹음, 사용자가 업로드한 콘텐츠, 그리고 음성 검색 기록이 포함된다.