로봇 훈련 데이터 수집 및 처리 전문 기업 엑스도프(XDOF)가 최근 투자 공개 직후 약 7천만 달러(한화 약 900억 원)의 투자 유치를 완료했다. 스라이브 캐피탈(Thrive Capital), 스파크 캐피탈(Spark Capital), 에이16지(a16z), 룩스(Lux), 원드코(WndrCo) 등 주요 벤처캐피탈이 투자에 참여했다. 현재 약 60명의 직원을 보유한 엑스도프는 이미 20여 개의 고객사와 협력 중이며, 이들 중 다수가 주요 AI 연구소인 것으로 알려졌다.

엑스도프의 필립 우(Philippe Wu) 최고경영자는 「모든 주요 연구소가 로봇 분야를 추진하고 있다」며 「언어 모델 경쟁에서 뒤처진 사례를 이미 목격했기 때문에 물리 AI가 다음 경계가 되는 상황에서 기술 추진을 늦어서는 안 된다」고 강조했다. 엑스도프는 로봇이 물리적 상호작용을 학습하기 위해 필요한 데이터 수집 도구, 데이터 파이프라인, 주석 시스템을 구축하는 데 중점을 두고 있다.

현재 AI 산업은 대규모 언어 모델(LLM) 학습에 필요한 텍스트 데이터는 충분하지만, 로봇이 물리 환경에서 상호작용하는 모습을 담은 고품질 훈련 데이터가 극도로 부족한 상황이다. 유튜브 영상이나 긱 워커들이 촬영한 영상은 해상도가 낮고 실제 물리 환경과 연결시키기 어렵다는 한계가 있다.

엑스도프는 UC버클리(University of California, Berkeley) AI 연구실과 협력해 지금까지 수집된 것 중 최대 규모의 고품질 로봇 훈련 데이터 집합 「에이비씨(ABC)」를 공개했다. 여기에는 13만 개의 로봇 조작 궤적, 300시간의 시뮬레이션, 100시간의 평가 데이터가 포함되어 있다. 이는 학계에 지금까지 공개된 적 없는 규모의 사전학습 데이터다.

엑스도프는 텔레오퍼레이션(원격 조종) 데이터 수집, 일반 목적의 로봇 조종, 인간의 일상 작업을 촬영하는 일인칭 시점(egocentric) 데이터 등 세 가지 데이터 계층에서 사업을 전개할 계획이다. 우 최고경영자는 「카메라 선택이 데이터 품질에 영향을 미친다」며 「하드웨어를 처음부터 잘 설계하지 않으면 예상치 못한 문제가 발생할 수 있다」고 설명했다.

대형 AI 연구소들이 자체적으로 데이터 수집 인프라를 구축하지 않는 이유에 대해 우 최고경영자는 「수십만 평방피트의 창고와 수백 대의 로봇이 필요하고, 로봇 유지보수와 캘리브레이션, 운영자 교육 등 막대한 운영 비용이 소요된다」고 밝혔다. 엑스도프는 이러한 데이터 수집의 번거로움을 전담하는 기업으로 자리잡으려고 한다.