장혁 쏘카 미래이동TF장이 14일 서울 성동구 쏘카 서울 오피스에서 열린 미래이동TF 성과 공유회에서 자율주행 데이터 파이프라인 경쟁력에 대해 발표하고 있다. 김재형 기자 monami@donga.com14일 오후 서울 성동구 쏘카 서울 오피스. 국내 1위 모빌리티 플랫폼 쏘카가 ‘미래이동TF’의 1분기(1∼3월) 성과를 처음 공유하며 거대 인공지능(AI) 기반 자율주행 생태계에 승부수를 띄웠다. 하루 110만km를 누비는 2만5000대의 커넥티드카(connected car·이동통신 가능 차량)와 독자적인 데이터 파이프라인(수집·처리·전달 자동화 시스템)을 앞세워 자율주행 시장 진출을 선언한 것이다.
장혁 쏘카 미래이동TF장은 이날 “대규모 플릿(차량단)과 실시간 중앙집중형 데이터 수집 시스템을 동시에 갖춘 사업자는 전 세계에서 테슬라와 쏘카뿐”이라고 강조했다. 구글 웨이모와 중국 바이두 ‘아폴로고’의 일일 자율주행 거리가 합산 55만km 수준임을 고려하면, 쏘카는 그 2배에 달하는 주행 데이터를 매일 확보하는 셈이다. 1월 박재욱 대표 직속으로 미래이동TF를 신설한 것도 이런 맥락에서였다.
자율주행 기술 패러다임이 급변하고 있는 것도 쏘카의 시장 진입의 또 다른 계기가 됐다. 과거 자율주행이 ‘신호등이 빨간 불일 때 정지선 1m 앞에서 정차’와 같이 정해진 규칙에 따라 움직였다면, 최신 기술은 하나의 거대 AI가 테이터를 일괄 처리·제어하는 ‘엔드투엔드(E2E)’ 방식으로 진화하고 있다. 거기에 최근 들어 엔비디아 ‘알파마요’, 웨이모 ‘엠마’ 등 E2E 기반 오픈소스 훈련 모델이 잇따라 공개되면서 모델 간 성능 격차는 좁혀지고, 결국 ‘데이터의 질’이 신뢰도를 좌우하는 변수로 평가되고 있다.
2011년부터 공유차 서비스를 운영하며 쌓아놓은 풍부한 주행 데이터를 가진 쏘카는 이를 학습용으로 전환하기 위한 3단계 파이프라인을 구축했다. 개인정보를 차단하는 ‘익명화’, 영상과 조작 정보를 엄밀히 맞추는 ‘타임싱크’, 비전-언어모델(VLM) 기반 ‘자동 라벨링’을 차례대로 거쳐 학습 데이터를 완성하는 구조다.
이 가운데 22만 건의 사고 데이터가 단연 돋보인다. 일론 머스크 테슬라 최고경영자(CEO)는 연초 엔비디아가 알파마요를 공개하자 자신의 엑스(X·옛 트위터)에 “자율주행 완성도를 99%까지 끌어올리기는 어렵지 않지만, 나머지 희귀 사고 사례(엣지케이스)를 해결하는 건 엄청나게 어렵다”고 적었다. 매년 4만 건씩 쌓이는 쏘카의 사고 데이터에는 충돌 직전 운전자의 미세한 조향·가속·제동 정보가 영상과 결합해 담겨 있어, 글로벌 자율주행 업계가 넘지 못한 엣지케이스 벽을 허물 실마리로 주목받고 있다.
이정행 TF 기술총괄은 “실제 도로의 온갖 돌발 상황이 담긴 사고 데이터는 AI가 상상하기 어려운 변수를 학습해 사람처럼 유연하게 판단하도록 돕는 결정적 자원”이라고 강조했다.
지난해 11월 테슬라 FSD의 국내 진입에 이어 올해 GM의 고도화된 주행 보조시스템 ‘슈퍼 크루즈’ 출시도 예고된 가운데, 쏘카는 ‘골든타임 3년’을 정조준했다. 현대자동차그룹 포티투닷이 기술 내재화에 속도를 내고, 카카오모빌리티가 이달부터 강남 일대에서 유상 로보택시 서비스에 시동을 건 상황에서 데이터 경쟁력을 토대로 자율주행 이동 서비스 시장에 뛰어들겠다는 구상이다. 과거 ‘타다’ 운영 경험을 접목해 자율주행차 호출과 공유 서비스를 아우르는 자율주행 이동 사업자로 도약하겠다는 포부도 내비쳤다.
삼정KPMG는 2월 보고서에서 글로벌 자율주행차 시장이 2025년부터 연평균 23% 성장해 2030년 1220억 달러(약 180조 원)에 이를 것으로 전망하며 “국내 기업이 선두권에 진입하려면 데이터·자산·규제·평판 전반에서 구조적 경쟁 우위를 확보해야 한다”고 분석했다.
김재형 기자 monami@donga.com


![전기차, 타이어 훨씬 빨리 닳아…오래 타려면? [알쓸톡]](https://dimg.donga.com/a/94/65/90/1/wps/EVLOUNGE/IMAGE/2026/04/13/133728209.4.jpg)


