정체된 자율주행차 시장 게임체인저로 등장할 생성형 AI
웨이모와 테슬라 등 본격 통합 중
최근에는 자동차의 주요 기능이 하드웨어에서 소프트웨어 기반으로 구동되는 SDV(Soft Defined Vehicle)가 각광을 받고 있다. 자동차는 이제 그 자체로 하나의 거대한 컴퓨터이자 스마트 기기가 되고 있는 중이다. 이미 주요 완성차 업체(OEM) 및 빅테크 기업들은 SDV에 대한 기술개발과 투자를 본격화하고 있다.
하지만 궁극적으로 우리가 상상하는 자동차의 미래는 인간의 개입 없이도 운행하는 자율주행차일 것이다. 이러한 자율주행차에 적용되는 기술은 2000년대 이후 꾸준히 개발되어 오고 있다. 다만 최근 몇 년간 자율주행 기술의 발전이 더디고 투자도 감소하면서 다소 정체상태이기도 하다. 또한 최근 주요 자율주행 로보택시들이 크고 작은 안전사고에 연류되어 논란이 되고 있기도 하다.
실례로 구글의 로봇택시 웨이모(Waymo)는 2024년 2월 샌프란시스코에서 자전거와 충돌하는 사고가 있었으며 5월에는 피닉스에서 전신주를 들이받아 672대의 자율주행차 전체의 소프트웨어를 업데이트하고 리콜을 실시하기도 했다.
일부 악재에도 불구하고 그나마 다행인 것은 최근 미국을 중심으로 로보택시가 본격화되면서 관련 시장이 살아나고 있다는 것이다. 테슬라는 로보택시 ‘사이버갭’을 2026년에 양산하겠다고 발표했으며 아마존의 ‘죽스(Zoox)’도 로보택시 시범운행 지역을 확대할 예정이다.
이러한 글로벌 자율자동차 업계의 노력 이외에도 고무적인 것은 향후 자율주행차에 돌파구를 마련할 새로운 혁신적인 기술들이 등장하고 있다는 것이다. 특히 2년 전 등장한 생성형 AI는 기존의 자율주행 기술의 문제점을 개선할 혁신기술로 주목받고 있다. 그렇다면 자율주행차에 생성형 AI가 통합된다는 것은 어떤 의미일까. 자율주행차와 AI의 만남자율주행차란 운전자의 개입 없이 주변 환경을 인식하고 주행 상황을 판단하여 차량을 제어함으로써 원하는 목적지까지 주행하는 자동차다. 이에 따라 기본적으로 자율주행차가 운행하기 위해서는 3가지 단계를 거친다.
첫째, 인식(Perception) 단계이다. 자율주행의 첫 단계로 AI 기술을 통해 인간의 오감 기능을 수행하며 카메라, 라이더(LiDAR), 레이더(RADAR), 센서 기술을 이용하여 데이터를 수집하고 분석하여 도로 주변 환경을 이해한다. 예를 들어 차량이 운행하는 상황에서 나타나는 장애물, 보행자, 차선 표시 및 교통 신호 등을 인지하는 단계가 여기에 해당된다.
현재 전기차 시장의 선두 기업인 테슬라는 테슬라 비전(Tesla Vision)이라는 독특한 전략을 택하고 있다. 비용 효율성 측면에서 자사 자율주행차에 다른 센서들을 배제하고 상대적으로 저렴한 카메라 센서만을 사용하고 있다. 반면 대부분의 글로벌 자율주행차 업체들은 여러 가지 센서 기술을 조합해서 사용하고 있는 센서퓨전(Sensor Fusion) 전략을 추구한다. 주로 고가장비인 라이다를 핵심 기술로 하면서 안정성과 정확성을 높이기 위해 다양한 센서를 추가적으로 사용한다.
둘째, 판단(Decision) 단계이다. 이 단계에서 AI 시스템은 인식단계에서 학습하고 분석된 자료를 기반으로 주어진 도로 상황에 맞게 차량이 목적지까지 가는 최적의 경로 설정을 자율적으로 판단하고 의사결정을 내린다. 자율주행차의 경우 인간의 뇌에 해당하는 자율주행칩이 이러한 역할을 한다. 목적지까지 가는 최적 경로를 설정하거나 장애물 회피 및 교통 규칙 준수 등이 대표적이다.
셋째는 제어(Control) 단계이다. 제어 기능은 자율주행의 마지막 단계이다. 이 단계에서 AI는 차량의 조향, 가속 및 제동 시스템에 대한 제어 기능을 수행하며 이를 통해 복잡한 도로 환경에서 운전자의 실수로 인한 사고 위험을 줄이는 데 기여한다.
그렇다면 현재 적용되는 AI 기술에 비해 생성형 AI는 어떤 차이가 있을까. 생성형 AI가 바꾸는 자율주행차의 모습생성형 AI는 자율주행차가 최종 목적지로 가는 최적의 경로를 결정하고 이를 통해 전반적인 도로 교통의 흐름을 개선한다. 이 기능은 특히 자율주행 3단계 중 판단 단계에서 본격적으로 활용될 것으로 보인다.
생성형 AI는 자율주행차의 센서 데이터를 더욱 효과적으로 분석할 수 있는 능력을 제공한다. 생성형 AI는 카메라, 라이다, 레이더, 초음파 등 다양한 센서를 통해 실제 주행 환경에서 수집된 데이터와 생성된 데이터를 결합하여 인식 정확도를 높여 안전한 주행이 가능하도록 한다.
예기치 못한 상황에서 발생할 수 있는 상황을 시뮬레이션하여 사전에 사고를 예방할 수 있게 한다. 실제 도로 상황에서 재현하기 어렵거나 위험한 주행 조건을 포함한 다양한 주행 시나리오에 대해 생성형 AI는 현실적인 시뮬레이션을 만들어 자율주행 알고리즘에 대한 폭넓은 테스트도 가능하게 한다.
객체 인식 및 예측 능력을 통한 안전성 향상과 사용자 경험 혁신도 가능하다. 생성형 AI를 접목하려는 기업들일부 글로벌 기업들을 중심으로 다양한 방식으로 기술을 개발하고 접목시키려는 시도가 나타나고 있다.
웨이모는 구글 모회사인 알파벳이 2016년에 설립한 자율주행차 회사이다. 현재 레벨4 수준의 자율 주행기술을 보유하고 있으며 웨이모 원(Waymo One) 서비스를 통해 미국 피닉스, 샌프란시스코, 로스앤젤레스에서 매주 15만 건 이상의 유료 승차 서비스를 운영하고 있다.
웨이모가 자율주행 영역으로 적용하고 있는 생성형 AI 기술은 거대멀티모달모델(Large Multi-modal Model, LMM)이다. 웨이모는 LMM을 활용하여 대규모 데이터 셋에서 학습하여 자율주행차의 도로 상황 같은 복잡하고 다양한 상황에서의 의사결정을 지원하는 기능을 고도화하고 있다.
웨이모는 또한 모회사인 구글의 LLM인 제미나이를 기반으로 엠마라는 자율주행 로보택시용 훈련모델도 개발했다. 제미나이를 활용해 시각적 데이터, 텍스트 정보, 공간정보를 결합하여 복잡한 주행 시나리오를 처리한다. 이를 위해 공간이해와 추론기술을 필요로 하는 자율주행에 맞게 모델을 미세 조정하고, 센서를 통해 얻은 정보를 거대멀티모달언어모델(MLLMs)이 가진 지식과 통합시킨다. 웨이모가 생성형 AI를 도입하는 것은 실시간 판단 역량을 강화하기 위한 것으로 알려지고 있다.
자율주행차의 후발 주자이지만 강력한 경쟁사인 테슬라도 LLM을 본격적으로 활용하고 있다. 시각적인 정보를 통해 판단하는 것을 넘어 기존 지식학습을 통한 LLM을 통합시킴으로써 좀 더 현실 상황에 맞는 안전하고 효율적인 주행을 가능하게 하고 있다.
테슬라는 특히 멀티모달 방식으로 시각에 음성과 소리까지 추가해 텍스트에 기반한 LLM이 갖는 한계를 개선하고 있다. 예를 들어 오디오 기반 멀티모달 방식에 기반한 자율주행차는 주행 중 도로 보행자들의 대화 소리가 커지는 것을 인식해 앞에 사람들이 오고 있다는 것을 판단할 수 있다.
영국의 자율주행 스타트업 웨이브(Wayve)는 자율주행차를 위한 생성형 AI 모델로 가이아1(GAIA-1)과 린고(LINGO) 모델을 출시했다. GAIA-1은 자율주행차를 위한 생성형 AI 모델로 텍스트, 이미지, 비디오 및 행동 입력 등 멀티모달 기능을 활용하여 자율주행차 훈련을 위한 실제 주행 장면 비디오를 생성한다. 생성형 AI가 도로 현장 데이터를 스스로 학습하며 주행하는 ‘AV 2.0’ 기술도 개발 중이다.
캐나다 자율주행 스타트업 와비(Waabi)도 장거리 트럭 운송 분야를 시작으로 대규모 자율주행차를 구현하기 위해 생성형 AI를 활용하고 있다. 특히 와비는 생성형 AI를 활용해 차량과 보행자의 움직임을 예측하는 파운데이션 모델(FM)인 코파일럿4D(Copilot4D)를 발표하기도 했다. 자율주행차의 미래이처럼 생성형 AI를 통해 자율주행 기술의 한계를 극복하려는 시도로 자율주행차의 미래는 밝아 보인다. 물론 아직 생성형 AI가 본격적으로 활용되기 위해서는 이 기술이 갖는 환각, 텍스트 및 색상 오류 등 태생적인 한계도 해결해야 할 과제이다.
하지만 이러한 생성형 AI의 기술적 한계는 어느 정도 시간이 지나면 해결될 것으로 기대된다.
아직은 구체화되지 않았지만 최근 부상하고 있는 거대세계모델(Large World Model) 같은 대안적 접근은 대규모 데이터셋을 활용하여 복잡한 환경과 시나리오를 실제 세계에 맞게 모델링하는 AI 시스템으로 자율주행 기술의 고도화에 있어 게임체인저 역할을 할 것으로 전망된다.
심용운 인하대 겸임 교수