이족 보행은 휴머노이드의 전유물

모델 기반 보행에서 학습 기반 보행으로 발전

최근 가장 많은 관심을 받은 로봇은 휴머노이드라 할 수 있다. 다른 로봇에는 없고 휴머노이드만 가진 기능이라면 단연 사람처럼 두 다리로 걷는 이족 보행을 들 수 있다. 휴머노이드의 보행 기술은 AI의 발전에 힘입어 한층 진화하고 있다.휴머노이드 로봇의 가장 큰 특징은 로봇의 형태가 사람의 신체 구조와 판박이라 할 만큼 닮았다는 점이다. 그런데 휴머노이드의 구조와 기능을 부위별로 나눠 보면 의외로 다른 로봇과 비슷하거나 부품까지 공유하는 경우가 많다.예를 들어 휴머노이드의 팔은 산업용 다관절 로봇이나 협동로봇과 구조적으로나 기능상으로 유사한 점이 많다. 사람의 손을 닮은 다지형 그리퍼는 휴머노이드뿐만 아니라 산업용로봇과 협동로봇도 공유할 수 있는 엔드 이펙터이다.그러나 두 다리는 오직 휴머노이드만 가진 부분이다. 즉 두 다리를 이용하는 이족 보행 기능은 다른 로봇에는 없고 휴머노이드만 가진 기능이다. 보행 기능이 모든 면에서 우월하다고 보기는 힘들다. 로봇청소기 등 AMR(Autonomous Mobile Robot)처럼 바퀴로 움직이는 차륜형이나 폭발물 처리 로봇 등 주로 특수 서비스 로봇에 적용되는 무한궤도형 등은 운반량이나 평지에서의 이동 속도 등에서 보행 방식을 능가한다. 그렇지만 보행 방식은 차륜형, 무한궤도형 이동 방식을 채택한 로봇들이 접근하지 못하는 지형지물에 접근할 수 있다는 특유의 강점을 지닌다. 문턱을 넘거나 계단을 오르내리고, 사다리를 탈 수 있는 방식은 보행 기능뿐이다. 지구 지표면에서 차륜형으로 접근할 수 있는 면적은 2분의 1 정도에 그치지만 다리를 이용하면 80% 이상의 면적에 접근할 수 있다는 미 국방부의 연구 결과도 공개된 바 있다. 이처럼 보행 기술의 유용성은 이미 입증되어 있지만 기술적으로 구현하는 데 상대적으로 오랜 시간이 걸렸다.인간이 생활하는 실제 환경에서 휴머노이드가 쉽게 이동할 수 있는 안정적인 보행 기능을 구현하기 위한 연구는 1990년대부터 꾸준히 진행되어 왔다. 휴머노이드의 보행 기술은 모델 기반 제어(Model-Based Control Methods)를 거쳐 강화학습 기반 제어(Reinforcement Learning-Based Control Methods)로 발전해 왔다. 최근에는 AI의 발전에 힘입어 두 유형의 기술이 가진 장점을 두루 갖춘 하이브리드 방식의 기술도 등장하고 있다.먼저 모델 기반 제어는 휴머노이드의 복잡한 동역학 및 기구학적 특성을 수학적으로 모델링하고, 사전에 계획된 보행 궤적을 그대로 따라서 동작하도록 두 다리를 제어하는 방식이다. 모델 기반 제어는 발을 디딜 위치가 정해지면 무게 중심의 이동과 로봇 다리가 움직일 궤적을 계획하고, 계획된 궤적에 맞춰 다리가 움직이도록 제어한다. 모델 기반 제어 중 핵심 알고리즘으로 자리 잡은 기술은 모델 예측 제어(MPC: Model Predictive Control) 방식이다.모델 예측 제어의 장점은 이론적으로 검증된 안정성과 예측 가능한 성능을 제공할 수 있다는 점이다. 정밀한 위치 제어가 필요한 작업이나 제약 조건이 엄격한 환경에서 우수한 성능을 보인다. 또 미래 상태를 예측해서 최적의 궤적을 계산할 수 있어 복잡한 제약 조건하에서도 효과적으로 제어할 수 있다. 모델 기반 제어는 수학적 모델을 기반으로 시스템의 동작을 정확히 예측할 수 있기 때문이다. 다만 실제 환경에서 발생할 수 있는 각종 변화를 모두 예측하긴 힘들므로 현장 지형과 모델 간의 오차를 완벽하게 고려하기 어렵다는 점은 모델 예측 제어의 한계로 지적된다.모델 예측 제어 중에서 많이 사용된 기술로는 ZMP(Zero Moment Point)와 CP(Capture Point)를 들 수 있다. ZMP 방식은 마치 줄타기를 타듯이 로봇이 걸을 때 발바닥에서 발생하는 모든 힘이 균형을 이루는 지점을 찾는 방법이다. 천천히 걷거나 예측 가능한 상황에서는 안정적으로 걸을 수 있지만 갑자기 밀리거나 장애물을 만나는 등 환경이 빠르게 변하거나 빨리 뛰고 점프하는 등 급격한 환경 변화 및 동작 전환에는 적합하지 않다는 한계도 지닌다.CP 방식은 사람이 넘어질 것 같을 때 본능적으로 발을 앞으로 내딛듯이 휴머노이드의 이동 속도와 방향을 고려해서 다음 착지 지점을 계산하는 방식이다. ZMP 방식과 달리 갑작스러운 상황 변화나 동작 전환에 신속하게 대응할 수 있지만 자세 제어가 부정확하다는 한계도 있다. 최초로 사람 같은 보행을 완벽하게 수행해 냈던 혼다의 아시모(ASIMO), 휴머노이드의 대표 모델이던 보스턴다이내믹스의 아틀라스(Atlas) 등은 모두 모델 기반 제어 기술에서 시작한 대표적인 휴머노이드들이다.모델 기반 제어에 이어 등장한 보행 기술은 딥러닝(Deep Learning), 강화학습(Reinforcement Learning, RL) 등의 AI 알고리즘을 활용한 학습 기반 제어(Learning-Based Control Methods) 방식이다. 학습 기반 제어는 로봇과 환경의 상호작용을 통해 발생한 경험 데이터로 학습해서 환경과의 상호작용을 통해 최적의 행동 패턴을 자율적으로 학습할 수 있는 능력을 제공한다.특히 강화학습 기반 제어는 울퉁불퉁한 지형 등 모델링하기 어렵거나 불확실성이 있는 복잡하고 동적인 환경에서도 우수한 적응 능력을 보인다. 학습 기반 제어도 완벽하다고 보기는 힘들다. 학습 과정에서 예측하기 어려운 행동이 나타날 수 있어 안전성 확보가 상대적으로 어렵고 실제 환경에서의 측정 오차 등으로 급격한 성능 저하가 발생할 가능성이 크다는 점 등은 여전히 해결해야 할 과제로 남아 있다.미국 어질리티로보틱스의 로봇 캐시(Cassie), 테슬라의 옵티머스(Optimus), 피겨AI의 피겨 01(Figure 01)은 강화학습 기반 제어가 적용된 대표적인 휴머노이드들이다. 유비테크 등 중국 휴머노이드 기업들도 초기에는 모델 기반 제어로 시작했다가 지금은 시뮬레이션과 실제 환경에 수집한 데이터를 이용한 강화학습(RL)이나 딥러닝 기술을 적극 활용하고 있다.최근에는 두 기술의 장점을 결합한 하이브리드 방식의 기술도 새로운 트렌드로 떠오르고 있다. 대표적인 예로는 스위스 취리히연방공대(ETH Zurich)가 개발한 DTC(Deep Tracking Control) 알고리즘을 들 수 있다. 모델 기반 경로 최적화 방법을 통해 험지에서 기구학 및 동역학적으로 실현 가능한 전신 궤적을 계산하고, 이를 강화학습 기반 AI 모델로 정밀하게 추종하는 혁신적인 방식을 제안했다. 일각에서는 지형 정보를 활용한 강화학습 기반 제어 기술도 연구하고 있다. 휴머노이드의 주변 지형을 고도를 나타내는 하이트 맵(Height map) 형태로 입력한 다음, 다양한 지형을 인지하고 보행 제어에 반영하는 기술들도 개발되고 있다.일부 중국 휴머노이드 기업들도 모델 기반 제어의 안정성과 학습 기반 제어의 적응성을 결합한 하이브리드 제어를 신속하게 채택하고 있다. 애지봇은 AI 기반 행동 인식과 기존 물리 기반 제어를 유기적으로 연동한, 보다 효과적인 보행 기술을 개발하고 있다. 발 부위에 바퀴를 부착한 하이브리드 방식의 다리를 가진 애지봇의 휴머노이드 X2-N은 카메라를 통해 수집되는 시각 데이터에 의존하지 않고 관절 토크, 압력 센서, 임 센서, 자이로 등 각종 센서의 신호를 이용해서 지형 환경을 실시간 판단하고 지형에 맞춰 다리 또는 바퀴로 이동 방식을 전환하는 보행 기술을 선보였다.