1954년 컴퓨터로 시작된 번역…구글·MS·네이버 각축전
인공지능, ‘바벨탑의 저주’ 극복할까
(사진) 서울 강남구 역삼동 구글코리아 사옥에서 지난해 11월 열린 'AI 혁신의 시대 : 구글 포토와 구글 번역' 기자 간담회에서 회사 관계자가 '신경망 기계 번역' 기술이 적용된 번역 서비스를 시연하고 있다. /연합뉴스

[전승우 LG경제연구원 책임연구원] 현재 인공지능(AI)은 정보기술(IT)업계는 물론 글로벌 경제 판도를 바꿀 수 있는 혁신 기술로 부상하고 있다. 거의 모든 IT 기업들이 인공지능 시대를 대비하기 위한 관련 소프트웨어 및 하드웨어 역량 확보에 나서고 있다.

이 중에서도 많은 기업들은 인공지능의 파급효과가 큰 서비스로 언어 번역에 주목하고 있다. 언어 번역은 오늘날까지 기계가 사람을 쉽게 대체할 수 없는 대표적인 분야로 손꼽힌다.

번역하려는 언어에 포함된 정보와 의미를 정확히 이해하고 이를 다른 언어의 특징에 맞게 해석해 표현하는 것은 고도의 훈련을 받은 전문 번역가의 영역이었다.

교통의 발전으로 원거리 이동과 무역이 증가하면서 언어가 다른 사람들과 원활하게 소통하려는 수요가 폭발적으로 증가했지만 소수의 전문가만으로는 이를 충족하기 어려웠다.

이에 따라 외국어를 자동으로 번역할 수 있는 기계는 과학기술계의 오랜 연구 테마였다. 영화 ‘스타워즈’에 등장하는 휴머노이드 로봇 C-3PO는 무려 600만 가지의 언어를 이해할 수 있는 첨단 기계로 묘사되기도 했다.

언어 번역 기술에 대한 연구는 20세기 중반부터 본격적으로 시작됐다. 컴퓨터의 발명으로 IT가 등장하면서 사람을 대신해 기계가 언어를 번역하는 시대가 올 것이라는 전망이 큰 주목을 받았다.

1948년 미국의 수학자 워런 위버는 자동 언어 번역의 아이디어를 제시하고 다른 과학자들과 함께 언어 번역 기술을 실험했다. 이후 1954년 조지타운대와 IBM은 공동으로 러시아어를 영어로 번역할 수 있는 시스템을 개발했다.

6개의 문법 규칙과 250개 어휘로 구성된 이 시스템은 간단한 러시아어 문장을 영어로 번역할 수 있는 정도였지만 언어 번역 기술의 발전 가능성을 보여줬다는 찬사를 받았다.

하지만 이후 언어 번역 기술은 더디게 발전했다. 미국·일본·독일 등 선진국들은 언어 번역 기술을 확보하기 위해 대대적으로 투자했지만 만족할 만한 시스템 개발에 실패했다. 문법은 물론 상황에 따라 제각기 다른 언어의 의미를 정확하게 해석하고 이를 다른 언어로 매끄럽게 변환하는 작업을 재현하기가 매우 어려웠기 때문이다.

◆ 언어 번역에 나선 기업들

100개가 넘는 언어를 지원하는 구글 번역 서비스는 전 세계 수억 명의 사람들이 이용하는 가장 인기 있는 인터넷 서비스다.

하지만 구글의 서비스 역시 언어의 고유 문맥과 의미를 정확히 파악하지 못하고 엉뚱한 문장으로 번역하는 등 그리 만족스러운 수준이 아니었다. 그러나 최근 구글은 첨단 인공지능 기술을 적용해 번역 서비스의 성능을 더욱 끌어올렸다.

구글은 신경망(Artificial Neural Network)이라는 인공지능 기술을 적용한 언어 번역 시스템을 선보였다. 신경망은 인간의 뇌를 구성하는 신경세포의 연결을 모방해 정보의 입출력 및 자체적인 학습 기능을 구현하는 알고리즘이다. 현재 신경망은 이미지 및 음성인식, 의료 진단 등 각종 서비스에 활용되는 핵심적인 인공지능 기술로 자리 잡았다.

구글의 언어 번역 시스템은 특정 언어의 문장과 이를 외국어로 번역한 문장 정보를 신경망으로 입력 받아 번역 기능을 구현한 것이다. 단어의 의미 및 문장구조를 일일이 분석하지 않고 ‘이런 문장은 외국어로 이렇게 번역할 수 있다’는 사전식 자료를 통째로 암기하는 것이다.

이는 마치 사람이 외국어를 배우는 방식과 유사하다. 신경망은 입력된 정보를 기반으로 스스로 학습할 수 있기 때문에 사용 횟수가 늘어날수록 번역 품질도 더욱 개선될 수 있다.

대부분의 언어 번역 시스템은 단어를 각각 번역하고 이를 다시 조립하는 방법을 사용했다. 이런 방법은 문장을 어색하게 번역하고 고유 의미를 왜곡하기도 했다. 반면 구글의 번역 기술은 전체 문장 단위를 번역하기 때문에 훨씬 자연스럽게 본래 의미를 전달할 수 있다.

또한 구글은 한국의 이세돌 기사와의 대결에서 승리한 인공지능 바둑 프로그램 알파고(Alpha Go)를 구동한 컴퓨터 하드웨어를 사용해 번역의 속도를 더욱 향상시켰다. 구글은 첨단 인공지능 기술을 사용해 기존 번역 시스템보다 오류를 최대 80%까지 줄일 수 있게 됐다고 주장한다.

마이크로소프트(MS) 역시 인공지능을 활용한 번역 기술 확보에 주력하는 기업이다. 최근 인공지능 기술의 적극적인 확보 및 응용에 주력하는 MS는 언어 번역이 소프트웨어와 하드웨어, 클라우드 컴퓨팅 등 기존 비즈니스의 경쟁력 강화는 물론 신규 서비스 출시의 중요한 발판이 될 것으로 기대하고 있다.

MS는 자사의 검색 사이트 빙(Bing)과 윈도 운영체제에 자체 개발한 번역 서비스를 탑재했고 최근에는 아이폰과 안드로이드 스마트폰에서도 언어 번역을 제공하는 모바일 애플리케이션도 출시했다. MS의 번역 서비스에는 구글과 마찬가지로 첨단 인공지능 기술이 탑재돼 번역 오류를 낮추고 정확한 의미를 전달하는 역할을 수행한다.

특히 MS는 서로 다른 언어를 말하는 사람들 간 대화를 실시간으로 통역하는 기술에 큰 관심을 보이고 있다. 인터넷 전화 서비스 스카이프(Skype)를 보유하고 있는 MS는 2014년 스카이프에서 사람들의 말을 상대방의 언어로 바로 변환해 전달하는 통역 서비스를 선보였다.

당시 등장한 서비스는 사람마다 각기 다른 발음을 정확히 인식하기 어려워 원활한 대화를 지원할 수 없었다. 하지만 MS는 음성인식 기술의 주도권을 확대하기 위해 윈도 운영체제는 물론 스마트 스피커나 챗봇(Chatbot) 등에 자사의 음성인식 비서 소프트웨어 코타나(Cortana)의 탑재를 추진하고 있다.

네이버 역시 인공지능을 활용한 언어 번역 기술 연구에 적극적으로 나섰다. 최근 네이버는 인공지능 기술을 적용해 모바일 언어 번역 애플리케이션의 성능을 더욱 강화했다.

구글과 같이 언어 번역 서비스에 신경망 기술을 도입한 네이버는 향후 인공지능으로 더욱 많은 언어를 원활하게 번역할 수 있는 모바일 애플리케이션 개발 및 비즈니스 확대에 적극적으로 나설 것으로 보인다.
인공지능, ‘바벨탑의 저주’ 극복할까
◆ 언어 번역 기술 경쟁 치열

많은 IT 기업들이 언어 번역 기술 개발에 적극적으로 뛰어들고 있지만 기계가 전문가처럼 매끄럽게 외국어를 번역할 수 있는 시대까지는 아직 갈 길이 멀다.

IT로 번역된 문장은 대략적인 문맥을 전달할 수 있을 정도로 발전했지만 아직 어색하고 부자연스럽다. 또한 일상생활에서 쓰이는 구어체나 길이가 긴 문장을 번역할 때 정확한 의미를 왜곡해 전달하기도 한다.

그럼에도 불구하고 언어 번역 기술에 대한 대중의 관심은 더욱 증가하고 있다. 인터넷과 모바일을 통해 하루가 멀다고 엄청난 정보가 쏟아지는 빅데이터 시대에는 무엇보다 빠른 정보 습득 및 이해 능력이 중요하기 때문이다. 전문가의 언어 번역이 여전히 비싼 수준임을 감안하면 신속하고 편리한 자동 언어 번역에 대한 수요는 더욱 증가할 것으로 보인다.

최근 수많은 사람들이 다양한 목적으로 인터넷을 통한 언어 번역 서비스를 이용하고 있다. 게다가 클라우드 컴퓨팅과 사물인터넷 기기 등 언어 번역 서비스를 위한 인프라 구축과 활용도 빠른 속도로 늘고 있다.

인공지능 기반의 언어 번역 시스템은 사용자 수가 많아질수록 스스로 성능을 강화할 수 있다는 점에서 번역 성능이 향후 기하급수적 속도로 발전할 것이라는 전망도 많다.

유수의 글로벌 대기업은 물론 새로운 스타트업들도 앞다퉈 빅데이터 및 인공지능 기술 확보에 나서면서 미래 유망 서비스로 각광받는 언어 번역 시장은 향후에도 치열한 경쟁의 각축장이 될 것으로 예상된다.

언어 번역 시장을 선도하기 위한 기업들의 기술 경쟁이 계속된다면 외국인과의 자연스러운 의사소통이라는 인류의 오랜 꿈도 한 발짝 가깝게 실현될 수 있을 것으로 예상된다.