정영훈 엑스엘에이트 대표

-전 세계 미디어 콘텐츠의 초벌 번역 담당
-번역 가능한 언어쌍(Language pairs) 73개(2022년 10월 말 기준)

(왼쪽부터) 정영훈 CEO, 박진형 CTO(최고기술경영자)
(왼쪽부터) 정영훈 CEO, 박진형 CTO(최고기술경영자)
[한경잡앤조이=이진호 기자] 엑스엘에이트(XL8)는 인공지능(AI) 기계 번역 기술을 개발한 스타트업이다. 정영훈 대표(41)가 2019년 10월에 설립했다.

삼성전자에서 첫 커리어를 시작한 정 대표는 2011년 미국 컬럼비아대로 유학을 떠나 컴퓨터공학 박사를 졸업한 뒤 구글에 취직해 4년간 검색팀, 이벤트 서치팀을 거쳐 테크 리드 매니저로 일했다.

“구글에서 자연어처리 시스템 개발 리드를 담당했습니다. 많은 발전이 있었지만 여전히 해결하지 못하는 문제가 많았습니다. 기계번역의 경우 2017년 구글이 발표한 ‘트렌스포머(Transformer)’ 기계번역 모델이 시작돼 기계번역 분야에 큰 발전이 있었지만, 여전히 미디어 번역 분야에서는 영상에서 화자를 인식해서 적합한 번역을 하거나 감정을 실어 번역된 목소리를 영상에 넣어주는 것 등 구글도 해결하지 못하는 부분들이 많이 있었습니다. 이런 문제들을 해결하기 위해 창업에 도전했습니다. 애플에 다니던 박진형 최고기술경영자(CTO)와 뜻이 맞아 함께 공동 창업을 하게 됐습니다.”

엑스엘에이트의 기계 번역 기술은 글로벌 온라인 동영상 플랫폼(OTT)에 공급되는 전 세계 미디어 콘텐츠의 초벌 번역을 담당하고 있다. 오리지널 영상의 대사를 받아적고, 이를 다른 나라 언어로 번역한다. 이후 전문 번역가들은 기계 번역된 자막과 영상을 보면서 포스트 에디트 과정을 거치게 된다. 이렇게 나온 자막은 영상 위에 올려지고 시청자 누구나 원하는 언어의 자막을 선택할 수 있게 된다.

“영상 자막을 번역하는 세계 1위 기업 아이유노와 같이 번역을 전문으로 하는 기업들(Localization Service Providers)이 엑스엘에이트 엔진을 통해 초벌 번역 작업을 하게 되고 이후 번역가들이 후 교정한 최종 결과물이 우리가 볼 수 있는 자막입니다. 파트너십을 통해 최종 결과물을 다시 엑스엘에이트 학습 데이터로 사용하고 있습니다. 그러면서 기술이 점점 고도화돼 사람이 말하는 것처럼 자연스러운 번역으로 이어지게 되는 것입니다.”

현재 엑스엘에이트는 73개의 언어쌍을 제공하고 있다. 그중에서도 영어에서 라틴 아메리카 스페인어(LATAM Spanish)가 번역 정확도 95.5% 이상으로 가장 현지에 적합한 기계 번역하고 있다.

정 대표는 엑스엘에이트의 경쟁력으로 “좋은 데이터로 기계번역을 학습시킨다”를 꼽았다. “구글과 비교해보면 구글은 보통 인터넷에서 수집하는 웹 페이지를 번역 학습 데이터로 사용합니다. 이 방식에는 두 가지 문제가 있습니다. 가장 큰 문제는 웹에서 전 세계의 홈페이지를 가지고 와서 문장을 학습하게 되는데 웹 데이터를 기반으로 하다 보면 틀린 정보들이 많을 수밖에 없습니다. 하지만 엑스엘에이트의 기계번역 학습 데이터는 파트너십을 맺은 LSP들의 정제된 데이터를 사용합니다. 누구나 만들고 접근할 수 있는, 웹상에서 가져올 수 있는 데이터가 아니라 번역 전문가들이 영상을 여러 번 수정해 번역한 데이터를 가지고 기계를 학습시키고 있습니다.”

엑스엘에이트는 영상 번역에 적합한 기술을 자체 개발해오고 있다. 그중 하나는 ‘문맥 파악 기술(Context Awareness)’이다. 영상에서 성별 혹은 등장인물 간의 관계를 파악하나 주어나 목적어가 없어도 화자의 전후 문맥을 파악해서 알아서 번역을 해주는 기술이다.

“이전에는 전문 번역가, 즉 사람만이 할 수 있었던 영역이라면 이제는 기계도 언어별로 가진 복잡하고 미묘한 차이를 평가해서 고차원적인 번역을 할 수 있습니다. 단순하게 단어 대 단어, 문장 대 문장을 번역해 주는 것이 아니라 앞뒤 문장을 고려해서 최종 번역 결과를 보여주는 방식이다 보니 그 정확도가 훨씬 높아지고 있습니다. 한번은 미국 현지 LSP에서 전문 번역가들을 모아 위원회를 구성하고 실험했습니다. 공상과학, 코미디, 음식, 여행, 드라마 총 5가지 카테고리로 문맥 인식 모델을 적용한 그룹과 그렇지 않은 그룹을 나눠 기계번역을 했습니다. 번역한 결과가 아주 흥미로웠습니다. 문맥 인식 모델을 적용하지 않은 그룹은 정확도가 91.2%, 적용 모델은 4.3%나 높은 95.5%로 나왔습니다. 엑스엘에이트의 엔진은 음식과 관련된 영상에서 재료를 소개하고 음식 만드는 방법을 설명하는 콘텐츠를 가장 잘 번역합니다.”

엑스엘에이트는 인공지능을 개발하는 기술 회사로 엔지니어 비율이 높다. 엑스엘에이트의 본사는 미국 산호세에 있다. 미국 본사와 한국 지사 통틀어 약 70%가 시니어급 엔지니어로 이뤄져 있다. 정 대표는 “해외 고객이 더 많다”며 “미국, 터키, 유럽 등 현지 전문가를 세일즈 팀으로 영입해 다양한 미디어 산업의 고객을 유치하고 있다”고 말했다.

프리A 투자유치를 받은 엑스엘에이트는 내년 상반기에는 기술 고도화를 위해 시리즈A 투자유치를 진행할 예정이다.

앞으로의 계획에 대해 정 대표는 “혁신적인 인공지능 기술로 언어 장벽을 허물어 모두가 더욱 넓은 세상을 경험하게 하고 싶다”며 “다양한 미디어 콘텐츠에 최적화된 최상의 기계번역을 제공하는 기업이 될 것”이라고 말했다.

설립일 : 2019년 10월
주요사업 : 인공지능 기계번역 기술 개발, 주요 서비스명은 ‘미디어캣(MediaCAT)’
성과 : 매월 번역하는 영상 콘텐츠 6만 시간 이상, 지금까지 번역한 영상 콘텐츠 65만 시간 이상, 번역 가능한 언어쌍(Language pairs) 73개


jinho2323@hankyung.com