챗GPT ‘대표 수혜주’ 플리토 이정수 대표 “제2 배민·토스…2023년 스타트업 황금기 다시 온다”

[스페셜 리포트 : 챗GPT 쇼크]
이정수 플리토 대표. 사진=서범세 기자
이정수 플리토 대표. 사진=서범세 기자
최근 플리토의 주가가 급등했다. 2022년 12월 14일 1만8300원으로 52주 신저가를 기록했던 플리토의 주가는 2023년 2월 8일 기준 3만8700원으로 52.7% 뛰며 반등 곡선을 그리고 있다. 애널리스트들은 플리토의 상승 모멘텀이 ‘챗GPT’의 돌풍에 있다고 분석한다. 플리토 앞에 한국의 챗GPT 대표 수혜주란 별칭도 따라붙었다.

미국 오픈AI의 대화 전문 인공지능(AI) 챗봇인 챗GPT가 돌풍을 일으키는데 왜 한국의 번역 업체인 플리토가 대표 수혜주로 주목받을까.

이 문제에 답하기 위해 이정수 플리토 대표를 만났다. 이 대표는 “플리토뿐만 아니라 2023년에는 무궁무진한 사업 기회가 열릴 것”이라며 “스타트업의 황금기가 다시 온다”고 자신했다. 다음은 이 대표와의 일문일답.

-플리토가 챗GPT의 수혜주로 떠올랐습니다.

“AI 챗봇 경쟁의 핵심은 결국 어떤 데이터들을 어떻게 학습시키느냐에 관한 것입니다. 영화 ‘루시’를 보면 인간의 평균 뇌 사용량은 10%인데 어떠한 특수 상황으로 인해 뇌의 90%, 100%를 쓸 수 있는 순간 주인공은 어떤 일이든 해내고 맙니다. 이는 SF의 영역이지만 GPT(Generative Pre-traination Transformer) 역시 앞으로 발전할 수 있는 가능성이 무궁무진합니다.

저장 능력, 속도, 데이터 객관성을 검증할 수 있는 영역 등 미래에는 챗GPT보다 더 발달한 천재 GPT가 나올 겁니다. 그러려면 데이터를 정제하고 데이터를 판매하는 부분이 다시 떠오를 수밖에 없는 상황입니다.

플리토가 챗GPT의 수혜주로 관심을 받는 가장 큰 이유는 언어 데이터의 판매에 있습니다. 현재 플리토 매출의 40% 이상은 글로벌 빅테크 기업 등 해외에서 발생하고 있죠.”

-‘언어 데이터’ 판매가 무엇인가요.

“챗GPT를 비롯해 AI 산업에서 선두권에 있는 업체들은 대부분 글로벌 기업입니다. 그들은 자신의 AI를 학습시키기에 가장 용이한 업체들을 전 세계적으로 물색합니다. 머신 러닝(기계 학습)에 쓸 대량의 언어 데이터가 필요한데 이를 구할 수 있는 곳이 많지 않기 때문입니다.

플리토는 2012년 창업 후 번역 사업 한 우물을 팠습니다. 챗봇용 언어 데이터 1일 수집량은 50만 건을 돌파했죠. 전문 번역 업체들도 많은 자료를 보유하고 있지만 저작권 문제로 판매가 불가능한 곳이 다수입니다. 플리토는 137개국 번역자 1300만 명에게 현금으로 바꿀 수 있는 포인트를 주고 약관을 통해 저작권을 미리 확보하고 있어 거래에 문제가 없습니다. 이 때문에 플리토가 다수의 해외 기업들과 파트너십을 맺게 된 거죠.

2022년에는 파트너 업체들과 함께 소위 ‘데이터 공장’을 만들었습니다. 과거에는 우리 쪽에서 데이터를 생성해 제공하는 방식이었다면 작년부터는 파트너 업체에서 밑그림을 주고 특화된 데이터를 생성합니다. 지난 한 해 이 업무에 많은 시간을 할애했고 앞으로는 플리토에 많은 기회가 열릴 것으로 보고 있습니다.”
이정수 플리토 대표 “데이터의 개인화…언어의 힘 더 강력해질 것” [챗GPT의 모든 것]
-‘챗GPT’는 얼마나 혁신적인가요.

“기본적인 기능에서 이전의 GPT들과 큰 차이는 없습니다. 하지만 연산 속도, 토큰(저장 기억)의 수 등이 전과 달리 엄청나게 빠른 속도로 성장했죠. 이는 ‘기존에 학습시킨 것을 기억한다’는 겁니다.

예컨대 제가 ‘플리토의 대표가 누구인가’를 물으면 챗GPT는 자신 있게 제임스 리라고 대답합니다. 그런데 저는 제임스 리가 아닙니다. 제가 다시 ‘플리토의 대표는 이정수’라고 답하면 챗GPT는 바로 자기의 잘못을 인정합니다. 그다음 제가 다시 ‘플리토의 대표가 누구인가’라고 물으면 챗GPT는 수정된 대답을 내놓습니다.

이전 GPT는 그전에 했던 대화를 기억하지 못했습니다. 오답을 수정하기도 쉽지 않았죠. 우리에게는 매우 쉬워 보이지만 대화를 기억한다는 것은 굉장히 어려운 기술을 필요로 합니다. AI는 기존에 쌓여 있는 데이터에서 수많은 연산 작업을 통해 정보를 제공하는데 연산 과정에서 새로운 정보를 제공할 경우 기존에 가진 데이터를 흩뜨릴 수밖에 없습니다. 새로운 정보를 즉각 받아들인다는 것은 고난도의 기술을 요구하는 거죠.

챗GPT는 하나의 대화창 안에서는 데이터를 학습시킴으로써 이 정보를 받아들일 수 있습니다. 쉽게 말해 ‘데이터의 개인화’가 이뤄질 수 있게 된 거죠. 챗GPT의 엄청난 발전입니다.”

-데이터의 개인화란 무엇인지 간략하게 설명해 주세요.

“과거에는 번역에서 ‘특화’라는 게 쉽지 않았습니다. 아이를 위한 번역기, 어른을 위한 번역기, 경제와 정치 분야에 특화된 번역기는 각기 다른 결과물을 내야 합니다. 화자에 맞게 혹은 청자에 맞게 다른 번역이 나와야 하는데 구글 번역이나 네이버의 파파고 모두 동일한 번역을 보여 줍니다.

그런데 이 번역을 챗GPT에 각각으로 구분해 학습을 시킨다면. A채팅은 ‘경제 전문’, B채팅은 ‘정치 전문’, C채팅은 ‘의학 전문’…. 이렇게 여러 개를 챗GPT에 전문화·개인화해 학습시키는 거죠.

누군가의 말투를 본뜬 초개인화 번역도 가능합니다. 배우 사무엘 잭슨의 말투가 굉장히 특이하거든요. 챗GPT에 이 번역문을 사무엘 잭슨의 스타일로 해달라고 하면 다른 번역문이 나옵니다. 물론 이미 전문 기업 등에 특화된 번역기가 나와 있긴 합니다만 2023년에는 챗GPT를 통해 전과는 비교할 수 없을 만큼 번역기의 성능과 다양성이 개선될 것으로 예상합니다.”
이정수 대표의 SNS에서 발췌 ("이러한 오역을 학습시킬 경우, 기존에는 해당 단어가 포함된 문장을 여러개 생성하여 엔진에 학습을 시켰지만 이제는 이렇게 간단하게 학습을 시킬 수 있다. 결국 데이터의 수량이 항상 문제가 되어 Domain이나 기업 특화된 번역기를 만드는데 문제가 있었다면 해당 데이터의 Translation Memory를 학습시켜 다양한 문장을 생성하는게 가능해진다. 그 결과도 화자에 맞게 혹은 청자에 맞게 전달하는 것도 가능하다.")
이정수 대표의 SNS에서 발췌 ("이러한 오역을 학습시킬 경우, 기존에는 해당 단어가 포함된 문장을 여러개 생성하여 엔진에 학습을 시켰지만 이제는 이렇게 간단하게 학습을 시킬 수 있다. 결국 데이터의 수량이 항상 문제가 되어 Domain이나 기업 특화된 번역기를 만드는데 문제가 있었다면 해당 데이터의 Translation Memory를 학습시켜 다양한 문장을 생성하는게 가능해진다. 그 결과도 화자에 맞게 혹은 청자에 맞게 전달하는 것도 가능하다.")
-데이터의 오류는 심각한 문제 아닌가요.

“위의 사례처럼 챗GPT가 진실만을 말하는 것은 아닙니다. ‘2023년 대한민국의 대통령은 누구인지’ 물으면 챗GPT는 문재인 대통령으로 대답합니다. 2021년까지의 데이터만으로 학습했기 때문이죠.

사람들은 흔히 기계는 객관적인 정보를 제공하므로 진실을 제공할 것이라고 생각하지만 그렇지 않습니다. 아마 이 문제를 오용할 수 있는 사례들도 나올 것이고 윤리적인 문제까지도 비화할 수 있다고 봅니다.

과거에는 데이터를 어떻게 확충시킬지 범용적인 부분을 늘리는 싸움이었다면 지금은 특화된 부분을 어떻게 늘릴 것인지가 데이터 전쟁의 주요 이슈로 떠오를 겁니다.”

-그럼에도 챗GPT에 대한 기대가 뜨겁습니다.

“사람들이 언어는 그렇게 중요하게 생각하지 않았습니다. 그런데 모든 기술의 가장 기초가 되는 서비스는 언어입니다. 법적 근거나 서비스에 들어갈 자료 등의 뒷단은 전부 언어로 돼 있어요. 현지화를 위해서는 현지 언어에 특화된 로컬라이제이션이 필수죠.

지금까지는 기술의 제약으로 하지 못했던 부분이 바로 언어인데 그 부분이 챗GPT를 시작으로 해결의 실마리가 보이면서 무한한 판도라의 상자가 열린 겁니다. 많은 사람들은 그동안 언어를 통일시켜 언어 장벽을 해결하자고 했어요. 영어를 세계 공통어로 쓴다든지, 새로운 언어를 만들자고 했죠.

그런데 언어 장벽을 해결할 수 있는 것은 언어를 통일하는 게 아니라 언어를 볼 수 있는 기술을 높이는 거예요. 언어를 배울 기회가 없는 사람들도 다른 나라에 대한 정보를 100% 이해할 수 있도록 해야 하는 거죠. 그런 기회가 열렸다고 봅니다.”

-그런데 챗GPT를 써 보니 오히려 ‘영어 공부’에 대한 후회가 막심했어요.

“챗GPT를 잘 알지 못하는 사람들은 한두 시간 해보고 ‘재미 없다’고 해요. 그런데 챗GPT 영역에 있는 사람들은 하루 종일 이것만 할 수 있어요. 아는 만큼 보이는 거죠.

언어도 마찬가지예요. 언어 공부를 하지 않아도 된다는 얘기는 40년 전부터 있었던 것 같아요. 그런데 지금 어떤가요. 해당 서비스를 충분히 활용하기 위해서는 그 언어를 완벽하게 이해하는 것이 중요해요. 기술은 사람들의 수준을 어느 평균선까지는 끌어올릴 수 있어요. 사람들이 원하는 수준은 그 이상이 되겠죠.

GPT를 활용해 사업 영역을 확장시키거나 자기 브랜드 가치를 확장시키고자 한다면 더 고차원 수준의 언어 능력이 필요하게 될 거예요.”

-챗GPT는 세상을 어떻게 바꿀까요.

“챗GPT를 기반으로 2023년에는 어마어마한 분야에서 굉장히 많은 신규 사업들이 떠오를 거예요. 이미 올해 1월부터 팝콘처럼 계속 서비스가 나오고 있어요. 기존에는 사람들이 크게 중요하지 않다고 생각했던 것들이 새로운 비즈니스가 될 거예요.

에컨대 데이터를 검증하는 업체들이 생겨나겠죠. 우리는 A란 문장을 기계가 썼는지, 사람이 썼는지 확신할 수 없습니다. 하지만 기계는 알고 있어요. ‘확률’에 의해 문장을 쓰기 때문입니다. 인간은 확률을 거치지 않지만 기계는 단어 뒤에 들어갈 단어를 확률에 의해 만들어 냅니다. 이를 도식화하면 사람이 만든 문장은 기계의 확률에선 튈 수밖에 없죠. 그래서 데이터를 검증하는 사업들이 많이 생겨날 수 있을 것이라고 보는 거죠.”

-황금기가 열리는 건가요.

“챗GPT란 사과나무가 열렸습니다. 사과를 따는 것, 사과를 어떻게 요리할지는 모든 사람들이 고민할 거예요. 더 중요한 것은 사과나무 주변이 어떻게 변화하는지입니다. 챗GPT로 인해 생태계가 변화할 겁니다.

스타트업에서 황금기가 언제였느냐 하면 2012~2013년입니다. 2000년대 닷컴 버블 이후 생과 사를 거듭하던 기업들은 스마트폰이 대중화되면서 황금기를 맞았습니다. 스마트폰에 들어갈 애플리케이션(앱)이 한정돼 있다 보니 수많은 비즈니스 기회가 생긴 것이죠. ‘배달의민족’, ‘토스’ 등 우리가 지금 쓰고 있는 유명 앱들이 전부 그때 탄생했습니다.

창의적인 생각을 하는 사람들의 머릿속에는 이러한 서비스가 있으면 좋겠다는 생각이 계속 있어 왔습니다. 그런데 기술이 법용적으로 뒷받침하지 못하기 때문에 서비스를 할 수 없는 거죠. 이러한 기술은 한 기업이 할 수 있는 게 아니라 수많은 기업들이 각자의 기술을 만들고 그 기술이 합쳐지면서 탄생합니다.

저는 셋째 황금기가 2023년을 기점으로 다시 올 것이라고 봅니다. 이미 무수한 기업들이 챗GPT를 기반으로 무궁무진한 서비스 개발을 계획하고 있습니다. 누가 이러한 기술과 기존의 서비스를 응용해 소비자가 매력을 느낄만한 서비스를 제공할 것인가, 또 어떻게 비즈니스 모델(BM)을 만들 것인가가 기업 생존의 핵심이 될 것입니다.”

-사람이 설 자리가 사라지는 건가요.

“기계가 사람의 영역을 대체할까 공포를 느낄 수 있습니다. 하지만 ‘원석’을 가지고 어떻게 다듬어 반지를 만들 것인가, 목걸이를 만들 것인가는 결국 사람이 하는 일이거든요.

신기술은 앞으로도 계속 나올 겁니다. 인간의 스트레스도 상당할 거예요. 부정적으로 보기보다 자신이 사는 세상에, 자기가 하는 산업에 이 기술을 어떻게 적용할지 궁리한다면 ‘대박’의 기회를 열 수 있다고 봅니다. 저는 그 기회가 지금 모두에게 찾아왔다고 보고 있어요.

번역에서도 마찬가지죠. AI가 어디까지 커버할 수 있을 것인지 갑론을박할 때 중요한 것은 데이터의 객관성입니다. 번역에서만 예를 들자면 사람의 어떤 문장에는 주관이 포함되고 말투에도 영향을 받습니다. 한국인은 ‘아니’를 서두에 습관적으로 말하는데 번역문에서는 이를 부정문으로 받아들이겠죠. 이렇게 하나하나 학습시켜 줘야 할 부분들이 너무나도 많다는 겁니다.

결국에는 사람 손을 상당히 많이 거쳐야 하죠. 플리토 역시 사람과 기계를 어떻게 섞어야 가장 이상적인 형태의 서비스가 나올 것인지를 계속 궁리하고 있어요.”

-플리토의 챗GPT 활용 계획은 무엇인가요.

“플리토의 최종 목표는 언어의 전달 과정에서 사람들이 언어 장벽을 전혀 느끼지 못하고 완벽하게 이해할 수 있는 세상을 여는 겁니다. ‘청보리차’라는 한국의 음료를 일본인은 일본어로, 중국인은 중국어로 즉각 이해하는 거죠. 무슨 말도 안되는 SF냐고 생각할 수도 있지만 GPT가 나왔듯이 불가능한 일은 아닙니다.

플리토 또한 이미 단계를 밟고 있어요. 일부 백화점과 전통 시장에서 메뉴판을 보고 사진을 찍어 올리면 플리토의 AI로 1차 번역한 후 전문 번역가들이 검수해 정확하고 자연스러운 번역을 제공합니다. 또한 한국인이 인도네시아 웹툰을 볼 때 플리토 번역을 거치면 인도네시아의 양념이 한국인이 이해할 수 있는 고추장으로 번역되는 등 문화적 차이로 인한 어색함을 번역판에서 삭제할 수 있습니다. 번역이 한국화 과정을 거치는 거죠.

모든 콘텐츠들이 이런 개인화 과정을 거치면 콘텐츠의 경계가 허물어질 겁니다. 올해 플리토는 이러한 기술을 완벽하게 제공하는 서비스를 내놓으려고 합니다.”
이정수 플리토 대표 “데이터의 개인화…언어의 힘 더 강력해질 것” [챗GPT의 모든 것]
플리토의 AI 번역 서비스를 통해 조선의 풍속화가 신윤복의 미인도 속 제발(題跋)을 해석했다. 자료=플리토 제공
플리토의 AI 번역 서비스를 통해 조선의 풍속화가 신윤복의 미인도 속 제발(題跋)을 해석했다. 자료=플리토 제공
-대표님은 지금 어떤 기분인가요.

“긴장과 설렘이 공존합니다. 플리토가 갖고 있는 기술과 챗GPT가 만나 얼마나 멋진 서비스가 나올 수 있을지 기대됩니다.

한편으로는 불안합니다. 예전에는 신규 업체나 경쟁 상대가 선두 주자를 따라잡으려면 3년은 걸릴 것으로 봤습니다. 그런데 지금은 2~3개월이면 더 좋은 서비스를 제공할 수 있는 후발 주자가 나올 수도 있어요. 2016년 구글이 알파고로 세상을 떠들썩하게 했을 때 방어를 잘한 기업들은 살아남았습니다. 네이버는 클로바를 통해 서비스를 더욱 확장했죠. 반대로 AI를 받아들이지 못해 도산한 기업들도 상당수 있었습니다.

올해 스타트업에서도 그런 사례들이 많이 보일 겁니다. 기존의 서비스들도 현재 트렌드를 외면하면 올해 출시되는 신규 서비스들에게 하루 아침에 도태되는 상황이 벌어질 것입니다.”

정채희 기자 poof34@hankyung.com