LG 한국에서 가장 ‘똑똑한’ 엑사원으로 상위 1% AI에 도전…네이버 카카오도 생태계 경쟁 본격

[스페셜 리포트] 2022년 판을 바꿀 파격 신사업
2021년 12월 14일 진행된 LG AI 토크 콘서트에서 배경훈 원장이 키노트스피치를 하고 있다. 사진=LG전자 제공
2021년 12월 14일 진행된 LG AI 토크 콘서트에서 배경훈 원장이 키노트스피치를 하고 있다. 사진=LG전자 제공
2016년 세상을 들썩이게 한 바둑대전을 기억하는가. 바둑 천재 이세돌 9단과 구글 딥마인드의 인공지능(AI) ‘알파고’가 벌인 세기의 대결은 바둑판을 넘어 산업 전반에 일대 혁신을 불러일으켰다. 그리고 6년 후 AI에 또 한 번의 격동이 찾아왔다. 스스로 의사 결정하고 진화할 수 있는 무한 잠재력의 AI, 이른바 알파고를 뛰어넘는 ‘초거대 AI’가 다시금 세상을 뒤흔들 준비를 하고 있다. 테크 기업들은 초거대 AI를 보유한 기업이 미래 시장에서 경쟁 우위를 점할 것으로 보고 초거대 AI 경쟁에 뛰어들고 있다.

LG, ‘1% AI’로 시장 선점 나선다

초거대 AI는 자율적으로 사고·학습·판단·행동하는 인간의 뇌 구조를 닮은 AI다. 대용량의 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있다. 쉽게 말해 ‘창조의 영역’에 AI가 발을 들인 셈이다. 전문가들은 ‘미래의 AI’라고도 부른다.

초거대 AI는 인간의 뇌에서 정보를 학습하고 기억하는 ‘시냅스’와 유사한 역할을 하는 인공 신경망의 ‘파라미터(parameter : 매개변수)’에 좌우된다. 이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있는 것으로 알려져 있다. 인간의 뇌 속 시냅스 수는 약 1000개 조다. AI의 기술 발전은 곧 파라미터 수를 높이는 것이자 인간 지능에 도전하는 과정과도 맞닿아 있다.

초거대 AI의 등장은 2020년으로 거슬러 올라간다. 엘론 머스크 테슬라 최고경영자(CEO)가 주도해 설립한 오픈AI가 공개한 ‘GPT-3’는 파라미터 수가 총 1750억 개로, 인간과 AI가 자연어 기반으로 소통할 수 있는 AI 모델로 딥러닝의 한계를 끌어올려 차세대 AI 시대를 열었다는 평가를 받았다. 파라미터 수만 단순 비교해도 기존 GPT-1의 1000배이자 GPT-2의 117배에 달하는 규모다.

이후 파라미터를 키우기 위한 한국·중국·미국 등 테크 기업들의 초거대 AI 연구가 계속됐다. 대표 주자는 바로 한국의 LG다.

LG의 AI 연구 기관인 LG AI연구원은 2021년 12월 14일 2년간 공들인 초거대 AI ‘엑사원(EXAONE)’을 발표했다. ‘인간을 위한 전문가 AI’란 뜻이다. LG 측은 엑사원의 파라미터가 한국 최대인 약 3000억 개라고 밝혔다. 파라미터 수로 보면 한국에서 학습 능력이 가장 우수한 AI가 등장한 것이다.

LG에 따르면 엑사원은 한국 최대의 파라미터 보유뿐만 아니라 언어를 넘어 이미지와 영상에 이르기까지 인간의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티(multi-modality : 여러 가지 형태와 의미로 컴퓨터와 대화하는 환경) 능력을 갖췄다. 향후 멀티 모달 AI 기술이 고도화되면 AI가 데이터를 습득해 이해하는 수준을 넘어 추론하고 시각과 청각 등 다양한 감각 영역을 넘나드는 창조적 생성을 할 수 있다. 이번 LG의 엑사원은 ‘멀티 모달 AI’로 가는 첫 단계다.
LG의 초거대 AI인 EXAONE이 만든 호박 모양의 모자. 사진=LG전자 제공
LG의 초거대 AI인 EXAONE이 만든 호박 모양의 모자. 사진=LG전자 제공
예컨대 기존 AI는 텍스트를 분석해 이미지를 찾는 수준이었다면 엑사원은 “호박 모양의 모자를 만들어 줘”라고 말하면 학습된 정보를 기반으로 스스로 판단해 ‘호박 모양의 모자’ 이미지를 새롭게 만들어 낸다.

이 같은 멀티 모달 AI를 개발하기 위해 LG AI연구원은 세계 최대 규모의 학습 데이터를 활용했다고 설명했다. 말뭉치 6000억 개와 언어·이미지가 결합된 고해상도 이미지 2억5000만 장 이상이 그 대상이다.

다양한 분야가 포진된 계열사의 힘도 동원했다. 엑사원이 다양한 산업 분야에서 전문가로 활약할 수 있도록 LG전자·LG화학·LG유플러스·LG CNS 등 LG 계열사들이 보유하고 있는 전문 데이터를 포함해 논문·특허 등의 정제된 말뭉치들을 학습하도록 한 것이다.

또한 언어에서도 차별화를 뒀다. 한국에서 개발 중인 다른 초거대 AI들이 한국어에 집중하는 것과 달리 엑사원은 한국어와 영어를 이해하고 구사하는 이중 언어 AI로 개발했다. LG는 “엑사원을 제조·연구·교육·금융 등 사실상 모든 분야에서 ‘상위 1% 수준의 전문가 AI’로 활약할 수 있도록 만들 것”이라고 밝혔다. 앞으로도 LG는 금융·패션·유통·교육 등 다양한 글로벌 파트너사와 함께 연합을 결성해 초거대 AI 활용 영역을 넓혀 나갈 계획이다. 배경훈 LG AI연구원장은 “향후 API(Application Programming Interface) 공개와 외부 파트너십을 통해 집단 지성으로 글로벌 초거대 AI 생태계를 만드는 데 기여할 것”이라고 말했다.
알파고는 잊어라…속속 등장하는 ‘초거대 AI’
알파고는 잊어라…속속 등장하는 ‘초거대 AI’
초거대 AI 생태계 확대 나선 포털 공룡

한국의 테크 공룡인 네이버와 카카오도 초거대 AI 기술 개발에 한창이다. 먼저 네이버는 2021년 5월 한국 기업 최초로 자사 초거대 AI인 ‘하이퍼클로바’를 공개했다. 정석근 네이버 클로바 CIC(사내독립기업) 대표는 “글로벌 기술 대기업들은 대형 AI 모델이 가져올 파괴적 혁신에 대한 기대로 투자를 가속화하고 있다”며 “한국의 AI 기술이 글로벌 플랫폼에 종속되지 않기 위해서는 이미 공개된 기술을 활용하고 따라잡는 수준에 그칠 수 없다고 판단했다”고 한국 최초로 초거대 AI를 개발하게 된 배경을 밝혔다.

하이퍼클로바의 파라미터는 2040억 개 규모다. 영어가 학습 데이터의 대부분을 차지하는 오픈AI의 GPT-3과 달리 하이퍼클로바의 학습 데이터는 한국어 비율이 97%에 달한다. 네이버 측은 “영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어 모델을 개발함으로써 AI 주권을 확보한다는 의미가 있다”고 설명했다.

네이버 역시 LG의 엑사원처럼 앞으로 한국어 외 다른 언어로 언어 모델을 확장하고 언어뿐만 아니라 영상이나 이미지 등도 이해하는 ‘멀티 모달 AI’로 하이퍼클로바를 계속해 발전시켜 나갈 계획이다. 정석근 대표는 “이전에 우리가 상상만 했던 또는 우리가 상상하지 못했던 일들마저 가능해지는 새로운 AI의 시대가 열리고 있다”며 “하이퍼클로바를 통해 AI 기술이 필요한 모두에게 새로운 경험을 제공할 것”이라고 말했다.

카카오는 AI 연구 전문 자회사인 카카오브레인을 통해 2021년 11월 ‘GPT-3’ 모델의 한국어 특화 AI 언어 모델인 ‘KoGPT’를 최대 오픈 소스 커뮤니티인 깃허브에 공개한데 이어 12월 둘째 초거대 AI 모델인 ‘민달리(minDALL-E)’를 공개했다. 김일두 카카오브레인 대표는 “순차적으로 초거대 AI의 다양한 모델을 공개할 것”이라며 “차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈 소스로 공개해 한국의 정보기술(IT) 생태계 기술 발전에 기여할 것”이라고 말했다.

양 사는 초거대 AI 기술이 장기적으로 매출은 물론 플랫폼 경쟁력에 기여할 것으로 기대하고 있다. 정용제 미래에셋증권 애널리스트는 “초거대 AI 확보는 플랫폼 주도권 경쟁의 핵심 요소”라며 플랫폼 장기 성장을 위해 필수 기술이라고 말했다.


정채희 기자 poof34@hankyung.com