구글·MS에 네이버·KT 까지…상반기 중 초거대 AI 사업 속속 공개 예정
[스페셜 리포트 : 챗GPT 쇼크] 챗GPT의 등장으로 빅테크들의 움직임이 빨라지고 있다. 정보 검색의 세대교체를 이끌 것이라는 전망과 ‘검색 시장 지배자’ 구글을 위협할 것이라는 예측이 나오자 대응책 마련에 나서고 있다.기선을 잡은 마이크로소프트(MS)는 검색 엔진에 챗GPT를 적용하는 방안을 추진 중이다. 구글은 서둘러 대항마인 바드를 출시하겠다고 발표했다. 한국에서도 네이버와 카카오 등이 대응책을 준비하고 있다.
인공지능(AI)의 가장 큰 과제는 과거에도 지금도 ‘인간처럼 생각하고 말하라’다. 아무리 똑똑한 AI라도 컴퓨터를 벗어나지 못한다는 지적이 많았지만 챗GPT는 ‘컴퓨터’보다 ‘인간’에 가깝다는 평가까지 나온다. 이 때문에 정보통신기술(ICT) 생태계 자체가 새로 재편될 수 있다는 의견도 제기되고 있다. “챗GPT 잡자” 구글, 대항마 ‘바드(Bard)’ 선보인다챗GPT는 지난해 12월 1일 오픈AI에서 공개한 AI 챗봇이다. 생성형 AI의 일종으로, 비지도형 기계 학습 알고리즘(훈련된 데이터를 기반으로 하지만 출력 값을 가르쳐 주지 않는 방식)을 사용해 새로운 디지털 이미지·비디오·오디오·텍스트 또는 코드를 생성하는 것이 특징이다.
챗GPT는 출시 두 달 만에 업계 변화를 주도하고 있다. 인간과 대화하는 것처럼 부드럽게 언어를 구사하고 직접적이고 정확도 높은 대답 능력뿐만 아니라 오류까지 짚어 낼 수 있기 때문이다.
현재까지 ‘검색’은 사용자가 원하는 답을 얻기 위해 수차례 질문을 던지고 수많은 결과 가운데 원하는 것을 일일이 찾아야 하는 과정을 거친다. 그런데 수많은 데이터를 학습한 챗GPT를 사용하면 직접 인터넷을 검색하고 링크를 일일이 확인해야 하는 단계를 생략할 수 있다.
이에 따라 전 세계 검색 시장의 90% 이상을 독점하는 구글에 비상이 걸렸다. 뉴욕타임스에 따르면 구글은 챗GPT 출시 약 2주 만에 위기감을 느끼고 내부에 ‘코드 레드’를 발령했다. 코드 레드는 심각한 위기 상황에 대한 경고 의미다. 익명의 소식통은 “챗GPT와 같은 AI 챗봇이 광고와 전자 상거래에 의존하는 검색 기업의 사업 자체를 뒤엎을 수 있다”고 우려했다.
구글의 매출 절반 이상이 검색에서 발생하는데 챗GPT의 영향력이 더 높아지면 구글의 실적이 줄어들 수 있다. 구글의 모기업인 알파벳은 2월 2일 2022년 4분기 실적을 발표했다. 전체 매출 760억4800만 달러 가운데 56%인 426억400만 달러가 검색 사업에서 나왔다.
구글은 서둘러 대항마 ‘바드(Bard)’를 내놓겠다고 발표했다. 바드는 수주 내에 신뢰할 수 있는 파트너에 우선 제공한 뒤 대중에게 공개한다. 순다르 피차이 구글 최고경영자(CEO)는 공식 블로그에 “AI 여정의 중요한 다음 단계를 위한 결정”이라며 “바드는 AI 프로그램 람다(LaMDA) 기반의 실험적인 대화형 AI 서비스”라고 설명했다.
바드의 응답이 실제 정보의 품질·안전·근거 등 구글이 제시하는 높은 기준에 충족하는지 확인하기 위해 외부 피드백을 내부 테스트와 결합하고 이를 통해 바드의 품질과 속도를 지속적으로 개선할 계획이다.
MS는 2019년 오픈AI의 기술 개발과 플랫폼 구축을 지원하기 위해 10억 달러를 투자했고 이듬해 GPT-3 기반 기술에 대한 독점 라이선스를 구입했다. 챗GPT로 기선을 잡은 MS는 자사 검색 엔진 빙(Bing)에 챗GPT를 결합해 경쟁력을 강화할 예정이다.
여기에 챗GPT의 기술 개선을 지원하기 위해 100억 달러 규모의 추가 투자도 고려하고 있다. 챗GPT의 기술력을 발전시키기 위해서는 투자가 이어져야 하는데 오픈AI의 자금력으로는 부담이 크기 때문이다. 뉴욕타임스는 “챗GPT는 현재 베타 버전에 불과하고 오픈AI가 매달 300만 달러(약 38억원)를 지출하고 있다”며 “답을 내놓는데 필요한 처리 비용이 상당하다”고 전하기도 했다. 한국 IT 기업도 움직인다…챗GPT 영향 ‘어마어마’챗GPT와 같은 수준으로 동작하기 위해서는 수천억 개의 파라미터(parameter : 매개변수)를 기반으로 대용량의 데이터를 학습하는 게 중요한데 그 규모가 상당해 ‘초거대 AI’로 불린다. 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단할 수 있다.
한국에서는 네이버·카카오·LG·KT 등 일부 대기업만 초거대 AI 시장에 뛰어들었다. 오픈AI가 GPT-3 모델을 2020년 5월 발표했는데 그 이후 한국 기업들도 적극적으로 초거대 AI 사업에 나서기 시작했다.
업계 관계자는 “초거대 AI는 데이터·인프라·모델 개발·서비스 전체를 아우르고 있는 기술”이라며 “결과가 나오기까지 비용 투자는 물론 시간 투자도 상당하기 때문에 대기업이 아니면 시작 자체가 어렵다. 대기업 정도 돼야 시작할 수 있는 사업”이라고 설명했다.
가장 빨리 결과물을 보일 곳은 네이버다. 네이버는 2021년 5월 자체 보유한 슈퍼컴퓨터와 네이버 생태계에 있는 방대한 데이터를 활용해 초거대 AI ‘하이퍼클로바’를 개발해 한국 최초로 공개했다. 하이퍼클로바는 대용량 데이터 처리를 위한 인프라를 안정적으로 구축해 모델의 지속적인 고도화가 가능하다는 게 강점이다.
특히 하이퍼클로바는 오픈AI의 GPT-3(175B)를 넘어서는 204B(2040억 개) 파라미터 규모로 개발됐다. 한국어 데이터 학습량은 GPT-3의 6500배 이상이다. 하이퍼클로바의 이러한 성능과 기술력은 자연어 처리 분야 최고 권위 학회인 ‘자연어처리방법론학회(EMNLP : Empirical Methods in Natural Language Proessing) 2021’에서 관련 연구 논문이 메인 트랙에 채택되며 세계적으로 인정받기도 했다.
네이버는 챗GPT에 대항할 수 있는 하이퍼클로바 기반의 검색 서비스 ‘서치GPT(가칭)’를 올 상반기 중에 공개한다. 네이버 관계자는 “아직 정확한 명칭이 정해지지 않았지만 서치 관련 서비스라 서치GPT라고 부르고 있다”며 “하이퍼클로바 기반인데 오픈AI의 GPT-3 모델보다 한국어 능력이 월등히 뛰어나다”고 밝혔다.
카카오는 카카오브레인을 통해 언어와 이미지 관련 초거대 AI 사업에 집중하고 있다. 2021년 11월 ‘GPT-3’ 모델의 한국어 특화 AI 언어 모델 ‘코GPT(KoGPT)’를 최대 오픈 소스 커뮤니티 깃허브(GitHub)에 공개하고 한국 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 ‘코GPT’ 효율을 기존 대비 100배 이상 향상시키겠다는 목표도 내놓았다.
같은 해 12월에는 초거대 AI 멀티모달 이미지 생성 모델 ‘민달리(minDALL-E)’를 발표하고 2022년 4월 민달리의 업그레이드 버전인 이미지 생성 모델 ‘RQ-트랜스포머’를 선보였다. 이후 두 달 만에 현대미술가 고상우 작가와 공동 작업을 통해 카카오브레인의 AI 아티스트 ‘칼로’를 공개했다. 다만 카카오는 기존 검색에 자체 기술을 적용하는 방안에 대해서는 확정하지 않았다.
KT도 초거대 AI ‘믿음’을 개발 중이다. 2000억 개 이상의 파라미터를 보유한 게 특징이다. KT는 상반기 중에 믿음을 상용화할 계획이다.
LG는 2021년 3000억 개의 파라미터에 6000억 개의 말뭉치, 2억5000만 개의 이미지 데이터를 학습시킨 초거대 AI ‘엑사원’을 2021년 공개했다. LG는 이미지를 이해하고 설명하는 쪽으로 엑사원을 키운다. LG는 “챗GPT가 자연어 검색 분야에 반향을 일으킨 것처럼 이미지 캡셔닝은 이미지 검색 분야에서 혁신 가져올 것으로 기대한다”고 말했다.
최수진 기자 jinny0618@hankyung.com
© 매거진한경, 무단전재 및 재배포 금지