[HELLO AI]인공지능 따라잡기


-기존 머신러닝 기반 AI 한계 뛰어넘어…별도 학습 필요 없는 ‘일반 인공지능’ 가능성 확인

[AI 따라잡기] 칼럼 쓰는 인공지능 ‘GPT-3’… 인간처럼 대화하고 프로그래밍도 '척척'



[한경비즈니스 = 진석용 LG경제연구원 연구위원 ] 최근 엘론 머스크 테슬라 최고경영자(CEO)는 향후 5년 이내에 인공지능(AI)이 인간을 추월하기 시작할 것이라고 의미심장한 인터뷰를 한 바 있다. 최근 주목받고 있는 인공지능 GPT-3의 능력을 보면 인간과 AI의 경계가 허물어지는 특이점이 생각보다 빨리 닥칠 것이란 견해를 단순히 도전적인 전망이라고 치부하기는 어려워 보인다.


◆인간처럼 대화하는 인공지능 GPT-3




2년 전 한국 언론의 폭발적인 관심을 받았던 정치인과 휴머노이드 로봇 간의 자연스러운 대화가 구설에 오른 적이 있다. 인간처럼 말하는 듯했던 AI의 대화가 실은 대본에 따른 것이란 사실이 폭로됐기 때문이다. 인간처럼 대화할 수 있는 AI의 등장은 초미의 관심사이지만 현실적으로는 아직 요원하다는 의견이 지배적이었다.
그런데 지난 5월, AI에 관심 있는 사람 모두를 흥분과 우려의 도가니로 몰아넣는 일이 발생했다. 대본도 없이 마치 인간처럼 대화할 수 있는 AI GPT-3가 등장한 것이다. 관련 논문과 베타 버전의 애플리케이션 프로그래밍 인터페이스(API)가 공개되고 다양한 테스트를 진행한 결과 AI GPT-3는 지금까지 지녔던 사람들의 인식을 뛰어넘는 모습을 연이어 선보이고 있다.


GPT-3는 머신러닝 방식의 자연어 기반 AI GPT(Generative Pre-trained Transformer) 시리즈의 3세대 모델이다. GPT-3와 2019년 발표된 이전 모델 GPT-2간의 가장 큰 차이점은 매개변수(파라미터)와 학습에 사용된 데이터 세트의 규모다. GPT-3는 GPT-2보다 최대 1000배나 큰 약 1750억 개에 달하는 매개변수를 가지고 있다. 또 GPT-3가 학습에 사용한 데이터 세트는 인터넷에서 찾을 수 있는 문서·책·위키피디아 자료 등 문자로 된 4990억 개의 데이터 세트 중에서 선정된 3000억 개에 달한다.
GPT-3를 만든 오픈에이아이(OpenAI)는 인간 친화적인 AI 개발을 목적으로 설립된 기업이다. 오픈에이아이는 AI의 윤리적 문제에 주목한 머스크 CEO와 유명 스타트업 인큐베이팅 업체 출신인 프로그래머 샘 알트만 등이 합심해 설립했다. 오픈에이아이는 애초 비영리 단체로 설립됐다가 2019년 마이크로소프트 등의 추가 투자를 받으면서 영리 단체로 탈바꿈한 바 있다.


GPT-3는 여타 머신러닝 방식의 AI에 비해 훨씬 다재다능한 모습을 보이고 있다. 일반적으로 머신러닝 방식의 AI가 어떤 특정한 결과물을 만드는 기능을 갖추려면 많은 시간을 들여 만들어진 특정 용도의 데이터 세트 수십만 개를 이용해 한동안 학습해야 한다. 하지만 GPT-3는 다른 AI들과 달리 특별한 사전 학습 없이도 그럴 듯한 결과물을 만드는 모습을 종종 보임으로써 더욱 강렬한 인상을 주고 있다. 많은 AI 개발자들이 진행한 다양한 테스트를 거치면서 GPT-3는 인간과 대화하는 것 외에도 더 다양한 작업을 할 수 있다는 사실이 속속 알려지고 있다.


GPT-3는 자연어 기반의 AI에 대해 사람들이 기대하는 대화·통역·번역 등의 기능을 기본적으로 갖추고 있다. GPT-3는 일상적인 수준의 대화를 나눌 수 있다. GPT-3가 인간과 나눈 대화 내용들을 보면 비록 장시간 맥락이 이어지는 수준의 대화는 아니지만 문학·역사·게임에서부터 시사에 이르는 다채로운 주제들에 대해 기존 AI들보다 훨씬 자연스럽게 대화한다. 어떤 테스트에서는 GPT-3가 대화의 연장선으로 볼 수 있는 퀴즈 풀기를 하기도 했다. GPT-3는 영어를 비롯해 프랑스어·독일어·스페인어 등 다양한 언어를 통·번역할 수도 있다. 언어별로 통·번역의 수준 차는 다소 있다고 하는데 한국어 번역도 어느 정도 가능한 것으로 알려진다.


GPT-3는 대화와 통·번역을 넘어 전문적인 영역의 지식을 탐색하고 정리해 알려주기도 한다. GPT-3에 어떤 환자의 건강 상태와 관련 질환을 말로 알려준 다음 보기로 제시된 약 성분들 중에서 환자에게 적합한 것을 고르게 하는 테스트도 성공적으로 수행했다고 한다. GPT-3가 인터넷을 통해 각종 약 성분을 검색한 후 제시된 약 성분 중에서 필요한 것을 콕 집어 고르고 관련 설명과 함께 알려줬다는 것이다. 또 식품 포장지에 표시된 성분을 문자로 추출해 GPT-3에 입력했더니 각각의 식품 성분에 대한 검색 결과를 정리해 알려주는 경우도 있었다.


여타 자연어 기반의 AI과 차별화된 GPT-3만의 특징은 자연어를 인식하고 구사하는 일 외에도 다양한 작업을 할 수 있다는 점이다. GPT-3는 새로운 문장을 만들거나 문서를 작성할 수 있다.


GPT-3는 문자 데이터 내에서 목적에 맞는 데이터를 특정 패턴과 순서에 맞게 골라 가공하는 데이터 파싱(parsing) 능력을 보유하고 있다. 그래서 맥락에 맞되 보다 과장된 표현을 쓰라는 명령을 GPT-3에 하면 단순히 기존 단어를 재배열하는 수준을 넘어 각종 단어를 바꾼 다음 완전히 새로운 문장을 만들 수도 있다고 한다. 이런 기능을 활용해 GPT-3는 이력서 등 용도에 적합한 문서를 작성하는 모습도 보여줬다.


이뿐만 아니라 GPT-3를 각종 프로그래밍 작업에 활용한 사례도 많이 소개되고 있다. 사람이 자연어로 지시한 사항을 GPT-3가 알아서 관련 프로그래밍 코드로 바꿔 입력하고 결과를 생성하는 셸 스크립트 프로그래밍 작업에 성공한 사례도 있다. GPT-3의 프로그래밍 기능을 자연어 인식 기능과 결부해 인터넷 검색 엔진을 만들거나 웹 디자인용 코드를 학습한 GPT-3에 필요한 사항을 자연어로 명령해 웹페이지를 생성하고 수정하는 경우도 있었다.



◆GPT-3가 가져다준 기대와 우려




통상 AI의 기능을 확장하려면 새로운 데이터 세트를 만들어 학습시키고 알고리즘을 수정하는 과정을 거쳐야 한다는 인식이 컸다. 하지만 GPT-3는 기존 관념과 달리 매개변수와 학습 데이터를 대폭 늘리는 것만으로도 AI의 기능이 상당히 확장될 수 있다는 것을 보여주고 있다. 일각에서는 2032년 무렵이면 GPT-3보다 1000배나 많은 약 100조 개의 매개변수를 가진 AI도 개발할 수 있다고 주장한다. 별도의 학습 과정을 거치지 않고도 다양한 일을 할 수 있는 AI는 결국 일반 AI(general AI)와 마찬가지다. 그런 점에서 GPT-3는 일반 AI의 등장 가능성을 한층 높이는 역할을 하고 있다. 데이터와 매개변수의 규모 확대를 통해 진일보한 모습을 보이는 GPT-3는 유명한 SF 소설에 나왔던 일반 AI를 떠올리게 한다. 저명한 SF 작가 로버트 하인라인의 ‘달은 무자비한 밤의 여왕’에서 달의 시설물을 관리하는 마스터 컴퓨터인 마크 IV는 끊임없이 메모리 용량과 데이터 세트의 확장을 거듭하던 끝에 어느 순간부터 갑자기 자의식을 갖게 되고 말문까지 트이면서 인간과 대화하고 인간처럼 생각하는 일반 AI으로 발전했다.


GPT-3는 AI의 발달이 가져다줄 부작용도 우려하게 만든다. 당면한 부작용은 AI가 스스로 만든 가짜 정보가 사회적 혼란을 유발할 가능성이다. 데이터 파싱 기능을 활용해 AI가 단어를 바꿔 가며 작성한 정치 관련 뉴스가 국내 정치계나 국가 간 외교상의 갈등을 일으킬 가능성을 배제할 수 없다. AI가 해석한 법률적 해석이 계층 간 갈등을 불러 올 수도 있다. 더 나아가 일반 AI의 등장 가능성이 높아지면 기계의 인간 대체 효과가 더욱 커질 것을 우려한 사회적 반발과 갈등이 더욱 커질 수도 있다.


[본 기사는 한경비즈니스 제 1295호(2020.09.19 ~ 2020.09.25) 기사입니다.]