“요즘 이거 모르면 대화가 안 돼”…인간의 말을 인간처럼 대화하는 인공지능의 모는 것
[스페셜 리포트 : 챗GPT 쇼크] 전 세계를 강타한 인공지능(AI) 챗봇 챗GPT가 과학 논문의 저자로 공식 데뷔했다. 홍콩에 있는 AI 기반 신약 개발 업체인 인실리코메디신의 알렉스 자보론코프 최고경영자(CEO)는 지난 1월 온코사이언스(Oncoscience)에 게재한 논문의 공동 저자로 챗GPT의 이름을 올렸다.‘파스칼의 내기’라고 불리는 철학적 맥락에서 면역 억제제 라파마이신 복용의 장단점을 논하는 내용의 논문이다. 자보론코프 CEO는 “그동안 논문 80여 편을 작성하는 과정에서 챗GPT와 같은 생성형 AI를 활용해 왔기 때문에 논문 작성에 AI를 활용하는 것은 전혀 새로운 방식이 아니다”며 “챗GPT는 기존의 AI들과 비교해 놀라운 성과를 보여줬고 공동 저자로 올리는 것에 대해서도 동료 학자들의 검토를 거쳤다”고 설명했다.
챗GPT가 작성한 과학 논문은 이뿐만이 아니다. 국제 학술지인 ‘네이처’ 뉴스팀에 따르면 지금까지 챗GPT가 저자로 이름을 올린 출판 논문과 출판을 앞두고 있는 논문은 4편이다. 2022년 12월 19일 의학 논문 사전 공개 사이트인 ‘메드아카이브(medRxiv)’에 게재된 ‘미국 의사 면허 시험에서의 챗GPT 성능’이란 논문에는 챗GPT가 12명의 저자 중 셋째 공저자로 포함돼 있다.
챗GPT와 같은 AI를 학술 논문의 저자로 인정하는 것이 타당할까. 챗GPT가 과학 논문의 공저자로 이름을 올린 이후 지금 학술지 발행인들과 편집자·연구원들은 챗GPT가 ‘저자’로서의 자격을 갖추고 있는지에 대한 논의가 뜨겁게 달아오르고 있다. AI가 인간의 가장 지적인 활동이라고 여겨져 왔던 ‘학술 논문’ 분야까지 침투하고 있다.
“챗GPT는 ‘알파고 쇼크’ 그 이상일 겁니다. 세상에 바뀌지 않는 분야가 없을 테니까요.”
한국의 한 AI 스타트업 최고기술경영자(CTO)는 챗GPT의 파급력을 묻는 질문에 이렇게 답했다. 챗GPT에 대한 관심이 갈수록 뜨거워지고 있다. 누군가는 ‘알파고 쇼크’를 언급하고 누군가는 ‘아이폰의 탄생’만큼이나 우리의 일상생활을 바꿔 놓을 것이라는 전망을 내놓는다. 이미 학술지뿐만 아니라 교육업계는 챗GPT로 인한 부작용과 이후 교육 방법의 변화에 대한 논의를 시작하고 있다. 법률·의학 등 전문 분야 또한 챗GPT로 인한 위협과 이후 상생을 위한 방안을 고민 중이다. 더욱 중요한 것은 챗GPT로 인한 우리 사회의 변화가 이제 겨우 ‘시작’이라는 것이다.
그렇다면 챗GPT는 무엇이고 우리가 살아가는 세상을 어떻게 바꿔 놓게 되는 것일까. 챗GPT의 모든 것을 열 가지 질문으로 담아 봤다. 질문들에 대한 답은 챗GPT가 직접 작성했다.
1.챗GPT가 뭐길래?
“챗GPT는 오픈AI가 개발한 대화형 언어 모델입니다. 대규모의 문서 데이터에 대한 학습을 통해 다양한 상황과 질문에서 인간과 유사한 답변을 생성할 수 있도록 훈련받은 프로그램입니다. 딥 러닝 기술을 사용해 일관되고 상황에 맞는 답변과 문서를 생성할 수 있습니다. 챗봇, 가상 비서, 언어 번역과 같은 분야에 적용하기에 적합합니다.”
“챗GPT에 대해 설명해 줘”라는 질문에 챗GPT 스스로 내놓은 대답이다. 간단하면서도 명료하게 스스로에 대해 설명하고 있다. 챗GPT는 2022년 11월 세상에 첫선을 보였다. 공개된 지 두 달 만에 월간 활성 사용자 수(MAU) 1억 명을 돌파했다. 챗GPT를 개발한 곳은 오픈AI라는 세계 최대의 AI 연구소다. 일론 머스크 테슬라 CEO와 와이콤비네이터의 창업자로도 잘 알려진 실리콘밸리의 유명 투자자인 샘 알트먼을 비롯한 글로벌 정보기술(IT)업계의 리더들이 투자해 2015년 설립했다.
현재는 샘 알트먼이 오픈AI의 CEO를 맡고 있다. 초창기에는 비영리 AI 연구 기관으로 출발했지만 2019년 영리 법인으로 전환했다. AI 연구에 막대한 투자 자금이 필요했기 때문이다. 이때를 계기로 머스크 CEO는 오픈AI에서 손을 떼고 그 빈자리를 마이크로소프트(MS)가 채웠다. 당시 MS는 오픈AI에 10억 달러를 투자했다. 지난해 챗GPT 공개 이후 그 위력을 제대로 실감한 MS는 현재 오픈AI에 100억 달러 투자 협상을 진행 중인 것으로 알려져 있다.
챗GPT는 스스로 소개한 것처럼 ‘대화형 AI’다. 머신 러닝을 이용해 인간의 언어와 지식을 습득했고 이용자는 마치 친구와 인터넷 채팅을 하듯 챗GPT와 대화할 수 있다.
그런데 여기서 궁금증이 생긴다. ‘사람처럼 대화할 수 있는 AI’는 예전에도 수차례 등장했기 때문이다. 가장 쉽게 떠올릴 수 있는 애플의 ‘시리’, 삼성의 ‘빅스비’, 아마존의 ‘알렉사’ 등이다. 그렇다면 챗GPT는 기존의 대화형 AI는 무엇이 다르기에 이토록 많은 사람들의 주목을 받고 있는 것일까.
2. 챗GPT는 기존의 대화형 AI와 뭐가 달라?
“챗GPT는 규칙 기반 또는 검색 기반 방법에 의존하는 기존의 대화형 AI 모델과 차별화되는 트랜스포머 기반의 언어 모델입니다. 챗GPT에서 사용된 트랜스포머 구조는 입력 텍스트에서 긴 범위의 종속성을 효과적으로 모델링할 수 있어 문맥과 관련된 반응을 생성할 수 있습니다. 이전의 대화형 AI 모델과 비교할 때 챗GPT는 언어를 더 정교하게 이해하고 더 미묘하고 다양한 응답을 생성할 수 있습니다. 대규모 훈련 데이터와 사용된 고급 딥 러닝 기술 덕분에 챗GPT는 지금까지 가장 강력한 대화형 AI 모델 중 하나가 되었습니다.”
챗GPT가 기존의 대화형 AI와 비교해 가장 큰 차이점으로 꼽은 것은 ‘대규모 훈련 데이터’를 통해 인간과 가장 유사한 답변을 할 수 있다는 것이다. 기존의 대화형 AI들도 물론 이용자의 질문에 반응하고 답하는 것은 가능했다. 하지만 그 수준은 매우 기초적인 수준에 머물렀던 것이 사실이다.
지금도 유튜브 등에는 대화형 AI들과 인간의 대화를 실험한 영상이 많이 올라와 있다. 그중 대표적인 것이 “임진왜란이 언제 일어났니”라는 질문에 “임진왜란아~ 엄마가 깨우지 않아도 스스로 일어난 거야”라고 답하는 내용이다. 사람의 언어란 그만큼 미묘하고 파악하기 어렵다. 상황은 물론 뉘앙스나 미묘한 단어 사용에 따라 그 의미가 완전히 달라질 수 있기 때문이다. AI가 사람과 대화를 나눌 때 그 맥락을 이해하고 의미를 제대로 파악하는 것이 얼마나 어려운지를 보여준다.
챗GPT가 기존 대화형 AI의 수준을 한 단계 더 높였다는 평가를 받는 것은 바로 이 지점이다. 마치 실제 사람과 대화하는 듯한 착각을 불러일으킬 만큼 자연스러운 답변을 내놓을 수도 있다. 예를 들어 ‘명절 스트레스 피하는 방법을 알려줘’와 같은 질문을 입력하는 챗GPT는 스스로 ‘명절 가족들과의 만남에서 스트레스를 피하는 방법으로는~’으로 시작하는 답변을 들려준다. 명절 스트레스를 언급할 때는 주로 ‘가족이나 먼 친척들과의 만남에서 스트레스가 많이 발생한다’는 맥락을 스스로 파악해 답변에 반영하는 것이다. 만약 챗GPT가 틀린 답변을 내놓았을 경우 이를 지적하면 챗GPT는 “제가 잘못된 답변을 내놓았군요. 죄송합니다”라고 깔끔하게 사과하기도 한다. 기존의 AI들은 하지 못하던 일이다. 비로소 AI와 인간의 실질적인 ‘소통’이 가능해진 것이라는 평가가 나오는 배경이다.
3. 챗GPT와 같은 AI가 공부하는 방법은?
“챗GPT는 비지도 학습(unsupervised learning)이라는 프로세스를 사용해 훈련받았습니다. 이 과정에서 모델은 대규모의 텍스트 데이터에 노출되고 입력 데이터와 유사한 텍스트를 생성하는 것을 배우게 됩니다. 챗GPT의 훈련 과정에서는 언어 모델링(language modeling)이라는 기술이 사용됩니다. 이 기술에서는 모델이 일련의 텍스트에서 다음 단어를 예측하는 것을 훈련시킵니다. 이 모델은 많은 양의 텍스트 데이터를 입력으로 받고 가능한 다음 단어에 대한 확률 분포를 생성합니다. 생성된 응답은 훈련 데이터에서의 실제 다음 단어와 비교되고 모델의 파라미터는 생성된 응답과 대상 응답 사이의 차이를 최소화하도록 업데이트됩니다.”
챗GPT의 원리를 묻는 질문을 던지자 답변 내용이 어려워진다. AI의 학습과 관련한 전문 용어들이 상당수 포함돼 있기 때문이다. 그래서 질문을 재입력했다. “기술을 잘 모르는 사람도 알아들을 수 있도록 쉽게 설명해 줄래.” 그러자 챗GPT는 “물론입니다”로 첫마디를 시작하며 답을 이어 간다.
“챗GPT는 사람처럼 대화할 수 있도록 설계된 컴퓨터 프로그램입니다. 이를 수행하는 방법을 가르치기 위해 기사, 책 및 대화와 같이 인간이 작성한 많은 텍스트를 보여 줬습니다. 챗GPT는 이 모든 텍스트를 보고 대화에서 단어와 구가 어떻게 사용되는지, 대화 흐름을 만들기 위해 문장이 어떻게 결합되는지 배웠습니다. 이렇게 하면 챗GPT가 누군가와 대화할 때 사람처럼 들리는 방식으로 응답할 수 있습니다. 예를 들어 다른 사람이 말하는 것을 읽고 들으면서 새로운 언어를 배우는 학생이라고 생각해 보십시오. 학생이 그 언어에 더 많이 노출될수록 스스로 말하는 능력이 향상됩니다. 챗GPT는 비슷한 방식으로 작동하지만 대화하는 방법을 배우기 위해 복잡한 수학과 컴퓨터 과학을 사용합니다.”
설명이 많이 쉬워졌지만 여전히 학습 원리를 이해하기에는 모호한 구석이 많다. 이를 이해하기 위해서는 부연 설명이 필요하다. AI가 학습을 하는 방법은 기본적으로 수많은 데이터를 AI에 입력한다. 예를 들어 ‘결혼해 행복하게 사는 커플’의 사진 1000장과 ‘이혼한 커플’의 사진 1000장의 데이터를 주면 AI는 각 커플 사진들의 특징과 패턴을 파악한다. 이렇게 스스로의 모델을 완성한 AI에 새로운 커플의 사진을 주면 AI는 이 커플이 행복하게 살고 있을지, 이혼했을지를 스스로 짠 공식에 기반해 결론을 도출해 내는 것이다.
이때 이전에는 각각의 커플 사진의 정답(행복한 커플인지 이혼한 커플인지 등의 결과)를 사람이 AI에 먼저 알려준 뒤 AI가 각 사진들의 특징을 파악하게끔 했다. 학습을 마친 AI에게 새로운 커플의 사진을 제공하면 AI는 기존에 파악한 커플 사진들의 특징에 맞춰 새로운 커플이 어느 쪽에 해당하는지를 결과로 내놓는 것이다.
하지만 최근에는 챗GPT에게 데이터를 학습시킬 때 사람이 정답(결과)를 미리 알려주지 않는 경우가 많다. 챗GPT가 스스로 설명한 ‘비지도 학습(unsupervised learning)’이다. 사람은 그저 수만 가지의 데이터를 무작위로 AI에 입력하면 AI가 스스로 여러 자료들을 비교, 분석한 뒤 패턴을 파악하고 특징에 따라 결과를 찾아가게 된다.
다시 말해 AI가 어떤 질문에 답을 찾아갈 때 사람은 AI가 어떤 ‘추론 과정’을 거쳤는지 알지 못한다. 사람이 직접 가르친 것이 아니라 AI 스스로 그 답을 찾아가는 패턴을 파악하고 공식을 만들었기 때문이다.
이정흔 기자 vivajh@hankyung.com
*'챗GPT'에 대한 질문, 챗GPT가 직접 답했다(2)에서 계속됩니다.
© 매거진한경, 무단전재 및 재배포 금지