“지식을 다루는 대화형 질답에 최적화…영역 넓힐지는 지켜봐야”
[스페셜 리포트 : 챗GPT 쇼크] 오픈AI에서 내놓은 대화형 인공지능(AI) 챗봇 ‘챗GPT’로 정보기술(IT)업계가 들썩이고 있다. 시장이 재편될 수 있다는 가능성까지 나오자 구글과 네이버 등 주요 기업들이 발 빠르게 대응에 나서고 있다.그렇다면 AI 검색 전문가는 ‘챗GPT 현상’을 어떻게 바라보고 있을까. 카카오 검색 엔진 리더 출신으로 현재 AI 스타트업 ‘업스테이지’의 AI 프로덕트 사업을 총괄하는 배재경 리더에게 물어봤다. 전 세계에서 챗GPT가 최근 관심을 끄는 이유는 뭔가.“언어에 대한 이해가 인간 고유의 능력이라 기계는 한참 걸릴 것으로 예상했는데 아직 한계는 있지만 기대보다 훨씬 빠르게 좋은 성능이 나왔다는 점 때문이다.” 챗GPT에 대한 업계의 평가는 어떤가.“놀랍다. 바둑을 둘 때 사람의 판단은 매우 복잡한 상황을 고려한 고도의 직관이라 여겨 기계가 사람을 뛰어넘지 못할 것이란 생각이 우세했지만 알파고의 등장으로 기계가 사람보다 훨씬 잘하는 것을 너무 쉽게 인정하게 됐다.
챗GPT는 언어도 크게 다르지 않다는 것을 보여준 계기가 됐다. 다만 언어는 바둑보다 더 복잡하다. 다양하고 중첩된 목표를 가지고 있는 정보 전달의 수단이기 때문이다. 언어는 목적이 아니라 ‘수단’이다.
챗GPT는 언어 모델이긴 하지만 인간의 모든 언어 패턴을 다 잘 대응하는 것이 아니라 지식을 다루는 대화형 질문과 답변에 최적화해 학습됐다. 이 목표를 좀 더 일반화해 넓혀 갈 수 있을지는 여전히 두고 봐야 한다.”자연어에 대한 이해는 고차원의 추론을 필요로 하는데 챗GPT 실력은 어떤가.“배고픈 사람에게는 물고기를 주는 것이 아니라 물고기 잡는 법을 가르쳐 줘야 한다는 말이 있다. 단순 지식과 고차원 추론의 차이는 정보의 나열을 넘어 그 정보들이 어떻게 연결되고 심지어 새로운 형태의 지식이 필요할 때 그 지식을 어떻게 찾을 수 있는지에 대한 문제로 이어진다. 이게 연속적인 여러 단계로 이어지면서 고도화될 수 있는 형태다.
물고기 잡는 법을 넘어 물고기를 양식해 대량으로 확보할 방법에 대해 알아낼 수 있는 형태로 점점 고도화될 수 있다. 인간은 이런 단계의 최고 수준에 이르러 메타 인지라고 부르는 ‘생각에 대한 생각’까지 할 수 있게 됐고 자아 인식까지 할 수 있는 능력이 있다.
챗GPT는 이렇게 메타를 인지하는 수준은 미흡하다고 볼 수 있지만 전문 도메인 지식 영역에서 패턴을 찾아내 자연스럽게 문장을 엮어 내는 데 탁월하다. 인간도 이 정도 능력을 갖추려면 많은 시간과 훈련이 필요하다.
계산기가 나온 후 인간의 계산 능력이 계산기보다 더 정확하고 빠르기 힘들고 알파고가 나오고 기계 바둑을 이기기 힘든 것처럼 주어진 지식에 대해 주된 내용을 깔끔하게 정리하고 요약하는 능력은 사람보다 기계가 더 앞설 수 있다.
다만 새로운 지식을 만들어 내고 다양한 지식 사이의 고차원 패턴을 파악, 추상화하는 능력은 아직은 여전히 인간의 영역이다.”근시일 내에는 달성되기 힘든 수준이라는데 어떻게 가능할까.“챗GPT는 일종의 언어 모델이다. 최근 언어 모델이 빠르게 발전하고 있는데 반대로 말하면 지금까지는 언어 모델의 발전 속도가 가장 느렸다. 비전이나 음성 등 비언어 분야 AI 모델은 이미 우리 주변에 퍼져 있다.
AI 모델은 근본적으로 데이터에 숨어 있는 패턴을 찾아내고 이해하기 위해 학습되는데 언어 모델은 비전이나 음성에 비해 그 패턴의 추상화 수준이 훨씬 다양하고 복잡하다.
이 때문에 학습 데이터를 어떻게 구축해야 하는지, 양은 얼마나 필요한지, 이들을 어떤 방식으로 학습시켜야 좋은지 등에 대한 답을 찾기가 어려웠다.
3년 전 거대 모델 학습으로 1차 도약(GPT-3)이 있었고 챗GPT에서는 추가적인 파인터닝(fine-tuning : 단순 수집 외에 추가적인 학습 데이터 구축) 단계를 통해 한 번 더 도약했다.
‘사람이 봤을 때 더 적합’이라는 학습의 목표가 모호하기 때문에 학습 데이터를 만들기도 힘들고 학습을 잘할지도 의문이었는데 예상보다 더 잘된 것이 이번 성능 향상의 주된 포인트다.”챗GPT가 변호사 시험에도 합격할 수준이라는데 인간과 비교하면 어떤가. “변호사 시험과 단순 비교하기는 어렵지만 일반화해 보면 챗GPT를 포함한 AI 모델이 인간 대비 차이가 나는 점 중 하나는 지식을 외우는 것과 관련 있다는 점이다.
인간은 외우기만 잘해 세상을 잘 살아가기 힘들기 때문에 지식을 더 추상화해 효율적으로 지식을 저장하도록 진화됐다. 그래서 인간에게는 ‘지혜(또는 메타 인지)’라는 단어가 어울린다.
반면 기계는 엄청난 메모리를 활용해 외우는 데는 탁월한 능력을 가질 수 있다. 사람은 아무리 똑똑해도 150개국 언어를 다 배울 수 없지만 기계는 가능하다. 그래서 각종 시험에서 도메인 전문 지식을 요구한다면 기계가 (인간보다) 더 유리하다.”챗GPT 이후의 검색 시장은 어떻게 변하고 사용자들의 삶에 어떤 변화가 생길 것으로 보나.“챗GPT의 세부 기술은 특정 회사에 종속되지 않는다. 오픈AI가 빠르게 서비스를 오픈했지만 구글과 페이스북, 한국의 IT 회사도 금방 구현해 낼 수 있다. 대화형 검색으로 기존에 고착화된 검색 시장 구도를 한 번 바꿀 기회가 생기겠지만 기존 업체들 역시 최고의 AI 기술을 보유하고 있기 때문에 흥미진진한 경쟁이 될 것으로 예상된다.
사용자는 빠르고 편하게 정보를 소비하게 된다. 검색창에 단어 몇 개 넣어 결과를 살펴보고 안 되면 키워드 바꿔 가면서 검색하는 행위는 줄어들게 된다. 자연어로 편하게 입력하고 정리된 결과를 받아보고 만족스럽지 못하면 대화 형태로 조건을 추가하면서 다시 결과를 받아보는 형태로 진화한다. 다만 시의성·정확도 등의 이슈가 있기 때문에 기존 검색 엔진이 사라지지는 않을 것이고 둘 다 활용하는 형태로 발전할 것으로 예상된다.” 챗GPT 등장으로 업계는 어디까지 영향을 받을 것으로 보나.“정보 검색과 콘텐츠 생성 분야는 직접적인 영향이 있다. 여기에 추천·요약·번역·코딩 등의 작업도 챗GPT가 잘하는 분야여서 거의 직접적인 영향을 받을 수 있다. 결국 ‘지식 노동자’들은 바로 영향을 받을 수 있다.
우리가 하는 대부분의 일이 정보를 찾고 분석하고 정리하는 일이기 때문에 각 업종에서 많은 사람들이 직간접적으로 영향 받을 것으로 보인다. 특정 업계가 영향을 더 받고 덜 받고는 있지만 지식을 소비하는 작업의 패턴 또는 우리 삶의 패턴이 바뀌게 되는 것이다.” 챗GPT로 발생하는 논란도 있다.“단기적으로는 어뷰징 등으로 약간의 혼란이 생길 수 있다. 검색 포털이 새로운 변화에 대응하기 위해 시간이 필요할 것이고 초기에 이 시기를 틈타 저품질의 자동 생성 콘텐츠가 증가하는 상황이 발생할 우려도 있다.
하지만 이른 시간 내에 정상화되고 최종적으로는 콘텐츠 품질에 순기능을 할 것으로 관측된다. 챗GPT가 생성해 내는 결과가 아무 조건 없이 만들어지는 것이 아니라 대화의 맥락과 질문의 정교함에 따라 큰 차이가 나기 때문이다.
기계적으로 생성된 콘텐츠는 특유의 패턴이 나타날 가능성이 높고 아마도 빠르게 분류 모델이 나와 탐지할 수 있을 것으로 보인다. 분류 모델이 완벽하게 어뷰징이냐에 대한 여부를 가리지는 못하겠지만 문서의 품질을 어느 정도 점수화해 보여줄 수는 있을 것으로 판단된다.
머지않아 사람의 개입이 들어가 더 풍성해지고 새로운 아이디어가 추가된 콘텐츠가 더 많이 소비되고 검색 엔진에도 더 상위에 노출되고 낮은 점수의 콘텐츠는 자동으로 순위에서 밀려나 도태될 것으로 보인다.
콘텐츠를 창작할 때 맨땅에 헤딩이 아니라 똑똑한 도구의 보조를 받으면서 작업하는 세상이 된다. 더 빠르게 더 양질의 콘텐츠를 생산해 낼 수 있다.
이에 따라 발생하는 저작권 이슈는 피하지 못할 문제다. 이미 이미지 생성 모델에서 저작권 이슈가 불거지고 있다. 글 콘텐츠에서도 유사한 문제가 나올 수 있다. 예를 들어 누군가 작성한 글과 50% 유사한 글이 새로운 콘텐츠로 다른 곳에서 올라와 검색에도 노출되면 원작자가 저작권을 문제 삼을 수 있고 중요한 문서 또는 경제적인 득실이 걸려 있다면 법적인 공방이 생길 수 있다.”챗GPT가 인간의 고유 영역을 따라 할 수 있는 시점은 언제라고 보나.“챗GPT가 그 역할을 할지 모르겠지만 AI 전체로 확장하면 거의 필연적으로 그 시점이 언젠가 온다. 하지만 근시일 내에는 힘들 것으로 보고 있다. 왜냐하면 아직 예측할 수 있는 정도로 고차원 추론의 메커니즘이 알려져 있지 않기 때문이다. 개인적인 희망으로는 내가 살아 있을 동안 그 시점이 오지 않으면 좋겠다.”챗GPT의 최종 목표는 뭔가.“챗GPT의 최종 목표는 AI의 최종 목표에 연결된다. 인간 고유 영역(고차원 추론, 자아 인식 등)을 따라 할 수 있는 능력까지 갖추는 것이 아닐까 생각한다. 이는 AI 기술을 연구하는 다수 연구자들의 목표이기도 하다.” 최수진 기자 jinny0618@hankyung.com
© 매거진한경, 무단전재 및 재배포 금지