[AI 따라잡기]


기계 학습은 데이터 확보에 막대한 비용·시간 소모…질문 이해 못하고 확률 높은 답만 제시
‘더 적은 데이터로 더 똑똑하게’… 하이브리드형 AI에 거는 기대
[한경비즈니스 칼럼=진석용 LG경제연구원 연구위원] 데이터는 우수한 인공지능(AI)을 만들기 위한 필수적인 요소로 간주된다. 머신 러닝 방식의 AI를 학습시키려면 막대한 비용과 긴 시간이 든다. AI를 충분히 학습시키려면 엄청난 규모의 데이터를 모으고 정리해야 하기 때문이다. 그래서 최근 더 적은 시간과 비용으로 수준 높은 AI를 만들려는 시도도 점차 늘어나고 있다.


GPT-3로 확인된 기계 학습 AI의 한계

업계의 구루이자 페이스북에서 AI 개발을 주도하고 있는 얀 르쿤 뉴욕대 교수는 2020년 8월 월스트리트저널과의 인터뷰에서 오늘날 AI를 훈련시키는 데는 엄청난 시간과 비용이 투입되는 데 비해 AI는 아직 중력과 같은 기본적인 개념을 이해할 능력을 갖추지 못했다고 말했다. 심지어 절벽에 너무 가깝게 차를 몰면 추락할 위험이 있다는 것을 AI가 학습하려면 적어도 수천 번의 추락 사고를 겪어야 할 것이라고도 했다.


2020년 상반기에 공개된 기계 학습(머신 러닝) 방식의 AI GPT-3는 다재다능한 능력을 선보여 크게 각광받았다. GPT-3는 대화하는 사람이 상대방을 AI인지, 사람인지 착각할 만큼 자연스럽게 일상적인 대화를 이어 가거나 초보자가 한 것처럼 유사한 수준의 통·번역도 해냈다. 사람이 쓴 문장의 감성이나 톤을 완전히 바꾸면서도 맥락을 유지하는 작문 능력도 보여줬다. 우수한 자연어 처리 능력뿐만 아니라 프로그래밍 코드를 학습해 사람이 말로 지시하면 간단한 기능을 갖춘 웹사이트를 만든다거나 자연어 인식 기능을 활용해 인터넷 검색 엔진을 만들었고 사람이 요구한 바에 따라 그럴 듯한 요리법을 만들어 내기도 했다. 이처럼 다양한 능력을 보여줌으로써 GPT-3는 강한 AI의 등장 가능성이 높아지고 있는 현황을 보여주는 대표적인 사례라고 평가받기도 한다.


하지만 르쿤 교수가 지적했듯이 이처럼 우수한 GPT-3조차 아직 여러 가지 한계를 노출하고 있다. 첫째, AI를 학습시키는 데 엄청나게 많은 데이터가 필요하다. 우수한 자연어 처리 능력을 갖추기 위해 GPT-3가 사용하는 매개 변수는 약 1750억 개에 달한다. 이처럼 많은 매개 변수의 원천은 약 3000억 개에 이르는 대규모 데이터 세트다(물론 막강한 연산 기능을 담당하는 프로세서와 메모리 등의 하드웨어도 중요하다). 인터넷에 있는 각종 문서, 책, 위키피디아 자료 등에서 모은 약 5000억 개의 문자 데이터 세트들 중에서 적합한 3000억 개의 데이터를 골라내고 일일이 주석을 다는 등으로 분류, 정리하고 저장하는 작업에는 엄청난 시간과 비용이 투자되므로 필요한 수준의 데이터 세트를 갖추는 것 자체가 큰 부담이 된다.


둘째, 어떤 논리와 근거로 판단하는지 알 수 없는 블랙박스다. 기계 학습 방식의 AI들이 공통적으로 지닌 블랙박스란 속성은 AI의 활용도를 제약하는 요인으로 작용한다. 어떤 이유로 판단을 내렸는지 이해할 수 없기 때문에 사람의 생사 여부가 걸린 문제와 같은 아주 중요하고 위험성이 큰 이슈를 다루는 분야에서는 확실한 안전성이 확인되기 전까지는 쉽게 도입하지 못한다.


셋째, 논리적 추론 능력이 크게 떨어진다. AI가 질문을 제대로 이해하고 답하는 것이 아니라 통계적으로 가장 확률이 높은 단어를 골라 답하는 것에 불과하기 때문이다. 월스트리트저널에 소개된 미국 소프트웨어 개발자의 간단한 테스트는 GPT-3의 추론 능력을 잘 보여준다. 신발 두 개가 든 상자에 연필 하나를 넣은 후 신발 하나를 꺼내면 무엇이 남느냐는 개발자의 간단한 질문에 GPT-3는 신발이란 오답을 제시했다. 이와 관련해 오픈 AI(Open AI) 관계자는 GPT-3가 논리적 추론이 아니라 단어 예측에 초점에 맞춰 개발됐기 때문이라고 설명하기도 했다.


적은 데이터로 학습할 수 있는 AI도 개발 중

이런 기계 학습 방식의 AI들이 지닌 단점을 극복하려는 의미 있는 시도들이 늘어나고 있다. 이른바 퓨샷 러닝(Few-shot Learning)이라고 불리는 AI는 데이터를 정리하기 어려운 경우뿐만 아니라 학습용 데이터를 구하기 어려운 분야에 적용할 AI를 개발하기에도 적합하다. 잠재적 요구는 많았지만 기술적으로 구현되지 못하던 퓨샷 러닝 방식의 AI에 대한 의미 있는 연구 성과는 수년 전부터 점차 소개되고 있다. 다양한 시도들 중에서 특히 주목받는 것은 매사추세츠공과대(MIT)와 IBM 연구팀이 지난 5월 공개한 것과 같은 뉴로 심볼릭 방식의 AI(Neuro-Symbolic Concept Learner)다. 뉴로 심볼릭 방식은 때로는 하이브리드형 AI로 불리기도 한다.


지금까지 등장한 AI들은 크게 두 가지로 분류된다. 하나는 데이터를 연역적으로 분석해 대상의 특징을 뽑아내는 기계 학습 방식이다. 기계 학습 방식 중에서 가장 유명한 것은 인간과의 바둑으로 대결한 알파고(Alphago)로 존재감을 보인 딥러닝 방식이다. 또 하나는 기계 학습 방식보다 먼저 개발돼 온 전문가 시스템 방식의 AI다. 전문가 시스템 방식은 확인된 지식과 논리적 추론에 바탕을 두고 사람이 정한 판단 규칙을 코드로 만들고 AI는 그 규칙에 따라 다양한 데이터들 중에서 답을 찾아내는 방식이다. 뉴로 심볼릭 방식의 AI는 비교적 소규모의 데이터로 학습해 대상의 속성을 도출한 다음 사람이 제공한 규칙에 근거해 답을 찾아 나간다. 뉴로 심볼릭 방식은 이처럼 단계별로 기계 학습 방식과 전문가 방식을 적절하게 결합해 사용하므로 하이브리드형으로도 불리게 됐다.


뉴로 심볼릭 방식의 AI가 주목 받는 이유는 GPT-3와 같은 기계 학습 방식의 AI들이 지닌 단점을 상당 부분 보완, 극복할 가능성이 높은 것으로 기대되기 때문이다. 학습 과정에서 딥러닝 방식의 AI보다 적은 데이터를 사용하므로 개발 시간과 비용을 절감할 수 있다. AI가 결론을 내린 이유를 사람이 이해할 수 있어 블랙박스라는 비판에서도 자유로운 편이다. 또한 기계 학습 방식의 장점인 단어 예측 능력과 함께 전문가 시스템 방식의 장점인 논리적 추론 능력을 동시에 갖춰 사람들이 기대하는 수준에 근접한 결과 값을 만들어 낼 잠재력을 지니고 있다. 뉴로 심볼릭 방식의 AI 개발이 가속화되면 지금처럼 음성 비서나 챗봇이 엉뚱한 답을 하는 경우는 대폭 줄고 사람의 질문에 꼭 맞는 답을 하는 경우는 더욱 많아질 것이다.


알파고가 몰고 온 딥러닝 방식의 충격파가 한풀 꺾이면서 AI의 판단 능력을 확률과 통계적 상관관계에만 의존할 것이 아니라 사람이 알고 있는 익숙한 지식과 규칙도 적절하게 결합해야 한다는 주장이 다시 힘을 얻고 있다. 일부 AI 연구자들은 AI의 수준을 효과적으로 높이려면 인간이 사용하는 상징과 활동상(scene), 인간으로 구성된 사회에 대한 이해와 지식을 추론 과정에 적절하게 대입해야 한다고 주장한다. AI도 결국 인간에 대한 깊은 이해를 바탕으로 추론해야 인간 사회에 보다 유용한 답을 찾아 낼 수 있다는 것이다. 이런 주장에 부합하는 AI들은 앞으로 점차 늘어날 것으로 보인다.

[본 기사는 한경비즈니스 제 1306호(2020.12.07 ~ 2020.12.13) 기사입니다.]