샘 알트먼 사태로 특이점 논쟁 촉발 이후 오픈AI ‘큐스타’와 구글 ‘제미나이’로 AGI 논쟁가열

생성형 AI, 특이점으로 가는 마지막 퍼즐 채울 수 있을까[테크트렌드]
최근 한 달간 가장 논란이 되고 있는 뉴스를 하나 꼽으라면 단연 챗GPT를 개발한 오픈AI의 최고경영자(CEO) 샘 올트먼 사태일 것이다. 특히 이사회에서 해임된 지 5일 만에 이루어진 올트먼의 전격적인 복귀는 그 배경에 대해 많은 논란과 추측을 불러일으켰다.

표면상 이번 사태의 원인은 올트먼과 이사회의 의사소통 문제로 알려졌다. 하지만 그 이면에는 올트먼의 상업성 추구와 안전이 담보되지 않은 인공일반지능(AGI: Artificial General Intelligence)의 개발 속도에 대한 의견 차이가 주된 이유로 보여진다. 특히 인류에 대한 실존적 위협이 될 수 있다는 AGI에 대한 문제는 결국 AI가 인간의 지적 능력을 넘어선다는 해묵은 특이점(singularity) 논쟁을 재점화하고 있는 상황이다.특이점 논쟁 재점화 역사적으로 볼 때 1950년대 등장한 인공지능(AI)은 2차례의 침체기와 2차례의 상승기를 겪어 왔다. 이후 2022년 챗GPT의 등장으로 3차 AI 전성기를 맞이하며 AI의 지적 능력이 인류 전체의 지적 능력을 넘어서는 특이점이 가까워졌다는 전망이 나오고 있는 중이다.

지금까지 전문가들의 예측을 종합해 보면 특이점이 도래하는 시점은 대략 2040년에서 2060년 사이로 전망된다. 기술적 특이점을 처음 주창한 미래학자 레이 커즈와일도 그 시기를 2045년이라고 예측한 바 있다.

반론도 적지 않다. AI 혁신의 대표 주자인 제리 캐플런 스탠퍼드대 교수는 인간의 지능을 뛰어넘는 특이점이 곧 올 것이라는 주장은 과장되었다고 반박한다.

현시점에서 특이점이 언제 올 것이라는 것을 정확히 예측하기 어려운 만큼 특이점에 도달하는 시기를 예측하기보다는 AI가 인간 수준의 지능에 도달한다는 의미가 무엇인지부터 먼저 파악하는 것이 더 중요하다.

현재 인간 수준의 지능은 일반인공지능, 즉 AGI를 의미한다. AGI는 “다양한 작업에서 인간과 동등한 또는 인간을 능가하는 능력을 보이는 인공지능”(MIT Technology Review)으로 정의된다. 일부에서는 AI의 컴퓨팅 파워가 인간의 지능보다 10억 배 정도 높아지는 시기라고 주장하기도 한다. 인간 지능 vs 현 AI 역량 수준인간이 AI와 구별되는 역량으로는 상식적 추론이나 사실 관계 파악, 추상적 개념 이해 등을 들 수 있다. 또한 사전 교육이나 학습 없이도 새로운 일을 자율적으로 수행할 수 있는 역량도 포함된다. 특히 특정 분야만이 아닌 다양한 상황이나 환경에서도 일을 수행할 수 있는 범용성이나 한 문제를 다른 문제에서도 응용할 수 있는 역량이 중요하다.

하지만 현재의 AI는 특정 작업 수행 역량은 뛰어나지만 이를 넘어선 상황에서는 제대로 작동하지 못한다는 것이 전문가들의 일반적인 평가이다. 최근 구글의 딥마인드 연구진도 현재의 AGI 역량수준을 5단계로 분류하고, 챗GPT나 바드, 라마2 같은 현재의 AI 기술을 1단계인 신생(emerging) 수준으로 분류하고 있다.

그렇다면 현재의 생성형 AI 기술 수준으로 인류는 AGI 시대를 맞이할 수 있을까. AGI 도래 가능성에 대한 상반된 전망 이 또한 예측하기가 어려운 질문이다. 현재의 대규모언어모델(LLM)로 AGI에 도달할 수 있다는 주장과 아직은 시기상조라는 주장이 첨예하게 대립하기 때문이다.

우선 LLM을 고도화해 AGI에 도달할 수 있다고 주장하는 진영에서는 GPT-4를 AGI의 초기 버전으로 간주한다. 마이크로소프트(MS) 리서치 소속 연구자들은 지난 3월 발표한 ‘AGI의 불꽃’이라는 논문에서 GPT-4가 AGI의 불꽃이라고 비유하며 인류는 이미 AGI 초입에 들어섰다고 주장한다.

물론 이들은 현재 LLM이 AGI로 가는 데 있어 해결해야 할 문제가 있다는 점은 인정한다. 가장 많이 언급되는 문제는 수학 문제와 환각이다. 현재의 LLM은 번역이나 요약과 같은 언어 관련 작업에는 뛰어나지만 수학적 논리와 과학적 추론 등에는 적합하지 않다는 것이다. 또한 허위 정보를 사실로 제시하는 환각 현상은 챗GPT의 태생적 문제이다.

이 문제를 해결하기 위해 오픈AI는 기존 LLM의 한계인 다중모드 기능과 환각을 거의 없앤 아라키스 모델을 개발한 바 있지만 기대했던 성능에 못 미쳐 폐기한 바 있다. 대신 LLM의 약점이던 수학이나 과학 추론 문제를 해결한 큐스타(Q*)라는 AGI 모델을 개발 중이다.

지난 12월 7일 출시된 구글의 새로운 AI 모델 ‘제미나이’도 AGI 가능성에 대한 기대감을 키우고 있는 최신 모델이다. 구글 자체 LLM인 팜2의 후속 모델로 알려진 제미나이는 기본적으로 다중모드(multi modal)로 설계되어 있다. 이 말은 제미나이가 처음부터 텍스트, 이미지, 오디오 및 비디오, 코딩 등을 포함한 다양한 유형의 데이터를 이해하고 추론할 수 있도록 설계되었다는 것이다.

실제로 제미나이는 대부분의 측정 항목에서 오픈AI의 GPT-4보다 우수한 것으로 알려지고 있다. 특히 수학, 물리, 역사, 법률, 의학 등 57개 과목으로 구성된 지식과 문제 해결 능력을 측정하는 방법인 대규모다중작업언어이해(MMLU)에서 탁월하다고 한다. 제미나이 울트라의 경우 MMLU에서 90퍼센트를 기록, 인간 전문가(89.8퍼센트)를 뛰어넘은 점수를 받았다. 상식과 의식 등 인간의 복잡한 능력을 처리할 수 있는 인공지능인 AGI에 가까이 온 것이 아니냐는 말이 나오고 있는 이유이다.

반면 현재의 LLM으로 AGI를 달성할 수 없다는 진영에서는 기술적 고도화로 인한 AGI 도래 가능성이 높아진 것은 인정하지만 아직은 이르다는 입장이다. 특히 오픈AI의 큐스타에 대해서는 어느 정도의 효율성 측면에서는 효과가 있을 수 있겠지만 기존의 아이디어를 확장하는 수준에 불과하다는 평가이다.

무엇보다 메타AI 수석 과학자 얀 르쿤은 AGI에 도달하기 위해서는 현재 기술의 고도화가 아닌 새로운 구조로의 근본적인 전환이 필요하다는 입장이다. 그는 AGI로 가기 위해서는 현재와 같은 자동회귀 기반 LLM 모델 구조가 아닌 인간 뇌의 작동 방식과 유사한 모듈 아키텍처가 필수적이라는 주장이다. 여기서 자동회귀언어모델(AR-LLM)은 하나의 단어가 주어졌을 때 이전 시점의 데이터를 기반으로 다음에 올 단어를 자동으로 예측하는 챗GPT가 채택한 언어모델로, 환각을 초래하는 것으로 알려졌다.

구글이 최근 발표한 제미나이에 대해서도 과대포장 논란이 불거지고 있다. 특히 제미나이 시연 영상의 편집 조작 논란이 불거지고 있으며 제미나이가 탑재된 바드의 성능에 대해서도 회의적인 반응이 나오고 있다.

이처럼 끊임없이 쏟아지고 있는 기술적 발전에도 불구하고 현재로서는 AGI 도래 가능성을 정확히 예측하기는 어려울 것 같다. 다만 분명한 것은 현재의 생성형 AI 기술 발전 속도로 보면 AGI 도래가 현실로 다가올 가능성은 과거에 비해 높아지고 있다는 것이다. 최근 엔비디아의 CEO인 젠슨 황이 향후 5년 내에 AGI 시대에 접어들 것이라는 파격적인 전망을 내놓은 것도 이러한 기대감이 반영된 것이 아닐까 싶다.

심용운 SK경영경제연구소 수석연구원