AI 시장의 '메기'인 딥시크(Deepseek)가 전 세계를 강타하고 있다. 개발 비용이 미국 기업의 10분의 1인 데 비해, 성능은 챗GPT에 뒤지지 않는다는 결과가 나와서다. 하지만 일각에서는 회의론도 적지 않다. 딥시크는 정말 오픈AI의 강력한 대항마가 될 수 있을까.

[마켓 리더의 시각]
엔비디아의 고성능 인공지능 칩 H100. 사진=한국경제
엔비디아의 고성능 인공지능 칩 H100. 사진=한국경제
지난 1월 20일 중국의 인공지능(AI) 스타트업 딥시크(DeepSeek)가 무료로 출시한 거대언어모델(LLM) R1이 오픈AI의 o1 모델에 버금가는 뛰어난 성능과 저렴한 요금제로 미국 애플 앱스토어 다운로드 1위를 기록하면서 전 세계적으로 큰 파장을 일으켰다.

특히 딥시크가 AI 모델을 개발하는 데 들어간 비용이 미국의 경쟁 AI 모델들 대비 현저히 낮았다는 점이 큰 화제가 됐고, 미국의 제재로 인해 미국 AI 기업이 사용 중인 최첨단 그래픽처리장치(GPU) 칩 대비 상대적으로 성능이 낮은 엔비디아의 H800 칩만으로 모델 개발에 성공했다고 공개하면서 미국 테크 기업의 대규모 자본 지출과 고성능 AI 칩의 필요성에 대해 의구심이 확산되는 모습을 보였다.

모델 훈련 비용 과소책정 논란

현재 시장에서는 딥시크의 AI 모델과 관련해 두 가지 논란이 제기되고 있다. 첫째는 V3 모델의 훈련 비용이 과소책정 됐다는 주장이고, 둘째는 딥시크가 오픈AI의 기술을 도용했다는 주장이다.

먼저, 개발 비용과 관련해서는 딥시크가 공개한 V3 모델 훈련 비용에는 2048개의 H800 GPU 칩 대여(rental) 비용만 포함돼 있으며, 그 외 훈련 과정에서 구입했을 것으로 추정되는 수천 개의 GPU 비용과 아키텍처, 알고리즘, 데이터를 위해 필요한 선행 연구, 실험과 관련된 기타 비용이 포함되지 않았다는 주장이다. 또한 V3 모델은 고밀도의 LLM 대비 경량화된 전문가 혼합(Mixture of Experts·MoE) 아키텍처로 각 입력 토근당 전체 6710억 개 파라미터 중 370억 개 파라미터만 활성화돼 GPU 의존도와 GPU 관련 비용이 상대적으로 낮을 수밖에 없다는 것이다.
오픈AI 도용 했나...딥시크의 혁신 비밀
미국 제재로 인해 딥시크가 밝히지 못했을 뿐 엔비디아의 H100 칩을 대량 보유하고 있을 가능성도 높다. 딥시크가 분사해 나온 하이플라이어 퀀트 측은 지난 2023년 5월 중국 언론 인터뷰에서 미국의 수출 금지 이전에 1만 장 이상의 GPU를 구매했다고 밝힌 바 있다. 미국 반도체 컨설팅 기관인 세미애널리시스에 따르면 R1 모델의 기초가 된 이전 모델 개발 과정에서 딥시크가 첨단 GPU 구매를 위해 5억 달러 이상을 투자했다고 주장하고 있다.

선두 기업 결과물 활용은 업계 관행

두 번째로 논란이 되고 있는 부분은 딥시크가 오픈AI의 GPT-4 모델의 기술을 도용했다는 의혹이다. 지난 12월 출시된 딥시크의 V3 모델을 해외 사용자가 이용하는 과정에서 V3 모델이 자신을 GPT-4라고 소개하면서 이러한 의혹이 불거졌다.
이와 관련해 미국 AI 업계에서는 미국과 중국에 위치한 AI 스타트업이나 학술기관이 오픈AI와 같은 선두 기업 모델의 결과물을 일부 활용하는 것은 AI 업계의 흔한 관행이며, 딥시크가 오픈AI 기술을 사용했다는 사실이 크게 놀랍지 않다고 얘기하고 있다.
오픈AI 도용 했나...딥시크의 혁신 비밀
특히 인간의 반복적인 피드백을 통해 모델을 훈련시키는 강화학습 과정에는 많은 인력과 비용이 투입되는 만큼 신생 기업들은 챗GPT와 같은 상업화된 모델을 자사 모델 훈련에 사용해 훈련 비용을 절감하고 있다는 주장이다. 오픈AI도 과거 언론을 통해 이러한 업계 관행을 막기 쉽지 않은 상황이라고 언급한 바 있다.

현재 딥시크 모델의 비용 효율성의 정도에 대해서는 논란의 여지가 있는 상황이지만 딥시크가 유사 성능을 나타내는 글로벌 경쟁 모델 대비 적은 비용으로 매우 훌륭한 모델을 만들어냈다는 사실에는 이견이 없다. 사실상 비용 이슈를 차치하더라도 오픈AI가 리드하고 있는 미국의 LLM 기술을 중국 기업이 따라잡았다는 사실만으로도 글로벌 AI 업계에는 큰 충격이 될 수 있는 부분이다.

딥시크는 훈련 비용 절감뿐만 아니라 혁신적인 추론 기술로도 주목을 받고 있고, 경쟁 모델 대비 현저히 낮은 API 요금제와 무료 배포를 통해 LLM의 상업화 정도를 크게 높였다는 점도 높게 평가받고 있다.

혁신 포인트 ①
강화학습 자동화를 통한 비용 절감


현재 딥시크의 R1 모델이 혁신적이라 평가받는 포인트는 크게 두 가지가 있다. 먼저, 딥시크는 그동안 업계에서 통상적으로 사용해 왔던 강화학습 방식을 택하지 않았다는 점이다.

일반적으로 강화학습 과정에서 오픈AI와 같은 개발자들은 ‘인간 피드백을 통한 강화학습(Reinforcement Learning from Human Feedback· RLHF)’ 또는 ‘AI 피드백을 통한 강화학습(RLAF)’이라는 방식을 통해 모델의 추론 능력을 키워 왔다. 이러한 방식은 인간 또는 AI가 모델의 모든 결과물을 레이블하고 어떤 결과물이 최선인지를 일일이 알려줘야 하는 만큼 많은 노동력과 비용이 투입될 수밖에 없다.

반면 딥시크의 모델은 인간이나 AI의 개입 없이 규칙 기반의 강화학습을 통해 스스로 배우고 진화하는 방식으로 자동화시켰고, 이를 통해 비용과 시간을 크게 절감해 대규모 훈련을 가능케 했다. 이 과정을 통해 딥시크의 AI 모델은 어떠한 외부 개입 없이도 추론 문제를 해결할 때에는 자연스럽게 생각하는 시간을 더 많이 갖는 놀라운 특징을 보였다.

이러한 강화학습 방식은 딥시크가 자체 개발한 ‘그룹 연계 정책 최적화(Group Relative Policy Optimization)’로 불리며, 하나의 문제(input)당 추론 과정과 정답을 포함한 다양한 출력값(output)과 그에 따르는 보상을 계산하도록 훈련하는 것이다.

혁신 포인트 ②
자체 검증 기술을 통한 정확도 향상


딥시크 R1 모델의 두 번째 혁신 포인트는 모델의 자체 검증 기술이다. R1 모델은 추론하는 과정에서 결과물을 재평가하고 수정해 AI 모델의 대표적인 오류 현상인 환각(hallucination) 현상을 보완하고 정확도를 높였다.
오픈AI 도용 했나...딥시크의 혁신 비밀
딥시크는 이러한 기능을 ‘아하 모멘트(Aha moment)’라 칭하고 있다. 미국의 대표적인 오픈소스 AI 플랫폼인 허깅페이스는 딥시크의 이러한 놀라운 기술력의 기반은 매우 강력한 사전학습 모델(V3)과 대규모로 강화학습을 진행할 수 있는 매우 훌륭한 인프라 덕일 것이라고 분석했다.

딥시크의 파격적인 가격 정책은 중국과 글로벌 시장에서 가격 경쟁을 촉발할 수 있다. 딥시크가 모델 사용료인 API 요금을 글로벌 기업 대비 압도적으로 낮은 수준으로 책정하고 있기 때문이다. 딥시크 R1 모델은 오픈AI의 o1 모델과 비교해 90~95% 낮은 비용으로 사용이 가능하다. 오픈AI o1 모델은 입력 토큰 100만 개당 15달러, 출력 토큰 100만 개당 60달러인 반면, 딥시크 R1 모델은 입력 토큰 100만 개당 0.55달러, 출력 토큰 100만 개당 2.19달러로 책정됐다.

또한 구독제 형태로 과금을 하는 오픈AI, 구글 등과는 달리 딥시크의 모델은 깃허브나 허깅페이스에서 무료로 다운로드가 가능하고, 실시간으로 정보를 검색해 답변을 제공하는 웹 검색 기능도 미국의 LLM 모델은 유료 또는 제한적인 사용량으로 제공 중인 반면, R1 모델은 무료로 무제한 이용이 가능하다. 이러한 파격적인 서비스 정책과 뛰어난 성능이 R1 모델이 출시 직후 미국 사용자들로부터 높은 인기를 얻은 주된 이유로 보인다.

AI도 가격 경쟁 시대

딥시크로 인해 이미 중국에서는 2024년 중반부터 가격 경쟁이 촉발된 상태다. 딥시크가 2024년 5월 출시한 V2 모델 요금제를 공격적으로 책정하면서 알리바바도 모델 가격을 최대 97% 인하한 바 있다. 최근 R1 모델 출시 이후에는 오픈AI도 최신 모델인 o3-미니(mini) 모델을 모든 사용자에게 무료로 제공하기로 결정하는 등 서비스 정책에 변화를 보이고 있다.

미국이 지난 수 년간 진행해 온 각종 대중 반도체 수출 제재가 궁극적으로는 혁신적인 AI 모델과 같은 중국의 첨단 인공지능 결과물을 막기 위한 목적이었기 때문에 이번 딥시크의 R1 모델 개발은 미국 정부 입장에서는 허를 찔린 기분이 아닐 수 없다. 딥시크 이슈를 계기로 미국 내에서는 중국 AI 산업 제재에 대한 회의론이 더욱 심화될 수 있는 만큼 중국에 대한 제재 수위는 더욱 강화될 것이다.

향후 미국 정부는 중국 틱톡에 취한 조치와 유사하게 딥시크 모델 다운로드를 전면 금지할 가능성도 배재할 수 없으며, 그 외 중국의 주요 AI 기업 블랙리스트 추가 등재, 저사양 반도체로 수출 통제 확대 등의 조치가 예상된다.

백승혜 하나증권 리서치센터 연구위원