◆급증하는 AI 컴퓨팅 수요

◆AI 에이전트 기술의 진화

최근 글로벌 반도체 산업이 다시 뜨거워지고 있다. 기존에 인공지능(AI) 연산에 쓰이는 그래픽처리장치(GPU)와 특수목적반도체(ASIC)는 계속 수요가 커지고 있었는데 최근에는 낸드(NAND)나 고성능대용량저장장치(SSD), 하드디스크드라이브(HDD) 등 데이터를 저장하는 용도의 반도체 수요가 재조명되고 있다. AI 데이터센터뿐만 아니라 레거시 데이터센터에 대한 수요까지도 함께 커지며 국내외 반도체 산업에 대한 기대감이 커지는 중이다.이 흐름이 얼마나 더 이어질지 가늠해 볼 수 있는 방법은 최근 변화된 흐름의 근본 배경을 이해하는 것이다. 반도체와 같은 AI 하드웨어의 수요는 결국 AI 소프트웨어에서 비롯된다. AI 소프트웨어의 확산과 기술 진보가 지금과 같이 새로운 반도체 수요를 계속 유발한다. AI 반도체는 그렇다 치더라도 이전에는 AI 산업에서 관심도가 떨어졌던 데이터 저장 장치에 대한 리레이팅이 활발하게 진행 중인데 이 부분에 대한 고찰이 좀 더 필요해 보인다.AI 확산과 기술 진보 동향을 점검했다. 이를 통해 최근 반도체 산업에 대한 눈높이가 높아지는 현상이 구조적인지 그리고 얼마나 이어질 수 있는지 가늠해보고자 한다.AI 컴퓨팅 수요 확산의 핵심은 사용자 증가와 사용량 급증이다. 지난 2분기 알파벳 실적발표에서 구글 클라우드가 처리하는 연산 토큰 수는 2025년 5월 월간 480조 개에서 7월 월간 980조 개 수준으로 기하급수적으로 증가하고 있다. 연초 딥시크 모먼트 이후 AI LLM의 상용화가 가속화되기 시작하면서 전 세계적으로 챗GPT, Gemini 등 AI 모델의 사용자가 급증하고 있다는 증거 중 하나다.우리나라 사용 현황은 어떨까. 한국은행(2025)에 따르면 올해 6월 기준 우리나라 근로자 5500여 명을 대상으로 조사한 결과 62%가 챗GPT와 같은 생성형 AI를 활용하고 있으며, 업무 용도에 한정한 사용 유무를 조사해도 50%가 넘는 사람이 활용 중이라고 응답했다. 이는 2000년대 인터넷 기술 침투 속도보다 8배 빠르고 현재 미국인들의 사용률보다 두 배 높은 수준이다. 사람들 사이로 AI 모델 사용이 빠르게 확산되고 있는 것이 AI 하드웨어의 수요 눈높이가 높아지는 전반적인 배경이다.더 중요한 요소는 기술 진보다. 올해 1분기가 딥시크 모먼트 이후 ‘생각하는 AI(Test-Time Computing)’가 보편화된 것이 생성형 AI 확산의 변곡점이었는데 올해 3분기도 새로운 진화의 시작점인 것으로 보인다. AI 기술 진보의 위치를 가늠하는 게 중요한데 지금은 ‘AI 에이전트’의 확산 국면으로 생각된다. 젠슨 황 CEO가 지난 5월 대만 컴퓨텍스 행사에서 언급했듯 AI 에이전트는 이전 AI 대비해서 100배에서 1000배 더 많은 컴퓨팅 연산량을 요구한다. 단일 프롬포트에서 단일 생성 콘텐츠 결과물을 보여주는 생성형 AI와는 달리 AI 에이전트는 스스로 판단하고 일부 인간의 비물리적 행동을 대체하기 시작하는 역할로 그 과정에서 여러 번의 반복 연산 과정을 거치기 때문에 이전 AI보다 더 많은 하드웨어가 필요한 것이다.올해 3분기가 AI 에이전트 확산의 변곡점일 수 있는 이유는 7월 이후 에이전트 기능을 탑재한 주요 AI 모델들이 기업 소비자 간 거래(B2C)에 공개되고 있기 때문이다. 지난 7월 오픈AI는 ‘챗GPT Agent’라는 모델을 통해 자사가 기존에 개발하고 있던 에이전트 기능을 ‘챗GPT’에 통합한 모델을 선보였다. 비슷한 시기에 xAI의 ‘Grok 4’가 공개되었는데 유료 사용자만 접근할 수 있는 ‘Grok 4 Heavy’라는 모델은 멀티 에이전트와 도구를 활용할 수 있는 모드다. 이들은 주요 벤치마크(AI 성능을 평가하는 일종의 시험) 점수에서 기존 생성형 AI와 차별화된 성능이 확인되는데 이전 AI보다 월등한 역량이 결국 확산의 밑거름이 될 것으로 보인다.단순히 텍스트 기반 콘텐츠를 만들어주는 생성형 AI에서 이러한 컨텍스트를 복합적으로 활용해 인간의 의사결정 및 판단을 대신해주는 AI 에이전트로 진화하면서 AI 성능을 보완해주는 기술도 함께 복잡화되었다. RAG(Retrieval Augmented Generation)라는 기술이 있다. AI 모델의 추론(사용) 과정에서 모델 자체의 추론에 더해 외부 데이터베이스에서 가져온 정보로 추론 결과를 향상시키는 기술이다. 생성형 AI 초기에 있었던 문제인 거짓 정보를 진실인 것처럼 포장하는 할루시네이션이라는 현상을 보완하기 위해 등장한 기술이다. 기술의 원리에서 보이듯 이는 ‘데이터의 저장’을 필요로 한다.AI 에이전트가 본격화되면서 이 기술도 Agentic RAG라는 이름으로 진화했다. 이 기술은 이전보다 더 많은 정보, 데이터의 저장을 요구한다. 이제는 사용자와 AI 모델이 상호작용한 로그 및 컨텍스트까지도 데이터 저장의 대상이 된다. 핵심은 이 데이터의 저장이 단기 메모리가 아니라 장기 메모리인 점에 있다. 데이터 저장의 휘발성이 강하고 읽는 속도가 빠른 디램(DRAM)과 달리 읽는 속도가 느리지만 데이터를 좀 더 장기간 저장하는 NAND나 HDD와 같은 저장장치의 수요가 생기는 셈이다.Agentic RAG 기술 도입도 점차 가속화될 가능성이 높아 보인다. 이미 올해 상반기 AI 관련 최신 연구들에서 Agentic RAG의 성능이 입증되고 있는 상황에서 장기 메모리 관련 프레임워크를 도입한다든지 빅테크들이 Agentic RAG 도입 관련 움직임이 포착되고 있다. AI 리더들의 기술 도입은 기술 표준을 의미하며 기술의 표준화는 확산의 핵심 매개이다.이미 미국에서도 8월 말부터 장기 메모리 관련 데이터 스토리지 기업들의 실적 서프라이즈 및 주가 상승이 눈에 띄고 있다. 9월 들어 한국에서 AI 데이터센터뿐만 아니라 기존 데이터센터 서버에 대한 니즈, DRAM뿐만 아니라 NAND 등 레거시 반도체 산업에 대한 기대감이 커지는 배경은 이런 기술적 진보에 기인한 것으로 보인다.AI 하드웨어, 특히 AI 반도체는 2023년 초부터 글로벌 증시를 이끌어 온 주도 산업이다. 2025년 하반기에 이르기까지 중간중간 과잉 공급 우려 등도 있었지만 AI의 기술적 진화와 사용자 확산이 AI 하드웨어의 새로운 수요를 유발하고 있다. 그리고 앞서 서술한 새로운 기술 진보는 또다시 강력한 AI 하드웨어의 초과 수요를 유발할 확률이 높다. 여기에 그동안 부진했던 레거시 반도체와 전통적 서버 산업까지도 재조명 받는 상황인데 현재는 아직 이들이 수혜를 보는 초입 국면일 수도 있다.황수욱 메리츠증권 애널리스트