AI 모델 성능 유지하면서 빠른 연산 가능한 양자화 기술 보유
경량화 기술력 고도화 및 글로벌 시장 확대 나설 것

[Start-up Invest] 스퀴즈비츠, 25억 원 프리 시리즈A 투자 유치
AI 경량화 기술 스타트업 스퀴즈비츠(SqueezeBits)가 카카오벤처스, 삼성넥스트, 포스코기술투자, 포스텍홀딩스로부터 25억 원 규모 프리 시리즈A 투자를 유치했다.

스퀴즈비츠는 AI 기반 서비스를 효율적으로 사용하도록 돕는 AI 경량화 기술을 개발하고 있다. 경량화 기술을 적용하면 AI 모델 추론 과정에서 필요한 메모리 사용량과 연산량을 줄일 수 있어 빠른 계산이 가능하다.

특히 스퀴즈비츠는 AI 모델 성능을 유지하면서 32비트 데이터를 4비트 이하로 양자화한다. 더 빠르고 가벼운 AI 모델을 만드는 핵심 기술이다. 양자화된 모델을 기존 하드웨어에서도 효율적으로 연산할 수 있는 소프트웨어 엔진도 보유했다. 챗GPT를 시작으로 수많은 AI 기반 서비스가 출시되는 상황에서, AI 대중화의 가장 큰 걸림돌인 운영비용을 절감할 것이라는 기대다.

스퀴즈비츠의 AI 경량화 기술은 모바일 스마트폰, 노트북을 비롯한 엣지 디바이스, GPU 클라우드 등 다양한 환경에 적용할 수 있다. 이미지, 비디오, 음성, 자연어 등 다양한 모델을 지원해 응용 분야도 넓다. 이미 네이버, SK텔레콤 등 20여 곳 기업과 기술 검증(PoC) 및 프로젝트를 완료하고, 초거대 AI 모델 등 다양한 분야 AI 서비스에 경량화 기술을 선보이고 있다. 최근 초거대 언어 모델인 LLM을 엣지 기기에서 실시간으로 구동하는 온디바이스 AI데모를 공개해 업계 관심을 받았다. 이미지 생성 AI 스테이블 디퓨전(Stable Diffusion) 모델을 스마트폰에서 실시간으로 구동하는 기술을 공개하기도 했다.

투자 유치를 기점으로 경량화 기술 경쟁력을 확보하고, 해외 시장 진출에 본격 나설 계획이다. 최근 경량화에 대해 익숙하지 않은 비전문가들도 손쉽게 AI 모델을 경량화하고 비교 및 분석할 수 있는 아울라이트(OwLite) 툴킷을 출시하기도 했다. 현재 엔비디아 GPU를 지원하고 있으며, 향후 인텔, AMD, ARM 등의 하드웨어, AI 반도체 스타트업들이 내놓는 NPU까지 다양한 하드웨어를 지원하도록 적용 범위를 확장할 예정이다.

스퀴즈비츠는 포스텍 대학원 딥러닝 가속기 하드웨어(Neural Processing Unit, NPU) 연구팀을 주축으로 구성됐다. 공동창업진은 지난 7년간 CVPR, NeurIPS, ICLR 등 머신러닝 분야 세계 최고 학회에서 경량화 관련 논문을 꾸준히 발표해 왔다. 현재까지 딥러닝 가속을 주제로 한 국제 논문만 70편 이상이다. AI 전용 하드웨어를 직접 설계한 경험도 있다. AI 알고리즘부터 하드웨어까지 전반에 걸친 최적화 기술을 구현하는 데 압도적인 기량을 갖춘 팀이라는 평이다.

신정호 카카오벤처스 심사역은 “스퀴즈비츠는 하드웨어와 소프트웨어 전문성을 기반으로 AI 밸류체인 전반에 걸친 솔루션을 제공하면서 AI 애플리케이션 보편화를 이끌 수 있는 팀“이라고 투자 이유를 말했다.

김형준 스퀴즈비츠 대표는 “AI 기반 서비스가 고객 확보에서 수익 창출 단계로 넘어가기 위해서는 AI 운영비용을 대폭 절감해야 하는 문제를 안고 있다”며 “스퀴즈비츠만의 AI 경량화 기술로 많은 기업이 안고 있는 비용과 효율 문제를 해결하고 AI 기술 잠재력을 극대화하는 데 기여하는 기업이 되겠다”고 말했다.

한편, 스퀴즈비츠는 2022년 3월 설립 이후 포스텍홀딩스와 네이버D2SF로부터 시드 투자를 유치했다. 기술력이 우수한 스타트업을 선정해 기술개발 자금을 지원하는 딥테크 팁스 프로그램에 선정되며 15억 원 규모 기술 개발 자금을 확보했다.

강홍민 기자 khm@hankyung.com