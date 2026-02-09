픽셀 예측을 넘어 실행 가능한 코드(HTML·CSS)로 다음 화면을 생성하는 세계 최초 모바일 월드모델

Llama-4-402B보다 높은 GUI 예측 성능…국내 모바일 환경에서 추가 학습 없이 작동 가능

AI 모델 스타트업 트릴리온랩스는 주변 환경의 인과관계를 학습해 미래 변화를 시뮬레이션하는 모바일 월드모델(Mobile World Model) ‘gWorld-32B’를 세계 최초로 개발했다고 9일 밝혔다.트릴리온랩스가 공개한 gWorld-32B는 세계 최초로 모바일 환경에 구현된 월드모델로, 모바일 환경에서 사용자의 터치 입력을 바탕으로 이후 화면 상태를 시뮬레이션하듯 실시간으로 재현한다. 월드모델은 AI 에이전트가 특정 행동을 하기 전 그 결과를 시각적·논리적으로 상상해 시뮬레이션하는 기술로, 인간이 물리 법칙을 이해하고 행동의 결과를 예측하는 것과 유사한 원리로 작동한다.기존 월드모델들이 다음 화면의 상태를 이미지(픽셀) 단위로 생성해 글자 뭉개짐이나 형태 왜곡이 발생했다면, gWorld-32B는 ‘실행 가능한 웹 코드(HTML·CSS)’ 형태로 예측해 기존 모델의 구조적 한계를 개선했다.이 기술은 다음 화면의 사진을 찍어 보내는 방식이 아닌 정교한 설계도에 해당하는 코드를 생성해 실시간 고화질 렌더링(Rendering)을 유도한다. 이를 통해 렌더링 실패율을 1% 미만으로 낮췄으며, 텍스트와 아이콘을 왜곡 없이 선명하게 유지하는 높은 정확도를 확보했다.특히 모델 최적화 기술로 매개변수 규모가 50배 이상 큰 초거대 AI 모델인 ‘Llama-4-402B’를 상회하는 GUI(Graphical User Interface, 사용자가 화면 속 아이콘이나 메뉴를 통해 기기와 소통하는 시각적 체계) 예측 성능을 기록했다. 이는 gWorld-32B이 실제 모바일 환경에서 화면 변화와 인터페이스 동작을 예측·생성할 수 있는 ‘실전형 멀티모달’ 모델임을 보여준다.또한 국내 모바일 환경에 특화된 한국어 벤치마크인 KApps(한국 모바일 앱 조작 성능 평가 지표)에서도 별도의 추가 학습 없이 바로 실전에 투입 가능한 '제로샷(Zero-shot, AI가 특정 데이터를 추가로 학습하지 않고도 처음 접하는 과업을 즉시 수행하는 것)’성능을 구현했다. 이와 같은 성능을 바탕으로 gWorld-32B는 글로벌 범용 모델 대비 한국 고유의 모바일 앱 생태계와 UI 구조에 최적화된 기술 경쟁력을 갖췄음을 입증했다.gWorld-32B는 모바일 에이전트, 앱 자동 테스트, 고객 응대 자동화 등 실제 산업 현장에서 활용 가능한 실행형 AI 기술로, 디지털 서비스 운영 전반의 자동화를 가능하게 한다.신재민 트릴리온랩스 대표는 “묻고 답하는 AI를 넘어, 복잡한 디지털·물리적 환경에서 직접 행동하는 ‘실행형 AI’의 시대가 도래했다”며 “이는 정부 AI 전략 과제가 본격화되기 이전부터 월드모델에 집중해온 결과물로, 로보틱스와 공공 서비스 자동화 등 다양한 영역에서 대한민국 AI 주권과 산업 경쟁력에 혁신을 가져올 것으로 기대한다”고 말했다.한편 트릴리온랩스는 네이버 하이퍼클로바X 핵심 개발 인력이었던 신재민 대표가 2024년 설립한 AI 모델 스타트업으로, 설립 1년 만에 프롬스크래치로 70B 규모의 LLM을 개발·공개했다.강홍민 기자 khm@hankyung.com