![No 네트워크! 스마트폰 안에 들어온 AI①[테크트렌드]](https://img.hankyung.com/photo/202504/AD.40267103.1.jpg)
AI가 디바이스 안으로 아예 들어왔다. 네트워크 연결도 필요없다. ‘온디바이스AI’다. 이미 온디바이스AI 스마트폰이 시장에 출시되었다. 디바이스 안으로 아예 들어온 AI는 당신의 하루하루 평범한 일상을 비범하게 도와준다. 어떻게 도와줄까? 그래서 어떤 시사점이 있을까? 일상에 즉각적인 도움온디바이스AI는 네트워크에 연결되어 클라우드와 커뮤니케이션하는 AI들, 즉 거대언어모델 AI들과 달리 기능이 제한적이다. 자신의 디바이스 안에 심어진 정보만을 가지고 검색, 분석, 판단, 동작 하기 때문이다. 스마트폰 안에 내가 등록해둔 주소록, 내가 적어둔 메모, 내가 촬영한 사진, 내가 저장한 동영상, 내가 링크 걸어둔 북마크, 내 취향으로 설정한 기기 값, 내가 세팅해 둔 메뉴와 UI를 빅데이터 삼아 내 스마트폰AI가 일을 한다. 정보의 절대적인 양은 온디바이스AI가 적을 수밖에 없다.
대신 속도는? 당연히 빠르다. 네트워크를 통해 연결된 다른 서버, 환경과 통신하고 원격에서 검색, 분석, 판단하지 않기 때문이다. 굳이 필요없는 방대한 정보 검색에 드는 리소스가 아까웠었다면 온디바이스AI가 딱이다. 원하는 정보만 내 디바이스에서 뽑아서 빠르게 답을 주니까 가성비가 좋다.
개인정보 보호에도 탁월하다. 내 스마트폰 안의 내 정보를 내가 확인하므로 안심해도 된다. 밖으로 나가고 안으로 들어오는 정보는 내 스마트폰 안으로 한정되고 통제된다. 기존에는 챗GPT에 원하는 답을 요청하려면 사용자가 질문을 먼저 해야 하는데 기업의 민감한 데이터나 핵심 소스, 나의 개인정보가 포함되기도 했다. 이런 위험을 방지한다는 차원에서도 온디바이스AI가 각광받고 있다.
AI를 운영하는 비용도 경제적이다. 네트워크 환경, 클라우드 서버와 연결되는 데 필요한 비용도 안 들고, 구독료나 사용료도 없고, 이를 위한 전력 비용도 줄어든다. 내 스마트폰만 신경 쓰면 되므로 외부 인프라 하드웨어를 사용하건 사용하지 않건 기본적으로 들어가는 구축·유지 비용도 꼭 필요한 것만 최소로 든다. 실제로 현재까지 AI 이용에는 비싼 하드웨어 리소스, 인프라 환경이 필요했다. 한마디로 돈이 많이 들었다. 외부와 통신해야 하고 데이터도 많이 넣어야 하니 GPU를 많이 사용하게 되고 제품 단가가 비싸졌다. 거대언어모델 AI를 개발하는 회사 입장에서도, 이를 탑재한 기기를 구매해서 사용하는 사용자 입장에서도 둘 다 돈이 많이 들었다.
AI의 운영 비용뿐 아니라 개발 비용도 경제적이다. 온디바이스AI는 라이트한 AI, 즉 소형언어모델을 사용한다. 그래서 거대언어모델 AI를 개발하거나 사용할 때보다 개발 리소스가 적게 든다.
AI의 개발 비용, 운영 비용이 준다는 뜻은 이때 드는 전력 비용도 감소한다는 말이다. 전력 소모량을 줄인다는 것은 자연스럽게 AI개발 회사도 사용자도 둘 다 환경오염 최소화에 기여한다는 장점도 있다.
이렇게 속도, 개인정보 보호, 비용, 환경보호 면에서 온디바이스AI가 주는 장점이 있다. 소구 포인트는 확실하다. 이제 온디바이스AI가 주는 시사점을 알아보자.
![No 네트워크! 스마트폰 안에 들어온 AI①[테크트렌드]](https://img.hankyung.com/photo/202504/AD.40267102.1.jpg)
혹은 방향을 이렇게 잡을 수도 있다. 나만의 특징, 차별점을 가진 칩이어도 경쟁력을 가진다. 애플은 2024년 연례 개발자 콘퍼런스에서 자체 설계 반도체인 ‘애플 실리콘’ 기반으로 기기 내부에서 주로 AI 기능을 구동하므로 강력한 개인정보 보호 기능을 가진다고 자사 제품의 차별화 포인트를 어필했었다.
멀티모달 AI는 텍스트, 이미지, 오디오, 비디오 데이터를 이해하고 입출력할 수 있다. 우리가 흔히 말하는 AI 비서는 사람처럼 앞뒤 맥락과 스토리를 이해하면서 의사소통하고 대화하는데 바로 이 멀티모달 AI이기 때문이다.
오픈AI가 공개한 GTP-40o도 그렇고 구글의 프로젝트 아스트라도 제미나이1.5 프로를 기반으로 한 멀티모달 AI 케이스다.
멀티모달 AI로 일상생활 불편을 해결하는 예를 들어 보자. 노트북에 연결한 스피커가 동작을 안 하고 에러가 난다고 해보자. 이 상황을 설명하는 텍스트를 스마트폰에 타이핑하거나 말을 할 필요가 없다. 에러가 나는 부분을 사진이나 영상을 보여주고 AI에 어떻게 조치해야 하느냐고 물으면 끝이다.
이 편이 더 상황을 정확히 묘사해주고 정확한 해결책을 찾을 수 있다는 것은 가장 확실한 장점이다. 다른 장점도 있다. 사용자가 손에 무언가를 들고 있어 지금 손을 쓸 수 없거나 다쳤을 때도 있다. 지금 여러 사람들이 방에 같이 있어서 말을 하기가 불편한 상황일 때도 있다. 이럴 때도 위 방법은 요긴하다. 기계와 사람 간의 인터페이스에 다양한 선택지를 주니까.
상대의 음성, 톤, 단어 분석으로 감정을 이해하는 것이 멀티모달 AI다. 사용자와 지금 진행 중인 대화나 태스크 관련 최신 정보, 중요 정보를 수집하고 분석하는 것은 기본이다. 사용자와 과거에 나눴던 대화 정보가 새 대화나 태스크에도 관련이 있다면 이를 찾아내서 적용한다.
이런 복잡한 상황을 다 해결할 능력이 있는 ‘말이 통하는’ AI비서 역할이 온디바이스AI에 필수다. 그래서 온디바이스AI 니즈가 거세진다면 멀티모달 AI에 대한 니즈도 커지게 될 것이다.
<No 네트워크! 스마트폰 안에 들어온 AI②편에서 계속>
정순인 ‘당신이 잊지 못할 강의’ 저자·IT 칼럼니스트
© 매거진한경, 무단전재 및 재배포 금지