[AI 활용] “아리아, 안녕”…4주년 맞은 SK텔레콤 ‘누구’
입력 2020-09-17 11:35:28
수정 2020-09-17 11:35:28
[AI·TECH] AI 활용 사례
국내 최초 AI 스피커에서 21종 130여 개 서비스로…“NUGU Everywhere”
[한경비즈니스=이현주 기자] “아침 약 복용 시간입니다. 식후 2알씩 꼭 챙겨 드세요. 5분 후 다시 알려 드릴게요.”
매일 먹는 약, 이제는 인공지능(AI) 스피커가 챙겨 준다. SK텔레콤이 지난 7월 말 출시한 누구 오팔(NUGU opal)을 통해서다. 누구 오팔은 시니어 고객을 위한 특화 서비스를 한데 묶은 상품으로 투약 알림, 일정 알림, 생활 알림, 두뇌 체조, 건강 박사, 이용 통계, 금영노래방과 같은 서비스를 제공한다.
시니어 고객은 ‘아리아, 두뇌 체조 시작’이라고 말하고 반복적으로인 퀴즈를 푼다. ‘산 이름 세 개를 말해 보세요’라고 물으면 ‘한라산, 속리산, 북한산’과 같이 답하는 식이다. 치매 예방 콘텐츠로 마련된 건강 정보 팟캐스트를 듣거나 노래방 서비스를 통해 노래를 따라 부르기도 한다. 응급 상황에서 ‘아리아, 살려줘’ 등 간단한 명령어로 SOS 알림을 보낼 수도 있다.
SK텔레콤은 2016년 9월 국내 최초로 AI 스피커 ‘누구(NUGU) 스피커’를 출시한 이후 내비게이션(T맵)과 셋톱박스(BTV) 등으로 서비스를 확대해 왔다. 누구 오팔을 비롯해 SK텔레콤에서 만든 AI 서비스는 ‘누구’로 통칭하고 있다. 누구는 친구·연인·가족·비서 등 고객이 원하는 누구라도 될 수 있다는 의미다.
아리아를 부르면 일상이 편리해진다
2020년 9월 현재 누구는 월간 활성 이용자(MAU) 700만 명, 21종 이상의 고객 접점(touch point), 130개 이상의 서비스로 성장했다. 올해 출시 4주년을 맞아 집(HOME)·자동차(CAR)·스마트폰(MOBILE) 등 일상생활의 주요 영역에서 AI와 만나는 ‘누구 에브리웨어(Everywhere)’에 속도를 내고 있다.
SK텔레콤에서 AI 연구를 시작한 것은 2013년으로 거슬러 올라간다. 향후 5년을 내다보고 진행한 연구의 일환으로 한국어 음성 인식 기술 개발을 시작하면서다. 2014년에 SK브로드밴드와 협업을 통해 Btv(IPTV)에 음성 인식을 통한 주문형 비디오(VOD)와 채널 검색에 적용했고 상용 적용을 통해 기술 개발에 필요한 데이터와 경험을 축적했다.
AI 스피커에 주목한 것은 2014년 아마존의 콘셉트 영상을 통해 아이디어를 얻으면서다. 박명순 SK텔레콤 AI사업유닛장은 “아마존 알렉사가 출시되기 전에 우연히 유튜브 영상을 보게 됐고 음성 사용자 경험(UX)에 새로운 경험을 할 수 있도록 제공하겠다는 기획 의도가 아주 인상적이었다”고 말했다.
리모컨의 도움 없이 음성만으로 제어한다는 점도 매력적이었다. 박 유닛장은 “기존의 터치 인터페이스나 리모컨 등에 비해 보완재였던 음성 UX가 메인 UX로서의 가능성을 검증할 수 있을 것으로 기대하면서 음성 스피커를 상용화하기로 결정했다”고 말했다.
음악을 듣고 날씨를 검색하는 행위는 주로 스마트폰을 통해 이뤄지고 있었다. 음악을 듣는 행위는 달라지지 않으면서 UX의 변화만으로 새로운 서비스가 되기 어렵다는 반대 의견에 맞서 스피커를 사용해야 할 이유를 만들어야 했다. 실무진은 해외 논문에서 멀티태스킹·핸즈프리 등의 장점을 찾아 음성 제어가 사용성 측면에서 의미가 있다는 것을 강조했다.
AI 스피커의 타깃 고객은 블루투스 스피커 시장과 동일하게 설정했다. AI 서비스에 대해 돈을 받는 구조가 아니라 블루투스 서비스에 음성 인터페이스를 추가로 제공한다는 콘셉트로 초기 시장을 개척했다.
AI 서비스를 깨우는 호출어(wake up word)를 결정하는 것도 도전 과제였다. 사업부에서는 친근하고 듣기 좋은 이름을 제1 원칙으로 내세웠지만 기술 쪽에서는 목소리를 오인식(false alarm)하는 문제를 제기하면서다. 아마존의 알렉사도 ‘알렉스’와 같은 유사한 이름에 자주 깨어나는 문제를 갖고 있던 때다. 결국 ‘아리아’라는 친근한 이름으로 선택됐지만 차선책으로 추가 호출어를 선택지에 포함했다. ‘크리스탈’, ‘레베카’, ‘팅커벨’이 그것이다. ‘ㅋㅌㅍ’과 같은 자음이 인식률이 좋다는 판단에 따라 선정된 발화어들이다. 그럼에도 불구하고 ‘아리아’도 ‘아리’나 ‘아니야’와 같은 유사한 발화에 깨어나는 현상이 나타났다. 동시에 이 난제를 해결하면서 기술력이 많이 높아진 것으로 SK텔레콤은 평가한다.
서비스 출시 단계에선 다양한 시도들이 이어졌다. 대표적으로 음악 이외에 ‘오디오북’을 콘텐츠로 추가했다. 네이버로 인수된 오디언과 협업해 2016년 말 서비스를 선보였다. 이때도 예상하지 못한 문제가 발생했다. 실제 소비자들이 책 이름을 명확하게 인지하지 못하는 경우가 많았다. ‘어린왕자’, ‘백설공주’와 같은 명작 이외에 긴 단어로 구성된 책 이름은 틀리게 말하거나 일부 단어만 언급하는 일이 많았다. 일찍이 11번가를 비롯한 커머스와도 손잡고 서비스를 선보였지만 마찬가지로 음성으로의 한계를 보였다.
이 때문에 음성 UX에 디스플레이 UX까지 동시에 제공하는 ‘멀티 모달 UX’를 지향하게 됐다. 현재 Btv나 T맵에 쓰이는 ‘누구’는 자체의 화면을 가지는 식으로 진화하고 있다.
AI 스피커뿐만 아니라 디바이스의 변화를 줄 필요성도 제기됐다. 당시 블루투스 스피커 시장을 연간 100만 대 정도의 규모로 파악했다. 음악을 매일 듣는 음악 마니아 층의 인구수를 고려할 때 AI 스피커의 마켓 사이즈는 100만~200만 대 사이로 내다봤다. 시장을 확대하기 위해 차 안에서의 쓰임새를 찾았다. T맵에 AI 서비스를 접목해 목적지 검색, 경우지 추가, 음악 검색 등의 기능을 추가했다.
‘누구’는 올해 출시 4주년을 맞아 새로운 변화들을 모색하고 있다. 오는 10월 T전화에 AI 서비스를 추가해 신규 서비스를 론칭할 예정이다. SK텔레콤은 지속적인 고객 접점을 확장해 집(스피커, Btv)·자동차(T맵)·모바일(T전화)을 연결하고 중단 없는(seamless) 서비스를 제공할 수 있다는 점을 강점으로 내세운다.
박 유닛장은 “4년 만에 크게 발전하면서 많은 플레이어들과 경쟁하는 것만으로도 큰 변화”라며 “누구는 언제 어디에서나 고객의 첫째 콘택트가 되기 위해 계속해 ‘누구 에브리웨어’를 추진할 것”이라고 말했다.
charis@hankyung.com
[본 기사는 한경비즈니스 제 1294호(2020.09.14 ~ 2020.09.20) 기사입니다.]