[한경 머니=정순인 LG전자 책임연구원 | 사진 각 사 제공] 아마존이 오프라인을, 구글이 하드웨어를 공략하는 이유는 모두 하나다. 제대로 된 빅데이터를 잡기 위해서다. 눈에 보이고 손에 잡히는 물성을 통해 사람들이 무슨 생각을 하는지, 왜 이렇게 움직이는지 파악하기 위해서다. ‘CEO가 알아야 할 IT 트렌드’ 이번 주제는 ‘빅데이터’를 다뤘다.


빅데이터를 잘 활용하는 기업 중 하나가 아마존이다. 아마존 사이트에서 쇼핑을 한 번 하면 내가 본 아이템과 유사한 아이템, 내가 본 아이템을 산 다른 사람이 추가로 구매한 아이템, 내가 본 아이템과 함께 사용할 수 있는 오프라인 매장 아이템이 바로 뜬다.

현재 아마존에서 고객 맞춤형 책 추천 시스템을 통한 매출은 아마존 매출이 35%를 책임진다. 시간이 지나면서 고객 데이터는 차곡차곡 더 많이 쌓이기 때문에 책 추천 시스템 역시 더 정밀해지고 고도화된다. 적중률 높은 추천 시스템에 신뢰가 간 고객들은 본인 데이터를 아마존에 또 기꺼이 적립한다. 이 탄탄한 순환구조가 아마존의 최대 먹거리다.

[CEO가 알아야 할 IT 트렌드⑮] 아마존이 오프라인을, 구글이 하드웨어를 공략하는 이유
개별 데이터가 가져올 가치

하루 평균 550명이 아마존 무인 편의점 아마존고를 방문한다. 매장당 연간 수익이 17억 원에 이른다. 블룸버그(Bloomberg) 보고서에 따르면 아마존은 2021년까지 아마존고 매장을 3000개 열 계획이라고 한다. 하지만 아마존이 오프라인 매장을 유지하는 가장 큰 이유는 매출 그 자체 때문이 아니다.

아마존은 이 오프라인 매장을 ‘빅데이터를 수집하기 위해’ 운영한다. 막대한 예산을 들여서 각 매장에 수천 대 카메라와 센서를 설치하고 거기서 수집된 데이터를 분석한 뒤 유의미한 결과를 아마존 온라인·오프라인 매장 수익을 창출·개선하기 위한 전략에 반영한다. 온라인에서는 수집할 수 없는 고객 표정, 섬세한 동선, 구매 망설임까지 다양한 행동 패턴을 오프라인에서는 알 수 있다. 카메라와 센서를 수천 대 설치하고 결과를 분석하는 기술에 막대한 돈이 소요되지만, 장기적인 수익 창출에는 오프라인 분석이 필수다.

고객 100만 명이 준 데이터 한 개보다 고객 한 명이 준 100만 개 데이터가 가치 있다. 아마존 빅데이터 분석 전략이다. 철저하게 개인 한 명, 한 명에게 맞춘 개별 데이터가 향후 더 큰 성과로 이어진다. 그런 말도 있지 않은가. 모두를 만족시키려 하면 아무도 만족시키지 못한다고. 유의미한 빅데이터가 쌓이면 고객에게 더 안성맞춤인 제품을 개발할 수도, 제안할 수도 있다. 구매 결과에 만족한 고객은 내 취향 데이터, 구매 데이터를 기꺼이 또 내놓는 선순환을 거친다.

제프 베이조스 아마존 최고경영자(CEO)는 말했다. “아마존은 무언가를 팔 때 돈을 버는 기업이 아닙니다. 아마존은 소비자가 구매를 효과적으로 결정하도록 도와줄 때 돈을 버는 기업입니다.”

스마트폰·이어폰 만드는 구글

구글은 2019년 10월 15일 미국 뉴욕에서 ‘메이드 바이 구글(made by Google) 2019’ 행사를 열고 정보기술(IT) 신제품 6개를 선보였다. 스마트폰, 무선 이어폰, 인공지능(AI) 스피커 같은 하드웨어에 구글 AI, 머신러닝 같은 소프트웨어 기술을 담아냈다. 구글이 하드웨어 시장에 이렇게 관심을 많이 기울이는 이유가 무엇일까. 여러 가지 이유가 있지만 그중 핵심은 빅데이터 때문이다.

지금까지 구글은 주로 온라인 검색, 이메일, 미디어, 콘텐츠를 통해 빅데이터를 수집한 뒤 AI, 자율주행, 사물인터넷(IoT) 개발에 활용했다. 하지만 앞으로는 부족하다. 오프라인에서 확보할 수 있는 사용자 음성, 동작, 표정, 스타일 같은 데이터도 중요해졌기 때문이다.

이런 오프라인 빅데이터는 온라인 빅데이터가 못 보는 영역까지 세심하게 훑어 주기 때문에 상호 보완적인 가치가 있다. 온라인 빅데이터와 오프라인 빅데이터 두 개가 다 있어야 양과 질이 모두 보장된다. 오프라인 빅데이터를 수집하기 위해서는 마이크, 위치 센서, 음성 센서, 이미지 센서, 카메라 같은 하드웨어가 도구로 필요하다. 구글이 다양한 하드웨어를 출시하면, 이를 사용하는 다양한 사람들과 ‘연결’될 수 있다. 하드웨어가 사람들과 ‘오프라인 접점’ 역할을 하기 때문이다. 구글은 이 하드웨어를 통해 다양한 장소·상황·인물 빅데이터를 입체적으로 수집·분석·활용할 수 있다.

[CEO가 알아야 할 IT 트렌드⑮] 아마존이 오프라인을, 구글이 하드웨어를 공략하는 이유

디즈니는 또 어떠한가. 디즈니는 최근 넷플릭스가 독주하던 글로벌 OTT(Over The Top: 인터넷을 통해 볼 수 있는 TV 서비스) 시장에 도전장을 내밀었다. 디즈니는 넷플릭스와 콘텐츠 계약을 해지하고, 디즈니 자체적인 서비스인 ‘디즈니 플러스’를 2019년 11월 론칭했다. 넷플릭스에서는 디즈니 콘텐츠는 물론 디즈니가 2009년 인수한 마블 콘텐츠가 모두 사라진다는 뜻이다. 디즈니는 콘텐츠는 물론이요, 그 콘텐츠를 배포하는 플랫폼까지 둘 다 손안에 움켜쥐고자 한다.

왜 꼭 고유한 콘텐츠를 고유한 플랫폼에서 서비스해야 할까. 콘텐츠 종속성(dependency)도, 채널 종속성도 없이 독자적으로 종합적인 고유 서비스를 제공해야 빅데이터를 확실하게 쌓을 수 있다. 콘텐츠만 꽉 잡고 있어도 안 되고 플랫폼만 꽉 잡고 있어도 안 된다. 이 두 가지를 다 꽉 잡고 있는 내 시스템에서는 고객이 좋아할 만한 영화, 드라마를 사전에 기획할 수 있다. 이 빅데이터를 내가 원할 때 언제나 분석하고 업데이트하고 활용할 수 있다. 흥행할 만한 마케팅 방향을 정할 수 있다.

딱 맞는 론칭 타이밍을 정할 수 있다. 콘텐츠도 수시로 변경하고 새롭게 시도해 볼 수 있다. 다소 위험할 수 있는 이런저런 ‘베타테스트’도 바로 실행에 옮겨 보고 또 바로 고칠 수 있다. 다른 눈치 볼 필요 없다. 내 플랫폼이니까. 내가 가진 빅데이터가 충분하니까. 내가 가진 빅데이터가 확실하니까. 마침내 이렇게 완성된 좋은 콘텐츠를 보려면 고객은 다른 곳이 아닌 바로 여기, 내 플랫폼에 와야만 한다. 이것이 바로 확실한 핵심 경쟁력이다.

빅데이터, 그 무한한 확장성

자율주행자동차를 3시간 운행하면 교통 빅데이터가 4테라바이트(terabyte) 쌓인다. 어느 도로가 현재 공사 중이라 진입 불가인지, 어디에 건물이 새로 생겨서 우회해야 하는지, 시간이 더 적게 걸리는 새로 생긴 길이 어디인지, 기존에 있던 어떤 건물이 지금은 없어졌는지, 지금 이 시간 어느 도로가 막히는지, 방금 어느 건물 뒤에 장애물이 생겼는지, 현재 신호등이 몇 초 유지될 걸로 보이는지, 지금 옆 차가 차선 변경을 시도하는지 정보를 실시간으로 계속 수집하기 때문이다. 이 최신 정보를 유지해야 자율주행이 가능하기 때문에 자율주행에는 빅데이터가 필수다.

빅데이터는 자율주행차뿐 아니라 자율주행이 접목된 공유자동차 시장에서도 필수다. 도요타, 소프트뱅크, 덴소 등이 우버 자율주행 자회사 ATG에 대규모로 투자했다. 우버가 가진 어떤 미래 가치를 확신했기 때문일까. 우버는 ‘어떤 사람이’, ‘언제’, ‘무엇을 하러’, ‘왜’, ‘어디로 가는지’, ‘어디로 갔었는지’, ‘어디로 갈지’, ‘무엇을 취소할지’, ‘무엇을 추가할지’를 모두 꿰차고 있다. 우버를 사용하기 위해 사용자가 입력한 건물, 도로명은 이동 의사가 확실한 데이터다. 그냥 한 번 궁금해서 포털에 검색해 본 키워드가 아니란 뜻이다. 이 빅데이터는 고객이 실제로 이동을 위해 정확히 제공한 데이터이기 때문에 신뢰성과 품질이 높다. 공유차 플랫폼 서비스를 기획·운영하는 데 필요한 알짜 정보다. 바로 이 때문에 우버 자율주행과 공유차 사업이 높게 평가받는다.

제너럴일레트릭(GE)은 비행기 엔진을 제조한다. 이들은 엔진에 센서를 달아 항공기가 운항할 때마다 데이터를 다운로드 받은 후 엔진 부품의 수명을 예측하고 필요한 부분만 교체하는 ‘예측’ 서비스를 개발했다. 2017년부터 이 예측 서비스 매출이 엔진 자체 매출보다 커졌다. 엔진보다 엔진 관리 서비스가 더 큰 매출을 내는 효자상품이 됐다. 이 서비스는 엔진 빅데이터를 기준으로 부품 수명이 얼마나 남았는지, 부품 교체가 필요한지, 엔진 점검 시점인지, 사고 가능성이 얼마인지를 파악한다.

GE 입장에서는 얼마나 많은 유지보수 비용이 절감되겠는가. 필요한 부품을 미리 사 둘 수도 있다. 필요 인력을 미리 대기시켜 둘 수도 있다. 항공기회사에 이 사실을 미리 알려 관리해 주니까 GE 신뢰도도 높일 수 있다. GE만 이득이 아니다. 항공기회사도 이득이다. 항공기 엔진 설비 사용 수명이나 사고 예측이 가능하니 필요한 예산을 미리 마련하고 항공 스케줄을 조정하고 사고도 미연에 방지할 수 있다. 모두가 이득인 상황이다. 빅데이터 덕분에.

반복성, 대표성, 유사성. 이 세 가지가 있어야 의미 있는 빅데이터다. 이제 단순한 길 안내, 현재 길이 막힘과 같은 단순 정보는 의미 있는 빅데이터가 아니다. 향후 교통 흐름, 향후 사고 위험, 가장 안전한 주행 경로, 교통 트렌드와 운전자의 성향에 맞는 정보까지 예측해야 제대로 된 빅데이터다.

최근에는 큰 도로, 아파트, 공장, 병원처럼 교통량이 많은 곳에 신호등이나 폐쇄회로(CC)TV를 추가로 더 설치하는 경우도 많다. 왜일까. 데이터를 더 많이 수집하기 위해서다. 데이터를 더 많이 수집하고 분석해야 반복되고, 대표적이고, 유사한 데이터를 이끌어 낼 수 있기 때문이다. 그리고 그런 데이터가 ‘진짜’ 답을 말해 주기 때문이다.

스포티파이(Spotify)라는 글로벌 음원 서비스 1위 업체가 있다. 사용자 패턴을 기반으로 자동으로 추천 생성되는 플레이 리스트로 유명하다. 추천 곡 리스트는 AI 빅데이터 분석과 선곡 전문가 분석을 결합해서 세세한 리듬·박자·장르별로 소비자 취향을 저격한다. 단순히 댄스곡 추천, 오리지널사운드트랙(OST) 추천과 같은 추상적인 수준이 아니다. 이 서비스는 완전히 개개인에 맞춘 촘촘한 그물망을 가지고 추천 리스트를 만든다.

애플은 2014년 한 해 동안만 나이·성별·취향별 맞춤형 콘텐츠를 다루는 큐레이션 업체 세 곳을 인수했다. 애플은 2019년 9월 음악 인식 서비스 앱 샤잠도 인수했다. 샤잠은 사용자가 TV나 영화를 보다 마음에 드는 음악이 나올 때 그 음악을 들려주면 음악 제목을 알려 준다. 어떤 나이, 어떤 직업, 어떤 지역 소비자들이 어떤 영상을 볼 때 어떤 부분에서 어떤 곡을 많이 궁금해하고 찾아봤는지 샤잠에 빅데이터가 정확히 쌓인다. 이 빅데이터는 당연히, 애플의 다른 여러 디바이스에도 요긴하게 사용된다. 궁극적으로 그 빅데이터 위에서 애플의 모든 제품들은 더욱 진화한다.

큐레이션 하면 빠질 수 없는 의류 분야도 살펴보자. 스티치픽스(Stitchfix)는 고객 구매 기록과 취향 빅데이터를 파악해 옷을 추천한다. AI과 전문 스타일리스트가 고객에게 맞는 스타일링 아이템 다섯 개를 고객이 원하는 날짜에 원하는 곳으로 보내 준다. 고객이 특정 제품만 구매하면 나머지는 무료로 반품을 받는다. 이곳의 재구매율은 85%에 육박하며 2018년 매출은 4년 만에 12배 이상 늘었다.

빅데이터를 가지게 된 기업들은 이제 사람들의 말 대신 행동을 믿는다. 사람들이 보고 싶다고 말하는 영화와 실제로 보는 영화는 다르다. 이를 넷플릭스는 일찌감치 눈치 챘다. 사람들은 현학적인 다큐멘터리나 교훈적인 영화를 보고 싶다고 했지만 막상 실제로는 코미디나 만화, 로맨스 영화를 봤다. 이제 넷플릭스는 사람들에게 더 이상 보고 싶은 영화가 무엇인지 묻지 않는다. 사람들이 실제로 많이 클릭한 영화가 무엇인지 직접 확인한 뒤 큐레이션해서 더욱 더 많은 시청자의 취향을 저격한다. 강력하고 차별화된 경쟁력이다.

디지털 매체 독자층이 가파른 속도로 늘어나고 있다. 최근 방문 시기(recency), 방문 빈도 (frequency), 콘텐츠 이용량(volume)을 일컫는 독자 RFV 빅데이터 확보가 점점 더 중요해지고 있다. 독자가 온라인을 방문하는 데 어떤 뉴스 콘텐츠가 어떤 계기가 됐는지 연구하고, 거꾸로 온라인 방문 독자들은 어떤 시기에 어떤 순서로 어떤 토픽을 보는지도 연구한다. 이 두 개의 빅데이터 사이클을 분석하면 최적의 온라인 콘텐츠를 기획할 수 있다.

복사, 공유되지 않는 데이터

위에서 살펴본 GE 예측 서비스, 스포티파이 큐레이션, 샤잠 서비스, 스티치픽스 추천 서비스 모두 소프트웨어 복사는 어렵지 않다. 마음만 먹으면, 자본만 있으면 유사 업체가 금방 만들 수 있는 소프트웨어다. 알파고가 유명세를 탄 뒤, 알파고와 유사한 바둑 프로그램은 우후죽순처럼 바로 등장했다. 이렇게 소프트웨어 소스 코드는 쉽게 복사된다.

이 업체들이 강력한 건 데이터 때문이다. 소프트웨어 복사는 어렵지 않지만 데이터는 복사가 어렵다. 이 업체들은 의미 있는 고객 데이터를 착실히 보유해 왔다. 이 데이터가 자산이다. 빅데이터 시대에는 소프트웨어 개발만 잘해서는 안 된다. 빅데이터를 수집하고 분석하고 활용해야 한다. 이 데이터가 경쟁력이다. AI 기술, IoT 기술, 자율주행 기술은 누구나 쓸 수 있게 대중화·범용화된다. 하지만 그 기술을 쌓아 올린 빅데이터 그 자체는 누구나, 아무나 가질 수 없다.

항해의 진정한 발견은 새로운 땅을 찾는 데 있는 것이 아니라 새로운 눈으로 보는 데 있다. 마르셀 프루스트의 말이다.


정순인 책임연구원은…
LG전자 VS(Vehicle Component Solutions) 사업본부에서 수주 대응, 오토모티브(Automotive) SPICE 인증, 품질보증(Quality Assurance) 업무를 한다. 소프트웨어공학(SW Engineering),Technical Documentation 사내 강사로 활동하고 있으며, 사내에서 2016~2017년 연속 최우수 강사상과 2018~2019년 연속 우수 강사상을 수상했다.
강의와 프레젠테이션 기법을 다룬 책 <당신이 잊지 못할 강의>를 썼다.


[본 기사는 한경머니 제 185호(2020년 10월) 기사입니다.]