[경영전략 트렌드] 구글 검색어 보면 현대차 판매량 보인다

‘돈 버는 법’ 바꿔 놓은 빅 데이터 분석…축적된 정보는 현대판 원유

2014년은 여러모로 스포츠 팬들에게는 행복한 한 해가 될 전망이다. 소치 동계 올림픽으로 시작으로 하반기에는 인천 아시안 게임, 여름에는 브라질 월드컵이 열린다.

말이 나온 김에 축구 얘기 하나 해 보자. 축구 경기에서 승패를 좌우하는 것은 무엇일까. 선수의 탁월한 개인기, 끈끈한 팀워크, 경기 흐름을 지배하는 감독의 전략과 리더십 모두 옳다. 그런데 요즘은 여기에 하나를 더한다. 바로 데이터의 힘이다.

2002년 서울 월드컵을 앞두고 한국 축구계에 미친 히딩크 감독의 영향은 지대하다. 무엇보다 그가 처음 한국 땅에 왔을 때 혼자가 아닌 한 팀이 왔던 것을 기억하는가. 그중 비디오 감독관이라는 타이틀을 가진 한 사람이 있었다. 그가 가지고 온 어마어마한 장비를 활용해 체계적인 선수 훈련 및 전략을 수립했다는 것은 유명한 사실이다. 축구가 단순히 열심히 뛰고 최선을 다하는 것만이 아니라는 것을 우리에게 알려준 것이다. 물론 예전에도 어떤 선수가 경기당 골을 몇 개 넣고 어시스트는 몇 개 했고 등의 데이터를 관리했다. 그러나 그 정도가 아니다. 바로 빅 데이터 얘기다. 2012년 7월 닛케이신문은 ‘빅 데이터가 축구 게임의 판도를 바꾸고 있다’는 기사를 실었다. 여기서 빅 데이터가 무엇인지 정의부터 살펴보자.



빅 데이터는 ‘기존의 데이터 관리·저장·분석의 역량을 훨씬 뛰어넘는 대량의 정형 또는 비정형의 데이터로부터 가치를 추출해 미래를 예측하는 기술 현상’을 일컫는다(네이버 지식사전). 즉, 우리가 상상할 수 있는 수준을 훨씬 뛰어넘는 대량의 데이터를 통해 의미 있는 결과를 예측한다는 뜻이다. 축구 얘기로 다시 돌아가면, 몇 년 전부터 이미 EPL(English Premier League)에서는 경기를 할 때 32대의 카메라가 설치돼 22명의 선수와 주심 1명, 공 1개, 즉 24개의 개체를 한시도 놓치지 않고 촬영한다. 그리고 현장에서 바로 분석해 데이터를 제공한다.


야외가 아니라 온라인 게이머 찾아간 게토레이
그래서 선수 한 명 한 명이 어떻게 움직이고 있고 어느 쪽이 비어 있고 경기 흐름이 어땠는지 실시간으로 확인할 수 있다. 이런 정보를 바탕으로 선수 관리 및 다음 경기 전략에 반영하는 것이다. 골 몇 개, 어시스트 몇 개와 같은 방식으로 관리하는 팀과 빅 데이터로 관리하는 팀이 경기할 때 어느 팀이 더 유리하겠는가. 싸움의 판도가 달라지고 있다. 그리고 이는 비단 축구만의 얘기가 아니다. 빅 데이터는 이미 우리 삶 깊숙이 들어와 있다. 사실 빅 데이터가 처음 대중에게 알려진 계기는 구글의 독감 예측 정보였다. 원리는 간단하다. 검색이 생활화된 오늘날 ‘사람들이 독감 기운이 있다면 아마 인터넷 검색을 먼저 하지 않을까’에 착안했고 검색 데이터와 실제 독감 환자 발생량의 상관관계를 분석했다.

결과는 ‘연도별 독감 유행’ 그래프에서 볼 수 있듯이 정확히 일치했다. 더 중요한 것은 이런 정보가 실시간으로 제공된다는 것이다. 물론 보건 당국도 독감 환자의 데이터를 가지고 있다. 그러나 이는 시간이 걸린다. 병원이나 약국에 환자들이 방문한 이후 얻을 수 있는 데이터이기 때문이다. 인터넷 검색 데이터는 훨씬 빠르고 정확하다. 그리고 누구나 이용할 수 있다.

미국의 스포츠 음료 게토레이는 어떤 사람들이 자사 제품에 관심을 많이 가지고 있을지 생각했다. 스포츠 음료니까 아마도 운동선수나 야외 활동을 많이 하는 사람들이지 않을까. 이를 확인하기 위해 소셜 네트워크 서비스(SNS)나 블로그 등에서 게토레이를 언급하는 사람들이 누구인지 분석했다. 결과는 정반대였다. 야외에 잘 나가지 않고 실내에서 주로 시간을 보내는 온라인 게이머들이 주인공이었던 것. 고객을 찾아 야외나 스포츠 경기장에서 주로 마케팅 활동을 벌였던 회사의 예상을 보기 좋게 뒤엎은 것이다. 이후 이들은 온라인상의 불특정 대중이 어떤 생각을 하고 어떻게 움직이는지 면밀히 분석해 전략에 활용한다.

바야흐로 2014년, 빅 데이터의 시대가 활짝 열렸다. 구글은 빅 데이터가 2014년 글로벌 기업 환경을 바꿀 것이라고 발표했다. 포브스는 올해 세계 빅 데이터 시장 규모를 17조 원이라고 예상한다. 정보기술(IT) 전체 시장보다 무려 6배나 빠르게 성장하는 추세다. 한국 미래창조부에서도 국가 사업 계획에서 빅 데이터에 올해만 406억 원을 투자하겠다고 공언했다. 이러한 새로운 트렌드에 어떻게 대응해야 할까.

시장조사 기관 가트너는 빅 데이터를 20세기 원유에 비유한다. 원유를 가진 자와 그렇지 않은 자 사이에 커다란 차이가 있는 것처럼 21세기에는 빅 데이터가 경쟁력의 원천이 될 것이라는 의미다. 그리고 또 하나. 원유가 우리 삶에 절대적인 영향을 미치지만 그렇다고 모두가 원유를 채취하는 것이 아닌 것처럼 빅 데이터도 마찬가지다. 원유를 채취하는 사람, 정제하는 사람, 활용하는 사람이 다르듯이 빅 데이터도 모으는 역할, 정제하는 역할, 활용하는 역할이 다르다. 그리고 이런 트렌드에 앞서가는 기업들이 있다.

먼저 빅 데이터를 모으는 기업은 구글·아마존·페이스북처럼 기술적 인프라를 갖춘 IT 기업들이 앞서 있다. 그 외 증권회사·신용카드회사·연금재단·이동통신사 등이 데이터를 수집하는 역할을 한다. 이들이 사람들의 관심사, 상품 정보, 주식거래 정보, 소비 패턴, 통화 내역, 기업 정보들을 대량으로 모아 전략에 활용한다. 구글은 앞으로 300년간 이 세상의 모든 정보를 모아 체계적으로 정리해 놓는 것을 아예 자신들의 비전으로 삼고 있다.

그러나 모든 기업들이 이런 IT 인프라를 갖추고 있을 필요는 없다. 누군가가 모아 놓은 데이터를 아이디어 삼아 부가가치를 높이는 역할이 있기 때문이다. 바로 캐글(Kaggle)과 같은 경우다. 캐글은 데이터를 가진 이와 데이터를 해석하는 이가 다를 것이라는 전제에서 출발했다. 이 둘을 연결만 해줘도 큰 부가가치가 생길 것이라는 것. 일례로 병원은 환자가 지불한 영수증이 수년 치 쌓여 있다. 그런데 이 환자가 다음에 언제 또 올지 궁금하다. 미리 알 수 있다면 병실 운영부터 환자의 건강관리까지 도움이 되는 것이 많기 때문이다. 지구 반대편에는 이를 수학적으로 풀어 줄 수 있는 사람들이 있다. 이들을 위해 캐글은 일종의 경연 대회를 만들었다. 영수증 데이터를 분석해 미래 환자 수를 예측하는 알고리즘을 만드는 대회다. 참가는 누구나 할 수 있고 과정은 모두에게 공개된다. 어느 팀이 예측률 50%의 방법을 알아냈다면 다른 사람이 이를 토대로 예측률 70%의 방법을 찾고 또 다른 사람이 예측률을 더 높인다. 이렇게 하다가 더 이상 예측률이 올라가지 않는다면 그것이 최선의 방식인 것이다.


다중 지능으로 데이터 분석 해결한 캐글
캐글의 경연 대회를 통해 한 보험회사의 사고 예측 정확도가 예전보다 370%나 높아지기도 했다. 앞의 병원 사례는 무려 3년간 대회가 지속됐고 1400팀이 넘는 참가자가 열띠게 경쟁했다. 상금이 300만 달러나 됐기 때문이다. 데이터와 상금은 병원이 지불하고 문제를 푸는 것은 참가자가 하는데 캐글은 무얼 할까. 중간에서 판을 벌여주고 수수료만 챙기면 된다. 빅 데이터를 직접 모으지 않아도 새로운 사업 모델을 찾은 것이다. 그래서 이런 시장은 아이디어가 관건이다. 인프라가 없어도, 자본이 없어도 성공할 수 있기 때문에 주로 벤처회사들이 빅 데이터 시장에 뛰어들기에 좋다. 그러면 이미 비즈니스를 하고 있는 일반 기업들은 어떻게 할까. 대부분의 사람들은 원유를 활용하는 사람들이지 직접 채취하거나 정제하는 사람들은 아니다. 빅 데이터도 마찬가지다. 아마도 대부분의 기업들은 이를 활용하기만 해도 충분하다. 그러면 어디에 활용해야 할까. 보통 데이터는 마케팅이나 홍보에서 많이 활용한다. 그러나 빅 데이터는 그렇지 않다. 맥킨지에 따르면 빅 데이터는 기업의 밸류 체인상 연구·개발(R&D)·공급·생산·구매·애프터서비스 등 어느 부분에서나 다 가능하다.

제품 개발부터 살펴보자. 쌍둥이 칼로 유명한 헹켈은 제품력도 좋고 브랜드도 좋은데 매출이 계속 줄어든다. 어떻게 해도 원인을 알 수 없어 수천만 명 사람들의 생각이 담긴 SNS 데이터에 눈을 돌렸다. 일반 사람들이 헹켈 칼에 대해 어떤 생각을 하고 있는지 본 것이다. 그런데 깜짝 놀랄 결과를 얻었다. 사람들은 헹켈 칼의 ‘향’에 대한 이야기를 하고 있었던 것. 칼과 향이 무슨 관련이 있다는 말인가. 이유가 어쨌든 헹켈은 빅 데이터 분석 결과를 받아들여 제품의 향을 바꿨다. 결과는 어땠을까. 매출이 다시 상승세를 타기 시작했다.


어떤 데이터도 함부로 내다 버리지 마라
어떤가. 빅 데이터가 기업의 경쟁력에 중요한 요인이라는 데 동의할 수 있겠는가. 그렇다면 우리 기업에 적용하는 방법은 무엇일까. 3가지가 있다.

첫째, 쉬운 방법부터 해 보자. 빅 데이터 시장이 발달하면서 데이터를 수집하거나 정제하는 기업들 중 이를 무료 또는 저렴한 가격에 일반에게 공개하는 곳이 많다. 구글 트렌드처럼 포털의 검색 데이터, 신용카드사의 소비 패턴 등이 대표적이다. 이런 것들을 활용하면 생각지 못했던 인사이트를 얻어낼 수 있다. 현대자동차는 구글 검색량이 자동차 매출량을 정확히 선행한다는 사실을 알았다. 마케팅 전략이나 광고 전략을 짤 때 구글의 검색 데이터는 중요 지침이 된다.

둘째, 데이터의 중요성을 인식했다면 내부의 데이터에도 눈을 돌려 보자. 데이터 하나하나로는 알 수 없던 사실을 대량으로 묶어 보면 일정한 패턴이 보인다. 건설 중장비를 취급하는 고마쓰는 장비당 가격이 비싸다 보니 주로 임대로 대여할 때가 많다. 이때 돈을 다 내지 않고 야반도주하는 문제가 발생해 도난 방지 목적으로 센서를 달았다. 그런데 센서에서 나오는 데이터가 뜻밖의 대박 아이템이었던 것. 어떤 지역에 임대한 장비들이 매일매일 바삐 움직이는 것으로 센서가 데이터를 보내고 있다. 무슨 의미일까. 그 지역 건설 경기가 활황이라는 의미다. 프로모션을 집중해야 할 단서다. 반대로 거의 움직이지 않고 있다면? 자금을 회수하거나 장비를 조기 회수해야 할지도 모른다. 도난 방지 목적의 센서 하나로 꿩 먹고 알 먹는 인사이트를 얻은 것이다.


빅 데이터 시장이 발달하면서 데이터를 수집하거나 정제하는 기업들 중 이를 무료 또는 저렴한 가격에 일반에게 공개하는 곳이 많다. 구글 트렌드처럼 포털의 검색 데이터, 신용카드사의 소비 패턴 등이 대표적이다.


셋째, 외부나 내부에도 마땅한 데이터가 없다면 지금부터 모으기 시작하면 된다. 빅 데이터를 위한 기술적 인프라가 갖춰지기 시작한 지 얼마 안 됐기 때문에 지금도 늦은 게 아니다. 단, 데이터를 모을 때 한 가지 염두에 둘 것이 있다. 기존에는 데이터의 목적을 먼저 생각하고 모으기 시작했다면 빅 데이터는 일단 모아 놓고 그다음에 용도를 생각해야 한다. 충분히 모아져야만 데이터들의 연관성이나 인사이트가 보이기 때문이다. 그래서 아마존 CEO 제프 베조스는 ‘우리는 어떤 데이터도 함부로 내다 버리지 않는다’고 공언한다.

마지막으로 필자가 겪은 이야기 하나. 어느 날 택시를 타고 가는데 택시 운전사 앞 대시보드에 깨알 같은 글씨가 잔뜩 쓰여 있는 달력을 발견했다. 하도 궁금해 무엇을 그렇게 열심히 적은 것인지 물어봤다. 택시 운전사 말씀인즉슨, 콜을 받은 내역이란다. 언제, 몇 시, 어디에서 어디로…. 그렇게 3개월을 적고 나니 분당의 모 벤처회사 앞에서 화요일 오후 3시만 되면 어김없이 콜이 들어오더라는 것이다. 필자는 무릎을 탁 칠 수밖에 없었다. 아마 대부분의 택시 운전사들은 어디에 가면 손님이 많다는 것을 알고 있을 것이다. 서울역이나 호텔이나 중심가. 그런데 서울역에서 30분을 기다려 손님을 태우고 가는 것과 이 택시 운전사처럼 남들이 알지 못하는 데이터를 가지고 있는 이의 차이가 어떨까. 빅 데이터가 싸움의 판도, 즉 돈 버는 방법을 바꾸고 있다.


조미나 IGM 세계경영연구원 상무
상단 바로가기