스페셜 제 1277호 (2020년 05월 18일)

[넷플릭스 ②] ‘빈지 워치’ 유도하는 추천 알고리즘

기사입력 2020.05.18 오전 10:57

[스페셜 리포트Ⅱ=  ‘슬기로운 집콕 생활의 최종 승자’ 넷플릭스의 경쟁력은 ]

-‘기업가 정신·알고리즘·오리지널 콘텐츠·스타 직원’이 성공 키워드


[편집자 주=신종 코로나바이러스 감염증(코로나19) 이후 라이프스타일을 한마디로 정의하면 ‘집콕’이다. 외출이 자유롭지 못한 상황에서 영화관을 비롯한 여러 산업이 큰 타격을 받았다. 하지만 오히려 새로운 기회를 맞이한 곳들도 있다. ‘집콕 문화’ 최대의 수혜주로 떠오른 넷플릭스다. 점점 치열해지고 있는 온라인 동영상 서비스(OTT) 시장의 확실한 승자로 두각을 나타내고 있는 넷플릭스의 경쟁력을 살펴봤다./ 한경비즈니스=이정흔 기자]


[넷플릭스 ②] ‘빈지 워치’ 유도하는 추천 알고리즘


◆ 경쟁력2 - 드라마는 몰아봐야 제맛. ‘빈지 워치’ 유도하는 추천 알고리즘

넷플릭스가 유행시킨 신조어는 또 있다. 시즌제 드라마 등을 주말이나 휴가 기간을 이용해 몰아보는 ‘빈지 워치(binge watch)’는 이미 일상 용어가 된 지 오래다. ‘빈지(binge)’는 본래 폭음·폭식을 뜻하는 단어다. 넷플릭스의 등장으로 드라마나 영화를 시청하는 소비자들의 행태가 완전히 달라진 것이다. 가파른 성장세를 기록하고 있는 넷플릭스의 가장 큰 원동력이기도 하다.

그렇다면 넷플렉스는 어떻게 우리를 ‘빈지 워치’하게 만드는 것일까. 바로 그 뒤에 자리 잡고 있는 것이 매우 정교한 콘텐츠 추천 알고리즘이다. 넷플릭스의 첫 화면은 고객마다 다르다. 철저하게 고객의 취향과 과거 시청 목록을 바탕으로 ‘개인화’돼 있기 때문이다. 헤이스팅스 CEO는 ‘개인화’를 넷플릭스의 성공 비결 중 하나로 꼽으며 “내 넷플릭스 계정은 나만을 위한 것”이라며 “그것이 아주 특별하다. 개인에게 가장 잘 맞춰져 있는 영화관을 제공하는 것과 같다”고 설명하기도 했다.

*2020년은 1분기 기준

*2020년은 1분기 기준



넷플릭스의 정교한 콘텐츠 추천 알고리즘은 역사가 깊다. 넷플릭스가 스트리밍 서비스를 출시하기 전 ‘DVD 대여’ 서비스를 중심으로 하던 때까지 거슬러 올라간다. 고객의 DVD 대여 목록을 분석해 취향에 맞는 영화와 드라마를 추천해 주는 ‘콘텐츠 추천 시스템’은 신규 고객을 유입하는 데 큰 역할을 했다. 무엇보다 넷플릭스로서도 고객의 취향을 미리 분석해 예측함으로써 콘텐츠 유통을 효율적으로 관리하고 속도를 높이는 효과를 얻을 수 있었다. 일찌감치 ‘빅 데이터 활용법’에 눈뜬 넷플릭스는 콘텐츠 추천 알고리즘을 정교화하는 데 막대한 비용을 투자하고 있다.

2006년부터 해마다 개최하고 있는 ‘넷플릭스 프라이즈(Netflix Prize)’가 이를 단적으로 보여준다. 당시 넷플릭스의 자체적인 영화 추천 시스템인 ‘시네매치’는 꽤 높은 정확도를 자랑하고 있었다.

하지만 이를 한 단계 더 도약시킬 필요가 있다고 판단했던 헤이스팅스 CEO는 파격적인 제안을 내건다. ‘시네매치’의 정확도를 10% 이상 끌어올리는 팀에 100만 달러(약 11억원)를 상금으로 주겠다고 선언한 것이다. 그 첫 대회의 승자는 ‘데이터 마이닝’ 기법을 활용해 추천 정확도를 끌어올리는 데 성공한 AT&T 연구원이 차지했다.

현재 넷플릭스에서는 이와 같은 추천 알고리즘을 담당하는 개발자만 800명이 넘는다. 넷플릭스 글로벌 고객들의 숫자가 늘어날수록 넷플릭스가 갖고 있는 데이터의 양 또한 기하급수적으로 늘어났다. 지금은 거의 모든 기업들이 빅데이터·머신러닝·인공지능(AI) 등으로 ‘추천 알고리즘’을 개발하고 있지만 넷플릭스의 고도화된 알고리즘을 쉽게 따라잡지 못하는 이유다.
넷플릭스의 콘텐츠 추천 알고리즘은 고객이 넷플릭스에 처음 계정을 만드는 순간부터 진행된다. 가장 먼저 ‘좋아하는 영화나 드라마’ 등을 물어보고 각각의 영화마다 ‘별점’을 매기게 한다.


넷플릭스의 개인화된 초기 화면.

넷플릭스의 개인화된 초기 화면.



하지만 사실 넷플릭스는 고객의 ‘말’보다 ‘행동’을 신뢰한다. 넷플릭스가 고객들에게 콘텐츠를 추천하는 데 가장 중요하게 여기는 데이터는 다름아닌 고객들의 ‘시청 패턴’이다. 주로 어떤 콘텐츠를 선택하는지, 이 콘텐츠를 끝까지 시청하는지, 중간에 시청을 멈췄다면 어느 지점에서 그만 뒀는지, 얼마나 자주 콘텐츠를 시청하는지 등등을 매우 세세하게 분석한다.

이렇게 세세하게 분석한 결과는 그룹별로 분석된다. 여기서 말하는 그룹이 사는 지역이나 비슷한 연령대를 말하는 것은 아니다. 그보다 ‘행동 패턴’이 분류의 근거가 된다. 어떤 드라마를 2~3회까지만 보고 중단했다면 비슷한 행동 패턴을 보인 사용자들이 그룹으로 묶이는 식이다. 같은 그룹 내의 고객들이 어떤 콘텐츠를 시청했는지, 이 콘텐츠는 어떤 인물들이 등장하며 어떤 스토리를 갖고 있는지 등을 분석한 결과가 콘텐츠 추천의 밑바탕이 된다. 넷플릭스는 시청 콘텐츠의 유사성은 물론 재생 중 되돌리거나 빨리 감기 한 지점까지 매우 세분화해 그룹을 만드는 것으로 알려져 있다.

모든 콘텐츠를 ‘태그화’하는 것도 넷플릭스 추천 시스템의 특징이다. 이때 콘텐츠의 태그는 단순히 ‘로맨스’나 ‘공포’ 등으로 분류되지 않는다. 콘텐츠가 만들어진 지역은 물론 장르와 영상의 분위기와 시대적 배경 등 각각의 콘텐츠마다 매우 세세한 태그가 붙는다. 어떤 고객이 ‘로맨스’를 좋아한다면 단순 로맨스 영화를 추천해 주는 것이 아니라 수많은 로맨스 영화 가운데서도 그 고객이 좋아하는 스토리나 등장인물 등을 갖춘 로맨스 영화를 추천해 줄 수 있다.


[본 기사는 한경비즈니스 제 1277호(2020.05.16 ~ 2020.05.22) 기사입니다.]


당사의 허락 없이 본 글과 사진의 무단 전재 및 재배포를 금합니다.

입력일시 : 2020-05-20 10:22