1. DATA TALK 084
영화 <마이너리티 리포트>는 프리크라임(Pre-Crime)이라는
영화 시스템이 범죄를 예지하면 특수경찰이 출동해 범법자를
미리 단죄한다는 설정이다.
우리는 미래를 예측하고 싶어 하고, 되도록 불확실성을 피하려 한다.
흥행에 관한 마찬가지로 요사이 유행처럼 회자하는‘빅데이터’
도
미래의 불확실성을 줄이려는 시도다.
다만 빅데이터가 마이너리티 리포트와 차이가 있다면
마이너리티 리포트 직관에 의한 예지가 아닌 데이터에 기반을 둔 예측이라는 사실이다.
데이터는 말한다 기했다. 이는 마케팅의 결과거나 순수한 영화에 대한 기대감일 수 있
데이터 분석으로 예측할 수 있는 것은 무궁무진하다. 이번에는 소셜 데 다. 반면 같은 기간 <7번방의 선물>의 언급 점유율은 극히 낮다. 상대적
이터 분석을 통해 흥행 영화를 예측할 수 있을지 알아보자. 으로 영화가 덜 노출됐다고 볼 수 있다. 이 양상은 <7번방의 선물> 개봉
후로 크게 변한다. 개봉한 1월 23일 이후, <7번방의 선물>의 대화 점유
100
90 율은 크게 올라갔고 역으로 <박수건달>의 존재감은 미미해졌다. 이 영
80 화에 관한 트위터 언급 점유율만 변한 것은 아니다. <그림 2>처럼 영화
70
60
관을 찾는 관객 수도 변했다. 이 장면을 어떻게 해석해야 할까?
50
40 600,000
30
500,000
20
10 400,000
0
01. 01 01. 06 01. 11 01. 16 01. 21 01. 26 01. 31 02. 05 300,000
<그림 1> 2013년 1월 개봉한 한국영화 3편의 트위터 언급 점유율 출처: 펄스K(www.pulsek.com)
200,000
<그림 1>은 2013년 1월 개봉한 한국영화 <박수건달>(1월 9일), <7번방 100,000
의 선물>(1월 23일), <베를린>(1월 30일)에 관한 트위터 언급을 점유율 0
01. 09 01. 14 01. 19 01. 24 01. 29 02. 03
로 나타낸 자료다. 세 영화에 관한 트위터 언급 점유율과 변화 양상을 <그림 2> 2013년 1월 개봉한 한국영화 3편의 관객 추이 출처: 영화관 입장권 통합전산망
자세히 살펴보자.
가장 먼저 개봉한 영화는 <박수건달>이고 늦은 영화는 <베를린>이다. 대규모 자료에서 유의미한 결과를 추출하는‘데이터 사이언티스트(Dat
사람들은 개봉하지 않은 1월 첫째 주부터 두 영화에 대해 꾸준히 이야 �는
a Scientist)’ 빅데이터를 분석할 때, 혼잡한 정보 속에서 발견되는
2. 085 201303 IM
특정한 패턴을 찾아내야 한다. 패턴을 찾아냄으로써 새로운 법칙을 발 1,000
견할 수 있기 때문이다. 800
<그림 1>에서 <7번방의 선물>이 경쟁 작품에 비해 많은 이야기를 끌어
600
내지 못하다가 극장에 걸린 뒤 많은 대화를 이끈 것에서 다른 흥행작에
서도 볼 수 있는 패턴,
‘입소문에 의한 흥행’ 찾을 수 있다. 개봉하기
을 400
전까지 트위터 타임라인에서 만나기 어려웠던 영화가 개봉 후 트위터 200
타임라인에 자주 출현한다면 올리브 잎을 물고 온 비둘기처럼 흥행의
0
길조로 받아들일 수 있다.
디
장
우
화
로
킹
이
명
맨
블
러
발
로
영
홀
랭
웨
혁
잭
리
패
장
크
봉
나
서
휴
터
셀
개
해
리
트위터 언급만으로 흥행을 예측하기 부족하다면 이번에는 더욱 고관여
러
앤
밀
레
<그림 4> 영화 <레미제라블>과 함께 가장 많이 언급한 키워드 톱10 출처: 펄스K(www.pulsek.com)
적 성격을 지닌 패턴,
‘검색’ 살펴보자.
을 ‘검색’ 소셜미디어를 이용
은
한 재잘거림과 달리 목적을 두고 행하는 행위다.
제라블>이 요새 다시 화제다. 대한민국 공군이 만든 <레미제라블> 패러
구분: PC / 기간: 2013. 01 ~ 2013. 02 / 검색어: 베를린, 7번방의선물, 박수건달
100 디 영상물‘레밀리터리블(Les Militaribles)’때문이다.
‘레밀리터리블’
━ 박수건달 ━ 7번방의선물 ━ 베를린
은 자베르 경감 역의‘러셀 크로우’ “너희, 이 비디오 봤어?”
가 라고 트
75
윗을 날리자 세계적인 명성을 얻었다.
50 <그림 4>는 2월 1일부터 8일까지 <레미제라블>과 함께 가장 많이 언급
한 키워드를 상위 10개까지 나열한 자료다.
‘패러디’
,
‘레밀리터리블’
,
25
‘러셀 크로우’ 눈에 띈다. 공군 패러디 영상
가 ‘레밀리터리블’덕분에 <
레미제라블>에 관한 트위터 언급도 영상 공개 전보다 2배 이상 늘었다.
0
08 10 12 14 16 18 20 22 24 26
이쯤에서 궁금해진다. 이러한 폭발적 반응에 힘입어 현재 일일 관람객
<그림 3> 2013년 1월 개봉한 한국영화 3편의 네이버 검색 통계 출처: 네이버 트렌드검색
이 수천 명 수준으로 떨어진 <레미제라블>이 <베를린>, <7번방의 선물>
<그림 3>은 앞서 살펴본 세 편의 영화에 관한 네이버 검색 통계를 나타 과 자웅을 겨룰 수 있을까? 그리고‘레밀리터리블’ 제2의
은 ‘강남스타
낸다. 검색 통계도 <7번방의 선물> 개봉 후부터 <박수건달>의 검색량이 일’ 돼 유튜브에서 많은 트래픽을 모을 수 있을까? <마이너리티 리포
이
현저히 떨어진다. 이는 트위터 언급 점유율과 비슷한 패턴이다. 세 편 트>에 등장하는 초능력자처럼 미래를 볼 수 있으면 모를까, 우리가 알
중 가장 늦게 개봉한 <베를린>도 개봉일이 다가올수록 검색 비중이 늘 수 없는 부분은 여전히 많다.
‘레밀리터리블’ 등장도 뜬금없고, 이를
의
고 있다. <베를린> 검색 비중이 높아질수록 <7번방의 선물> 검색은 상 ‘러셀 크로우’ 언급한 것도 예측할 수 있는 영역은 아니다.
가
승폭이 줄고 <박수건달> 검색은 곤두박질친다. 앞서 <그림 2>에서 살펴 우리에게는 영화 주인공의 초능력도, 안광이 지배를 철할 경지의 직관
본 관객 수 변화와 일치하는 것. 이처럼 검색은 행위를 통해서도 예측 도 없다. 게다가 개개인은 지극히 소수다. 이럴 때 기댈 곳은 데이터다.
할 수 있다. 이 부분에서 철학자 비트겐슈타인의‘우리는 말할 수 없는 것에 대하여
침묵해야 한다’ 말을 곱씹어 볼 만하다.
는
우리는 말할 수 없는 것에 대하여 침묵해야 한다
노진석
지난해 개봉해 역대 국내 외화 흥행 톱10에 진입한 뮤지컬 영화 <레미 소셜분석서비스 담당 매니저
코난테크놀로지에서 소셜분석서비스‘펄스K’ 마케팅 커뮤니케이션 업무를
의
담당하고 있다. 다양한 기업 및 공공 기관에 소셜 분석을 활용한 이슈 모니터
�데이터 사이언티스트(Data Scientist): 정형∙비정형 데이터를 창조적으로 분석하고 기존에 의미 없
링 및 오피니언 마이닝 관련 콘텐츠를 제공한다.
는 데이터에서 새로운 패턴과 기회를 찾아내는 분석활동을 업으로 삼고 있는 사람