1. 방송통신기술 이슈&전망 2014년 제 39호
Personal 빅데이터
주요 이슈 및 기술적 대응 방안
Korea Communications Agency ❙ 2014.01.15
2. 2
방송통신기술 이슈&전망 2014년 제 39 호
개요
전세계적으로 개인의 일상을 기록하는 퍼스널 빅데이터에 대한 관심과 기대가 매
우 뜨겁다. 국내에서도 개인화된 빅데이터에 대한 활용과 지원을 두고 정부와 기업
이 초미의 관심을 두고 있으며, 여러 미래 전망기관들은 미래의 가장 핵심적 키워드
및 기술 분야로 이러한 (퍼스널) 빅데이터를 꼽고 있다. 이에 본고에서는 최근 우리
사회의 핵심키워드로 등장한 퍼스널 빅데이터와 관련 주요 이슈 및 기술적 대응방
안에 대해 살펴본다.
1. 퍼스널 빅데이터 소개와 정의
최근 ICT분야에서 가장 핫이슈를 꼽으라면 단연 빅데이터가 아닐까 한다. 빅데이
터를 처음 정의한 사람은 가트너의 더그 레이니(Doug Laney)로, 그는 빅데이터를 데
이터양(Volume), 증가속도(Velocity), 다양성(Variety)으로 정의하였다. 이후 빅데이터
에 대한 정의는 여러 가지 측면에서 이루어지는데, 이중 IDC(2011)의 기술적 정의에
따르면, 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추
출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아
키텍처를 말한다. 반면 매킨지(2011)는 일반적인 데이터베이스 SW가 저장, 관리, 분
석할 수 있는 범위를 초과하는 규모의 데이터로 정의하고 있으며, 국내 삼성경제연
구소(2010)는 빅데이터를 당초 수십-수천 테라바이트에 달하는 거대한 데이터 집합
자체만을 지칭하였으나 점차 관련 도구, 플랫폼, 분석기법까지 포괄하는 용어로 변
화하고 있는 개념으로, 방법적 정의를 하고 있다[7].
그런데 이러한 빅데이터가 최근에는 트위터와 페이스북 같은 사회관계망 서비스
(SNS)가 확산되면서 이를 통해 개인이 언제, 어디서, 누구와 만났는지, 무엇을 했는
지 쉽게 기록하고 검색할 수 있는 개인화된 빅데이터, 즉 퍼스널 빅데이터에 대한
관심이 집중되고 있다. 이러한 퍼스널 빅데이터는 기존의 공급자 중심의 데이터 수
집과 확보로부터 사용자 중심으로 진화하여 온/오프라인 상에서의 이용 데이터를 수
집, 확보한다는 측면에서 사용자를 제대로 이해하고자 하는 많은 기업들의 주목을
받고 있는 것이다. 글로벌 경영컨설팅 기업인 액센츄어는 이러한 산업 트렌드에 주
목하고 있는데, ‘Accenture Technology Vision 2012’ 보고서를 통해 빅데이터가 사
3. 3
Personal 빅데이터 주요 이슈 및 기술적 대응방안
용자 중심으로 구성됨으로써 새로운 가치를 창출할 수 있다는 내용을 강조하고 있
다. SNS의 서비스 영역이 확대되면서 사용자가 오프라인에서 보이는 행태까지도 예
측 가능한 수준까지 발전하면서 퍼스널 빅데이터의 새로운 사업 기회는 전세계적으
로 가장 가치 있는 도전으로 인식되고 있다.
<그림 1> 사용자 중심 DB가 새로운 경쟁력
※ 출처 : Accenture, Accenture Technology Vision 2012, 2012 (www.acceture.com)
2. 퍼스널 빅데이터 확보 방식 및 특징
퍼스널 빅데이터는 개인화된 빅데이터를 다양한 경로를 통해 확보한 이후에 사용
자의 성향 및 행태를 분석하는 것이 가능하다. 사용자가 인터넷을 통해 어떤 콘텐
츠, 서비스를 주로 이용하고, 시간대별 주로 활동하는 지역이 어디인지 등과 같은
개인의 일상을 자동으로 추적하고 기록하고 파악하기 때문이다. 이런 경우 어떻게
보면 자신이 모르는 사이에 개인의 사생활에 대해 상당히 많은 것을 알아챌 수 있
기 때문에 심리적인 거부감이 있을 수 있으나, 다른 관점에서 보면 사용자 스스로
알기 어려운 본인의 취향을 추가적인 노력 없이 알아서 잘 파악해주므로 편리한 점
도 꽤 많아질 것이라는 판단도 가능하다. 오늘날과 같이 인터넷이나 모바일 웹 등을
통해 이용할 수 있는 콘텐츠의 양이 폭증한 가운데, 스스로 자신의 취향에 맞는 콘
텐츠를 찾아서 이용하는 것이 쉽지 않은데, 이런 상황에서 만약 알아서 사용자의 성
향을 파악해주고 콘텐츠, 서비스를 적시에 잘 제공해 줄 수 있다면 사용자도 새로운
경험을 할 수 있고, 또한 만족도도 높아질 것이다.
4. 4
방송통신기술 이슈&전망 2014년 제 39 호
이러한 긍정적인 이유로 인해 많은 글로벌 기업들이 퍼스널 빅데이터에 집중하고
있다. 한편, 기존의 일반적인 빅데이터의 확보 방식은 공급자 측면에서 마케팅 기회
를 찾고, 영업을 강화하기 위해 공급자 중심의 데이터를 수집, 확보하는 것인데, 몰
론 이벤트 마케팅(event-triggered marketing) 등을 통해 사용자에게 유용한 정보를
전달하려는 시도도 있었지만, 그 또한 사용자 입장에서는 귀찮고 성가신 스팸 정도
로만 여겨지는 경우가 많았다[1].
그러나 이러한 방식은 최근 사용자를 제대로 이해하고 사용자 중심의 마케팅과 영
업을 통해 새로운 가치를 창출하고자 하는 많은 글로벌 기업들을 중심으로 변화하
고 있다. 즉 개인화된 빅데이터 기반 서비스(Intelligent Assistant)가 충분한 사용자
가치를 제공하기 위한 진화를 시작했으며, 이러한 퍼스널 빅데이터가 지닌 잠재력을
감안해 볼 때 수년 내로 엄청난 새로운 가치를 제공해 줄 것으로 기대되고 있다.
<표 1> 데이터 확보방식의 변화 : 공급자 중심에서 사용자 중심으로
※출처 : 이종근, 빅데이터 시대의 스마트 비서 경쟁 시작되었다, LG Business Insight, LG경제연구원, 2012.12.05.
위 <표1>에서 보는 것처럼 최근의 퍼스널 빅데이터 확보방식은 공급자 중심에서
사용자 중심으로 변화했다고 할 수 있다. 단순히 공급자가 제공하는 특정 서비스의
사용자 이용데이터를 분석하여 CRM 등의 제한적인 범위 내에서만 이용하는 방식이
과거의 확보 방식이었다면, 최근에는 공급자가 제공하는 특정 서비스나 플랫폼이 아
닌, 사용자가 다양하게 이용하는 서비스나 SNS 등에 광범위하게 분포되어 있는 모
든 데이터를 분석하여 이용자의 소비 성향을 정밀하게 분석하는 형태로 변화한 것
이다. 이러한 변화는 소셜 네트워크 서비스(SNS)와 스마트폰, 태블릿 PC 등 모바일
기기의 광범위한 보급으로 사람사이의 소통방식과 정보전달 방식의 변화가 그 기반
이 되었기 때문이라 할 수 있다.
5. 5
Personal 빅데이터 주요 이슈 및 기술적 대응방안
3. 퍼스널 빅데이터 관련 주요 이슈
실시간으로 쏟아지는 방대한 데이터를 취합, 분석하여 의미있는 결과를 도출해, 기
업의 주요 의사결정에 활용하거나 불확실한 미래를 예측하는 빅데이터 시대가 열렸
다. 그리고 세계 각국은 빅데이터 시대를 맞이하여 보건ㆍ의료, 공공부문, 유통, 마케
팅, 제조업 등 다양한 분야에서 빅데이터를 효과적으로 활용하려는 노력에 분주하다.
그러나 많은 주목과 관심을 받고 있는 빅데이터임에도 불구하고, 아직 이를 적극
적으로 활용하는 기업은 그리 많지 않은 실정인데, 이는 퍼스널 빅데이터 활용과 관
련하여 최근 큰 이슈로 부상 중인 프라이버시 침해 및 개인정보보호 등과 밀접한
관련이 있는 것이 그 중요한 이유라 할 것이다. 사실 빅데이터 분석과정에서 이용될
수 있는 개인정보는 안전하게 이용되어야 함을 전제로 하는데, 그 이유는 빅데이터
를 활용하여 다양한 분석을 하게 되면 기존에 알 수 없었던 사용자 개개인의 성향
이 분석될 수도 있고, 이러한 정보는 곧 개인정보이자 개인의 프라이버시가 될 수
있기 때문이다. 또, 이와 함께 빅데이터 활용과 관련한 법적 규제장치로 개인정보보
호법이라는 강력한 규제가 있다. 이는 개인정보 등이 유출돼 악용될 경우 심각한 사
생활 침해 문제가 발생하기 때문에 사전에 미리 보호해야 한다는 취지에서 마련된
법적 안전장치이다.
이외에도 퍼스널 빅데이터의 성장가능성 및 활용가능성을 토대로 전세계 유수 기
업 및 국가적 관심과 활용 시도에서 여러 가지로 검토가 필요한 이슈적 사안이 많
은데, 퍼스널 빅데이터 활용을 둘러싼 각종 이슈에 대해 살펴보고자 한다.
첫째, 프라이버시 문제이다. 퍼스널 빅데이터의 효용과 가치라는 긍정적 이슈들이
있는 반면, 향후 퍼스널 빅데이터의 발전과 활성화를 위해 반드시 해결하고 극복해
야 할 문제로‘프라이버시’ 문제를 들 수 있다. 우선 Google, Apple, MS, Facebook,
Twitter 등은 데이터마이닝을 통한 비즈니스모델을 가지고 있는데, 개인정보를 수집
하면서 불필요하거나 제한되어야 할 개인정보까지 수집하는 문제가 광범위하게 발
생하고 있고, 이와 함께 SNS 데이터의 소유권도 문제가 되고 있다(Gigaom, '11.03)다.
사실 데이터를 생성한 경우 일차적으로 데이터 소유권은 그 업체에게 있지만,
Facebook, Twitter 등의 SNS는 사용자들이 직접 데이터를 생성하므로 데이터 소유권
이 명확하지 않다. 현재 퍼스널 빅데이터 소유권의 추세는 소유권은 정보생성자인
개인에게 있으나 정보의 사용권과 보호권은 기업에서 제공하는 것으로 정리되고 있
다(Data Portability, '11.3).
6. 6
방송통신기술 이슈&전망 2014년 제 39 호
두 번째 이슈는 보안문제이다. 개인정보 중 80% 이상이 기업의 데이터센터에 보관
중이나 실제로 정보보호가 되는 데이터는 50%에 불과하며 보안체계가 갖추어진 정
보 또한 전체의 1/3에 불과하다(IDC, '11.5). 이처럼 개인정보 소유권 이슈가 보안문
제로 확산되면서 기업 내 데이터 통제 및 관리에 대한 경각심이 주요한 이슈로 부
각되고 있다.
세 번째는 전문인력에 관한 것으로, 퍼스널 빅데이터는 기술적 이슈임과 동시에
인력의 문제이기도 하다. 퍼스널 빅데이터를 제대로 활용하기 위해서 필요한 인력은
주로 분석전문가, 데이터 기반의 관리자와 분석가, 기술적 지원인력 등이며
(McKinsey, '11.5). 이들은 통계·인공지능 분야의 분석기술, 분석결과의 해석능력, 데
이터를 활용한 H/W·S/W 도구의 적용과 활용능력을 가진 사람들이다. 이들에 대한
주요 리서치기관들의 조사결과를 살펴보면, 2018년까지 BI종사자에 대한 산업인력은
세계적으로 60%이상 초과수요가 발생할 전망(McKinsey, '11.5)이고, 미국의 경우 분
석 전문인력 수요가 2018년까지 50~60% 증가함에 따라 14만~19만 명의 추가 인력이
필요할 것이라고 한다. 또한, 데이터 기반의 의사결정이 가능한 관리자도 150만명
이상 부족할 것으로 예측되고 있는데, 이러한 결과에 따라 퍼스널 빅데이터와 관련
된 주요 현안이슈로 인력의 문제가 제기되고 있는 것이다.
네 번째로는 제도 정비 및 산업별 대응으로, 빅데이터 관련 법규의 재정비가 필요
하다는 것이다. 특히 퍼스널 빅데이터 활용에 대한 전략적 가치를 인식하고, 필요한
법규 환경이 조성(McKinsey, '11.5)되어야 하며, 데이터로부터 가치창출이 가능한 법
률적 프레임워크도 형성되어야 한다.
다섯 번째로는 데이터 공유에 대한 인센티브 제공의 문제이다. 퍼스널 빅데이터는
의미 있는 값들을 도출하기 위한 의미 있는 데이터가 수집되어야 하는데, 이를 위해
정부차원의 기업간 정보공유 인센티브를 마련하는 등의 정책이 필요하다(McKinsey,
'11.5). 적절한 인센티브 제공을 통한 정보수집과 공유가 원활히 이루어질 수 있는
환경을 조성하는 것은 퍼스널 빅데이터 활용 확대 및 활성화를 위해 전제되어야 할
중요한 과제이자 문제라 하겠다.
마지막으로, 데이터 국가정보전략의 수립이다. 데이터는 정보를 의미하고, 수집된
정보들은 체계적이고 안전하게 관리되어야 하는데, 이를 위해서는 관련 아키텍쳐,
솔루션, 데이터 모델링 등을 충족하기 위한 기업별 전략 수립이 필요하다. 이는 산
업계는 물론이고, 정부 각 부처들도 퍼스널 빅데이터 대응정보전략 수립이 필요함을
의미한다.
7. 7
Personal 빅데이터 주요 이슈 및 기술적 대응방안
4. 퍼스널 빅데이터 이슈 해결을 위한 대응 방안
위에서 살펴본 퍼스널 빅데이터를 둘러싼 최근 이슈들을 효율적으로 해결하기 위
한 대응방안은 무엇인가. 이에 대한 해법으로 다음의 종합적인 방안을 고려할 수 있
을 것이다. 먼저 개인의 이익(프라이버시)와 공공의 이익(공익)을 위한 합리적인 균
형점을 찾는 것이 중요하다. Google, Apple, MS, Facebook, Twitter 등은 데이터 마
이닝의 과정에서 제한되어야 할 개인정보까지 수집함으로써 많은 문제를 낳고 있다.
그러므로 시장 동향, 트렌드, 잠재고객 등의 분석에서 실제 정보 소유주의 동의 없
이 정보가 활용되지 않도록 주의해야 한다.
또한 인터넷업체들은 개인이 자사의 서비스를 통해 특정 정보를 퍼블리싱하는 행위
자체가 이미 자신의 데이터가 사용될 것임을 전제하므로, 이와 관련된 정책이나 법률
적 해석이 정비되어야 할 것이다. 아울러 대학, 기업체, 정부 등 모두가 퍼스널 빅데
이터 전문가 양성에 함께 노력을 기울여야 한다. 이는 인프라, 법제도 개선 및 정보
활용문화 및 여건 조성을 통해 퍼스널 빅데이터 생태계 구축이 필요하기 때문이다.
이중에서도 퍼스널 빅데이터와 관련해 가장 첨예하고도 우려되는 프라이버시 및
개인정보보호 이슈에 대해서는 차단 및 방지, 문제해결을 위한 기술적 대응방안을
보다 면밀히 살펴볼 필요가 있다. 사실 퍼스널 빅데이터 환경에서의 프라이버시 문
제 해결 및 개인정보보호를 위해서는 빅데이터 분석 각 단계별 개인정보 침해 가능
성을 차단, 또는 보호하기 위한 기술적 조치와 대응은 반드시 필요하다 하겠다.
이에 현 수준에서 검토 가능한 개인정보보호 및 침해방지를 위한 기술적 활용방안
을 몇 가지 제시하고자 한다. 우선 데이터 수집단계에서는 개인정보가 포함된 데이
터를 수집할 경우 해당 데이터 주체로부터 동의를 받아야 함을 유념해야 한다. 따라
서 관련된 수집정보가 개인정보인지를 판별할 수 있는 기술, 데이터 수집 시 법률적
위반사항에 대한 자동화된 검토 기술, 웹 로봇 또는 웹크롤러 등과 같은 자동화된
데이터 수집시스템을 통해 자동으로 대량의 데이터를 수집하는 형태에 대한 차단
기술 등이 고려될 수 있다.
다음으로 데이터를 저장ㆍ관리하는 단계에서 필요한 관련 기술은 데이터 암호화
기술 및 접근통제 기술, 데이터 필터링 및 등급 분류 기술 등이다. 데이터 암호화
기술은 저장되는 데이터를 보호함과 동시에 DB 서버의 자료 유출로부터 데이터의
기밀성을 유지할 수 있도록 지원하는 기술이다. 접근통제 기술에는 침입탐지시스템,
침입차단시스템, VPN 등의 네트워크 기반의 기술, 데이터 접근 시 사용자 인증 및
8. 8
방송통신기술 이슈&전망 2014년 제 39 호
권한에 대한 계정관리 기술 등이 포함된다. 또한 저장되는 데이터에 따라 등급을 분
류하고 이에 따라 데이터를 관리하는 기술인 데이터 필터링 및 등급 분류 기술도
매우 필요한 기술이라 하겠다.
데이터 처리ㆍ분석단계에서 필요한 기술로는 익명화된 데이터 처리 기술 및 암호
화된 데이터 처리 기술이 있는데, 먼저 전자의 경우 PPDM과 같은 프라이버시를 보
호하며 데이터를 처리ㆍ분석하는 기술이 필요하다. 이를 위해 K-익명성, L-다양성,
차분프라이버시 등의 방법 등이 활용되고 있다. 후자의 경우에는 순서보존 암호 및
연산보존 암호 등의 기술이 많이 활용되고 있다.
그리고 취합된 데이터를 분석 후 활용단계인 데이터 분석결과 가시화 및 이용단계
에서 필요한 기술은 이용자 동의와 관련된 기술과 분석정보의 이용 모니터링 기술
로 구분될 수 있다. 먼저 전자의 경우 퍼스널 빅데이터 분석을 통해 도출될 영역을
미리 예측하는 기술 등이 필요한데, 이는 서비스 이용자가 수집된 데이터의 개인정
보보호를 위해 제공받는 서비스가 제한적일 수 있음에 따른 것이다. 후자의 기술은
해당 정보가 안전하게 사용되는지 확인 가능하여 개인정보 침해를 사전에 예방할
수 있다는 측면에서 유용하면서 필요한 기술이라 하겠다.
마지막으로 데이터 폐기단계에서는 데이터 폐기 모니터링 기술과 분산 환경에서
완전한 데이터 폐기 기술을 들 수 있다. 사실 수집된 데이터는 이용목적을 달성하면
바로 폐기되어야 한다. 전자는 이를 위한 필요 기술로, 이 기술은 정보의 잠재적인
유출 위험을 사전 방지하고 관련된 법안 위반의 가능성도 미연에 방지하는 기능을
한다. 또한 빅데이터 환경에서 저장되는 데이터는 여러 곳에 분산되어 저장될 수 있
고, 이렇게 저장된 데이터도 여러 곳에 복제되어 저장될 수도 있다. 따라서 완벽한
데이터 폐기를 위한 기술은 일반적인 삭제 명령 등을 통한 기존의 데이터 폐기방법
의 보완책으로 활용할 수 있다.
5. 시사점 및 결론
정보통신기술의 발달과 함께 가속화된 디지털 혁신으로 인해 현대 사회는 무수히
많은 데이터가 실시간으로 발생하고 또 이를 분석하여 다양하게 활용하고 있다. 특
히 스마트기기 및 소셜미디어 등으로 대표되는 다양한 정보채널의 등장과 이로 인
한 정보의 생산, 유통, 보유량의 증가는 데이터의 기하급수적인 증가세를 이끌고 있
9. 9
Personal 빅데이터 주요 이슈 및 기술적 대응방안
으며, 그리고 그 중심에 퍼스널 빅데이터가 있다. 퍼스널 빅데이터 서비스는 개개인
의 상세 정보를 모아서 제공하는 서비스이다 보니 사생활 보호 관점에서 사용자들
의 거부감이 생길 수 밖에 없다. 실제로 퍼스널 빅데이터 서비스를 이용해 본 사람
들의 반응은 ‘신기하다’도 있지만, 대체로 ‘무섭다’는 반응도 의외로 많다. 결
국 퍼스널 빅데이터 서비스가 생활 깊숙이 침투하여 활용될수록 개인정보보호에 대
한 이슈는 부각될 수밖에 없다.
그러나 모든 혁신에는 양면성이 있기 마련이며, 퍼스널 빅데이터의 경우에도 개인
정보보호라는 암초가 있기는 하지만, 그럼에도 불구하고 많은 사용자들이 충분한 가
치를 느낄 수 있다면 지금보다 더 편리하고 스마트한 삶이 가능해질 것이다.
퍼스널 빅데이터는 이제 단순한 IT 트렌드를 넘어 우리 경제, 사회 현안 해결의
실마리로 주목받고 있으며 그야말로 빅데이터 시대가 개막되었음을 예고하고 있다.
이러한 시대적 변화와 함께 새로운 정보와 지식이 만들어내는 미래의 중요한 가치
창출전략으로서의 퍼스널 빅데이터가 우리 사회와 경제에서 성공적으로 기능하고
추진될 수 있도록 지금은 정부, 민간, 학교 등의 모든 경제주체의 관심과 노력이 필
요한 때이다.
10. 10
방송통신기술 이슈&전망 2014년 제 39 호
[참고문헌]
[1] 이종근, 빅데이터 시대의 스마트 비서 경쟁 시작되었다, LG Business Insight, LG경제연구
원, 2012.12.05.
[2] Accenture, Accenture Technology Vision 2012, 2012
[3] IDC & EMC, Digital Universe Study 2011, 2011.06
[4] 심우민, 빅데이터의 활용과 개인정보 보호, 이슈와 논점, 국회입법조사처, 2013. 10. 11
[5] 범지인, 최성종, 빅데이터(Big Data) 활용사례와 시사점, 농협경제연구소, 2013.08.28.
[6] 빅데이터 분석과 주요 업체 활용사례, http://prworld.blog.me/20201072724, 2013.12.12.
[7] 이재식, 빅데이터 환경에서 개인정보보호를 위한 기술, Internet & Security Focus, 2013.03
11. 발 행 호❙2014년 제 39 호
발간물명❙퍼스널 빅데이터 주요 이슈 및 기술적 대응방안
방송통신기술 시장・정책 콘텐츠