SlideShare a Scribd company logo
1 of 6
1
이중 데이터 전략
소프트라인 R&D 센터 이호성
2017 년 5,6 월호 Harvard Business Review 에 기고된 ‘What is your data strategy?’ 의 내용을 요약
정리함. 누구나머릿속으로는막연하게 개념은가지고있었던부분을 명료하게정의해놓은 훌륭한
자료라고 판단됨.
저자 : Leandro Dalle Mule (Chief Data Officer at AIG), Tom Davenport (Professor at Bobson
College)
빅데이터가트렌드를 넘어 현실이 되며 쏟아지는 데이터 관련 기술들에 더해 machine learning, AI
등등 엄청난 변화가 숨가쁘게벌어지고 있음. 이러한 변화에 적응하고자많은 기업들이 데이터와
관련한 전략을 수립 / 추진하는 CDO (Chief Data Officer) 포지션을만들고 있음. 이들이 데이터
전략을 수립할 시 참고할 수 있을만한 프레임워크를 아래와 같이 제언함.
참고문서
• Harvard Business Review (May-June 2017) ‘What is your data strategy?’
• 기타 웹 서치
Background
• 데이터의 종류와 양의 폭증.
• 그럼에도 불구하고, 산업 전반에 걸친 연구결과에 따르면…
• 기업의 정형 데이터 중 50% 이하, 비정형데이터 중 1% 미만이 의사결정을 위한
분석과정을거치고 있음
• 70% 이상의 임직원이접근해서는 안될 데이터에 엑세스할 수 있었으며,
• 데이터 애널리스트들은 80% 이상의 시간을 단순 검색 내지는데이터 전처리에활용함.
• 이러한 상황으로 인해
• 데이터 유출은 이제 늘상 발생하는 일과처럼 되었으며,
• 잘못된 데이터가 전체 데이터저장공간으로 광범위하게 퍼져 나가며,
• 기업의 데이터 처리 기술이 비즈니스요건을 충족시키지 못하는 경우가 흔하게발생함.
• 기업들의 대응
• CDO (Chief Data Officer) 휘하 데이터 관리 조직 구성
• 하지만, 조직 상의 변화만으로는 부족함.
• 필요한 것은 조직 내 정보자산을 구성, 통제, 분석, 활용할 수 있는 유기적인 전략.
Data Strategy
• 이어질 내용은 바로 이러한 유기적인전략을 수립하는데에 활용할 수 있는 새로운
프레임워크.
• 공저자인 Dalle Mule 이 CDO 로 재직하고있는 AIG 에서의 실제 사례와 더불어 그 외 6 개
기업에서도적용한 결과를 통해 구상함.
• AI, 머신러닝 등 화려한 데이터 활용이 가능하려면, 기업 내 데이터가다양한가능성을 실현해
낼 수 있으려면, 활용에앞서 데이터에 대한 관리전략이 우선 정립되어야함.
2
Data vs Information
• Data : 수집하고 정제한 원천 데이터.
• Information : 원천 데이터에 목적성을 부여해 의미를 부여한 결과.
• Peter Drucker “Information 은 목적과 연계성이 부연된 데이터”
• 따라서, data architecture 와 information architecture 는 다르게 보아야 함.
• Data architecture
• 데이터의 수집, 저장, 변환, 배분, 소비가 어떻게 이루어져야하는가를 정의
• 기업 내 모든 DB, 파일 시스템 등의 기본적인 구성을 고려해야 함
• 즉, data strategy 의 defense 측면과 깊은 관련이있으며,
• 동시에 Single Source of Truth (SSOT) 를 지향함.
• Information architecture
• 데이터를 어떻게 information 으로 전환하는가에 관한 절차와 규칙을 정의
• 수집 / 정제된 데이터의활용방안을 고려해야 함
• 즉, data strategy 의 offense 측면과 깊은 관련이있으며,
• 동시에 Multiple Versions of Truth (MVOT) 를 지향함.
SSOT vs MVOT
• 대부분의 기업들이 기업 전반을 관장하는 데이터 구조를 정립하고자하는 노력은 하고있음.
• Master Data Management (MDM) 프로젝트가 대표적인 예시.
• 하지만, MDM 으로 대표되는접근방식은 top-down 형식으로 일괄적인 데이터의 정합성 및
체계를 강조하는 전형적인 SSOT 에 방점을 둔 방식임.
• 대부분의 기업들도 SSOT 의 개념은쉽게 받아들이고있지만, MVOT 에 대해서는 아직
이해도가 부족한 것으로 판단됨.
• SSOT 를 지나치게 강조하면data 에 대한 control 은 강해지지만 일괄적인 규칙이 지나치게
강조되면 flexibility 가 떨어져 MVOT 가 약해짐.
• Data Defense Strategy = Data = Control = Single Source of Truth (SSOT)
• Data Offense Strategy = Information = Flexibility = Multiple Versions of Truth (MVOT)
• 결국, 앞서 강조한 것처럼 SSOT 와 MVOT 의 균형, 즉, 내게 맞는 data strategy 의 defense 와
offense 의 균형을 찾는 것이 모든 기업의 제 1 과제가 되어야 함.
SSOT (Single Source of Truth)
• SSOT 는 모든 핵심적인 데이터에 대한 권위를가진 유일무이한카피본을 의미함.
• 요건
3
• 데이터를 활용한 모든 비즈니스 활동이 의지할수 있도록 건실한 데이터의 정합성과
통제성 보장,
• 동일한 language 를 사용해야 관련된모든 function 들이 동일한 interface 를 통해
데이터에 접근하고 활용할 수 있음.
• 필요성
• SSOT 가 보장되지 않는다면…
• 데이터의 정제가 이루어지지않아 신뢰도가 떨어지고,
• 접근제어 및 보안이 약해져 데이터 유출 사고 가능성이높아지며,
• 복수의 서로 다른 원천 데이터로 인해 혼선이 야기됨.
MVOT (Multiple Versionsof Truth)
• MVOT 는 비즈니스 요건에 따라 원천 데이터로부터 (SSOT 로부터) 다양하게 추출한 정보.
• 요건
• 비즈니스 요건과의 관련성, 목적성에부합하도록 데이터를 유연하게추출, 변형해야 함.
• SSOT 의 데이터 정합성을 유지할 수 있어야 하며, MVOT 에서 최종 SSOT 로의변경내역
추적이 가능해야 함
• 필요성
• SSOT 데이터를 그대로 사용한다면현업 부서의 목적에 맞는 데이터를 추출하기 어려움
• 예) 같은 매출 데이터라도 마케팅 부서에서 보는 관점과재무팀에서 보는 관점은다름.
따라서 각자의 관점과 상황에 맞는 버전의데이터는 그 내용에 차이가 있더라도 모두
사실이라고 볼 수 있음.
• SSOT 와 MVOT 간의 데이터 무결성, 정합성 문제를해결할수 있는 자동 동기화 도구가
필요함
• 그러나, 필요한대로 데이터를마음대로 변형한다면 SSOT 와의간극이멀어지고,
결국에는 연계성을 잃어버릴수 있음. 따라서, 일정하게 통제된 규칙에 의거해 변형이
이루어져야함.
Defense vs Offense
• 제언하고자하는 프레임워크는 크게 defense 와 offense 로 구분.
• 본 프레임워크의 핵심은 defense 와 offense 의 밸런스를 조정하는 것.
• Defense
4
• 데이터 정합성, 관련 규제 준수, 데이터 접근제어및 보안, 실제 활용을위한 전처리 등
데이터 활용을 위한 제반 활동
• 데이터의 실제 활용을위한 기본 요건을 만족시키기 위한 일련의 활동을지칭하며, 기본이
되는 데이터를 Single Source of Truth 관점에서 관리하는 것이 중요.
• 주요 관점 : 데이터에 대한 control
• 예시 : Master Data Management, Data security, Pre-processing (전처리), Compliance,
Data Warehouse, Data Lake
• Offense
• 매출증대, 고객만족 제고, 원가절감 등 데이터를활용해 실질적인비즈니스 가치를
뽑아내기 위한 제반 활동
• 원천 데이터를 응용해데이터분석, 모델링, visualization, 여기에서 더 나아가 모델링을
통한 머신러닝까지 데이터의활용성을 강조 (Multiple Versions of the Truth)
• 주요 관점 : 데이터에 대한 flexibility
• 예시 : Machine learning, AI, Self-service BI, Voice of Customer, Regular reporting,
Marketing, Data Mart
• 각 조직의 성격, 업계의성격에 따라 본질적인 defense 와 offense 의 비중이 다름.
예를 들어, 금융업계에서는 관련 규제 준수 요건이 타 업계 대비 강하므로, 본질적으로
defense 에 더 많은 비중이갈 수 있음.
• Offense 가 강화된다면 (= flexibility 가 강화된다면) 개별적인 비즈니스요건에맞도록
데이터를 변형하고 해석할 수 있는 역량이 강화되는 것이고,
• Defense 가 강화된다면 (= control 이 강화된다면) 규제준수, 데이터 접근통제역량이강화됨.
Defense 와 Offense 의 균형
• 개념적으로양자간의 균형을이루는것은 쉽게 이해할수 있음
• 하지만, 실제로이 균형을 이루기 위해서는 데이터 통제와 기준, 그리고 관련된 기술력이
뒷받침 되어야 함.
5
• 일반적으로CDO (Chief Data Officer) 와 CTO (Chief Technology Officer) 가 기업의 데이터
거버넌스를진두지휘 하에 각 부서의책임자들이 참여하는 방식으로진행됨.
• 핵심은….
• Defense = Control : SSOT 는 정확하고 유일한 데이터 원천으로 유지
• Offense = Flexibility : MVOT 는 주의깊게통제된 방식을 통해 SSOT 의데이터활용
• 양자간의 균형을 50/50 으로 나누는 것이 답이 아님.
• 각 기업 / 조직이 처한 상황에 따라 defense / offense 균형점은 달라짐.
• CDO / CTO 는 이 균형점을찾는 것에 가장 집중해야함
• 고려해야 할 부분
• 기업 전체의 전략
• 업계 전반에 대한 정부규제의강도
• 경쟁사의 데이터 관련 처리 능력
• 기업 내 데이터관리 성숙도
• 데이터 관리를 위해 할당된 예산 등등
• 예시
• 금융 보험업계는 관련 정부규제가 매우 심하므로 일반적으로defense 에 더 중점을둠.
• 소매업계의경우 관련 정부규제가 상대적으로 낮고, 고객 데이터 분석, 상권분석등
다양한
데이터 분석에 기반한경쟁이훨씬 심하므로 일반적으로 offense 에 더 중점을 둠.
• 한 헤지펀드 사의 사례
• 가장 중요한 데이터는실시간으로 수집된 공개 혹은 상용 외부 데이터이며 이
데이터들은이미 고품질의 정제된 정형 데이터임.
• 또한, 보험/은행에 비해 규제도 훨씬 약한 편.
• 따라서, 아 회사는 offense 에 훨씬 높은 비중을 두고 있음.
• 데이터 거버넌스의 수준이 올라가면서 전략의 방향을defense —> offense 로 조정하는 것은
일반적으로관찰되는 현상. 반대로 offense —> defense 로의 전환은 상대적으로 빈도가 낮고
또한 더욱 어려운 일.
Data
strategy 평가
• Defense / offense 의 균형점을 찾기 위해 아래 질문에 기반해 1 차적인 판단을 할 수 있음.
• 평가툴 URL
https://assessments.hbr.org/simulate/hbr/assessment/simulation/?X_ref=https://hbr.org/2017/
05/whats-your-data-strategy&X_id=75d0d2dd-1005-11e7-80b4-063e6ef7c69d#/1
6
• 질문지 내용 번역 (질문 순서대로)….
• 아래 중 최대 8 개를 고르시오
• 부서 간 교차매출, 가격정책, 고객층 증대를 통해 전체 매출 확대를도모하는가?
• 내외부의 새로운 데이터 소스를 활용하고자 하는가?
• 새로운 제품 혹은 서비스를 만들어내고자 하는가?
• IT 인프라 개선 혹은 데이터 관련 소요 원가감소 (DB 수 감소 등) 를 지향하는가?
• 데이터 훼손, 사기 등 운영상의 리스크를감소시키고자하는가?
• 외부 공격으로 인한 데이터 유출을 방지하고자하는가?
• 데이터 품질을 향상시키고자하는가?
• 기존 데이터 분석가, 데이터 사이언티스트들을위한 최적화를기획하고 있는가?
• 복수의 원천 데이터로부터 데이터와정보가 생성되는환경을합리적으로 변형하려
하는가?
• 현업을 위해 고도의 실시간 혹은 준실시간 데이터 분석을 활용하고자 하는가?
• 기업 내 데이터가 가진 가치로부터 수익을 창출하고자하거나, 내부 데이터를 상품
혹은
서비스화 하고자 하는가?
• 빅데이터와데이터 분석 인프라로부터 ROI를 창출하고자 하는가?
• 일반적인 운영비용 감축과 비즈니스프로세스 효율화를 도모하는가?
• 시장의 변화와 경쟁환경에 빠르게 반응하고자 하는가?
• 업계의 규제를 준수하고자 하는가?
결론
• 데이터의 양, 종류가 다양해지며 데이터에 대한 가치가급상승 중.
• 데이터 관리와 활용의기반이되는 전략을 수립하는 것은 기업의 핵심 경쟁력이되었음.
• 전략 수립의 기반이 되는 사상을 크게 defense, offense 로 구분하였음.
• Defense & Offense
• Defense = Control : SSOT (Single Source of Truth)는 정확하고 유일한 데이터
원천으로 유지
• Offense = Flexibility : MVOT (Multiple Versions of Truth) 는 주의깊게 통제된 방식을
통해 SSOT 의 데이터 활용
• 각자의 상황에 맞는 Defense 와 Offense 의 균형점을 찾는 것이 data strategy 의 핵심.
(균형점을 찾기 위한 출발점으로서 평가 툴을 제안하였음)
• 새로운 기술의 등장으로 defense / offense 를 보다 효율적으로 수행할수 있도록 되었음.
• Machine learning 역시 새롭게각광받는 기술 중 하나. 많은 기업들이 이미 machine learning
을 defense 와 offense 에 모두 활용하고 있음.

More Related Content

What's hot

Using the CC BY license, Workshop for 2013 OPEN Kick-off
Using the CC BY license, Workshop for 2013 OPEN Kick-offUsing the CC BY license, Workshop for 2013 OPEN Kick-off
Using the CC BY license, Workshop for 2013 OPEN Kick-offJane Park
 
Go Viral on the Social Web: The Definitive How-To guide!
Go Viral on the Social Web: The Definitive How-To guide!Go Viral on the Social Web: The Definitive How-To guide!
Go Viral on the Social Web: The Definitive How-To guide!XPLAIN
 
Manual de-crescimento-peniano-
Manual de-crescimento-peniano-Manual de-crescimento-peniano-
Manual de-crescimento-peniano-Antonio Gonçalves
 
An Easy Step-By-Step Guide On How To Satisfy A Man Sexually
An Easy Step-By-Step Guide On How To Satisfy A Man SexuallyAn Easy Step-By-Step Guide On How To Satisfy A Man Sexually
An Easy Step-By-Step Guide On How To Satisfy A Man Sexuallyleadingedgehealth
 
4 Cute Ways to Ask a Girl Out Over Text
4 Cute Ways to Ask a Girl Out Over Text4 Cute Ways to Ask a Girl Out Over Text
4 Cute Ways to Ask a Girl Out Over TextFrankie Cola
 
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...LibrosMotivacionales
 
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022Adrien Russo
 
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...Frankie Cola
 

What's hot (8)

Using the CC BY license, Workshop for 2013 OPEN Kick-off
Using the CC BY license, Workshop for 2013 OPEN Kick-offUsing the CC BY license, Workshop for 2013 OPEN Kick-off
Using the CC BY license, Workshop for 2013 OPEN Kick-off
 
Go Viral on the Social Web: The Definitive How-To guide!
Go Viral on the Social Web: The Definitive How-To guide!Go Viral on the Social Web: The Definitive How-To guide!
Go Viral on the Social Web: The Definitive How-To guide!
 
Manual de-crescimento-peniano-
Manual de-crescimento-peniano-Manual de-crescimento-peniano-
Manual de-crescimento-peniano-
 
An Easy Step-By-Step Guide On How To Satisfy A Man Sexually
An Easy Step-By-Step Guide On How To Satisfy A Man SexuallyAn Easy Step-By-Step Guide On How To Satisfy A Man Sexually
An Easy Step-By-Step Guide On How To Satisfy A Man Sexually
 
4 Cute Ways to Ask a Girl Out Over Text
4 Cute Ways to Ask a Girl Out Over Text4 Cute Ways to Ask a Girl Out Over Text
4 Cute Ways to Ask a Girl Out Over Text
 
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...
El Mejor Libro sobre Intimidad Femenina - El Placer de Ser Tu Misma Fernando ...
 
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022
Maitriser le SEO d'un site JavaScript - SEO Campus Paris 2022
 
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...
How to Know if a Girl Likes You - 5 Signs a Girl Likes You vs. 5 Signs You're...
 

Similar to 이중 데이터 전략 (Two-track data strategy)

전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수Devgear
 
Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용오라클 클라우드
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드kosena
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studiesDLAB
 
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...Amazon Web Services Korea
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요Hosung Lee
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례Amazon Web Services Korea
 
데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득Pikdata Inc.
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기Amazon Web Services Korea
 
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼ABRC_DATA
 
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...A Modern Data Integration Approach to Transform and Amplify Your Business (데이...
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...Denodo
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)Treasure Data, Inc.
 
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for DataSejeong Kim 김세정
 
마스터 데이터 도메인을 위한 데이터 모델링 마스터
마스터 데이터 도메인을 위한 데이터 모델링 마스터마스터 데이터 도메인을 위한 데이터 모델링 마스터
마스터 데이터 도메인을 위한 데이터 모델링 마스터Devgear
 
DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다eungjin cho
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가r-kor
 
How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesDataya Nolja
 
Software defined storage solution 소개자료
Software defined storage solution 소개자료Software defined storage solution 소개자료
Software defined storage solution 소개자료Jaewon Lee
 
Software defined storage solution 소개자료
Software defined storage solution 소개자료Software defined storage solution 소개자료
Software defined storage solution 소개자료Jaewon Lee
 

Similar to 이중 데이터 전략 (Two-track data strategy) (20)

전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수전사 데이터 관리 반드시 피해야 할 7가지 실수
전사 데이터 관리 반드시 피해야 할 7가지 실수
 
Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용Big data preparation cs를 이용한 비정형데이터 활용
Big data preparation cs를 이용한 비정형데이터 활용
 
[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드[코세나, kosena] 빅데이터 구축 및 제안 가이드
[코세나, kosena] 빅데이터 구축 및 제안 가이드
 
DLAB company info and big data case studies
DLAB company info and big data case studiesDLAB company info and big data case studies
DLAB company info and big data case studies
 
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
[Bespin Global 파트너 세션] 분산 데이터 통합 (Data Lake) 기반의 데이터 분석 환경 구축 사례 - 베스핀 글로벌 장익...
 
2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요2017 주요 기술 흐름 및 개요
2017 주요 기술 흐름 및 개요
 
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
[Partner TechForum] 고객을 360도로 이해하고 수익으로 연결하는 글로벌 선도 금융 기업들의 데이터 플랫폼 활용 사례
 
데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득데이터 블렌딩으로 더빠른 Insight 획득
데이터 블렌딩으로 더빠른 Insight 획득
 
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
AWS Finance Symposum_AWS 로 빅데이터 분석을 쉽고 간단하게 시작하기
 
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
빅데이터 윈윈 컨퍼런스-4차 산업혁명 핵심:데이터 가공 플랫폼
 
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...A Modern Data Integration Approach to Transform and Amplify Your Business (데이...
A Modern Data Integration Approach to Transform and Amplify Your Business (데이...
 
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
 
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
[한국IBM] Data&AI 통합 플랫폼, Cloud Pak for Data
 
마스터 데이터 도메인을 위한 데이터 모델링 마스터
마스터 데이터 도메인을 위한 데이터 모델링 마스터마스터 데이터 도메인을 위한 데이터 모델링 마스터
마스터 데이터 도메인을 위한 데이터 모델링 마스터
 
DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003DLAB Big Data Issue Report 003
DLAB Big Data Issue Report 003
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다
 
지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가지능정보시대를 위한 빅데이터, 이대로 좋은가
지능정보시대를 위한 빅데이터, 이대로 좋은가
 
How to Make Money from Data - Global Cases
How to Make Money from Data - Global CasesHow to Make Money from Data - Global Cases
How to Make Money from Data - Global Cases
 
Software defined storage solution 소개자료
Software defined storage solution 소개자료Software defined storage solution 소개자료
Software defined storage solution 소개자료
 
Software defined storage solution 소개자료
Software defined storage solution 소개자료Software defined storage solution 소개자료
Software defined storage solution 소개자료
 

이중 데이터 전략 (Two-track data strategy)

  • 1. 1 이중 데이터 전략 소프트라인 R&D 센터 이호성 2017 년 5,6 월호 Harvard Business Review 에 기고된 ‘What is your data strategy?’ 의 내용을 요약 정리함. 누구나머릿속으로는막연하게 개념은가지고있었던부분을 명료하게정의해놓은 훌륭한 자료라고 판단됨. 저자 : Leandro Dalle Mule (Chief Data Officer at AIG), Tom Davenport (Professor at Bobson College) 빅데이터가트렌드를 넘어 현실이 되며 쏟아지는 데이터 관련 기술들에 더해 machine learning, AI 등등 엄청난 변화가 숨가쁘게벌어지고 있음. 이러한 변화에 적응하고자많은 기업들이 데이터와 관련한 전략을 수립 / 추진하는 CDO (Chief Data Officer) 포지션을만들고 있음. 이들이 데이터 전략을 수립할 시 참고할 수 있을만한 프레임워크를 아래와 같이 제언함. 참고문서 • Harvard Business Review (May-June 2017) ‘What is your data strategy?’ • 기타 웹 서치 Background • 데이터의 종류와 양의 폭증. • 그럼에도 불구하고, 산업 전반에 걸친 연구결과에 따르면… • 기업의 정형 데이터 중 50% 이하, 비정형데이터 중 1% 미만이 의사결정을 위한 분석과정을거치고 있음 • 70% 이상의 임직원이접근해서는 안될 데이터에 엑세스할 수 있었으며, • 데이터 애널리스트들은 80% 이상의 시간을 단순 검색 내지는데이터 전처리에활용함. • 이러한 상황으로 인해 • 데이터 유출은 이제 늘상 발생하는 일과처럼 되었으며, • 잘못된 데이터가 전체 데이터저장공간으로 광범위하게 퍼져 나가며, • 기업의 데이터 처리 기술이 비즈니스요건을 충족시키지 못하는 경우가 흔하게발생함. • 기업들의 대응 • CDO (Chief Data Officer) 휘하 데이터 관리 조직 구성 • 하지만, 조직 상의 변화만으로는 부족함. • 필요한 것은 조직 내 정보자산을 구성, 통제, 분석, 활용할 수 있는 유기적인 전략. Data Strategy • 이어질 내용은 바로 이러한 유기적인전략을 수립하는데에 활용할 수 있는 새로운 프레임워크. • 공저자인 Dalle Mule 이 CDO 로 재직하고있는 AIG 에서의 실제 사례와 더불어 그 외 6 개 기업에서도적용한 결과를 통해 구상함. • AI, 머신러닝 등 화려한 데이터 활용이 가능하려면, 기업 내 데이터가다양한가능성을 실현해 낼 수 있으려면, 활용에앞서 데이터에 대한 관리전략이 우선 정립되어야함.
  • 2. 2 Data vs Information • Data : 수집하고 정제한 원천 데이터. • Information : 원천 데이터에 목적성을 부여해 의미를 부여한 결과. • Peter Drucker “Information 은 목적과 연계성이 부연된 데이터” • 따라서, data architecture 와 information architecture 는 다르게 보아야 함. • Data architecture • 데이터의 수집, 저장, 변환, 배분, 소비가 어떻게 이루어져야하는가를 정의 • 기업 내 모든 DB, 파일 시스템 등의 기본적인 구성을 고려해야 함 • 즉, data strategy 의 defense 측면과 깊은 관련이있으며, • 동시에 Single Source of Truth (SSOT) 를 지향함. • Information architecture • 데이터를 어떻게 information 으로 전환하는가에 관한 절차와 규칙을 정의 • 수집 / 정제된 데이터의활용방안을 고려해야 함 • 즉, data strategy 의 offense 측면과 깊은 관련이있으며, • 동시에 Multiple Versions of Truth (MVOT) 를 지향함. SSOT vs MVOT • 대부분의 기업들이 기업 전반을 관장하는 데이터 구조를 정립하고자하는 노력은 하고있음. • Master Data Management (MDM) 프로젝트가 대표적인 예시. • 하지만, MDM 으로 대표되는접근방식은 top-down 형식으로 일괄적인 데이터의 정합성 및 체계를 강조하는 전형적인 SSOT 에 방점을 둔 방식임. • 대부분의 기업들도 SSOT 의 개념은쉽게 받아들이고있지만, MVOT 에 대해서는 아직 이해도가 부족한 것으로 판단됨. • SSOT 를 지나치게 강조하면data 에 대한 control 은 강해지지만 일괄적인 규칙이 지나치게 강조되면 flexibility 가 떨어져 MVOT 가 약해짐. • Data Defense Strategy = Data = Control = Single Source of Truth (SSOT) • Data Offense Strategy = Information = Flexibility = Multiple Versions of Truth (MVOT) • 결국, 앞서 강조한 것처럼 SSOT 와 MVOT 의 균형, 즉, 내게 맞는 data strategy 의 defense 와 offense 의 균형을 찾는 것이 모든 기업의 제 1 과제가 되어야 함. SSOT (Single Source of Truth) • SSOT 는 모든 핵심적인 데이터에 대한 권위를가진 유일무이한카피본을 의미함. • 요건
  • 3. 3 • 데이터를 활용한 모든 비즈니스 활동이 의지할수 있도록 건실한 데이터의 정합성과 통제성 보장, • 동일한 language 를 사용해야 관련된모든 function 들이 동일한 interface 를 통해 데이터에 접근하고 활용할 수 있음. • 필요성 • SSOT 가 보장되지 않는다면… • 데이터의 정제가 이루어지지않아 신뢰도가 떨어지고, • 접근제어 및 보안이 약해져 데이터 유출 사고 가능성이높아지며, • 복수의 서로 다른 원천 데이터로 인해 혼선이 야기됨. MVOT (Multiple Versionsof Truth) • MVOT 는 비즈니스 요건에 따라 원천 데이터로부터 (SSOT 로부터) 다양하게 추출한 정보. • 요건 • 비즈니스 요건과의 관련성, 목적성에부합하도록 데이터를 유연하게추출, 변형해야 함. • SSOT 의 데이터 정합성을 유지할 수 있어야 하며, MVOT 에서 최종 SSOT 로의변경내역 추적이 가능해야 함 • 필요성 • SSOT 데이터를 그대로 사용한다면현업 부서의 목적에 맞는 데이터를 추출하기 어려움 • 예) 같은 매출 데이터라도 마케팅 부서에서 보는 관점과재무팀에서 보는 관점은다름. 따라서 각자의 관점과 상황에 맞는 버전의데이터는 그 내용에 차이가 있더라도 모두 사실이라고 볼 수 있음. • SSOT 와 MVOT 간의 데이터 무결성, 정합성 문제를해결할수 있는 자동 동기화 도구가 필요함 • 그러나, 필요한대로 데이터를마음대로 변형한다면 SSOT 와의간극이멀어지고, 결국에는 연계성을 잃어버릴수 있음. 따라서, 일정하게 통제된 규칙에 의거해 변형이 이루어져야함. Defense vs Offense • 제언하고자하는 프레임워크는 크게 defense 와 offense 로 구분. • 본 프레임워크의 핵심은 defense 와 offense 의 밸런스를 조정하는 것. • Defense
  • 4. 4 • 데이터 정합성, 관련 규제 준수, 데이터 접근제어및 보안, 실제 활용을위한 전처리 등 데이터 활용을 위한 제반 활동 • 데이터의 실제 활용을위한 기본 요건을 만족시키기 위한 일련의 활동을지칭하며, 기본이 되는 데이터를 Single Source of Truth 관점에서 관리하는 것이 중요. • 주요 관점 : 데이터에 대한 control • 예시 : Master Data Management, Data security, Pre-processing (전처리), Compliance, Data Warehouse, Data Lake • Offense • 매출증대, 고객만족 제고, 원가절감 등 데이터를활용해 실질적인비즈니스 가치를 뽑아내기 위한 제반 활동 • 원천 데이터를 응용해데이터분석, 모델링, visualization, 여기에서 더 나아가 모델링을 통한 머신러닝까지 데이터의활용성을 강조 (Multiple Versions of the Truth) • 주요 관점 : 데이터에 대한 flexibility • 예시 : Machine learning, AI, Self-service BI, Voice of Customer, Regular reporting, Marketing, Data Mart • 각 조직의 성격, 업계의성격에 따라 본질적인 defense 와 offense 의 비중이 다름. 예를 들어, 금융업계에서는 관련 규제 준수 요건이 타 업계 대비 강하므로, 본질적으로 defense 에 더 많은 비중이갈 수 있음. • Offense 가 강화된다면 (= flexibility 가 강화된다면) 개별적인 비즈니스요건에맞도록 데이터를 변형하고 해석할 수 있는 역량이 강화되는 것이고, • Defense 가 강화된다면 (= control 이 강화된다면) 규제준수, 데이터 접근통제역량이강화됨. Defense 와 Offense 의 균형 • 개념적으로양자간의 균형을이루는것은 쉽게 이해할수 있음 • 하지만, 실제로이 균형을 이루기 위해서는 데이터 통제와 기준, 그리고 관련된 기술력이 뒷받침 되어야 함.
  • 5. 5 • 일반적으로CDO (Chief Data Officer) 와 CTO (Chief Technology Officer) 가 기업의 데이터 거버넌스를진두지휘 하에 각 부서의책임자들이 참여하는 방식으로진행됨. • 핵심은…. • Defense = Control : SSOT 는 정확하고 유일한 데이터 원천으로 유지 • Offense = Flexibility : MVOT 는 주의깊게통제된 방식을 통해 SSOT 의데이터활용 • 양자간의 균형을 50/50 으로 나누는 것이 답이 아님. • 각 기업 / 조직이 처한 상황에 따라 defense / offense 균형점은 달라짐. • CDO / CTO 는 이 균형점을찾는 것에 가장 집중해야함 • 고려해야 할 부분 • 기업 전체의 전략 • 업계 전반에 대한 정부규제의강도 • 경쟁사의 데이터 관련 처리 능력 • 기업 내 데이터관리 성숙도 • 데이터 관리를 위해 할당된 예산 등등 • 예시 • 금융 보험업계는 관련 정부규제가 매우 심하므로 일반적으로defense 에 더 중점을둠. • 소매업계의경우 관련 정부규제가 상대적으로 낮고, 고객 데이터 분석, 상권분석등 다양한 데이터 분석에 기반한경쟁이훨씬 심하므로 일반적으로 offense 에 더 중점을 둠. • 한 헤지펀드 사의 사례 • 가장 중요한 데이터는실시간으로 수집된 공개 혹은 상용 외부 데이터이며 이 데이터들은이미 고품질의 정제된 정형 데이터임. • 또한, 보험/은행에 비해 규제도 훨씬 약한 편. • 따라서, 아 회사는 offense 에 훨씬 높은 비중을 두고 있음. • 데이터 거버넌스의 수준이 올라가면서 전략의 방향을defense —> offense 로 조정하는 것은 일반적으로관찰되는 현상. 반대로 offense —> defense 로의 전환은 상대적으로 빈도가 낮고 또한 더욱 어려운 일. Data strategy 평가 • Defense / offense 의 균형점을 찾기 위해 아래 질문에 기반해 1 차적인 판단을 할 수 있음. • 평가툴 URL https://assessments.hbr.org/simulate/hbr/assessment/simulation/?X_ref=https://hbr.org/2017/ 05/whats-your-data-strategy&X_id=75d0d2dd-1005-11e7-80b4-063e6ef7c69d#/1
  • 6. 6 • 질문지 내용 번역 (질문 순서대로)…. • 아래 중 최대 8 개를 고르시오 • 부서 간 교차매출, 가격정책, 고객층 증대를 통해 전체 매출 확대를도모하는가? • 내외부의 새로운 데이터 소스를 활용하고자 하는가? • 새로운 제품 혹은 서비스를 만들어내고자 하는가? • IT 인프라 개선 혹은 데이터 관련 소요 원가감소 (DB 수 감소 등) 를 지향하는가? • 데이터 훼손, 사기 등 운영상의 리스크를감소시키고자하는가? • 외부 공격으로 인한 데이터 유출을 방지하고자하는가? • 데이터 품질을 향상시키고자하는가? • 기존 데이터 분석가, 데이터 사이언티스트들을위한 최적화를기획하고 있는가? • 복수의 원천 데이터로부터 데이터와정보가 생성되는환경을합리적으로 변형하려 하는가? • 현업을 위해 고도의 실시간 혹은 준실시간 데이터 분석을 활용하고자 하는가? • 기업 내 데이터가 가진 가치로부터 수익을 창출하고자하거나, 내부 데이터를 상품 혹은 서비스화 하고자 하는가? • 빅데이터와데이터 분석 인프라로부터 ROI를 창출하고자 하는가? • 일반적인 운영비용 감축과 비즈니스프로세스 효율화를 도모하는가? • 시장의 변화와 경쟁환경에 빠르게 반응하고자 하는가? • 업계의 규제를 준수하고자 하는가? 결론 • 데이터의 양, 종류가 다양해지며 데이터에 대한 가치가급상승 중. • 데이터 관리와 활용의기반이되는 전략을 수립하는 것은 기업의 핵심 경쟁력이되었음. • 전략 수립의 기반이 되는 사상을 크게 defense, offense 로 구분하였음. • Defense & Offense • Defense = Control : SSOT (Single Source of Truth)는 정확하고 유일한 데이터 원천으로 유지 • Offense = Flexibility : MVOT (Multiple Versions of Truth) 는 주의깊게 통제된 방식을 통해 SSOT 의 데이터 활용 • 각자의 상황에 맞는 Defense 와 Offense 의 균형점을 찾는 것이 data strategy 의 핵심. (균형점을 찾기 위한 출발점으로서 평가 툴을 제안하였음) • 새로운 기술의 등장으로 defense / offense 를 보다 효율적으로 수행할수 있도록 되었음. • Machine learning 역시 새롭게각광받는 기술 중 하나. 많은 기업들이 이미 machine learning 을 defense 와 offense 에 모두 활용하고 있음.