SlideShare a Scribd company logo
1 of 25
2015. 03
㈜이디엄 김한도
데이터가 우리 눈 앞에
펼쳐지기까지…
- 2 -
데이터가 우리 눈 앞에 펼쳐지기 까지..
수집 가공 분석 시각화
이미지 출처 : http://www.sensenetworks.com/wp-content/uploads/2012/05/grey-abstract.png
- 3 -
그런데… 이런 얘기는…
이미지 출처 : http://www.cutestpaw.com/images/computers-are-so-boring/
- 4 -
음식이 우리 식탁 앞에 놓여지기 까지…
이미지 출처 : http://www.grandpark-px.jp/iwaki/kr/
- 5 -
음식이 우리 식탁 앞에 놓여지기 까지…
식재료
수확
식재료
다듬기
명품
레시피
먹음직한
요리
이미지 출처 : http://health.mthai.com/howto/health-care/9839.html
http://paulapuffer.com/food-ingredients-shot/
http://bakethiscake.com/2012/06/30/vintage-banana-bread-recipe/
http://www.vegasnews.com/13227/chef-pierre-gagnaire-gives-sneak-peak-of-award-winning-cuisine.html
- 6 -
데이터가 우리 눈 앞에 펼쳐지기 까지…
수집 가공 분석 시각화
- 7 -
시각화된 데이터는 먹음직한 요리
좋은
데이터의
획득
데이터의
손질
패턴
시나리오
Rule
명품
시각화
- 8 -
DATA RECIPE, PATTERN
이미지 출처 : http://notquiteamishliving.com/2012/12/31-days-of-cookbooks-the-mennonite-treasury/
http://statistical-solutions-software.com/images/Comprehensive%20Meta%20Analysis.jpg
- 9 -
시각화의 두 가지 종류
정지해 있는 것 움직이는 것
이미지 출처 : http://m.dbguide.net/about.db?cmd=view&boardConfigUid=19&boardUid=176436
http://mundoepm.com.br/2015/02/07/new-power-bi-features-available-for-preview/
- 10 -
정지해 있는 시각화
200G의 데이터를 드릴테니 내게 Infographic을 넘기시오.
이미지 출처 : http://m.inven.co.kr/board/powerbbs.php?come_idx=2778&l=29789
- 11 -
데이터 정제가 필요
정지해 있는 시각화
이미지 출처 : http://blog.bigml.com/2012/12/10/filtering-filtering-and-filtering/
- 12 -
움직이는 시각화
- 13 -
누군가 계속해서 데이터를 가공해 주어야 함
움직이는 시각화
이미지 출처 : https://www.behance.net/gallery/1505597/Busy-Office-Worker
- 14 -
시각화는 결과인가 과정인가?
과정
결과
이미지 출처 : http://nybull.tistory.com/115
- 15 -
데이빗 맥칸들리스 : 정보시각화의 아름다움(TED)
이미지 출처 : http://www.everystockphoto.com/photo.php?imageId=12445877
우리 대다수는 지나치게 많은 정보 때문에 버거워합니다.
그런데 이를 간단히 해결할 방법이 있습니다.
그건 우리가 눈을 더 많이 사용하는 것입니다.
그렇게 정보를 시각화함으로써 우리는 패턴 사이의 의미 있는 관계를 알아낼 수 있습니다.
- 16 -
빅데이터 시각화의 전설 : 맥주와 기저귀의 상관관계
보면 알 수 있다.
이미지 출처 : http://www.birst.com/blog/marketing-all-things-human%E2%80%93-beers-and-diapers-life-insurance-and-games
- 17 -
상관관계는 인과관계가 아니다.
빅데이터 인사이트는 인과관계가 아닌 상관관계를 포착
상관관계
이미지 출처 : http://mooseburger.com/moose/sweat-summer/
http://www.realfoods.co.kr/realfoods/view.php?ud=20140409000667&sec=01-75-06
http://www.breakingnews.ie/ireland/dublin-burglar-sold-190000-of-jewellery-for-500-worth-of-heroin-663770.html
- 18 -
각 요소별 n:n 상관관계 분석을 반복하는 것
상관관계 패턴 추출법
이미지 출처 : http://www.bloomberg.com/bw/magazine/correlation-or-causation-12012011-gfx.html
- 19 -
사례 : VOC를 통한 해지 패턴 비교
이미지 출처 : http://www.actualinsights.com/category/voice-of-the-customer-2/
http://www.the-chiefexecutive.com/projects/custvox-act-upon-the-voice-of-your-customer-federico-cesconi-and-jukka-hekanaho
/custvox-act-upon-the-voice-of-your-customer-federico-cesconi-and-jukka-hekanaho3.html
- 20 -
좋은 도구는 패턴을 쉽고 빠르게 찾게 해줌
수작업 : 1주일
Logpresso : 2시간
- 21 -
빅데이터 고급 분석 기술
이미지 출처 : http://www.zdnet.com/article/why-data-scientists-are-in-demand-and-how-they-enable-big-data/
비즈니스 상황을 예측하고 효율적인 의사결정을 지원하기 위해 대용량의 데이터에
서 요인들 간의 상관관계와 의미 있는 데이터의 패턴을 식별하고 예측하기
위한 모든 기법과 기술들을 의미
- James Kobielus, Forrester
- 22 -
데이터가 우리 눈 앞에 펼쳐지기 까지…
수집 가공 분석 시각화
Data Recipe
- 23 -
蛇足 : 목적이 무엇인가?
시각화
심미적?
의미전달?
빅데이터
Hadoop?
Insight?
음식
만드는 것?
먹는 것?
- 24 -
蛇足 : DATA RECIPE에 집중하라.
이미지 출처 : https://bobgillis.wordpress.com/page/4/
http://eediom.com
Hando.kim@eediom.com

More Related Content

Viewers also liked

5장. Execution Engine
5장. Execution Engine5장. Execution Engine
5장. Execution Engine김 한도
 
3차보고서 20150106
3차보고서 201501063차보고서 20150106
3차보고서 20150106Joung Hun Youm
 
사업 실적
사업 실적사업 실적
사업 실적mobigen
 
Data analysis with Tajo
Data analysis with TajoData analysis with Tajo
Data analysis with TajoGruter
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21Donghan Kim
 
꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며neuroassociates
 
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호KTH, 케이티하이텔
 
6장 Thread Synchronization
6장 Thread Synchronization6장 Thread Synchronization
6장 Thread Synchronization김 한도
 
(주)모비젠 회사소개서 일반
(주)모비젠 회사소개서 일반(주)모비젠 회사소개서 일반
(주)모비젠 회사소개서 일반mobigen
 
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...Hortonworks
 
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecomcbs15min
 
H3 2011 파이썬으로 클라우드 하고 싶어요
H3 2011 파이썬으로 클라우드 하고 싶어요H3 2011 파이썬으로 클라우드 하고 싶어요
H3 2011 파이썬으로 클라우드 하고 싶어요KTH
 
클라우드란 (기획자대상)
클라우드란 (기획자대상)클라우드란 (기획자대상)
클라우드란 (기획자대상)Minwoo Park
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표Dylan Ko
 
Docker기반 분산 플랫폼
Docker기반 분산 플랫폼Docker기반 분산 플랫폼
Docker기반 분산 플랫폼SeongHyun Jeong
 

Viewers also liked (17)

5장. Execution Engine
5장. Execution Engine5장. Execution Engine
5장. Execution Engine
 
3차보고서 20150106
3차보고서 201501063차보고서 20150106
3차보고서 20150106
 
사업 실적
사업 실적사업 실적
사업 실적
 
Data analysis with Tajo
Data analysis with TajoData analysis with Tajo
Data analysis with Tajo
 
FAQ
FAQFAQ
FAQ
 
IRIS
IRISIRIS
IRIS
 
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
시나리오로 알아보는 빅데이터 대응전략(배포용) Dh kim-2013-3-21
 
꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며꿈꾸는 데이터 디자이너 1기를 끝내며
꿈꾸는 데이터 디자이너 1기를 끝내며
 
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호
H3 2011 파이썬으로 클라우드 하고 싶어요_분산기술Lab_하용호
 
6장 Thread Synchronization
6장 Thread Synchronization6장 Thread Synchronization
6장 Thread Synchronization
 
(주)모비젠 회사소개서 일반
(주)모비젠 회사소개서 일반(주)모비젠 회사소개서 일반
(주)모비젠 회사소개서 일반
 
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...
Discover Enterprise Security Features in Hortonworks Data Platform 2.1: Apach...
 
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom
세바시 15분 데이터로 세상이 다시 한번 바뀝니다 @하용호 SK Telecom
 
H3 2011 파이썬으로 클라우드 하고 싶어요
H3 2011 파이썬으로 클라우드 하고 싶어요H3 2011 파이썬으로 클라우드 하고 싶어요
H3 2011 파이썬으로 클라우드 하고 싶어요
 
클라우드란 (기획자대상)
클라우드란 (기획자대상)클라우드란 (기획자대상)
클라우드란 (기획자대상)
 
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
[우리가 데이터를 쓰는 법] 좋다는 건 알겠는데 좀 써보고 싶소. 데이터! - 넘버웍스 하용호 대표
 
Docker기반 분산 플랫폼
Docker기반 분산 플랫폼Docker기반 분산 플랫폼
Docker기반 분산 플랫폼
 

데이터가 우리 눈 앞에 펼쳐지기까지

  • 1. 2015. 03 ㈜이디엄 김한도 데이터가 우리 눈 앞에 펼쳐지기까지…
  • 2. - 2 - 데이터가 우리 눈 앞에 펼쳐지기 까지.. 수집 가공 분석 시각화 이미지 출처 : http://www.sensenetworks.com/wp-content/uploads/2012/05/grey-abstract.png
  • 3. - 3 - 그런데… 이런 얘기는… 이미지 출처 : http://www.cutestpaw.com/images/computers-are-so-boring/
  • 4. - 4 - 음식이 우리 식탁 앞에 놓여지기 까지… 이미지 출처 : http://www.grandpark-px.jp/iwaki/kr/
  • 5. - 5 - 음식이 우리 식탁 앞에 놓여지기 까지… 식재료 수확 식재료 다듬기 명품 레시피 먹음직한 요리 이미지 출처 : http://health.mthai.com/howto/health-care/9839.html http://paulapuffer.com/food-ingredients-shot/ http://bakethiscake.com/2012/06/30/vintage-banana-bread-recipe/ http://www.vegasnews.com/13227/chef-pierre-gagnaire-gives-sneak-peak-of-award-winning-cuisine.html
  • 6. - 6 - 데이터가 우리 눈 앞에 펼쳐지기 까지… 수집 가공 분석 시각화
  • 7. - 7 - 시각화된 데이터는 먹음직한 요리 좋은 데이터의 획득 데이터의 손질 패턴 시나리오 Rule 명품 시각화
  • 8. - 8 - DATA RECIPE, PATTERN 이미지 출처 : http://notquiteamishliving.com/2012/12/31-days-of-cookbooks-the-mennonite-treasury/ http://statistical-solutions-software.com/images/Comprehensive%20Meta%20Analysis.jpg
  • 9. - 9 - 시각화의 두 가지 종류 정지해 있는 것 움직이는 것 이미지 출처 : http://m.dbguide.net/about.db?cmd=view&boardConfigUid=19&boardUid=176436 http://mundoepm.com.br/2015/02/07/new-power-bi-features-available-for-preview/
  • 10. - 10 - 정지해 있는 시각화 200G의 데이터를 드릴테니 내게 Infographic을 넘기시오. 이미지 출처 : http://m.inven.co.kr/board/powerbbs.php?come_idx=2778&l=29789
  • 11. - 11 - 데이터 정제가 필요 정지해 있는 시각화 이미지 출처 : http://blog.bigml.com/2012/12/10/filtering-filtering-and-filtering/
  • 12. - 12 - 움직이는 시각화
  • 13. - 13 - 누군가 계속해서 데이터를 가공해 주어야 함 움직이는 시각화 이미지 출처 : https://www.behance.net/gallery/1505597/Busy-Office-Worker
  • 14. - 14 - 시각화는 결과인가 과정인가? 과정 결과 이미지 출처 : http://nybull.tistory.com/115
  • 15. - 15 - 데이빗 맥칸들리스 : 정보시각화의 아름다움(TED) 이미지 출처 : http://www.everystockphoto.com/photo.php?imageId=12445877 우리 대다수는 지나치게 많은 정보 때문에 버거워합니다. 그런데 이를 간단히 해결할 방법이 있습니다. 그건 우리가 눈을 더 많이 사용하는 것입니다. 그렇게 정보를 시각화함으로써 우리는 패턴 사이의 의미 있는 관계를 알아낼 수 있습니다.
  • 16. - 16 - 빅데이터 시각화의 전설 : 맥주와 기저귀의 상관관계 보면 알 수 있다. 이미지 출처 : http://www.birst.com/blog/marketing-all-things-human%E2%80%93-beers-and-diapers-life-insurance-and-games
  • 17. - 17 - 상관관계는 인과관계가 아니다. 빅데이터 인사이트는 인과관계가 아닌 상관관계를 포착 상관관계 이미지 출처 : http://mooseburger.com/moose/sweat-summer/ http://www.realfoods.co.kr/realfoods/view.php?ud=20140409000667&sec=01-75-06 http://www.breakingnews.ie/ireland/dublin-burglar-sold-190000-of-jewellery-for-500-worth-of-heroin-663770.html
  • 18. - 18 - 각 요소별 n:n 상관관계 분석을 반복하는 것 상관관계 패턴 추출법 이미지 출처 : http://www.bloomberg.com/bw/magazine/correlation-or-causation-12012011-gfx.html
  • 19. - 19 - 사례 : VOC를 통한 해지 패턴 비교 이미지 출처 : http://www.actualinsights.com/category/voice-of-the-customer-2/ http://www.the-chiefexecutive.com/projects/custvox-act-upon-the-voice-of-your-customer-federico-cesconi-and-jukka-hekanaho /custvox-act-upon-the-voice-of-your-customer-federico-cesconi-and-jukka-hekanaho3.html
  • 20. - 20 - 좋은 도구는 패턴을 쉽고 빠르게 찾게 해줌 수작업 : 1주일 Logpresso : 2시간
  • 21. - 21 - 빅데이터 고급 분석 기술 이미지 출처 : http://www.zdnet.com/article/why-data-scientists-are-in-demand-and-how-they-enable-big-data/ 비즈니스 상황을 예측하고 효율적인 의사결정을 지원하기 위해 대용량의 데이터에 서 요인들 간의 상관관계와 의미 있는 데이터의 패턴을 식별하고 예측하기 위한 모든 기법과 기술들을 의미 - James Kobielus, Forrester
  • 22. - 22 - 데이터가 우리 눈 앞에 펼쳐지기 까지… 수집 가공 분석 시각화 Data Recipe
  • 23. - 23 - 蛇足 : 목적이 무엇인가? 시각화 심미적? 의미전달? 빅데이터 Hadoop? Insight? 음식 만드는 것? 먹는 것?
  • 24. - 24 - 蛇足 : DATA RECIPE에 집중하라. 이미지 출처 : https://bobgillis.wordpress.com/page/4/