네이선 야우의 데이터 포인트 북 리뷰. 데이터가 무엇인가부터 데이터를 시각화하고 인포그래픽으로 나타내는 과정까지를 설명했습니다.
4. 데이터의 시각적 탐색
1) 작업과정
2) 범주형 데이터의 시각화
3) 시계열 데이터의 시각화
4) 공간 데이터의 시각화
5) 다중 변인
6) 분포
데이터 저널리즘의 새 바람, 뉴스젤리(Newsjelly)
http://newsjel.ly
1. 네이선 야우의
데이터 포인트
데이터 시각화 + 인포그래픽을 깨우치다
B o o k R e v I e w 박소영, 이주원
http://newsjel.ly/
2. 네이선 야우의
데이터 포인트
데이터 시각화 + 인포그래픽을 깨우치다
Ch. 4
데이터의 시각적 탐색
작업 과정 / 범주형 데이터의 시각화 / 시계열 데이터
의 시각화 / 공간 데이터의 시각화 / 다중 변인 / 분포
http://newsjel.ly/
3. 작업 과정
ü 어떤데이터를가지고있는가?
ü 데이터에서무엇을알고자하는가?
ü 어떤시각화기법을사용해야하는가?
ü 무엇을보여주고있고그결과가적절한가?
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
4. 데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
ü 어떤데이터를가지고있는가?
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터를먼저취하고구성한뒤시각화작업을데이터에맞게수행해야하며,
탐색하고싶은데이터가있을때수치들이표현하는대상이무엇인지,어디서획득되었는지,
어떤변수들이측정되었는지등을고려해야한다.
5. 데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
ü 데이터에서무엇을알고자하는가?
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
처음시작할때데이터에대해알고싶은것이무엇인지자신에게물어보고,
조사를진행하면서도더많은질문을하면서파고들어야한다.
6. 데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
ü 어떤시각화기법을사용해야하는가?
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
다양한차트들을만들어보고여러변수들을비교하면서흥미로운가치를찾아보는단계로,
다양한시각적형태들을가지고실험해보면서가치가있는그래픽을발견한다.
심플하게만보여주려하지말자.복잡한데이터는복잡한시각화가필요할때가있다.
7. 데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
ü 무엇을보여주고있고그결과가적절한가?
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
흥미로운점들을찾아낸후에는다음과같이되묻는것이중요하다.
‘결과가이치에맞는가?’, ‘왜이치에맞는가?’
8. 범주형 데이터의 시각화
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
범주들/전체를이루는부분들/하위범주들
9. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
0
2
4
6
D
C
B
A
A B C
막대그래프
직관적인비교가능
기호그래프
작은차이를구별하기어려운면이있음
범주들: 데이터가간단하면읽기도만들기도쉽다
10. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
전체를이루는부분들: 범주별구분이흥미롭거나필수는아니지만전체그룹을같이제시하고싶을경우
파이차트
전체가100%,가독성을위해
반시계방향으로정렬
축적막대그래프
여론조사결과를보여줄때사용,
원본수치표시하기위함
0%
50%
100%
D
C
B
A
11. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
하위범주들: 위계구조를가진데이터는데이터해석이중요하므로다른시점에서볼수있도록해야한다
트리맵
좁은공간에나타내고
면적+색상단서로나타냄
모자이크 그래프
한시점에서여러개의
범주간비교가능
A
B
C
D
E
A
B
C D E
18. 공간데이터의 시각화
위치. 지역. 카토그램(통계지도)
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
19. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
위치
위도와 경도 정보를 직접적으로 적용하는 방법으로 직접적이고 직관적이다.
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
20. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
지역
개별 포인트를 표시해 중복되게 하지 않고 지역별 밀도로 표시한다.
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
21. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
카토그램(통계지도)
데이터를 기반으로 지역의 크기를 보여주고 물리적 면적은 무시한다.
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
22. 다중 변인
몇개의 변인, 다수의 변인, 다중 뷰 사용하기
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
23. [출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
상관 이란?
변인들 간의 통계적 관련성
강한 상관관계 약한 상관관계
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
24. [출처] 네이선 야우, 데이터 포인트"
http://newsjel.ly/"
크기와 색상을 사용하여 한 시각화 결과물에
세가지 이상의 변인을 포함시킬 수 있다
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
25. [출처] 네이선 야우, 데이터 포인트"
http://newsjel.ly/"
평행좌표 그래프란?
수평방향으로 변인들을 배치하고, 수직축에 수치를 표현하는 방법이다.
여러 변인들의 상관관계를 한화면에서 볼 수 있다.
그러나 복잡해져서 보기 어려운 경우가 많이 생긴다.
양의 상관관계
선들이 평행하다.
음의 상관관계
선들이 일관성 있게 교차된다.
약한 상관관계
방향이 불명확하다.
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
26. 분포
몇개의 변인, 다수의 변인, 다중 뷰 사용하기
[출처] 네이선 야우, 데이터 포인트
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
27. [출처] 네이선 야우, 데이터 포인트 "
http://newsjel.ly/"
박스그래프
범위와, 중간값, 4분위값을 나타냄
바이올린 그래프
박스 그래프와 밀도 그래프의 조합 형태
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
분포요약: 구체적 분포보다는 핵심적인 수치를 보여줌
28. [출처] 네이선 야우, 데이터 포인트"
http://newsjel.ly/"
히스토그램
수평축은 계급 구간축이고 수직축
은 밀도를 나타냄
밀도 그래프
히스토그램과 비슷한 개념이지만
계급 대신 연속적 변화를 나타냄
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
단일변인의분포: 데이터가 군집되어 있는 형태와 특이점을 발견할 수 있다
29. [출처] 네이선 야우, 데이터 포인트"
http://newsjel.ly/"
히트맵
2차원 평면에 밀도를 색상으로 표시
서피스 그래프
히트맵과 비슷한 패턴을 보이지만 색
상 대신 높이를 시각적 단서로 사용
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
다중변인의분포: 동시에 표시되어야 의미 있게 제시 될 수 있는 수치들도 있다
30. 정리하기
데이터를 이해하기위한 중요한 열쇠는
데이터를 보면서 어떤 의문을 가져야 하는지를 아는 것!
To be Continued..
http://newsjel.ly/
데이터의 시각적 탐색 – 작업과정 / 범주형데이터의 시각화 / 시계열데이터의 시각화 / 공간데이터의 시각화 / 다중변인 / 분포
31. Enjoy Data news, Like Jelly
뉴스젤리는 빅데이터 분석을 기반으로 인포그래픽,
차트, 그리고 새콤달콤한 스토리를 통해 누구나
흥미로워 할 수 있는 뉴스를 제공하는 서비스입니다.
help@newsjel.ly
박소영, 이주원
데이터의 의미와 가치를 Data Visualization을 통해
많은 사람들에게 의미있고 아릅답게 전달하는 것을
목표로 하고 있습니다.