빅데이터 분석 시각화 분석 : 3장 시각화 방법

12,679 views
12,288 views

Published on

데이터 베이스 진흥원에서 발간한 데이터 분석 전문가 과정의 시각화 파트 2장에 대한 시각화부분의 3장 시각화 방법스 대한 강의 화일

저작권 문제로 강의 화일의 다운로드가 안됨을 양해 부탁드립니다.

sun.neofuture@gmail.com

Published in: Data & Analytics
1 Comment
107 Likes
Statistics
Notes
No Downloads
Views
Total views
12,679
On SlideShare
0
From Embeds
0
Number of Embeds
9
Actions
Shares
0
Downloads
0
Comments
1
Likes
107
Embeds 0
No embeds

No notes for slide

빅데이터 분석 시각화 분석 : 3장 시각화 방법

  1. 1. 시각화 방법
  2. 2. 시각화 방법  앞서 언급한 바와 같이 빅데이터 시각화는 정보 구조화, 정보 시각화, 정보 시각표현의 3단계로 진행  정보의 구조화를 위해서는 정보를 분류, 조직화, 재배열하는 기본원리를 익히고, 정보 시각화를 위해서는 각종 툴 에서 일반적으로 제공하는 그래프 스타일의 원리와 쓰임새를 아는 것이 중요 정보 구조화 정보 시각화 정보 시각표현 데이터 수집 및 탐색 데이터 분류하기 데이터 배열하기 데이터 재배열 시간 시각화 분포 시각화 관계 시각화 비교 시각화 그래픽 7요소 그래픽 디자인 기본 원리 인터랙션 시각정보 디자인 7원칙 여러변수 비교 공간 시각화 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화 방법
  3. 3. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 구조화  앞서 기술한 바와 같이 양적 데이터를 다루는 빅데이터의 정보 디자인의 성패는 빅데이터에서 다루는 데이터를 어 떻게 통합했는지, 데이터 고유의 특성이 훼손되지 않으면서 비교되는 통계 품질이 어떠한지, 의도한 정보 디자인 을 위한 통계 데이터의 도출이 적절하게 됐는지 의해 좌우된다고 할 수 있음  데이터를 수집·정제하는 과정이 적절히 배분되지 않는다면 빅데이터 시각화에서는 제대로 된 결과물을 도출하기 어려움  정보의 조직화는 데이터를 수집하는 과정을 거쳐 혼돈의 상태로 존재하는 데이터를 분류(Classifying)하고 배열 (arranging)하고 조직화(Organizing)해 질서를 부여하는 작업을 의미  정보를 이해하기 쉽도록 조직화 해 배치할 때, 정보의 가치와 유용성은 더욱 증대되며 정보를 어떻게 조직하느냐 에 따라 정보를 대하는 관점과 정보가 전하는 이야기도 달라짐
  4. 4. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 구조화 정보의 조직화 과정 [데이터 수집] 데이터 자료 또는 논거를 수집 [분류] classifying 분류해 유사한 것끼리 묶음 [배열] arranging 값의 의미에 따라 배치 [관계 맺기] organizing 데이터 사이의 관계를 만듦
  5. 5. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 데이터 수집 및 탐색  데이터 수집 및 탐색  대부분의 경우 이미 빅데이터의 풀에 접근성을 갖고 시작하지만, 그렇지 않은 경우 아예 빅데이터를 분류하기 전에 다양한 경로를 통해 데이터를 모으는 것이 필요하기도 함  이렇게 수집된 원 데이터를 바탕으로 필요한 데이터를 추출하고, 활용하는 절차를 거쳐야 함  유의미한 데이터를 선정하고 무의미한 데이터를 걸러내는 ‘데이터 에디팅’ 과정이 수행됨
  6. 6. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 데이터 분류  데이터 분류  이렇게 모은 데이터는 일정한 형식으로 정리·분류하는 작업이 이뤄진다. 우선 갖고 있는 데이터를 형 식으로 정리하는 것  데이터를 하나의 깔끔한 형식으로 정리하기 위해서는 다양한 데이터 형식을 알고, 다양한 형식을 다 룰 수 있는 도구를 갖춰야 하며, 약간의 프로그래밍 기술도 알아야 함
  7. 7. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 데이터 분류  구분 텍스트  줄바꿈으로 행을, 구분자로 열을 구분하는 텍스트 데이터를 말한다. CSV(comma separated values) 파일은 쉼표로 구분하고, TSV(tab seperated values)라면 탭으로 구분  구분자는 공백(space), 세미콜론(;), 콜론(:), 슬래시(/), 어떤 것이라도 가능  JSON  자바스크립트 객체 형식으로 표현된 데이터를 한 함수에서 다른 함수로, 또는 비동기식 애플리케이 션은 웹 클라이언트 측에서 서버 측 프로그램으로 쉽게 전달할 수 있는 스트링으로 변형 가능  XML  확장마크업 언어(eXtensible Markup Language)은 마크업 언어의 일종으로, 수많은 종류의 데이 터를 기술하는 데 적용할 수 있음  XML은 주로 다른 시스템, 특히 인터넷에 연결된 시스템끼리 데이터를 쉽게 주고받을 수 있도록 HTML의 한계를 극복할 목적으로 구조적 데이터를 설명
  8. 8. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  배열  리처드 솔 워먼의 저서인 『정보 욕구(Information Anxiety)』에서는 정보의 조직화를 위한 래치 (LATCH) 방법 제시  위치(Location), 알파벳(Alphabet), 시간(Time), 카테고리(Category), 위계(Hierarchy) 이상 5가 지가 정보를 정리 또는 조직화하는 기준이 됨
  9. 9. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열 강아지의 조직화 http://parsonsdesign4.files.wordpress.com/2012/03/all-breeds-for-web.jpg  강아지의 모든 종을 크기로 표시해 한군데에 모은 것  수많은 강아지들을 래치방법으로 정리한 예를 들어 설명
  10. 10. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  위치  강아지들을 나라별로 분류  강아지들을 지도 위에 맵핑할 수 있도록 분류  정보를 공간적인 위치에 배열하는 방법으로 지리적인 것만이 아니라 공간적으로 구분하는 것 모두를 포괄  다양한 출처나 장소에 기반을 둔 정보를 조사하고 비교할 때 일반적인 선택 방법  위치(Location)에 따른 정보 디자인의 가장 보편적인 예로는 지도가 있으며 일반적인 지도뿐 아니라 건물의 안내도, 학문 영역의 범위를 표현하는 것 등도 해당
  11. 11. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  알파벳  강아지 종에 따라서 알파벳 순서로 정리  사전, 전화번호부, 인명부와 같이 방대한 정보를 조직화할 때 알파벳 또는 가나다 순으로 정렬하는 방 법이 흔히 사용  1차로 정보를 분류하고 하위 분류에서 가나다순으로 조직화하면 효과적  인명이나 사물의 이름 등을 정리할 때에는 '카테고리'나 '위치'와 같은 다른 기준을 사용하는 예도 있 으나 데이터의 속성이 다양한 경우에는 알파벳(또는 가나다 순) 순 정렬이 보편적
  12. 12. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  시간  연도별 시간 순서에 따라서 분류한 것으로 일정 기간에 일어난 사건을 조직화하는 최적의 원리는 시 간(Time)으로 정보를 배열하는 것  시간은 정보의 변화를 발견하고 비교할 때 쉽게 이해  예를 들면 역사 연표 또는 TV 방송 편성표 등으로 TV 방송 자체가 시간에 따라 방영되는 방송의 내용 , 형태가 다른 것도 여기에 기인하고 있으며 개인 스케쥴 표나 달력도 여기에 해당
  13. 13. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  카테고리  털이 짧은 강아지와 털이 긴 강아지로 나눈 것으로 종류, 분류를 의미하는 카테고리(Category)는 정 보의 속성에 따라 분류할 때 적합  카테고리를 통한 조직화는 중요도나 주제가 서로 유사한 정보에 적합하며, 수치 표시와는 달리 색상 등으로 표현을 달리해 고유의 특성을 부여할 수 있음  상점 또는 슈퍼마켓에서 상품 분류, 도서관의 서적분류 등이 해당
  14. 14. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 배열  가중치  강아지 종을 무게라는 가중치(Hierarchy)에 따라 분류  물량의 변화(적음에서 많음), 질량의 변화(가벼움에서 무거움), 고도의 변화(낮음에서 높음), 가격의 변화(싼 것에서 비싼 것으로) 등 정보의 변화에 따라 데이터의 값이나 중요도의 순서로 정보를 조직 화하는 것  카테고리에 의한 조직화와 달리 가중치는 단위나 수치로 표현할 수 있음
  15. 15. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계맺기(재배열)  관계맺기(재배열)  데이터 재배열(data rearrangement)은 데이터에 의미를 부여하는 가장 기본적인 과정으로, 정보의 시각화와 밀접한 관계가 있음  정보의 조직화가 데이터를 분류하는 것이라면, 재배열은 분류된 데이터를 정보 수용자가 인식하기 쉽게 패턴을 만드는 일에 속함
  16. 16. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계맺기(재배열)  로버트 스펜서(Robert Spence)는 『정보 시각화(Information Visulization)』 저서에서재배열에 대해 설명  1, 2, 3 등으로 표시 된 밀, 쌀, 콩 등의 열 가지 곡물에 A, B, C 등으로 표시된 일곱 가지의 비료를 사 용했을 때 각 곡물에 효과가 있는지를 알아보는 실험의 결과로 설명  비료 효과가 나타나면 검은색으로, 그렇지 않으면 흰색으로 표시
  17. 17. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계맺기(재배열)  곡물과 비료를 함께 실험한 결과는 (a)와 같음. 여기서의 나열은 단순히 어떤 곡물이 어떤 비료를 썼는가를 보여주고 있는 단순 참조에 지나지 않음. 이것만으로는 어떤 비료가 어떤 곡물에 효과가 있었는지 즉각적 으로 알아채기 힘듬  이것을 (b)처럼 비료를 기준으로 가로로 한 줄씩 잘라 내 (c)처럼 특정 곡물과 연관되는 비료들끼리 나열 할 수 있는데 처음 특정 곡물이 특정 비료에만 효과가 있는 패턴을 감지하게 됨
  18. 18. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계맺기(재배열)  이것을 다시 반복해 곡물을 중심으로 세로로 (c)처럼 잘라내어 (d)처럼 관련이 있는 곡물끼리 다시 나열한 다면 (e)처럼 어떤 비료가 어떤 곡물에 효과가 있는지를 시각적 패턴으로 분명화할 수 있음
  19. 19. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 시각화 정보 시각화 방법 시간 시각화 분포 시각화 관계 시각화 비교 시각화 공간 시각화 막대그래프 누적 막대그래프 점그래프 파이차트 도우넛차트 트리맵 누적연속그래프 스캐터 플롯 버블차트 히스토그램 히트맵 체르노프 페이스 스타차트 평행 좌표계 다차원 척도법 지도 매핑  대용량 데이터나 빅데이터를 막론하고 정보 시각화 방법은 분석과 함께 제공되는 시각화 도구(Tool)에 의 해 결정 되는 경향이 강함. 이러한 차트와 그래프가 분석의 내용을 반영하기 위해 어떤 방식으로 써야 하는 지 그 쓰임새를 익히고, 적절한 데이터와 정보 시각화를 하기 위한 수단으로 사용해야 함  시각화 도구에 한정한 그래프로만 구현하다 보면, 분석적 사고를 효율적으로 보여주기보다는 단지 멋져 보 이는 그래프를 선호하기 쉬우나 어떠한 효율적인 분석 내용을 전달할 것인가를 고려해 그에 따른 그래프를 선택하는 것이 매우 중요
  20. 20. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  시간에 따른 데이터는 변화를 표현하며, 시계열 데이터의 가장 특징적인 요소는 트렌드, 즉 경향성으로 장 기간에 걸쳐 진행되는 변화 또는 트렌드를 추적하는 데 주로 사용  시간의 전후 관계를 감안하면 값의 의미를 더 분명하게 이해 가능  시간 데이터는 분절형과 연속형으로 분류 가능  분절형 : 데이터의 특정 시점 또는 특정 시간 구간 값  연속형 : 기온 변화 같은 데이터
  21. 21. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  막대그래프  값들이 뚜렷한 차이를 보이는 경우로 수치를 길이로 표현해 절대값을 갖는 막대를 배치함으로써 상 대적인 차이를 한눈에 알아보는 것이 가능  시간축(가로)은 시간 순서대로 정렬된 시간의 특징 시점을 나타냄  값축(세로)은 그래프의 크기 범위를 나타냄  하지만 막대 값들의 차이가 미미하거나 표시할 값(막대)의 수가 많은 경우에는 막대들을 비교하기가 쉽지 않은데, 시각적 차이를 강조하기 위해 막대에 다양한 색상을 적용할 수 있는데, 이때 색상은 특 정 상태나 범위 따위를 나타냄
  22. 22. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  누적 막대그래프  누적 막대그래프의 구성은 일반적인 막대그래프와 거의 비슷. 단 하나의 차이점이라면 한 구간에 해 당하는 막대가 누적된다는 점  한 구간이 몇 개의 세부 항목으로 나뉘면서도 전체의 합이 의미가 있을 때 누적 막대그래프 사용  한 구간의 각 세부항목은 질감과 또는 색상으로 구분․표시
  23. 23. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  단어들의 바차트(Bar Chart for Words)  단일 소프트웨어 봇(single software bot)이 모은 엄청난 양의 단어와 이미지를 갖고 있는 위키피디 아(http://www.wikipedia.org) 편집역사를 시각화한 것 http://commons.wikimedia.org/ wiki/File:Viegas- UserActivityonWikipedia.gif
  24. 24. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  점 그래프  점그래프는 면적을 표시할 필요가 없기 때문에 더 적은 공간에 그릴 수 있고, 한 점에서 다음 점으로 변하는 점의 집중 정도와 배치에 따라 흐름을 파악하기 용이  일반적으로 두 변수의 연관 관계를 보여줄 때 많이 쓰임 시간 데이터를 점 그래프로 그 릴 때의 구조를 나타냄
  25. 25. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시간 시각화  연속형 데이터: 연결된 점.선 그래프  연속 시계열 그래프는 점그래프와 거의 같은데, 점 사이를 선으로 연결한다는 점이 차이  선으로 표현되는 연속적인 데이터의 끊임없이 변화하는 현상의 추이를 볼 수 있으며, 변수의 변화를 명확히 표시할 필요가 있거나 트렌딩 또는 변화율 정보가 중요한 경우 선그래프를 사용가능
  26. 26. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  분포 데이터의 일반적인 특성은 최대(maximum), 최소(minimum), 전체 분포(overall distribution)로 분 류  최대와 최소는 글자 그대로 순서 정렬에서 양 끝을 취하면 최대와 최소  분포 그래픽에서 가장 주목해야 할 것은 분포 정도  분포 데이터는 부분을 전부 합치면 1 또는 100%가 됨  전체의 관점에서 부분 간의 관계를 보여줘야 함
  27. 27. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  원 그래프  원그래프는 부분과 부분 간의 비율을 알아보는 데 사용되는 방법  하지만 육안으로 면적을 가늠하고 시각(visual angles)을 비교해야 하므로 어떤 경우에는 그래프를 해석하기가 쉽지 않음  최대한 구성요소를 제한하고 내용을 설명하기 위한 텍스트와 퍼센티지를 포함시키는 것이 좋음  추가 정보를 제공으로 사용자가 각 그래프 조각의 의미와 가치를 놓고 혼동하는 상황을 방지 가능  원그래프는 분포의 정도를 총합 100%로 나타내서 부분간의 관계를 보여주며, 면적으로 값을 보여 주며, 수치를 각도로 표시
  28. 28. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화 10명의 아티스트, 10년 http://visual.ly/10-artists-10-years-color-palettes)  모네·르누아르·드가·세잔 등 10명의 인상파와 신인상파 화가 들이 1895년부터 1904년까지 10년 동안 사용한 색상을 분석 해 색상 사용이 어떻게 변화해왔는지를 시각화  각 화가의 대표작에서 가장 많은 면적을 차지하는 5개의 색을 추출해 만든 이 시각화는 원그래프로, 파이썬(Python)으로 색 을 추출해 개발 칼라를 사용한 예 : http://jisunlee.net/
  29. 29. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  도넛 차트  도넛차트(donut chart)는 원그래프와 마찬가지로 수치를 각도로 표시  원그래프와 달리 중심부를 잘라내 도넛 모양으로 보인다는 점이 다름  중심의 구멍 때문에 조각에 해당하는 수치는 조각의 면적이 아닌 길이로 표시
  30. 30. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  트리맵  트리맵은 영역 기반의 시각화로, 각 사각형의 크기가 수치를 나타냄  한 사각형을 포함하고 있는 바깥의 영역은 그 사각형이 포함된 대 분류를, 내부의 사각형은 내부적인 세부 분류를 의미  트리맵은 단순 분류 별 분포 시각화에도 쓸 수 있지만, 위계 구조가 있는 데이터나 트리 구조 의 데이트를 표시할 때 활용가능
  31. 31. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  마르코스 웨스캄피(Marcos Weskampi)가 개발한 뉴스맵(Newsmap)은 구글 뉴스를 실시간으로 14개 지역, 7개의 카테고리로 시각화  뉴스 내용이 있는 내부 사각형을 선택하면 뉴스에 대한 간략한 내용을 이미지와 텍스트로 노출 뉴스맵 http://newsmap.jp/
  32. 32. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  누적 연속 그래프  몇 개의 시계열 그래프를 차곡차곡 쌓아 올려 그려 빈 공간을 채워가는 것  가로축은 시간을 나타내며 세로축은 데이터 값을 나타냄  누적 영역그래프에서 한 시점의 세로 단면을 가져오면 그 시점의 분포를 볼 수 있음  시간에 따라 연속적인 누적 막대그래프라고 볼 수도 있음
  33. 33. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  네임보이저는 100년이 넘는 아기 이름 데이터베이스를 이용한 정보를 웹에 공개  어느 시기에 어떤 아기 이름이 얼마나 선택됐는지를 알 수 있음  자신이 찾고자 하는 이름을 입력하면 이 이름에 대해 시기별로 얼마나 많은 사람들이 선택했는가를 보기 쉽게 제공 네임보이저 http://www.babynamewizard.com/voyager
  34. 34. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계 시각화  상관관계를 알면 한 수치의 변화를 통해 다른 수치의 변화를 예측 가능  관계 시각화는 스캐터 플롯과 멀티플 스캐터 플롯이 사용  스캐터 플롯은 시간적인 변화를 알아보는 데 도움이 되지만 두 변수의 관계를 알아볼 때도 활용
  35. 35. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계 시각화  산점도
  36. 36. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계 시각화  산점도  두 데이터 항목의 공통 변이를 나타내는 2차원 도표  각 마커(점, 사각형, 플러스 기호 등) : 관측치  마커의 위치 : 각 관측치에 대한 값  가로축과 세로축의 변수값에 대응하는 점을 좌표에 배치하면 그 상관관계를 확인  점들이 오른쪽 위로 올라가는 추세를 보인다면 양의 상관관계  점이 오른쪽 아래로 떨어지는 추세라면 음의 상관관계  점의 배치에 패턴이 보이지 않는다면 두 변수는 상관관계가 없음  데이터가 얼마나 분포됐는지 또는 데이터 포인트들이 얼마나 밀접한 관련이 있는지 이해하는 데 도 움을 주며, 데이터의 분포에 존재하는 패턴을 신속하게 식별 가능  데이터 포인트가 많을 때 특히 유용한 반면, 데이터 포인트의 수가 적은 경우에는 오히려 막대그래프 나 일반 표가 정보를 제대로 표시하는 데 효과적일 수 있음
  37. 37. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계 시각화  버블차트  세 가지 요소의 상관관계를 표현할 수 있는 방법  가로축의 변수, 세로축의 변수, 버블의 크기  버블차트는 수십 또는 수백 개의 값을 갖거나 값들이 몇 자릿수씩 차이가 나는 데이터세트에 유용  특정 값들을 다양한 크기의 버블로 시각적으로 표현하고자 할 때도 이 방식을 사용 가능  하지만 종종 버블차트를 보는 사람들은 원의 면적을 보는 것이 아니라, 원의 지름을 갖고 판단하는 경향이 있음
  38. 38. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  갭 마인더의 버블차트  유엔의 데이터를 바탕으로 한 인구 예측, 부의 이동 등에 관한 연구논문과 통계정보를 공유  두 가지 수의 변수(생활 기대 값과 1인당 GDP)를 위해 자료를 표시 한스 로슬링의 갭 마인더 http://www.gapminder.org/world/
  39. 39. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 관계 시각화  히스토그램  히스토그램(분포 그래프) : 평균값을 중심으로 양옆이 점진적인 감소 모양을 보이는 종 곡선  왼쪽으로 치우친 모양이라면, 데이터가 전체 범위에서 수치가 낮은 쪽에 몰려있다  오른쪽에 치우쳐 있다면 높은 쪽에 몰려 있음을 의미  수평선으로 그려진다면 균일한 분포를 의미  막대의 높이는 빈도를 나타내고 폭은 의미가 거의 없음, 가로축과 세로축은 연속적임
  40. 40. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  여러 개의 변수를 다뤄야 할 때 마주하는 첫 번째 난관은 시작점을 찾는 것으로 자신에게 있는 데이터를 끊임없 이 생각하다 보면 너무 많은 변수와 세부 분류에 압도되곤 함  때로는 모든 데이터를 한번 훑어본 다음 흥미로운 점을 짚고 다른 점을 찾아가는 과정이 더 도움이 될 수 있음
  41. 41. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  히트맵  시각화 기법에서 가장 많이 유용하게 쓰이는 그래프 중 하나로 여러 가지 변수를 비교 가능  한 칸의 색상으로 데이터 값을 표현  하나의 대상에 해당하는 한 행을 왼쪽에서 오른쪽으로 보면서 모든 변수를 파악할 수도 있고, 하나의 변수에 대응하는 한 열을 위에서 아래로 읽을 수도 있음  데이터가 지나치게 많을 경우엔 더 혼란스러울 수 있으니 적당한 색상을 선택하고 약간의 정렬 과정 을 거쳐야 함
  42. 42. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  주식시장에 대한 전망을 SNS의 사회적 주식 지수로 보여줌  트위터에서 많이 이야기되는 주식이 블록에 나타나며 해당 주식에 대해 어떠한 감정으로 이야기하는 지가 색상으로 표시 감정 히트맵 http://www.marketprophit.com/heat-maps/
  43. 43. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  체르노프 페이스  체르노프 페이스(Chernoff face)는 데이터를 사람의 얼굴 이미지로 표현하는 방법  얼굴의 가로 너비, 세로 높이, 눈, 코, 입, 귀 등 각 부위를 변수로 대체  데이터의 개별적인 부분에 집중해 그리는 것이 가능  엄밀한 의미의 데이터 그래픽에는 포함되지 않으며, 보통 사람들에게 혼란을 줄 우려도 있음  체르노프 페이스의 유용성은 상황에 따라 다르며, 통상 유용성보다는 전문가의 흥미가 주 목적
  44. 44. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화 나단 아우의 ‘미국 범죄의 얼굴’(Crime-Chernoff-Faces-by-state-edited) http://flowingdata.com/2010/08/31/how-to-visualize-data-with-cartoonish- faces/crime-chernoff-faces-by-state-edited-2/
  45. 45. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  스타차트  스타 차트 : 거미줄 차트 또는 방사형 차트  중앙에서 외부 링까지 이어지는 몇 개의 축을 그리고, 전체 공간에서 하나의 변수마다 축 위의 중앙으 로부터의 거리로 수치를 나타냄  각 변수를 라인 위에 표시한 지점을 연결해 연결선을 그리며 그 결과는 별 모양의 도형으로 나타남  중심점 : 축이 나타내는 값의 최소값  바깥 점 : 가장 먼 끝은 최대값을 나타냄
  46. 46. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화 2013 NBA 올스타 서부지역 http://ramimo.com/2013-NBA-All-Stars  미국 서부지역 MBA 농구 선수들의 강점을 방사 형 차트로 표현한 것이다. 각 색상코드는 선수들이 속한 구단의 색상을 의미하며, 각 축은 농구선수들 의 기록을 나타낸다.
  47. 47. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  평행 좌표계  대상이 많은 데이터에서 집단적인 경향성을 쉽게 알아볼 수 있게 해줌  여러 축을 평행으로 배치해서 만듬  Y 축에서 윗부분은 변수 값 범위의 최대값, 아래는 변수 값 범위의 최소값  측정 대상은 변수 값에 따라 위아래로 이어지는 연결선으로 그려짐
  48. 48. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화 카이 창의 영양소 콘텐츠 http://exposedata.com/parallel/  카이 창(Kai Chang)의 영양소 콘텐츠 : USDA의 영양소 데이터베이스를 시각화  각 식품 100g당 들어있는 영양성분을 비교  카이 창이 개발해 배포하는 D3.js의 평행좌표계 - Parallel Coordinates(0.2.2)를 이용해 직접 개발 가능
  49. 49. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  다차원 척도법  데이터세트상의 개별 데이터 간의 유사도를 바탕으로 시각화하는 방법으로 대상 간의 유사성(또는 선호도) 측도에 의거해 대상을 다차원 공간 속에 배치시키는 방법  표현하고자 하는 객체 간 간격이 발생하는, 즉 거리행렬(distance matrix)을 포함하는 데이터의 시 각화에 유용  유사성이 작은 대상끼리는 멀리, 유사성이 큰 대상끼리는 가까이 위치시킴
  50. 50. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 비교 시각화  공간 시각화  지도의 한 위치를 다른 위치와 비교해보는 것 = 그래픽의 한 클러스터 영역과 나머지의 비교  지도를 만들 때 위치를 정확하게 배치해야 하며, 색상 구분도 정확해야 하고, 라벨이 위치를 가려서는 안 되며, 정확한 투시 방법을 선택해야 함  하나의 지도는 시간상의 한 지점, 한 순간의 현실만을 반영하고 있지만, 여러 장의 지도를 통해 시간 의 여러 단면을 표현 가능
  51. 51. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 분포 시각화  위도와 경도의 위치 값을 이용해 지도 위에 정확한 매핑 포인트를 표시해야 하지만 구글 차트의 지 오차트(Geo Chart)는 이 값을 모르고 지명만 알아도 시각화 작업을 가능  영역 모드와 마커 모드를 갖고 나라별, 대륙별 또는 지역의 지도를 쉽게 그려볼 수 있음  영역 모드 : 국가, 지방 또는 국가와 같은 전체 지역을 채색  마커 모드 마크 : 사용자가 지정한 값에 따라 조정되는 것으로 버블 차트를 사용해 영역을 지정가능 인터랙티브 미국 선거 지도 http://cmoreira.net/interactive-world-maps-demo/usa-custom-election-map/
  52. 52. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  그래프 유형의 선택은 시각화해야 하는 범주와 측도(또는 차원)의 수에 좌우  다양한 유형의 시각 자료를 적용해 보고 이를 대상 자에게 테스트해 정보가 정확하게 전달되는지를 지속적 으로 확인할 필요가 있음  그래프를 그릴 때는 최소한의 것으로 표현하는 것이 최대한의 것을 전달하는 힘을 갖는 경우가 대부분  에드워드 터프티(Edward Tufte)의 『 The Visual Display of Quantitative Information』  데이터 링크를 더 이상 지울 수 없는(non-erasable) 그래픽의 핵심이며, 숫자의 변화 를 비중복(non-redundant)적으로 표현하는 잉크  아래의 그래프를 단순화 하는 단계는 그대로의 데이터가 더 보기에 낫다는 관점에서 단계별로 그래프를 단 순화해 표현하는 방법을 설명하고 있다. http://darkhorseanalytics.com/blog/data-looks-better-naked/
  53. 53. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  1. 배경을 지워라  배경에 들어간 질감으로 된 배경은 그래프를 눈에 띄게 할 수는 있지만 시각적으로 데이터를 강조하 는데 오히려 방해
  54. 54. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  2. 범례를 지워라  그래프에 범례가 포함돼 있다면 굳이 범례를 추가할 필요가 없다. 또한 범례를 보고 그래프를 보려면, 보는 사람이 직접 색상과 글씨를 매칭해야 하기 때문에 해석에 방해
  55. 55. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  3. 테두리를 지워라  배경이 흰색인 문서에서 테두리는 답답한 느낌을 주며, 디자인에 방해
  56. 56. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  4. 색깔을 지워라  다양한 색은 보는 사람에게 핵심이 무엇인지 파 악하기 어렵게 만듬  5. 특수효과를 지워라  그림자 효과와 볼록 효과와 같은 특수 효과는 전 체적인 디자인의 통일성을 맞추기 어렵게 만듬  특수 효과는 데이터의 핵심을 전달하는 데 방해
  57. 57. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  6. 굵은 글씨를 지워라  굵은 글씨는 보는 사람의 눈을 끄는 효과가 있지 만, 오히려 핵심에 집중 못하게 하고 시선을 분 산시킴  7. 라벨을 흐리게 처리해라  흐릿하게 처리 된 라벨은 처음 그래프를 보는 사 람이 데이터의 핵심에 집중하게 함
  58. 58. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  8. 보조선을 흐리게 처리하든지 아예 지워라  진하게 그려진 보조선은 데이터를 표현하는 부분과 겹치기 때문에 흐릿하게 처리하거나 없애는 편이 깔끔  9. 라벨을 직접 표시하라  보조선을 없앤 대신에 라벨을 데이터에 직접 표 현하면 보는 사람이 즉각적으로 그래프를 해석 가능 OR
  59. 59. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 그래프 단순화  시각화 툴에서 제공하는 그래프를 이용하더라도 토프티가 주장하는 바와 같이 단순하고 명료하게 원하는 데이터만 전달하는 측면에 주력한다면 효율적인 정보 시각화가 가능
  60. 60. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 시각표현  정보 시각표현  그래픽적으로 디자인을 완성시키는 단계  정보 시각 표현에 사용되는 정보 디자인의 그래픽 요소는 정보의 내용을 시각적 형식으로 전환해 전 달 과정에서 사용자의 감각을 자극하여 정보가 쉽게 이해되도록 시각적 안내 역할을 함
  61. 61. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 시각표현  정보표현을 위한 그래픽 요소  시각 정보를 보기 위해 뇌는 패턴을 감지하고 이를 해석한 뒤에 학습  시간을 단축하기 위해 뇌는 먼저 비슷한 물체, 즉 크기와 색깔이 똑같은 사각형들과 조금 달라 보이는 사각형 하나를 구분한 다음에야 나머지를 자세히 탐색  자크 베르탱(Jacques Bertin)의 그래픽 7요소  그래픽 요소는 수치적(양적), 질적 데이터 간의 차이, 순서, 비율의 관계를 시각적으로 전환할 수 있 는 가장 효율적인 표현의 수단이며, 사용자가 이를 통해 정보를 시각적으로 지각하고 이해하게 하는 절대적인 역할을 한다 자크 베르탱 Jacques bertin과 그의 저 서 [기호의 그래픽semiologie graphique]
  62. 62. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 시각표현  자크 베르탱(Jacques Bertin)의 그래픽 7요소
  63. 63. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  위치  위치(Position)에 변화를 줌으로써 하나의 요소를 강조할 수 있다. 아래에서는 같은 요소를 나열하면 서 Y 좌표 값에 변화를 줌으로써 강조를 했다. 특정 요소의 상대적인 위치를 확인한다. 주변의 여타 요소와 관계를 비교할 수 있다. 크기와 마찬가지로 수치로 표현할 수 있다. 정보의 상하구조를 효과적 으로 전달할 수 있다. 가장 중요한 정보나 자주 쓰이는 기능은 좌측 상단에 배치한다.
  64. 64. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  크기  같은 크기(Size)를 갖고 있는 요소들이라면 하나만 작게 만들면 상대적으로 그것이 강조돼 보인다. 따라서 크기가 크고 적은가의 문제가 아니라 같이 있는 것들 간의 관계에 따라 결정된다. 클수록 사람 들의 시선을 끈다. 크기는 수치로 표현할 수 있고, 순서로 구분할 수도 있다. 따라서 양과 중요도를 인 지할 수 있다.
  65. 65. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  모양  같은 모양(Shape) 중에 하나만 다른 모양을 취한다면 이것이 도드라진다. 중요한 것은 비슷한 형태 가 아닌 전혀 다른 형태로 바꾸어야만 강조돼 보인다. 사람들은 외곽선을 보고 대상을 인식한다. 하지 만 형태를 구분하는 능력은 색상이나 크기를 인지하는 능력보다 고도의 기술이다. 형태만으로는 큰 대비 효과를 기대할 수 없다.
  66. 66. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  색  같은 색(Color)이라면 다른 색을 쓴 것이 잘 보인다. 대개의 경우 강조를 위해 보색을 쓰는 경우가 많 다. 인쇄물의 보색과 스크린상의 보색이 다름을 인지하고 선정하는 것이 중요하다. 문화적 환경에 따 라 다른 의미를 지닌다. 크기나 명암과 달리 수치로 표현하기 힘들다. 본질적으로 정량적인 속성이 아 니기 때문이다. 순서를 매기기에는 적합하지 않다. 정보를 전달할 때 색상에만 의존해서는 안 된다.
  67. 67. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  명도  하나만 명도(Value)가 유난히 높거나 낮다면 이것 또한 비교돼 잘 보일 수 있다. 명도가 높고 낮음은 색상보다 더 명시성에 영향을 준다.
  68. 68. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  기울기  같은 것들 중 하나의 기울기(Orientation)에 변화를 주어 시선을 유도할 수 있다. 시선은 반복에서 벗어나 변화를 감지해 강조한다고 느낀다.
  69. 69. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 정보 표현을 위한 그래픽 요소  질감  같은 색상과 형태일지라도 질감(Texture)을 틀리게 주면 강조하게 만들 수 있다. 질감을 지나치게 많 이 쓰면 좋지 않은 결과를 가져올 수 있으므로 신중하게 선택할 필요가 있다.
  70. 70. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  전체적인 질적 향상을 위해 그래픽 디자인 기본 원리를 바탕으로 완성 : 타이포그래피, 그리드, 색상, 아이 소타이프는 시각화 결과물의 질적인 부분을 크게 좌우 1. 타이포그래피  정보 디자인에 있어서는 3가지 보다는 2가지의 서체 또는 1가지의 서체에 크기나 스타일의 변화를 주어 쓰는 것이 중요  가급적이면 영문과 한글 각각 한가지 서체를 쓰거나 한글서체를 한가지 정하고 이를 변화해 쓰는 것 이 효과적, 한글서체와 영문서체를 비슷한 느낌으로 주는 것이 좋음
  71. 71. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  먼터번드(Munterbund)는 책에 있는 에세이들에서 텍스트 유사성을 그래픽 시각화의 결과로 보여줌  에세이의 매력과 정보를 나타내는 그래픽과 타이포그래픽의 표현을 형태를 찾는데 초점  미리 정의 된 규칙에 따라서 그래픽을 자동으로 생성하는 시스템을 개발해 적용  한가지 서체만을 이용해 크기의 변화  범계를 같은 크기로 하고, 콘텐츠는 가중치에 따라서 크기를 변화해 표현 먼터번드 http://www.munterbund.de/visualisierung_textaehnlichkeiten/essay.php
  72. 72. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 1) 서체  3가지 보다는 2가지의 서체 또는 1가지의 서체에 크기나 스타일의 변화를 주어 쓰는 것이 중요  가급적이면 영문과 한글 각각 한가지 서체를 쓰거나 한글서체를 한가지 정하고 이를 변화해 쓰는 것 이 효과적, 한글서체와 영문서체를 비슷한 느낌으로 주는 것이 좋음  서체 저작권 문제가 민감하므로 웹이나 인쇄용으로 퍼블리싱 하는 경우 공개 폰트를 쓰는 것이 바람 직하 2) 무게  글자의 무게는 글자를 구성하는 획의 두께를 의미  시각적 정보 표현에서는 심리적 무게감에 따라 정보의 위계 표현이 가능  굵은 서체는 무게가 무거워 보이기 때문에 가는 서체 와 함께 사용하면 위계 표현이 가능
  73. 73. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 3) 크기  글자 크기는 실제 글자의 크기가 아니라 글자가 배치 되는 금속 활자판의 높이를 의미, 따라서 같은 크기라 해도 서체에 따라 실제 글자의 크기가 달라짐  글자 크기는 정보의 중요성 및 위계 관계를 보여줄 수 있으므로 글자 크기는 어느 요소를 강조하거나 그 반 대의 경우에도 사용한 4) 스타일  서체는 가로 세로의 비율, 각도에 따라 그 스타일이 달 라짐  이탤릭체와 같이 기울이거나 장체, 평체 처럼 글자의 폭을 좁히거나 넓히기도 함  정보의 차별화나 강조 등을 위해 선택적으로 사용
  74. 74. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 6) 간격(글자 사이, 낱말 사이, 글줄 사이)  가독성에 큰 영향을 미침  읽어야 할 다음 글자가 다른 글자보다 근접해 있어야 하며 이 때문에 글자 사이보다 낱말 사이 가, 낱말 사이보다 글줄 사이가 넓어야 함 5) 색채  명도, 채도, 색상의 색채 속성을 활용해 정보를 분류할 수 있으 며, 정보의 중요도나 종속의 관계표현이 가능  글자가 놓이는 바탕색에 크게 영향을 받으며, 빛으로 글자를 표현하는 경우 청색은 후퇴돼 보이기 때문에 자제해야 함
  75. 75. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 2. 색상  흔히 많이 저지르는 실수 중 하나가 여러 색상을 함께 쓸 때 채도를 달리하면서 균형을 깨는 것  색상을 쓸 때, 두 가지 색을 쓰는 경우 보색을 이용하고 명도와 채도를 같게 하면 됨  시각화 결과물을 컴퓨터 모니터에서 제공한다면 가산혼합 보색을 이용해야 함  컬러 스킴 : 스크린에서 구현하기에 적절한 보색 및 배색 색상 팔레트를 추출 http://paletton.com  어도비의 쿨러 : 색상 팔레트 외에 공유된 단어와 관련된 배색 팔레트를 가져다 쓸 수 있음 어도비 쿨러 https://kuler.adobe.com/
  76. 76. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  데이비드 맥캔들레스(David Mccandless)의 비타 민과 같은 의학 보조제를 시각화한 스네이크 오일 (Snake Oil) 프로젝트를 보면, 색상을 효과적으로 사용하고 있음  풍선경주(Balloon Race)라 불리는 이 버블차트에 서는 위쪽으로 갈수록 보충제에 대한 효과가 입증 된 것으로 볼 수 있음  증명된 의학적 근거가 있는 상단 버블은 파란색을, 그렇지 않은 것은 초록색에서 노란색까지의 그라 데이션으로 표현  풍선의 크기는 구글 검색어 기준 인기도에 비례  색상과 크기를 통해 즉각적으로 효과와 선호하는 보충제의 인기를 동시에 파악 가능 스네이크 오일 http://www.informationisbeautiful.net/play/snake -oil-supplements/
  77. 77. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 1) 구분 표현  색상은 정보를 구분하고 묶는 데 사용  시각적 대상물 구별에 색을 이용하는 것이 편리한 방법이고 쉽게 인지될 수 있기 때문  색은 인간의 인지를 고려할 때 사용 숫자를 제한할 필요가 있음. 인간의 단기 기억력은 장기 기억력 과 달리 시간이 조금만 흘러도 올바로 기억하지 못하기 때문. 보통 사람이 분명하게 구분할 수 있는 색상은 대략 8가지 2) 순서 표현  순서나 위계가 필요한 정보는 색의 단계로 표현 가능  검은색에서 하얀색으로 이어지는 명암 단계나, 스펙트럼에서 빨간색으로부터 녹색으로 이어지는 단 계, 노란색에서 파란색으로의 단계를 이용해 분명하게 구분하면 위계를 명확히 할 수 있음  순서와 위계는 색의 채도 단계로도 표현 가능  섬세한 순서와 상태를 표현하는 데는 무채색의 단계가 정보를 더 명확하게 전달  명도와 채도의 복합 개념이라 할 수 있는 톤은 선형적 단계를 표현하므로 정보의 순서와 위계를 표현 하는 데 활용가능
  78. 78. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 웹 페이지 영역에서 마우스 클릭 수를 적외선 열지도로 표현한 예시 http://wel.cs.manchester.ac.uk/studies/saswat/ticker.php 3) 비율 표현  비율을 색으로 정확하게 표현할 수는 없지만, 시각적으로 구별할 정도로 표현가능  비율의 연속은 0을 중심으로 0을 중립적인 명도로 표시하고 위, 아래의 수치들은 상반되는 두 가지 색을 사용 : 예를 들어 회색을 기준으로 0이라 했을 때, 빨간색이 늘어나면 부정적 수치가 증가하는 것이고, 녹색이 늘어나면 긍정적 수치가 늘어나는 것
  79. 79. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  4) 색채 사용과 인지  색을 통해 정보를 이해할 때 인간의 지각과 인지 작용이 관여  지각된 색채 정보들이 서로 충돌 없이 인지될 때 정보의 해석이 빠르고 수행 결과도 최적화  색의 잘못된 사용으로 사람이 인지할 때 혼란을 야기  금지를 상징하는 붉은색과 허용을 상징하는 녹색이 반대의 의미로 사용돼 기존의 지식이나 관습과 충돌하기 때문
  80. 80. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 3. 그리드  현대 디자인에서 가장 중요한 원리 중 하나가 그리드를 이용하는 것  단지 데이터만 제시하는 등의 단순 시각화를 할 때는 적게 적용되지만 디자인 안에 여러 요소를 복합 적으로 배치할 때는 반드시 그리드를 계획하고 지켜야 시각적으로 우수한 디자인으로 완성  인쇄 디자인뿐 아니라, 모션 인포그래픽과 인터랙션 정보 디자인에서도 그리드는 중요한 요소  그리드를 이용해 블록 레이아웃을 잡고 그 위에 요소를 효율적으로 올려놓아 전체적인 조화 추구가 중요
  81. 81. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  니콜라스 펠톤은 자신의 데이터를 이용해 2005년 첫 번째 개인 연차 보고서를 발표한 이래 매년 발표해 오고 있다. 펠톤의 연감을 보면 타이포그래피와 그리드를 이용해 정보 디자인의 완성도를 끌어올림 좌측 페이지와 우측 페이지에 각각 4단 그리드를 구성하고 좌에서 우를 가로지르는 숫자들의 위치도 그리 드에 맞추어 같은 위치에 구성 니콜라스 펠톤의 2012 연차 보고서 http://feltron.com/ar12_03.html
  82. 82. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 1) 하나의 화면을 읽는 방식  디자인 요소를 레이아웃 안에 배치할 때 사람의 눈이 움직이는 방향을 생각해야 함  사람의 눈은 이미지나 본문을 훑어볼 때 하나의 화면의 특정 영역에서 다른 부분보다 더 뜨겁고 활발한 움직임이 드러남  인간의 눈은 습관적으로 상단 왼쪽의 입구를 본 다음 하단 오른쪽 귀퉁이로 훑어 내려감  아래 예제에서 색의 농도는 가장 강하게 주목하는 초점이 어디인지를 보여줌  이러한 원리를 이용하여 주요 디자인 요소를 더 두드러지거나 아니면 눈에 덜 띄게 배치 가능
  83. 83. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  2) 정보의 역피라미드  가장 중요하고 강력한 정보가 맨 위로 가고 이차 정보가 뒤 따르며 더 일반적인 정보는 마지막에 온다  보는 사람이 화면의 모든 텍스트를 읽지 않을 것이므로 가 장 중요한 정보가 앞장서고 그 다음 중요한 것이 뒤따라야  디자인 구조는 그리드 상단을 효과적으로 이용하고 극대화 할 필요가 있음
  84. 84. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리 3) 망 그리드  개략적인 그리드를 갖고 작업하면 배치할 때 선택안이 줄어들겠 지만 일관성이 생기고 실험의 여지도 남겨 놓기 때문에 역설적으 로 디자인이 쉬워짐  망 그리드는 수평선과 수직선의 연속이 개체를 배치하는 지침이 돼 일관성 있고 정확하게 개체를 배치 가능 4) 3등분의 법칙  이 법칙은 이미지 구도와 레이아웃의 지침으로 한 개의 화면 에 3×3 그리드를 포개 그리드 선이 교차하는 곳을 적극적 핫스팟으로 삼아 역동적인 결과를 배치  우측에 보이는 점들이 핫스팟으로, 한 핫스팟에 항목들이 규 칙적으로 떨어지지는 않아도 핵심 요소를 그 가까이에 배치 하면 구성에 역동성을 더할 수 있음
  85. 85. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  4. 아이소타이프  아이소타입(ISOTYPE, International System of Typographic Picture Education)은 많은 양의 데 이터를 쉽게 지각할 수 있도록 도와주는 시각표현 방법  1930년대에서 40년대 사회학자이자 철학자 오토 노이라트(O. Neurath), 교육학자 마리 라이데마 이스터(M. Reidemeister)와 미술가 게르트 아른츠(G. Arntz)를 중심으로 개발된 시각언어체계  국제적인 그림 언어 체계로, 갖가지 지식을 조직적으로 시각화  정보, 자료, 개념, 의미 등을 나타내기 위해 문자와 숫자 대신 상징적 도형이나 정해진 기호를 조합해 시각적이고 직접적으로 나타내는 방식  교육을 목적으로 특정 단어나 문장을 간략화한 도형으로 제작해 국제적으로 통용할 수 있는 소통 수 단으로 삼으려 함  하나의 기호가 일정 수량을 대표한다는 것이 중요 : 각종 시각적 수단을 통해 정보를 소통해온 인류 의 전통에 기대고 있어, 아이소타이프 도표의 기호들은 시공간을 초월해 읽혀야 함 게른 아르츠 웹아카이브 : http://www.gerdarntz.org/
  86. 86. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각화를 위한 그래픽 디자인 기본 원리  1960년부터 활동한 미국 디자이너 리처드 솔 워먼  ‘이해를 결정하는 것은 사물 그 자체가 아니라 우리가 사물과 함께 연상하는 의미나 패턴’  이미지를 활용해 정보를 명확하게 전달하는 방식  아이소타입은 그래프를 표현하는 수단으로도 자주 활 용  최근 들어 아이콘 등으로 발전 동물은 얼마나 오래 사는가? http://visual.ly/how-long-do-animals-live
  87. 87. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  인터랙션  빅데이터의 시각화를 위해서는 대량의 데이터를 정보로서 의미 있고(meaningful) 이해할 수 있으 며(undestandable) 유용한(usable) 기술과 방법으로서 인터랙션이 많이 이용된다. 또한 시각화 툴 자체가 인터랙션 형태로 이뤄진 경우가 많으며 이러한 빅데이터 시각화에서의 인터랙션은 사용자 스 스로 정보를 필터링하고 탐색하는 과정에서 인사이트를 얻어갈 수 있는 기회를 제공한다.  디지털 미디어의 정보 디자인은 인터페이스와 인터랙션의 문제와 연계되며, 이러한 분리할 수 없는 관계가 설정된다. 특히 정보 디자인에서 디지털 미디어의 인터페이스와 인터랙션은 상호 의존적이다 . 대부분의 인터랙션 위에 구현된 정보 디자인은 비선형적 구조로, 정보 제시 순서가 고정돼 있지 않 고 사용자가 정보에 임의로 접근하고 선택적으로 탐색할 수 있다.  이는 정보 전달과정에서 시간 제약이 없으므로 사용자의 정보 이용이 능동적이며, 비교적 자세하게 탐색하므로 정보의 전달효과 또한 높다. 정보 메시지도 다양하게 조직화할 수 있으며, 디지털 미디어 의 상호작용 특성으로 정보의 폭과 깊이를 사용자가 통제할 수 있다.
  88. 88. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  디지털 환경에서 정보 전달을 위한 인터랙션은 사용자에게 데이터와 정보를 단순히 전달하는 것이 아니라, 정보 사용자의 행동이나 조작에 따른 반응, 감각의 확장, 정보 시각화의 변화 등으로 정보와 정보 사용자 간의 관계를 확장하고 심화하는 것이다.  정보를 둘러싸고 생성된 인터랙션은 정보 사용자에게 인상에 남는 다른 모습을 보여주는 것이며, 정보에 대한 흥미성을 높이고 궁극적으로 정보에 대한 새로운 경험을 제공한다. 인터랙션은 사용자 참여를 유도해 적극적으로 정보에 접근하게 하며, 흥미를 유발해 정보에 대한 관여도를 높이는 역할을 한다.
  89. 89. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  1. 강조하고 디테일을 보여주는 방식  ‘웹의 진화(Evolution of the Web)’라는 시각화 프로젝트는 하이라이트 방식의 강조를 이용해 사용자의 적극적 개입을 유도한다. 색상이 들어간 곡선들은 다른 브라우저에서 적용되는 기능과 마찬가지로 사용자의 마우스 움직임에 반응하며 강조된다. 웹의 진화 http://visual.ly/evolution-web?view=true
  90. 90. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  2. 사용자가 콘텐츠를 선택하는 방식  인터랙티브 시각화의 장점 중 하나는 콘텐츠 보는 방식을 사용자가 결정할 수 있다는 것이다. 사 용자는 데이터 변환 컨트롤을 이용해 다른 구조의 비슷한 데이터세트를 불러오는 템플릿 위에 자 신이 필요한 데이터만을 취사선택해 볼 수 있다. 이러한 방식의 인터랙티브 시각화는 비교 가능 한 통계 그래프보다 더 많은 데이터 세트를 관찰할 수 있도록 한다.
  91. 91. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 당신과 같은 가구는 얼마나 있는가? http://www.nytimes.com/interactive/2011/06/ 19/nyregion/how-many-households-are-like- yours.html?_r=0)  그 예로 '당신과 같은 가구는 얼마나 있는가?(How Many Households Are Like Yours?)'에서 사용자는 가족구성원을 더하거나 빼면서 기본 가구타입을 선택할 수 있다. 변경의 경우에, 즉각적으로 반영되는 시 각화된 정보가 보여진다. 이러한 인터랙션은 수많은 가구타입을 데이터를 한꺼번에 보지 않아도 많은 다른 종류의 가구 타입의 데이터를 보는 것을 가능하게 한다.
  92. 92. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 네 돈은 어디로 가는가 http://wheredoesmymoneygo.org/bubbletree-map.html#/~/total  지출 카테고리를 보여주는 '내 돈은 어디로 가는가?(Where Does My Money Go?)'의 인터랙티브 시각 화 프로젝트는 위계적인 원 모양의 드릴다운 내비게이션 버블로 구성됐다. 사용자가 아이, 형제자매, 부모 지출 카테고리 버블을 선택하면 내비게이션 요소는 선택된 버블로 확대된다. 버블 크기는 지출 규모다.
  93. 93. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  3. 여러가지 방법으로 데이터 보여주기  단일 그래픽 표현은 전형적으로 한 번에 특정 방법으로 몇 차원만을 보여줄 수 있다. 예를 들면, 지도는 지리적 위치와 시간 흐름의 타임라인을 강조한다. 지도에서의 축소/확대 기능인 팬앤줌 (pan and zoon)과 같은 인터랙션은 잘 알려진 표현방법이다. 다중 기준 부분을 복합하고 조정 해, 사용자는 같은 시간에 데이터세트의 다른 면을 볼 수 있다.
  94. 94. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 트위터에서 소문이 어떻게 퍼지나 http://www.theguardian.com/uk/interactive/2 011/dec/07/london-riots-twitter  가디언지가 선보인 트위터에서 소문이 어떻게 퍼지나(The How Riot Rumours Spread on Twitter) 시 각화는 버블차트의 콘텐츠를 조정하기 위해 선그래프를 이용한다. 선그래프는 소문과 관계된 시간당 트위 트들과 중요한 이벤트들을 강조해 보여준다. 버블차트는 다른 트위트들도 보여주는데, 이 트위트와 관련된 정보다. 사용자는 애니메이션으로 시각화를 실행할 수 있고, 직접 인터랙션해볼 수도 있다.
  95. 95. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 CNN의 홈어웨이 http://edition.cnn.com/SPECIALS/war.casualties/index.html  CNN의 홈앤어웨이(Home and Away) 시각화 프로젝트는 화면 하단의 다중 조절 막대그래프를 사용해 나이, 지역, 날짜를 필터링한 정보를 맵 위에 보여준다.
  96. 96. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  4) 사용자에 의해서 시각 맵핑 변화  멀티 조정 시각화(Multiple coordinated visualizations)는 각각의 시각화가 있는 작은 화면 공 간이라는 제약을 벗어나 동일 시간대에 데이터의 다양한 관점을 보여준다. 사용자가 시각화 유형 을 지정할 수 있도록 시각 데이터 재매핑을 지원하며, 시각화 크기를 극대화하도록 한다.
  97. 97. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 뉴욕타임즈’의 허리케인 아이린에 따른 홍수․정전․폭우와 피해 http://www.nytimes.com/interactive/2011/08/27/us/preparations-for-hurricane-irene-and-reports-of-damage.html  ‘뉴욕타임즈’의 허리케인 아이린에 따른 홍수․정전․폭우와 피해라는 인터랙티브 시각화는 사용자가 설정 할 수 있는 4개의 다른 맵을 제공한다. 사용자가 다른 설정을 선택할 때, 데이터가 맵 위의 시각 레이어를 프로젝션하는 방식으로 나타난다. 허리케인의 경로를 포함한 지도와 그 이후의 스토리는 일정한 프레임에 참고자료로 제공된다.
  98. 98. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션  5. 사용자의 관점과 의견이 반영되는 형태  인터랙션 시각화의 가장 매력적인 부분은 사용자의 관점과 의견이 반영될 수 있도록 한다는 데 있다. 사용자의 주관적 관점과 데이터 표현을 혼합하는 시각화는 주제를 표현하는 사용자 반응 프로세스의 가장 중요한 부분이다. 에드워드 터프트(Edward Tofte)는 ‘훌륭한 시각 디자인은 시각적으로 표현된 명쾌한 생각’이라고 말했다. 보는 이의 인지적인 과업과 디자인 원칙을 깊이 이해해야 훌륭한 시각화 작업을 할 수 있다.
  99. 99. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 인터랙션 OECD의 더 나은 삶 지수 http://www.oecdbetterlifeindex.org/  OECD의 더 나은 삶 지수 시각화는 국제협력개발기구(OECD)가 개발한 것으로 각 국가를 나타내는 꽃은 11개의 꽃잎으 로 구성돼 있다. 각 꽃잎은 주거환경, 보시, 가구별 소득 같은 OECD에서 수집한 개별 항목을 나타낸다. 나라의 꽃이 높게 있으면 해당 국가의 웰빙 예측치가 높은 것을 의미한다. 또한 이 시각화는 인터랙티브 버전으로 거주, 삶의 만족도, 교육 등의 다른 주제의 중요 비율을 사용자가 설정하도록 한다. 각 주제 측정은 사용자가 생각하는 주관적인 지표에 의해 결정 된다. 개인적으로 중요하게 생각하는 것은 다른 통계 그룹과 비교돼 결과치를 소셜 미디어를 통해 공유할 수 있다.
  100. 100. 시각화의 정의 시각화 프로세스 시각화 방법 빅데이터와 시각화 디자인 시각 정보 디자인 7원칙 터프티의 시각정보 디자인 7원칙  시각 정보 디자인 7원칙  위의 정보 구조화, 정보 시각화, 정보 시각표현을 거쳐 최종적으로 시각화가 완성된다고 할 수 있 다. 에드워드 터프티(Edward Tofte)는 다음과 같은 시각정보 디자인 7원칙을 제시한다. 에드워드 터프트(Edward Tofte)는 ‘훌륭한 시각 디자인은 시각적으로 표현된 명쾌한 생각’이라고 말했다. 보는 이의 인지적인 과업과 디자인 원칙을 깊이 이해해야 훌륭한 시각화 작업을 할 수 있다.  에드워드 터프트(Edward Tofte)는 ‘훌륭한 시각 디자인은 시각적으로 표현된 명쾌한 생각’이라고 말했다. 보는 이의 인지적인 과업과 디자인 원칙을 깊이 이해해야 훌륭한 시각화 작업을 할 수 있다. 1. 시각적 비교를 강화하라 연과된 변수와 트렌드를 비교할 수 있는 도구를 제공해야 한다. 정보는 비교를 통해 사용 자에게 더욱 가치가 올라간다. 2. 인과관계를 보여라 정보를 디자인할 때 원인과 결과를 명쾌하게 제시하라. 3. 다중변수를 표시하라 여러 개의 연관된 변수를 활용해 정보를 표현하는 데이터도 있다. 4. 텍스트, 그래픽, 데이터를 조화롭게 배치하라 라벨과 범례가 도표에 녹아 있는 다이어그램이 더욱 효과적이다. 5. 콘텐츠의 질과 연관성, 진실성을 분명히 하라 보여주려는 정보가 과연 사용자가 특정 목적을 달성하는 데 도움이 되는지를 고민하라 6. 시간순이 아닌 공간순으로 나열하라 시간보다는 공간에 따라 나열할 때 사용자의 이해가 쉬워진다. 7. 정량적 자료의 정량성을 제거하지 마라 트렌드를 나타내기 위해 정량적 자료를 그래프나 도표로 표현할 수 있다. 정량적인 정보를 한 눈에 파악할 수 있기 때문이다.

×