4. 2. 시도 , 시군구, 행정경계 column을 하나의 column으로 합치기
시도 ->Edit cells -> Transform -> 표현식 입력
cells["시도"].value+ " "+cells["시군구"].value+" "+cells["읍면동"].value
DATA 정리
1. Google Open refine 이용, 전국 읍,면,동 별 평균연령 xlxs 파일 열기
총 3549개의 읍,면,동 주소파일이 열릴 것이다.
5. 3. 필요 없는 column 없애기
시군구/읍면동/ 남/ 여 column -> Edit column -> Remove this column
시도와 평균연령 Column만 남긴다.
DATA 정리
6. 4. www.biz-gis.com에 들어가서 정리한 주소를 지오코딩 한다.
지오코딩 된 좌표는 Katec으로 저장하고, 앞서 Open refine으로 정리한 자료와 합친다.
5. 합친 자료는 ‘전국읍면동평균연령csv’ 파일로
다른 이름 저장한다.
DATA 정리
7. 6. QGIS를 열어서 읍,면,동 행정경계shp, STARBUCKSshp,
전국읍면동평균연령 csv 파일을 오픈한다.
: 전국 읍,면,동의 수가 너무 많으므로 (3549개) 분석과 시각화가 용이하게
상위와 하위 500개만을 선택하여 분석해 보자
DATA 분석 및 시각화
8. 7. 전국 읍,면,동 평균연령 중 낮은 순으로 500개를 새로운 파일로 저장한다.
전국 읍면동 평균연령 파일 우 클릭 -> 속성테이블 -> 평균연령 오름차순으로 정리
-> 위에서 부터 500개를 선택 -> 전국 읍면동 평균연령 파일 우 클릭 ->
선택된 객체 다른 이름으로 저장 클릭 -> 읍면동 평균연령 낮은순500 으로 다른 이름 저장
DATA 분석 및 시각화
9. 8. 전국 읍,면,동 평균연령 중 높은 순 으로 500개를 새로운 파일로 저장한다.
전국 읍면동 평균연령 파일 우 클릭 -> 속성테이블 -> 평균연령 내림차순으로 정리
-> 위에서 부터 500개를 선택 -> 전국 읍면동 평균연령 파일 우 클릭
-> 선택된 객체 다른 이름으로 저장 클릭 -> 읍면동평균연령높은순500 으로 다른이름 저장
DATA 분석 및 시각화
10. 9. 지도 위에 표시된 속성들을 구분할 수 있게, 다른 아이콘과 색상으로 바꿔준다.
레이어 우 클릭 -> 속성 -> 아이콘과 색상 , 크기를 선택
10. 개별 속성들마다 지도 위에 다르게 표시된 것을 볼 수 있다.
지도 위에 시각화된 데이터를 보며 일정한 패턴을 분석해 보자
DATA 분석 및 시각화
11. ㅂ분석 결과
다음 인포그래픽스를 보면,
읍,면,동 평균연령이 낮은 지역을 나타내는 아이콘과 Starbucks 지점을 나타내는 아이콘이
많은 부분 겹치는 것을 알 수 있다.
반면에 읍,면,동 평균연령이 높은 지역을 나타내는 아이콘의 경우 Starbucks 지점을 나타내는
아이콘과 거의 겹치지 않는 것을 알 수 있다.
즉,
읍,면,동 평균연령이 낮을수록, 해당 지역에 Starbucks 지점이 많이 분포되어 있으며
읍,면,동 평균연령이 높을수록, 해당 지역에 Starbucks 지점이 적게 분포되어 있다.
는 사실을 알 수 있다.