국민체감 통계서비스, 국민이 직접 디자인, 국민이 평가. (통계청 정부3.0)
통계청(청장 유경준)은 국민중심의 통계서비스 발굴을 위해 국민디자인단을 운영하고, 2016.9.8(목) 대전 통계센터에서 그 활동성과를 공유하는 발표대회를 가졌다.
통계청은 그동안 통계가 국민에게 어떻게 서비스되어야 하는지에 대한 해결책을 찾기 위해 3개 과제 21명의 국민디자인단을 구성하여, 지난 4월부터 7월까지 약 4개월간 서비스디자인 활동을 진행해 왔다.
통계청은 국민디자인단이 제시하는 통계서비스 정책에 대해 어떤 정책이 국민에게 가장 필요한 서비스인지를 국민이 직접 평가할 수 있도록 했다. 국민평가단을 모집한 결과 전국 각지에서 많은 국민들이 신청하였고 이 중 30여명을 선정하여 현장 투표방식으로 국민이 체감하는 우수사례 선정에 참여하였다.
[2016 통계청 국민디자인단 과제 소개]
우수상
‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네!
서비스디자이너 : 하광수 한밭대학교 시각디자인과 교수
대학원생 B씨는 졸업논문 때문에 오랜만에 KOSIS를 다시 접해보게 된다. 과거 통계와 관련된 용어를 정확히 넣어야 원하는 정보를 얻었던 것과 달리 유사한 용어를 입력하여도 연관검색어를 통하여 원하는 정보를 빠르게 얻을 수 있도록 개선되어 있었다.
그래도 못 찾는 통계정보를 질문하니 놀랍게도 하루도 안 되어 다른 이용자가 내가 원하는 정보의 위치를 알려주었다. 논문작성에 필요한 통계정보를 든든하게 확보한 B씨는 역시 ‘통계’하면 통계청
‘KOSIS!’구나.. 하고 느꼈다.
국민디자인단 구성
01 일반국민 (김민경 씨, 허선념 씨)
02 전문가 (김유미 과장_유코아 디자인사업부)
03 대학생 (민경은 학생)
04 주관 공무원 (이주원 사무관, 심현수 주무관)
05 서비스디자이너 (하광수 교수_한밭대학교)
06 그 외 관계자(서비스 개발자, 서비스 관련 공무원 등)
진행경과
01 환경 이해: 서비스 이해 및 현황 파악 (1 week)
서비스의 이유와 목적에 대한 이해, 서비스 현황파악
서비스를 둘러싼 환경에 대한 이해
02 문제 발견: 서비스 이해관계자 경험 이해하기 (2, 3, 4 week)
서비스와 관련된 이해관계자에는 어떤 문제를 격고 있는가
서비스를 이용하는 고객은 어떤 사람이고 어떤 문제를 격고 있는가
03 문제 정의: 대상사용자 경험 모델링 및 문제점 도출 (5, 6 week)
서비스를 이용하는 주된 고객은 어떤 사람인가 (퍼소나)
고객은 어떤 절차로 서비스를 경험하고 사용하는가(고객여정)
04 문제 해결: 서비스 컨셉 아이디어 (7, 8 week)
서비스 타입에따른 서비스 시나리오 제안
핵심 아이디어
Ideation Workshop을 통해 프로젝트 기간동안 분석된 송윤희씨의 경험과정을 바탕으로 사용자가 처한 각 과정의 문제점과 경험적 특징요인을 격려 함으로서 사용자 경험을 극대화 할 수 있는 아이디어를 도출하고 제안하였다. 아이디어는 4가지 측면에서 검토 되었다.
1. 스스로 찾아오는 사용자
2. 검색을 사용자에게 돌려주는 방법
3. 쇼핑같은 즐거운 경험
4. 참여하는 통계, 공감하는 통계
...
담당자 :안성문
담당부서 : 통계청 창조행정담당관실
출처 : 통계청 보도자료 http://goo.gl/EDjyR5
국민체감 통계서비스, 국민이 직접 디자인, 국민이 평가. (통계청 정부3.0)
통계청(청장 유경준)은 국민중심의 통계서비스 발굴을 위해 국민디자인단을 운영하고, 2016.9.8(목) 대전 통계센터에서 그 활동성과를 공유하는 발표대회를 가졌다.
통계청은 그동안 통계가 국민에게 어떻게 서비스되어야 하는지에 대한 해결책을 찾기 위해 3개 과제 21명의 국민디자인단을 구성하여, 지난 4월부터 7월까지 약 4개월간 서비스디자인 활동을 진행해 왔다.
통계청은 국민디자인단이 제시하는 통계서비스 정책에 대해 어떤 정책이 국민에게 가장 필요한 서비스인지를 국민이 직접 평가할 수 있도록 했다. 국민평가단을 모집한 결과 전국 각지에서 많은 국민들이 신청하였고 이 중 30여명을 선정하여 현장 투표방식으로 국민이 체감하는 우수사례 선정에 참여하였다.
[2016 통계청 국민디자인단 과제 소개]
우수상
‘통계’ 하면 통계청 ‘KOSIS!’, 내가 필요한 정보는 꼭 집어주네!
서비스디자이너 : 하광수 한밭대학교 시각디자인과 교수
대학원생 B씨는 졸업논문 때문에 오랜만에 KOSIS를 다시 접해보게 된다. 과거 통계와 관련된 용어를 정확히 넣어야 원하는 정보를 얻었던 것과 달리 유사한 용어를 입력하여도 연관검색어를 통하여 원하는 정보를 빠르게 얻을 수 있도록 개선되어 있었다.
그래도 못 찾는 통계정보를 질문하니 놀랍게도 하루도 안 되어 다른 이용자가 내가 원하는 정보의 위치를 알려주었다. 논문작성에 필요한 통계정보를 든든하게 확보한 B씨는 역시 ‘통계’하면 통계청
‘KOSIS!’구나.. 하고 느꼈다.
국민디자인단 구성
01 일반국민 (김민경 씨, 허선념 씨)
02 전문가 (김유미 과장_유코아 디자인사업부)
03 대학생 (민경은 학생)
04 주관 공무원 (이주원 사무관, 심현수 주무관)
05 서비스디자이너 (하광수 교수_한밭대학교)
06 그 외 관계자(서비스 개발자, 서비스 관련 공무원 등)
진행경과
01 환경 이해: 서비스 이해 및 현황 파악 (1 week)
서비스의 이유와 목적에 대한 이해, 서비스 현황파악
서비스를 둘러싼 환경에 대한 이해
02 문제 발견: 서비스 이해관계자 경험 이해하기 (2, 3, 4 week)
서비스와 관련된 이해관계자에는 어떤 문제를 격고 있는가
서비스를 이용하는 고객은 어떤 사람이고 어떤 문제를 격고 있는가
03 문제 정의: 대상사용자 경험 모델링 및 문제점 도출 (5, 6 week)
서비스를 이용하는 주된 고객은 어떤 사람인가 (퍼소나)
고객은 어떤 절차로 서비스를 경험하고 사용하는가(고객여정)
04 문제 해결: 서비스 컨셉 아이디어 (7, 8 week)
서비스 타입에따른 서비스 시나리오 제안
핵심 아이디어
Ideation Workshop을 통해 프로젝트 기간동안 분석된 송윤희씨의 경험과정을 바탕으로 사용자가 처한 각 과정의 문제점과 경험적 특징요인을 격려 함으로서 사용자 경험을 극대화 할 수 있는 아이디어를 도출하고 제안하였다. 아이디어는 4가지 측면에서 검토 되었다.
1. 스스로 찾아오는 사용자
2. 검색을 사용자에게 돌려주는 방법
3. 쇼핑같은 즐거운 경험
4. 참여하는 통계, 공감하는 통계
...
담당자 :안성문
담당부서 : 통계청 창조행정담당관실
출처 : 통계청 보도자료 http://goo.gl/EDjyR5
Characterizing a User from Large-scale Smartphone-sensed DataLeeSoomin6
In this study, researchers tried to characterize users with semantic labels by collecting smartphone log data and extracting features from them. With the extracted features, each user could be represented as a 'feature vector'.
Characterizing a User from Large-scale Smartphone-sensed DataLeeSoomin6
In this study, researchers tried to characterize users with semantic labels by collecting smartphone log data and extracting features from them. With the extracted features, each user could be represented as a 'feature vector'.
2. Table of Contents
1. 도입
1.1 주제 선정
1.2 주요 국가 선정
1.3 연휴 기간 설정
2. 분석
2.1 분석 모델 선정
2.2 임펄스 반응 함수
2.3 소비 형태 분석
3. 결론
3.1 시계열 분석 결과
3.2 제안
4. 추가
4.1 문제점
4.2 딥러닝 추천시스템
4. 주제 선정
관광산업은 우리나라 경제에서 73조원(2015년 기준)을 차지하는 상당한 규모의
산업이다.
특히, 외국인 관광객의 유치는 단지 수익이 늘어나는 것 뿐만이 아닌 문화적 파
급력, 나라의 위상 제고 등 다양한 역할을 기대할 수 있다는 데 의의가 크다. 따라
서 이번 분석을 통해 어떤 요인이 외국인 관광객 수에 어떤 영향을 미치는 지를 확
인하고 외국인의 관광 및 소비 패턴을 파악함으로서 관광자원을 효율적으로 활용
하고 방문한 외국인들의 만족도를 제고하는 자료를 제공하고자 한다. 또한 최근
발생한 THAAD사태를 통해 관광산업에 있어 보다 많은 국가에 다양한 관광 포트
폴리오를 제공하는데 기여하고자 한다.
더불어 아직 우리나라 관광지를 잘 모르는 외국인들을
대상으로 관광지 추천시스템을 도입하여, 관심을 유도해
다양한 나라에서부터의 관광객을 모집하고자 한다.
1.1 주제 선정
7. 주요국가의 연휴기간 설정
국가마다 연휴일이 다르고, 년도 별로도 다르기 때문에 직접 연휴기간에 대한 전수조사를 시행하였다.
월별로 토요일, 일요일을 제외한 휴일을 카운트하여 데이터 셋을 생성하였다.
기간 휴일
2016-01 1
2016-02 5
2016-03 0
2016-04 1
2016-05 1
2016-06 2
<데이터셋 구성 방법의 예시>
1.3 연휴 기간 설정
9. 국가별로 휴일이 우리나라로 여행 오는 것에 영향을 미치고 있는지를 확인하기 위해 다변량 시계열
(Multivariate Time Series)모델을 활용하기로 하였다.
Impulse Response Function
어떤 시계열이 t=0 일 때 1이라는 값을 가지고 t<0 또는 t>1 일 때는 0인 것을 임펄스(impulse)라고 한다.
임펄스 형태의 시계열이 다른 시계열에 미치는 영향을 시간에 따라 표시한 것이 임펄스 반응 함수(impulse
response function)이다. VAR 모형에서는 원소를 이루는 여러개의 시계열 간의 상호상관관계를 기반으로 각각
의 원소가 다른 원소에 어떤 영향을 주는지를 임펄스 반응 함수로 구할 수 있다.
분석 모델 선정
Python statsmodels 패키지는 VAR(Vector Auto-Regressive) 모형 분석 및 추정을 위해 다음과 같은 클래스
를 제공한다.
클래스 이름 용도
VARProcess 미리 정해진 계수를 가진 VAR 모형
VAR 주어진 자료에서 계수를 추정하기 위한 VAR 모형
VARResults 주어진 자료에서 추정된 VAR 모형
2.1 연휴 기간 설정
10. Impulse Response Function(중국)
방문자수 데이터와 연휴기간 데이터를 결합하여 분석을 시행했다. 방문자수의 경우 기간이 지남에 따라 그 수와 분산
이 증가하는 형태기 때문에 해당 값에 log를 취해주고 차분을 한 후 사용하였다.
중국의 경우 큰 연휴로는 춘절(음력 1월1일)과 국경절(10월 1일)이 있는데, 해당월에 방문자수가 증가하는 형태는 보이
지 않는다. Impulse Response 모양을 봐도 연관이 별로 없음을 알 수 있다.
2.2 임펄스 반응 함수
11. Impulse Response Function
2.2 임펄스 반응 함수
<일본> <대만>
<필리핀> <태국>
중국에서 뿐만 아니라 나머지 국가에서도 연휴와 우리나라 방문자수 증가와는 큰 연관은 없는 것으로 나타났다.
12. 국가별로 소비성향은 차이가 있을까?
0
50000
100000
150000
200000
250000
중국 일본 대만 필리핀 태국
쇼핑
숙박
요식
관광
교통
신한카드에서 제공한 데이터를 기준으로 국가별 소비성향에 차이가 있는지 알아보았다.
1개 사업장당 기준으로 봤을 때 소비하는 금액은 쇼핑, 숙박, 요식, 관광, 교통 순으로 비슷한 형태를 띄고 있다.
2.3 소비 형태 분석
13. 국가별 쇼핑 성향
0
20000
40000
60000
80000
100000
120000
140000
면세점 백화점 남.여기성복 화장품 인삼 및
건강제품
중국
0
1000
2000
3000
4000
백화점 화장품 남.여기성복 면세점 인삼 및
건강제품
대만
0
1000
2000
3000
4000
5000
백화점 면세점 남.여기성복 화장품 인삼 및
건강제품
필리핀
0
1000
2000
3000
4000
백화점 화장품 남.여기성복 면세점 인삼 및
건강제품
태국
0
1000
2000
3000
4000
5000
6000
7000
8000
면세점 백화점 남.여기성복 화장품 할인점
/슈퍼마켓
일본소비데이터 중 가장 많은 부분을 차
지하고 있는 쇼핑 부분을 국가별로 비
교해 보았다.
1개 사업장당 기준으로 봤을 때 국가
마다 소비성향에 차이가 있음을 알 수
있다. 중국과 일본은 면세점에서 대
만, 필리핀, 태국은 백화점에서 소비
를 많이 하는 행태를 보이며 국가별로
차이가 있음을 알 수 있다.
2.3 소비 형태 분석
15. 시계열 분석 결과 및 예측(중국)
3.1 시계열 분석 결과
국가공휴일인 연휴기간과는 상관이 없는 것으로 나타났지만, 매년 8월마다 방문자수가 증가하는 계절성은 뚜렷
이 나타나는 현상을 보인다. 2016년 12월까지의 5년간의 데이터를 바탕으로 2017년도를 예측한 값과 실제 값을
비교해 보면 상당히 차이가 나는 것을 볼 수 있다. 이는 THAAD의 여파가 상당한 영향을 미친 것으로 나타난다.
2012.1 2012.7 2013.1 2013.7 2014.1 2014.7 2015.1 2015.7 2016.1 2016.7 2017.1
16. 시계열 분석 결과 및 예측(일본)
3.1 시계열 분석 결과
매년 3월과 8월마다 방문자수가 증가하는 계절성을 띈 현상을 보인다. 시간이 흐를수록 점차 감소하다가 최근
들어서 비슷한 수준을 유지하는 것으로 보인다. 지난 5년간의 데이터를 바탕으로 예측한 값과 2017년 실제 값이
유사한 수준으로 나오는 것을 알 수 있다.
2012.1 2012.7 2013.1 2013.7 2014.1 2014.7 2015.1 2015.7 2016.1 2016.7 2017.1
17. 시계열 분석 결과 및 예측(대만)
3.1 시계열 분석 결과
매년 6,7월 경으로 방문자수가 증가하는 형태를 보인다. 또한 매년 시간이 지남에 따라 방문자수가 증가하는
양상을 보인다. 지난 5년간의 데이터를 바탕으로 예측한 값과 2017년 실제 값이 유사한 수준으로 나오는 것으로
보아 현재까지의 상승 추세가 유지되는 것으로 보인다.
2012.1 2012.7 2013.1 2013.7 2014.1 2014.7 2015.1 2015.7 2016.1 2016.7 2017.1
18. 시계열 분석 결과 및 예측(필리핀)
3.1 시계열 분석 결과
뚜렷한 계절성을 보이진 않지만 매년 10월마다 방문자수가 증가하는 경향을 보인다. 시간이 지남에 따라 방문
자수가 점차 증가하는 모습을 보인다.
2012.1 2012.7 2013.1 2013.7 2014.1 2014.7 2015.1 2015.7 2016.1 2016.7 2017.1
19. 시계열 분석 결과 및 예측(태국)
3.1 시계열 분석 결과
매년 7, 8월에 방문자수가 급격히 감소하는 계절성을 뚜렷하게 보여준다. 지난 5년간의 데이터를 바탕으로 예측
한 값과 2017년 실제 값이 유사한 수준으로 나오는 것으로 보아 현재까지의 추세가 유지되는 것으로 보인다.
2012.1 2012.7 2013.1 2013.7 2014.1 2014.7 2015.1 2015.7 2016.1 2016.7 2017.1
20. Come Back to KOREA
중국은 우리나라와 인접한 나라 중 가장 큰 소비력을 가진 나라이며 동시에 가장 교류가 많은 나라이다. 우선적
으로는 THAAD로 인한 관광침체국면의 장기화를 해소하는 것이 중요하다. 또한 중국은 국내 컨텐츠에 대한 관
심이 많다. 따라서 쇼핑, 면세품, 화장품 등과 더불어 문화컨텐츠 산업과 시너지 효과를 낼 수 있는 환경을 만들
어야 할 것이다. 중국은 여름철에 관광객이 몰리는 특성을 보이는데 곧 있을 평창 올림픽과 연계해 대중 관광상
품을 겨울철까지 확장하는 방법 또한 좋은 대안이 될 수 있으리라 생각된다.
일본의 경우 다른 나라와의 특이점은 면세, 백화점을 제외할 경우 비즈니스 목적의 방문율이 상당히 높은
편이며 전체적인 추세가 2012년을 기점으로 하향추세로 접어들어 회복하지 못하고 있다는 것이다. 여행이
용이함에도 불구하고 하락추세에서 벗어나고 있지 않다는 것은 시사하는 바가
크다. 따라서 일본의 경우 비즈니스 목적으로 방문하는 일본인을 위한
서비스를 생각해 보아야 하며 일본인에게 호감을 얻는 관광 컨텐츠의
개발이 시급하다고 판단된다.
대만, 필리핀, 태국 세 나라의 경우 중국과 일본 대비 잠재적인
수요가 크다는 점에 주목해야 한다. 또한 세 나라는 메르스
때를 제외하면 상승추세를 보여주고 있다. 세 나라는 여름에
국내로 관광하는 비율이 낮아지는 점에 주목할 필요가
있다. 따라서 국내의 뚜렷한 사계절성을 감안해 가을~
봄이라는 계절과 연관도가 높은 계절관련 관광상품을
개발하는 것이 유효할 것으로 생각된다.
3.2 제안
21. 시계열 모델로 미래 예측, 관광정책 효과 분석 검증 모델로 활용 가능
시계열 분석의 예측치는 실제 관광객 방문수와 상당히 일치하는 경향을 보인다. 따라서 이러한 시계열 예측을
통해 관광수요에 대비하는데 활용할 수도 있으며 정책결정에 있어 관광자원을 효율적으로 분배하는 참고 자료가
될 수 있다.
나아가 관광정책을 시행했을 때 기존 시계열 예측치와 비교하여 유효한 성과를 거두었는지를 확인하는데도 사
용될 수 있다.
3.2 제안
23. 문제점? 아시아에만 과도하게 집중되어 있는 현상
현재는 중국에서의 THAAD처럼 한 사건을 통해 받는 영향이 매우 크다. 이러한 국지적인 위험요소를 제거하기 위해서
는 아시아에만 의존하는 형태가 아니라 전 세계로부터 관광객을 끌 수 있어야 한다.
4.1 문제점
24. 딥러닝을 활용한 관광지 추천시스템
우리나라 관광지를 잘 모르는 외국인들도 손쉽게 본인의 성향에 맞는 관광지를 추천해주는 시스템을 만들고자 한다.
본인이 가봤던 여행지중 만족스러웠던 관광지를 입력하게 되면, 이와 유사한 우리나라의 관광지를 추천해 준다.
이를 구현하기 위해 TripAdvisor의 리뷰를 수집하여 데이터셋을 만든 후, 딥러닝과 협업 필터링을 사용한다.
4.2 딥러닝 추천시스템
26. TripAdvisor 리뷰 후처리
각 관광지 별로 수집된 리뷰를 바탕으로 Python의 KoNLPy패키지를 활용해 단어별로 카운트한 후 명사, 형용사, 동사
만 따로 모아 데이터셋을 구성한다.
4.2 딥러닝 추천시스템
27. 성능
4.2 딥러닝 추천시스템
각 관광지에 대한 961개의 리뷰들을 단어 별로 Word-Vector화한 뒤에 Neural Network로 훈련시킨 모델이다. 출력 값
들을 국내 관광지 5개로 해운대, 남이섬, 덕수궁, 쌈지길, 그리고 동백섬을 설정했으며, 관광객이 자신이 원하는 형태의
관광지를 단어로 입력하면 그에 어울리는 관광지를 확률 별로 나타내도록 만들었다. 테스트 셋으로는 961개의 20%인
192개로 설정했고, 0.9129의 accuracy를 얻을 수 있었다.
Keyword
‘저렴한’
‘사진’
‘전통적인’
28. 관광지 추천 시스템
4.2 딥러닝 추천시스템
최종적인 모형으로는 외국인 관광객이 자신이 과거에 방문한 관광지에 대한 순위를 정하면 이를 가중 계수로 하여 해당
관광지의 키워드를 저장하고, 이를 다시 TF-IDF로 상위 단어를 Word-Vector화 하여 국내 관광지를 추천하는 모형을 만
들었다. 이를 통해, 한국에 방문하는 관광객은 자신이 과거에 만족했던 국내외 관광지와 유사한 관광지를 추천 받을 수
있다. 특히, 한국에 처음 방문하는 관광객은 국내 관광에 대한 리스크를 감소시키고 만족도를 높일 수 있을 것이다.
29. • 데이터 출처
- 관광지식정보시스템, “입국관광통계”
- 관광지식정보시스템, “주요관광지입장객통계”
- 관광지식정보시스템, “외래관광객실태조사”
- “신한카드데이터”
• 참고문헌
- “파이썬 라이브러리를 활용한 데이터 분석”, 한빛미디어, 웨스 맥키니
- “시계열 분석 이론 및 SAS 실습”, 자유아카데미, 이상열
- “밑바닥부터 시작하는 딥러닝”, 한빛미디어, 사이토 고키
- “웹을 위한 머신 러닝”, PACKT, 안드레아 아이소니
- “Hands-On Machine Learning with Scikit-Learn and TensorFlow”, O'Reilly Media, Aurélien Géron
• 이미지
- https://pixabay.com/
Reference