컨컴1 빅더IOIEi
업무적용가이드
I
Wh따 Big,Why Big, How Bi형
]
맨ffl)
μ양니냐
빼
l
,
.
‘l
l」l
•
니μ빼η뷰
M
、‘
μ
M
μ
H
U
H
-
、
--‘p
g
T
↓’’
、
l
l
「K
T
+
·
、
-----’’”·
、、、‘、‘、
‘、
‘‘
‘、
‘‘
“ “
ti I 정백현운변화
『뎌i•I터 • 행정자*|부 NIA햄쟁보확핀흉웬
2.
<목 차>
제1장 개요1
제1절 목적과 필요성 ···································································································2
제2절 구성과 활용범위 ·······························································································3
제3절 빅데이터 분석 및 활용의 의의 ·····································································4
제2장 사전준비 단계 11
제1절 추진체계 구성 ·································································································13
제2절 빅데이터 분석과제 발굴 ·············································································16
제3절 데이터 확보방안 검토 ···················································································25
제4절 분석과제 선정 ·································································································30
제5절 분석 방안 수립 ·······························································································33
제6절 분석 결과 활용계획 수립 ·············································································33
제7절 분석 추진계획 수립 ·······················································································36
제3장 활용 및 분석모델 고도화 43
제1절 업무 적용 및 효과 검증 ···············································································45
제2절 분석 결과 홍보 ·······························································································48
제3절 유지관리 ···········································································································50
제4절 분석모델 고도화 ·····························································································52
부록1. 사업 추진 단계별 점검항목 55
Ⅰ. 요건 정의 ··············································································································57
Ⅱ. 데이터 수집 ··········································································································62
Ⅲ. 데이터 전처리 ······································································································64
Ⅳ. 분석모델링 ············································································································69
Ⅴ. 모델 구현 ··············································································································71
Ⅵ. 시각화 ····················································································································73
Ⅶ. 검증 및 안정화 ····································································································75
부록2. 사업 추진 단계별 주요항목 79
3.
<표 목차>
[표 1:빅데이터 기술과 DW/BI 기술의 차이점] ····················································6
[표 2: 주제 도출 시 고려사항] ···············································································16
[표 3: 민원 신고 사이트별 주요 관리 민원] ·······················································19
[표 4: ‘16년 행자부 추진 표준분석 모델별 상세내용] ································23
[표 5: 웹소셜데이터 수집 대상 URL 및 ID 개수 (2016년 8월말 기준)] ····26
[표 6: 공공데이터포털 보유데이터 건수(2016. 5. 기준)] ······························27
[표 7: 국내 공공분야 주요 오픈 API] ··································································28
[표 8: 과제 평가 기준표 예시] ·············································································30
[표 9: 수요조사의 심사기준과 심사내용] ·····························································38
[표 10: 사업비 산정 단계별 주요 내용] ······························································41
[표 11: 유지관리 체크리스트] ··············································································50
[표 12: 유지관리 대상별 관리 포인트] ······························································51
[표 13: 분석모델의 장·단기 활용 방안 예시] ················································53
[표 14: 품질관리목표] ······························································································66
[표 15: 결과공유 항목] ····························································································75
<그림 목차>
[그림 1: 공공 빅데이터 분석과제 추진 프로세스] ···············································3
[그림 2: 빅데이터의 속성 3V + 1V] ·····································································5
[그림 3: 빅데이터 추진체계도 예시] ·····································································14
[그림 4: 주제 선정 절차 예시] ·············································································16
[그림 5: 빅데이터 아이디어 공모전 예시] ·························································21
[그림 6: 빅데이터 포털 메인 페이지] ···································································22
[그림 7: 분석 주제 시급성/난이도별 순위 선정 예시] ·····································31
[그림 8: 시내버스 효율적 운영 사업(광주시)의 분석 결과 활용방안 예시] ····34
[그림 9: ‘16년 신규 분석사업 선정 절차 및 일정 예시] ······························38
[그림 10: 빅데이터 포털 활용 검토 방법] ······················································39
[그림 11 : 분석 과제의 장·단기적 목표 및 활용계획 예시] ························46
[그림 12: 분석결과 공유] ························································································48
[그림 13: 분석 전문가 세미나] ············································································48
[그림 14: 빅데이터 사업 설명이 가능한 인포·모션그래픽스 제작 및 활용] ···49
4.
[그림 15: 빅데이터역량 강화의 선순환 구조와 단절 원인] ··························52
[그림 16: 요건 정의 단계의 주요 활동] ······························································57
[그림 17: 데이터 수집 단계의 주요 활동] ························································62
[그림 18: 데이터 전처리 단계의 주요 활동] ······················································65
[그림 19: 데이터 기초 통계분석 예시] ································································67
[그림 20: 데이터 연계 구상도 예시] ····································································68
[그림 21: 분석모델링 단계의 주요 활동] ····························································69
[그림 22: 분석 시나리오 구성 예시] ····································································69
[그림 23: 모델구현 단계의 주요활동] ································································71
[그림 24: 시각화 단계의 주요 활동] ··································································73
[그림 25: 검증 단계의 주요 활동] ······································································76
[그림 26: 통합 테스트 절차 예시] ········································································77
공공 빅데이터 업무적용가이드
2
제1절 목적과 필요성
1. 가이드의 목적
m 공공 빅데이터의 다양한 가치에 대한 인식을 제고하고 효율적인 빅데이터
분석과 활용으로 국가, 지자체 및 공공기관 업무의 효과성 극대화를 도모함
- 빅데이터 분석을 통한 공공정책 의제발굴 · 정책결정 및 추진전략 수립의
방향을 이해하고 올바르게 적용할 수 있는 가이드를 제공
m 공공 빅데이터 분석과제의 추진 담당자가 추진절차를 실제 업무에 적용하기
위해서 점검해야 할 단계별 항목과 체크리스트를 제시함으로써, 실제 업무
에서 담당자가 쉽게 활용할 수 있는 체계를 마련함
- 사전준비 단계와 활용 및 분석모델 고도화 단계는 추진 담당자가 주도적으로
수행할 수 있도록 비교적 상세하게 기술하였으며 사업추진 단계는 담당자가
사업을 추진하면서 검토해야 할 점검사항 위주로 기술하였음
- 가이드를 통해 정보화 담당자는 물론 빅데이터를 경험해 보지 못한 현업
담당자도 빅데이터 분석과제를 준비하고 추진할 수 있도록 기술하였음
2. 배경 및 필요성
m 국가 안전 및 치안, 의료, 교육, 복지, 환경 등 사회 전반에 걸쳐서 빅데이터의
활용 가능성이 높아지고 실제 수요도 크게 증가하고 있음
m 그러나 이를 수행하는데 참고할 지침이 마련되어 있지 않아 실무 담당자들이
실제 추진과정에서 불필요한 시행착오를 거쳐 추진될 우려가 있음
m 빅데이터를 업무에 효과적으로 적용하기 위한 절차 및 방법 등에 대해
체계적으로 설명된 가이드의 제작이 필요함
- 공공부문 실무 담당자를 위하여 과제 목표와 방향 설정, 과제 추진 및 관리를
위한 체계적인 절차와 점검 항목 등을 제시한 가이드 제작
7.
3
- 빅데이터 분석시의 추진 프로세스를 고려한 실무지침을 현장 업무에 직접
활용 가능하도록 작성
제2절 구성과 활용범위
1. 가이드의 구성
m 본 가이드는 사전준비 단계, 사업추진 단계, 활용 및 분석모델 고도화의
3단계로 구성되어 있으며, 부록1의 사업추진 단계별 점검항목에서는
실무 담당자가 확인해야할 사항을 점검항목 형식으로 제공함
m 공공분야 빅데이터 단계별 프로세스를 포괄적으로 포함하여 실무 담당자가
이해하기 쉽도록 작성하였음
m 사전준비 단계는 가이드를 활용하여 분석과제 추진을 준비할 때 어려움이
없도록 필수 활동들을 상세하게 설명하였으며, 활용 및 분석모델 고도화
단계에서는 분석모델의 활용, 결과 홍보, 유지보수, 고도화 측면에서 활용
할 수 있도록 상세하게 기술하였음
- 본 가이드는 빅데이터 분석과제 추진 담당자의 업무 활용을 목적으로 하므로,
사전준비 단계와 활용 및 분석모델 고도화 단계에 대해서는 본문에서 상세히
설명하였으며, 사업추진 단계는 부록으로 별도 구성하여 추진 담당자가
점검사항 위주로 참고할 수 있게 하였음
[그림 1: 공공 빅데이터 분석과제 추진 프로세스]
8.
공공 빅데이터 업무적용가이드
4
2. 활용범위
m 본 가이드는 빅데이터 분석을 통한 공공정책 의제발굴과 추진전략 기획을
담당하는 공공기관의 실무 담당자를 위한 것임
- 본 가이드는 빅데이터 분석과제를 대상으로 작성되었으며, 빅데이터 시스템
구축 사업에 대한 가이드는 제시하지 않음
m 공공부문에서의 빅데이터 분석과 활용에 대한 이해를 높이고, 과제 타당성
검토와 방향성 확보 등의 기획 업무 등에 활용되기 위해 작성됨
m 본 가이드에서 제시하는 업무 절차는 필수 적용 절차가 아닌 참고용으로,
각 기관의 빅데이터 활용 목표와 운영 환경 및 분석 대상 데이터의
특성에 따라 타당성 검토 후 적용되어야 함
제3절 빅데이터 분석 및 활용의 의의
1. 빅데이터 분석의 개념 및 의의
m 빅데이터는 기존의 방법으로 처리가 어려운 대용량 혹은 다양한 유형의
실시간 생성되는 데이터의 집합을 의미함
m 빅데이터 분석은 시간, 공간 그 외 조건들의 변화에 따른 데이터의
분포와 데이터 간의 상호관계를 다양한 관점으로 조망하므로 의미 있는
패턴을 발견하고 세상을 이해해 가는 과정임
m 초창기『일반적인 DB SW가 저장·관리·분석하는 범위를 초과하는 데이터』등
규모를 강조하던 관점에서(McKinsey, 2011), 최근에는『다양한 종류의
데이터로부터 저렴한 비용으로 가치를 추출하고 초고속 분석을 지원하는
기술』등으로 가치창출 및 활용으로 초점이 이동됨(IDC, 2011)
9.
5
[그림 2: 빅데이터의속성 3V + 1V]
m 빅데이터는 경제, 사회 전반에서 혁신을 주도하는 일종의 플랫폼 기술
(GPT: General Purpose Technology)을 의미하며 효과적으로 활용시 정부·
기업·개인 모두에 막대한 효용을 수반함
2. 빅데이터 활용의 필요성
m 빅데이터를 분석하는 목적은 과거에 어떤 일이 일어났고, 그 원인이
무엇이며, 앞으로 어떤 일이 일어날 것인지를 예측하기 위함
- 미래를 예측할 수 있다면 합리적인 의사결정을 통하여 기관 및 국민
에게 엄청난 이득을 가져다줄 수 있으며, 과학적으로 데이터에 근거
해서 의사결정을 하게 되면 문제와 결론이 명확한 합리적 의사결정을
할 수 있음
* (예시) LAPD(로스엔젤레스 경찰국)에서 도입한 범죄예측 시스템은 아침마다 순찰을 할
때 LA 경찰들이 어디를 가보아야할지 범죄율과 연관된 순찰 코스를 정해주면서, 최소의
인력으로 최대의 효율을 이끌어 낼 수 있는 합리적인 업무를 가능하게 함
m 기존 DW(Data Warehouse), BI(Business Intelligence), 통계분석 등은 비싼
하드웨어, 소프트웨어에서 실행되며, 이 또한 데이터가 많아지면, 비싼
하드웨어를 추가해도 실행할 수 없음
m 그래서 나온 것이 빅데이터 기술이며, 우선 빅데이터는 PC같이 상대적
으로 싼 하드웨어와 공개 소프트웨어에서 운영되고 많은 데이터를 돌릴
때에는 하드웨어를 계속 늘려나가도 문제가 없으며 컴퓨팅 성능도 계속
올라감
10.
공공 빅데이터 업무적용가이드
6
m 결국 기존 RDBMS기술의 고질적인 문제점을 빅데이터 소프트웨어가
해결했는데 이것이 바로 하둡(Hadoop), NoSQL DB임
3. 빅데이터 활용 사례
m 맞춤형 서비스 분야
- (시민목소리 분석) 특정주제에 대한 시민의 목소리를 이해하고 그 추이를
분석함. 민원 접수 데이터와 소셜 데이터에 기반할 수 있으며, 정책의제
빅데이터 기술 DW/BI 기술
데이터
정형과 비정형 데이터
(SNS, 사진, 동영상, 위치 정보,
지리 정보, 기타)
정형 데이터
기본 기술
Hadoop, No SQL, CEP 등 대단히
다양
RDB에 근간
특징
수십, 수백억 건 이상도 처리 가능,
HW만 늘려가면 퍼포먼스가
증가함(Scale-out)
데이터가 수십억 건 이상 되면
HW를 더 많이 사용해도
퍼포먼스가 증가하지 않음
서버 저가의 일반 x86 서버 사용 주로 Unix, x86에 비해 고가
소프트웨어
대체로 공개 소프트웨어
(물론 상용 소프트웨어도 있음)
모두 고가 상용 소프트웨어
데이터 처리
3개 노드에 데이터 중복해서
카피함, 1~2개의 노드에 문제가
동시에 있어도 자동 복구
데이터 중복을 안 하는 대신
시스템은 중복, 고비용
데이터 처리
방식
배치 처리(Hadoop), 실시간 데이터
처리(CEP 등), 다양한 분석
방식(NoSQL 등)
주로 배치 처리
참고사항
공개 소프트웨어이므로 기술 지원
문제, 기존 RDB와는 완전히 다른
기술
고가이고, 데이터 처리 양이
늘어나면 한계에 이르며, 비정형
데이터는 처리하기 어려움
향후 트렌드
기존의 DW/BI에 빅데이터 기술을 도입하는 방향,
비정형 데이터를 처리해야 하는 분야에 부분적으로 도입 가능,
DW/BI에 빅데이터 기술을 융합하는 형태
[표 1: 빅데이터 기술과 DW/BI 기술의 차이점]
11.
7
발굴과 전략 방향설정 등에 활용할 수 있음
* (예시) 시민의 소리(민원) 분석(광주 광산구), 시민 요구사항 분석(영천시)
- (사회이슈 분석) 사회이슈의 자동 감지와 연관 주제의 동향 분석을 통해
잠재 정책 수요를 발굴함. 지역별 이슈를 도출하고 지역별 맞춤형 대국민
서비스 전략 수립이 가능함. 주요 일간지, 소셜 데이터, 민원 접수 데이터
등이 분석 대상임
* (예시) 지자체 갈등 이슈 파악을 통한 선제적 대응(행자부), 빅데이터 기반의
여론분석(문화체육관광부)
- (맞춤형 민원서비스) 지역별, 기관별 민원인의 행동 및 요구사항 분석을
통해 민원 행정서비스의 개인 맞춤형 서비스를 구현함. 지역별 기관별
서비스 사용로그, 게시판 및 민원 접수 데이터, 포털게시판과 질의응답
데이터 등이 주요 분석 대상임
* (예시) 구민 건의사항 및 온라인 민원 분석(부산 해운대구)
m 국민 안전 분야
- (범죄예방과 대응) 지역별, 시간별, 이벤트별, 유형별, 범죄 패턴 분석과
이를 활용한 지역별, 시기별 맞춤형 범죄예방 전략 도출이 가능함. 범죄
및 경찰업무기록, 보고서, 뉴스 및 소셜 데이터 등이 주요 분석 대상임
* (예시) 수원시 CCTV·보안등 사각지대 선정(경기도), 시민순찰대 순찰노선 지정
지원을 위한 빅데이터 분석(성남시)
- (도시관제 및 재난대응) 도심 내의 문제를 조기 파악하거나 재난을 조기에
감지하여 대응할 수 있도록 하며, 도시민과 재난지역의 시민 목소리를
바르게 이해하여 응급활동에 반영할 수 있는 정책의제 발굴에 활용함.
센서 데이터, CCTV, 소셜 데이터 등이 주요 분석 대상임
* (예시) 빅데이터 기반 산불 위험예보(산림청), 재해 예․경보시설 스마트 365감시
체제 구축(제천시), 홍수대응시스템 구축(세종시)
m 조세 분야
- (금융감독 및 세금추징) 금융거래 이상 징후, 조세 회피 및 탈세 등의
12.
공공 빅데이터 업무적용가이드
8
패턴 감지와 조기 대응력 확보, 금융 및 조세정책에 대한 시민 인식과
지역별, 기간별 동향에 대한 분석에 활용됨. 조세·금융거래 데이터, 소셜
데이터 등이 주요 분석 대상임
* (예시) 통합형 탈세 및 사기 범죄 방지 시스템(미국 국세청)
m 의료·복지 분야
- (의료 및 복지서비스 강화) 의료보험 비용 분석을 통한 사업 최적화,
부당 청구 방지, 복지 정책 입안과 만족도 분석, 지역별 복지 불균형
해소 등에 활용됨. 의료 및 복지 지출데이터, 민원센터 로그, 소셜 데이터,
서비스기관 홈페이지 및 포털 게시판, 주요 일간지 등이 주요 분석 대상임
* (예시) 스마트 공간을 위한 빅데이터 기반의 스마트 라이프 케어서비스(청주시)
- (질병 및 전염병 관리) 유행 전염병, 질병에 대한 예측 및 대응과 지역별
분포 분석에 활용됨. 연도별 마크로 분석, 가축 전염병과 환경, 이동 경로
데이터 등이 주요 분석 대상임
* (예시) 국민건강 알람서비스(국민건강보험공단), 의약품 부작용 분석(식약처)
m 교통·환경 분야
- (환경감시 및 대응) 환경오염과 변화 상황의 모니터링을 통한 대응 및
환경정책관련 중장기적 수행 전략수립 등에 활용됨. 국가 및 도심 센서
네트워크로부터 수집된 환경 데이터, 다양한 관련 보고서 등이 주요 분석
대상임
* (예시) 쓰레기 무단투기 분석(부산광역시)
- (교통상황관리 및 최적화) 교통흐름 모델링과 예측, 최적화 시스템 구현,
교통 신호체계와 유지보수 정책에 활용됨. 도로 센서 네트워크, 사건사고
로그, 날씨, 명절 및 스포츠 등 이벤트 데이터 등이 주요 분석 대상임
* (예시) 교통정보 빅데이터분석시스템 구축(청주시)
13.
9
m 교육 분야
-(교육정책 및 현안분석) 교육환경 개선과 교육 민원 처리, 합리적 교육
예산 집행과 절감 등을 위해 활용됨. 교육 예산 집행 데이터, 각종 보고서
및 소셜 데이터, 민원로그 분석 등이 주요 분석 대상임
* (예시) 교육 빅데이터를 활용한 아젠다 개발(한국교육학술정보원)
4. 공공 빅데이터 활용의 기대효과
m 공공 부문에서 축적된 빅데이터를 분석하고 활용하면 다양한 편익과
기대효과를 창출하게 되며, 특히 대국민 서비스 향상, 재난 관리, 안보,
범죄 예방, 부패 방지, 공공관리 등 공공적 가치 증진에 기여할 수 있음
- (대국민 서비스 만족도) 개방과 협력을 통해 지역별 맞춤형 민원 서비스,
교육 환경 개선, 교통 환경 최적화 등에서 빅데이터 분석 결과가 활용
되므로 대국민 서비스의 질을 높이고, 서비스 만족도를 제고함
- (예산 절감) 정책 의제 발굴을 위한 비용과 시간을 절약할 수 있으며,
의료 복지 서비스, 국가 R&D 정책 입안, 교육 정책과 범죄 예방 등
거의 모든 부분에서 예산 절감 효과가 있음. 예를 들어, 조세 분야에서
빅데이터 분석 결과를 활용할 경우 탈루된 세금을 회수하는 등 상당한
예산절감 효과를 기대할 수 있음
- (정책운영 효과성 향상) 빅데이터 분석을 통한 가시적인 정책효과 예측
으로 국민의 수요에 부응하는 공공서비스를 제공함으로써 국가 정책
운영의 효과성 향상
- (사회비용 절감) 환경, 교통 등의 분야에서 빅데이터를 활용하여 국민의
개인적인 비용 절감은 물론 사회 전체가 공동으로 부담해야 하는 사회
비용을 절감할 수 있음
- (합리적 정책 수립) 고부가가치 정보 활용으로 글로벌 환경변화에
대응하고 합리적 국가정책을 수립하고 집행함
14.
공공 빅데이터 업무적용가이드
10
- (위기대응 능력항상) 재난안전 분야에서 빅데이터의 활용은 정책권자의
신속한 의사결정을 지원할 뿐만 아니라, 국민의 위기 대응능력을 향상
시킬 수 있음
- (업무효율성 제고) 빅데이터 분석을 통해 미래예측에 근거한 선제적
행정서비스를 제공함으로써 공공의 업무 효율성 제고
- (공공 기관과 국가 투명성 제고) 공공데이터 공개와 빅데이터 기반의
평판* 관리, 투명하고 근거 있는 내부감사 등은 기관과 국가의 투명성을
향상시키며 국제 경쟁력 확보와 지속적 성장을 견인함
* 평판(Reputations)이란 공공서비스에 대하여 다수의 국민이 공유하는 집합적 인식을 의미하며,
좋은 평판은 공공에 대한 신뢰를 통해 정책 추진의 우호적 여론을 형성할 수 있음
- (정보 비대칭 해소) 공공 빅데이터 분석결과를 공공데이터포털, 빅데이터
포털 등을 통해 공개·공유함으로써 공공-민간, 중앙정부-지자체간 정보
비대칭 문제를 해소
- (산업 활성화) 민간·공공의 융합지식을 민간에 개방·공유하여 다양한
비즈니스 창출 및 산업 활성화에 기여함
참고 – 범정부 빅데이터 추진체계
범정부 빅데이터 활용추진체계 및 인프라 업무는 크게 행정자치부(공공정보정책
과)와 미래창조과학부에서 담당한다. 행정자치부는 정부차원의 빅데이터 활용에
관한 전반적인 업무와, 대용량의 정형 또는 비정형의 데이터 셋에 관한 제도·정책
및 기본계획의5 수립·시행, 빅데이터 기반 구축·운영 및 활용에 관한 업무를 총괄
한다. 미래창조과학부는 대학 및 민간차원의 빅데이터 활용에 관한 업무를 담당
한다.
15.
제2장 사전준비 단계
제1절추진체계 구성
제2절 빅데이터 분석과제 발굴
제3절 데이터 확보방안 검토
제4절 분석과제 선정
제5절 분석 방안 수립
제6절 분석 결과 활용계획 수립
제7절 과제 추진계획 수립
16.
공공 빅데이터 업무적용가이드
12
사전 준비 단계 개요
사전 준비 단계에서는 빅데이터 분석과제를 선정하는 과정을 다룬다. 이는 업
무 담당자가 가장 어려워하는 작업이기에 어떤 과정을 거쳐 분석과제들을 발
굴하고 과제 후보들을 어떤 기준으로 평가하여 최종 추진 과제를 선발할지에
대한 절차를 소개한다. 과제가 확정되면 과제의 필요성과 문제를 식별하고 정
의하며, 빅데이터 분석을 통해 어떻게 문제를 해결할 수 있는가에 대한 방안
을 정리하고 분석 결과를 어떤 목적으로 활용할 수 있을지도 생각해 봐야 한
다. 이 장의 내용을 숙지하면 빅데이터 분석과제 선정부터 과제 추진계획 수
립 까지의 업무를 처리 할 수 있을 것이다.
□ 추진 절차
17.
13
제1절 추진체계 구성
m추진체계는 과제가 발굴되고 빅데이터 분석을 준비하는 과정에서 구성되는
것이 일반적이지만, 이런 경우 기관 전체의 빅데이터에 대한 관심을 유도
하는 것이 어렵고, 조직내 다양한 분야에서 과제를 발굴하는 것도 어려움
m 빅데이터 기술은 IT 기술이지만, 빅데이터 분석은 IT 사업이 아니라는 인식이
필요하며, 기존의 정보화 사업과 달리 빅데이터 분석은 IT부서 단독으로
추진할 수 없음. 따라서, 과제 발굴 단계에서부터 국민과의 접점에서
현안을 가장 잘 이해하고 있는 현업 부서의 참여가 반드시 필요함
- IT 담당자들은 현장 업무를 해박하게 알지 못하므로 데이터 분석을 할
수 없고, 현업 담당자는 업무는 알지만 빅데이터를 모르기 때문에 자신의
업무 중 어떤 부분에 빅데이터를 도입해야 할지 알 수가 없음.
- 또한 외부 전문가는 빅데이터는 알지만 업무를 잘 모르므로 빅데이터
분석과제를 제시할 수 없음
- 따라서, 현업 담당자, IT 담당자, 외부 전문가가 함께 참여하여 빅데이터
분석과제를 발굴할 필요가 있음
m 분석과제를 발굴하는 과정에서 현업 부서와 정보화 부서가 함께 정책
수요와 현안 및 문제점을 도출하고 아이디어 구현 방안을 도출하는
작업을 함께 하는 것이 바람직함
m 따라서, 빅데이터 분석과제를 추진하기 위한 추진 체계의 구성이 우선
되어야 하며, 데이터, 정보, 기술 등에 대한 전문성을 지닌 정보화 부서와
정책 분야별로 국민의 요구를 가까이에서 파악할 수 있는 현업 부서와의
시너지 효과가 창출될 수 있도록 해야 함
18.
공공 빅데이터 업무적용가이드
14
[그림 4: 빅데이터 추진체계도 예시]
m 또한, 창의성을 갖춘 빅데이터 전문가가 자문함으로써 아이디어를 발굴하고
현업 및 정보화 부서에 이를 제공할 수 있는 체계가 이상적임
- 빅데이터 전문가는 현업 부서와 정보화 부서를 지원하는 자문 역할로써
상시 참여하도록 구성함
- 데이터 분석 및 정책 개발을 바탕으로 사회 문제를 해결하기 위해 빅데이터
전문가, 정보화 부서, 현업 부서 간의 교류가 활발히 이루어져야 함
- 특히, 현업 부서가 파악한 개별 정책 수요와 빅데이터 전문가들이 개발한
창의적인 아이디어를 잘 결합하여 빅데이터 활용에 의한 정책 구현이
현실적으로 가능해지도록 정보화 부서의 전문성이 뒷받침되어야 함
- 국민이 무엇을 필요로 하는지 현업 부서에 수요를 제기하면, 현업 부서는
이 사항을 빅데이터 전문가 및 정보화 부서와 협의
- 정보화 부서는 정책 수요를 해결할 수 있는 공공 데이터의 유무를 확인하고,
관련 정보를 빅데이터 전문가에게 제공하여 문제 해결 방안에 대한 자문을
받을 수 있음
- 정보화 부서는 빅데이터 전문가의 자문내용을 종합하여 추진방향 및
19.
15
아이디어를 도출하고, 실제어떻게 구현할 수 있는지 등에 관한 전문적인
지식과 정보를 현업 부서에 제공함
- 이를 바탕으로 현업 부서는 정책을 최종적으로 기획, 조정하여 수요 맞춤별
정책을 제공함
- 이상의 과정이 유기적으로 연계될 수 있도록 각 주체들 간의 교류와 협력이
활발히 이루어질 때 국민의 편익을 극대화시킬 수 있음
m 도출된 과제 후보들을 평가하여 빅데이터의 과제를 최종적으로 결정하는
것은 현업 부서의 역할이고 정보화 부서와 외부전문가는 이를 지원하고
후보 과제들을 평가하는 보조적인 역할을 해야 함
빅데이터 활용에 대해 기관장과 관리자의 관심과 추진 의지가 있나?
추진체계에 현업 담당자가 포함되어 있나?
과제추진을 위한 현업/정보화 담당자간 명확한 역할과 책임이 정의되었는가?
빅데이터 전문가가 참여하여 필요시 자문을 받을 수 있는가?
20.
공공 빅데이터 업무적용가이드
16
제2절 빅데이터 분석과제 발굴
1. 주제 도출 절차 및 고려사항
m 업무 담당자는 데이터 분석을 해보지 않은 경우가 대부분이므로, 빅데이터
주제를 도출하는 것은 매우 어려운 작업임
m 추진체계가 구성되고 IT 담당자, 현업 담당자, 외부 전문가가 함께 참여
하여 주제를 도출하는 것이 바람직함
m 다음은 빅데이터 주제 선정 절차 예시로, 정책 방향과 시민 중심의 주제
위주로 현황 파악을 위한 자료 조사를 하고, 인터뷰를 진행한 후 주제를
도출하고 향후 과제를 선정할 수 있도록 주제별 특성을 정리함
[그림 5: 주제 선정 절차 예시]
m 분석 주제는 다음과 같은 기준에 적합한 것들을 도출하며, 도출된 주제는
추진 가능성을 최종 검토하여 분석 주제를 확정하게 됨
주제 도출 기준 고려 사항
분석 목적
· 분석 주제는 어떤 기대효과를 달성하기 위해 도출하였나?
- 대국민 서비스 개선
- 예산 절감
[표 2: 주제 도출 시 고려사항]
21.
17
2. 주제 도출방법
m 빅데이터 분석 주제를 도출하는 방법은 내부의 당면한 문제와 현안을
파악하여 해결하기 위한 방안을 찾는 방법과 기관 외부로부터 아이디어를
수집해서 주제를 도출하는 방법이 있음
- 현업 담당자는 조직이 당면한 문제와 해결 방안, 국민 만족도 제고
방안을 가장 잘 파악하고 있고, IT 담당자는 문제 해결을 위해 조직의
IT 자원이 충분한지를 파악하고 있으므로, 주제 도출 과정에서 서로
긴밀히 협력해야 함
- 외부로부터 아이디어를 수집하는 것은 내부에서 주제가 도출되지 않은
경우에 활용하지만, 아이디어 공모전과 같이 전국민의 관심을 유도하고
기관의 정책을 홍보할 수 있는 이벤트로써의 의미도 있음
주제 도출 기준 고려 사항
- 정책 수립 또는 개선 등
서비스 제공 대상 · 기관 내부용인가, 외부 서비스용인가?
데이터 획득 가능성
· 내부에 존재하는 데이터를 활용하는가?
· 분석 대상 데이터의 품질은 좋은가?
· 필요한 외부 데이터는 확보 가능한가?
· 외부 데이터를 내부 데이터와 매시업*할 수 있는가?
* 매시업(Mashup) : 데이터를 서로 융합하여 새로운 서비스를 만들어
내는 것
담당 조직의 의지 · 담당 조직은 적극적으로 참여하는가?
분석의 가능성 · 제시된 주제를 분석할 때 구현이 가능하며 제약 사항 해결이 가능한가?
예상 구현 비용 · 제시된 주제를 분석하는데 소요되는 예산은 적절한가?
22.
공공 빅데이터 업무적용가이드
18
2.1 문제 해결을 위한 주제 도출
2.1.1 사회 문제 해결을 위한 국민의 수요 파악
m 각 부처, 지방자치단체 및 기관 별로 당면 문제가 무엇인지 국민들의
수요를 파악해 나가는 전략적 접근 방식이 요구됨
m 최근 공공부문에서도 빅데이터 활용이 강조되면서 이에 관한 논의가
활발히 전개되고 있기는 하지만, 주로 ‘데이터’ 그 자체, 즉, 기술 혹은
시스템적인 측면에만 관심을 가짐
m 현재 직면한 문제들을 데이터와 연계시켜 해결하려는 노력이 선행돼야 함
- 각 부처, 혹은 각 지방자치단체에서 행하고 있는 개별 정책 업무 영역을
파악한 후 이를 현재 보유하고 있는 데이터들과 매칭 시켜 보는 작업이
필요함
- 이를 통해 현재 어떠한 데이터들이 부족한지, 개별 정책 업무 영역을
관통하는 공통의 문제가 무엇인지를 파악함
- 기관의 정책 추진 방향성 수립을 위하여 빅데이터 분석 결과를 적용할
수 있는 사례를 발굴함
* (예시) 전주시는 지역 관광정책 수립 및 집행을 위해 소셜미디어 키워드 분석, 주요 유입
관광객 특성 분석 등을 실시(‘15)하여 관광객의 이동경로 및 특성을 파악하여 전주시
인근 지역과 연계 관광정책을 수립
m 결국 빅데이터 활용이 문제 해결 중심으로 이루어져야 민의에 적합한
공공서비스를 제공할 수 있게 되며, 국민들의 수요를 가까이에서
파악해야 하는 지방자치단체의 경우, 이러한 접근 방식이 더욱 요구됨
참고 사항 – 언론보도 내용 탐색
언론보도를 통하여 문제된 이슈를 기관 차원에서 해결하기 위해 빅데이터 분석을
고려할 수 있다. 경기도는 2014년 아파트 관리비 비리 문제가 언론에 자주 보도
되면서 전국의 아파트 관리비 비리문제를 해결하기 위하여 ‘공동주택 관리비 투
명성 제고(’15)’ 사업을 추진한 바 있으며, 많은 지자체와 공공기관에서 언론에 이
슈가 되는 지역, 사회의 다양한 문제들을 해결하기 위해서 빅데이터 분석을 추진
한다.
23.
19
2.1.2 민원 해결을위한 주제 발굴
m 중앙부처, 지자체 및 공공기관 등에 제출된 각종 민원 내용을 분석하면
기관에서 시급히 해결이 필요한 민생현안 문제를 식별할 수 있음
* (예시) 포항시는 최근 10여년간 집적된 민원을 분석해 시민의 요구사항을 파악하고
요구사항 관련 해결방안을 제시(‘15)
민원 사이트(URL) 주요민원내용
행정자치부
(http://www.moi.go.kr)
- 정책의 수립, 집행, 평가 등 전 과정에 국민이 직접 참여
하는 민주주의를 실현하기 위한 국민제안 및 참여
- 공직비리신고, 예산낭비신고 등 공정하고 합리적인 정책
을 위한 사이버 신고 등
국민신문고
(http://www.epeople.go.kr)
- 법령ㆍ제도ㆍ절차 등 행정업무에 관한 질의 또는 설명
이나 해석 요구
- 행정기관의 위법ㆍ부당한 처분 및 불합리한 행정제도로
인해 침해된 국민의 권리 구제 등
정부민원안내콜센터
(https://www.110.go.kr)
- 정부관련 모든 문의사항 뿐만 아니라 생활 불편사항이
있을 경우 정부대표전화 110으로 문의
지자체(서울 중구청 등)
(http://www.junggu.seoul.kr)
- 소음, 쓰레기, 보도ㆍ차도 파손 등 주민의 일상생활 중 겪게
되는 불편사항 등 지자체 생활불편 신고
새올민원
(각 지자체 온라인 민원상담)
- 쓰레기, 시설물, 교통, 환경 등 생활불편 사항을 온라인
과 스마트폰을 통해 신고
[표 3: 민원 신고 사이트별 주요 관리 민원]
2.1.3 업무 효율성 제고를 위한 주제 발굴
m 빅데이터의 분석 및 활용을 통해 기관 업무 추진의 효율성과 효과성을
제고하고, 업무 프로세스를 개선하는 주제를 식별할 수 있음
m 현재 지방자치단체에서 빅데이터를 활용하는 주요 분야는 교통 및
관광과 같은 주민서비스와 관련이 있으며, 재난·재해 분야는 중앙부처를
중심으로 빅데이터가 활용되고 있음
m 하지만, 지방자치단체에서도 주민서비스 외에 예산의 절감을 위해
24.
공공 빅데이터 업무적용가이드
20
빅데이터를 활용하는 등 그 분야를 다양하게 확장시킬 필요가 있음
* (예시) 고용노동부는 근로감독관의 효율적인 근로감독을 위하여 기초고용질서 위반의 위
험성이 높은 사업장을 예측하기 위한 ‘근로감독 사업장 선정 과학화’(’15) 사업을 추진
2.1.4 대국민 서비스 개선을 위한 선제적 주제 발굴
m 국내·외 빅데이터 활용 사례를 분석하여, 공공분야에 활용되었을 때
사회적 비용이 감소되거나 국민 만족도 제고가 가능한 테마를 선별함
m 빅데이터 개념이 먼저 도입된 선진국의 경우, 우리보다 빅데이터를 활용한
사례가 보다 많이 확산되어 있으며, 이 중 우리나라의 상황을 고려하여
도입 가능한 서비스를 벤치마킹 할 수 있음
* (예시) 건강보험심사평가원(‘16)은 건강보험 청구자료와 기상청의 날씨자료 등을 활용하여
날씨와 질병과의 상관관계를 분석, 국민관심질병 예측 서비스 사업을 추진 중에 있음
2.2 아이디어 수집을 통한 주제 도출
2.2.1 아이디어 공모전을 통한 주제 발굴
m 행정자치부에서 주최한 ‘공공 빅데이터 아이디어 공모전’과 같이 대국민
공모전을 통하여, 생활의 불편함 및 문제점을 파악하고 해결할 수 있는
아이디어를 수집함
m 언론보도, 주관 기관의 민원사항, 대국민 서비스 또는 업무 추진의 효율성과
효과성을 제고할 수 있는 내용으로 공모전을 추진하여 창의력이 돋보이는
주제를 도출함
- 공모전을 주최하는 경우 지자체는 지역민의 관심을, 공공 기관은 해당
주제에 대한 전국민의 관심을 유도하여 빅데이터를 활용한 정책 시행에
탄력을 줄 수 있음
25.
21
[그림 6: 빅데이터아이디어 공모전 예시]
2.2.2 공공 빅데이터 사례집을 통한 주제 발굴
m ‘생활을 디자인하는 빅데이터’(2016. 행정자치부), ‘2015년도 빅데이터 글로벌
사례집’(2015. NIA) 등 빅데이터 활용 사례집을 통해 아이디어를 발굴할 수 있음
2.2.3 빅데이터 컨설팅사를 활용한 주제 발굴
m 전통적인 IT 프로젝트와 달리 빅데이터 프로젝트에서는 컨설팅이 ‘보조’
또는 ‘지원’의 역할을 함. 빅데이터의 주요한 테마, 주제를 결정하는
것은 현업 부서의 역할이지만 컨설팅은 이를 도와주고 지원하며, 후보들을
검토하는 보조적인 역할을 수행할 수 있음
m 빅데이터 컨설팅을 활용하기 위해 빅데이터 주제 도출 부분을 프로젝트화
할 수 있으며 빅데이터 교육, 활용 데이터의 타당성 분석, 빅데이터 마스터
플랜 수립 등에 도움을 받을 수 있음
26.
공공 빅데이터 업무적용가이드
22
3. 주제 중복성 검토
3.1 빅데이터 포털을 통한 중복성 검토
m 추진하고자 하는 분석 주제가 유관기관에서 이미 실행한 것인지에 대한
중복성 여부를 사전 검토하여, 불필요한 자원 투자를 최소화하고 유사
하거나 중복인 경우 빅데이터 포털에 공유된 분석사례를 참조하여 문제
해결을 할 수 있음
m 빅데이터 포털에는 각 정부부처, 공공기관에서 수행한 분석과제에 대한
정보들이 정리되어 있음
- 내부망에서 빅데이터 포털사이트(http://www.insight.go.kr)에 접속, 공직자
이메일 계정으로 회원가입 후 활용
[그림 7: 빅데이터 포털 메인 페이지]
- 빅데이터 포털을 통해 소셜 데이터 수집이 가능하며, 빅데이터 분석에 대한
설명과 함께 분석 서비스를 제공하고 있음
27.
23
- 특히 빅데이터포털에서 분석과제 정보, 데이터 로딩, 데이터 전처리, 분석
기법적용, 보고서 작성 및 시사점 도출의 5단계에 걸쳐 시범과제에 대한
설명을 열람할 수 있음
- 또한, 과제 수행 과정의 이해도를 높이기 위한 샘플 데이터를 제공함
3.2 기 분석모델 활용 검토
m 주제 중복성 검토 결과 유사하거나 중복된 빅데이터 서비스가 이미 존재
하는 경우, 담당자는 기 분석모델 활용을 우선적으로 고려하여야 함
* (예시) 행자부는 기 추진 빅데이터 분석모델 중 기관의 수요가 높고 공통적으로 적용이 필
요한 모델을 표준분석모델로 정립(‘16년 민원, 교통, 관광, 공동주택, 근로감독, CCTV의 6건)
모델명 활용영역 분석모델 상세내용
민원
민원 내용과
처리 절차
분석 및 활용
- 민원데이터를 분석하여 민원에 효과적으로 대응할 수 있는 단
기 및 중장기 해결방안 제시
※ 민원데이터 : 새올, 민원 상담 콜센터, 시장/도지사에게 바
란다, 칭찬합시다 등
- 민원 처리 절차를 분석하여 민원 대응의 효율성 개선
교통
효율적인
대중교통(버스)
정책 수립
- 교통카드 이용 현황, 유동인구 및 주거인구 데이터 등을 분석
하여 이동수요, 저상버스 필요 노선, 환승 지점 등 파악
- OD분석, 운행기록 분석 등을 통한 탄력배차제 적용 노선 결정,
배차간격 조정·결정 등
관광
관광 정책
수립
- 지역행사·축제 방문인구, 전년대비 증감분석 및 축제장소별, 시
간추이별 관람객 증감 분석을 통한 관광객 수요예측 및 관광
시설 공급판단 등 관광정책 수립
- 상권 통계 기반 지역상권 매출 분석을 통한 최적화된 상권 관
리 및 지역 경제 활성화 기여도 평가
- 관광 통계 기반 외국인 관광객 유치 활성화 방안 마련 및 외국
인 전용 관광 코스 개발 활용 등
공동
주택
공동주택
관리비 및 입찰
비리 분석
- 공동주택 관리비 부당 징수 의심 대상 단지 분석
- 공동주택 공사 입찰 부정 및 원·하도급 부당 거래 의심 정보
분석
근로
감독
효율적인
근로감독
- 사업장별 5대 취약 지수(최저임금, 서면계약, 임금체불, 근로시
간 불이행, 약자보호) 도출 및 이를 활용하여 반복적으로 위법
행태를 보이는 근로 사업장을 선정하여 우선 감독
- 근로감독 분야와 유사한 형태의 관리 감독 업무가 필요한 분야
에 대한 확대 적용 가능한 개념적 분석 모델 제공
CCTV CCTV 설치지역 - 범죄, 사고 다발지역 등 보안이 취약한 안전사각지대 도출 및
[표 4: ‘16년 행자부 추진 표준분석 모델별 상세내용]
28.
공공 빅데이터 업무적용가이드
24
* ‘16년 분석 사업 중 실시간 국민관심질병예측 서비스(심평원), 국민 참여형 어린이 안전 및
교통사고원인 분석(경기도), 잠재적 사회취약계층 일자리 창출 및 자립 지원(국민연금공단, 남
양주시) 등 5개 모델이 ’17년에 추가될 예정
m 추진하고자 하는 분석주제가 행정자치부가 정립·보급하는 표준분석모델에
포함되어 있을 경우, 표준분석모델 활용 가이드북을 이용하여 분석을
수행함
- 표준분석모델 활용 가이드북은 빅데이터 포털에서 제공되며, 데이터
수집부터 시각화까지의 전 프로세스에 대한 상세한 설명을 제공함
- 가이드북과 함께 분석에 필요한 표준 데이터 목록 및 포맷, 샘플 데
이터, 분석 프로세서, 분석 스크립트 등도 제공됨
- 분석 주제의 특성과 수행 기관의 상황에 따라 행정자치부 빅데이터
공통기반시스템의 활용 여부에 대한 의사결정이 필요함
주제 도출 과정에 현업 담당자가 참여하여 적극적으로 의견을 제시하였나?
도출된 주제의 서비스 대상, 데이터 획득 가능성, 구현 가능성은 고려하였나?
해결하고자 하는 문제가 국가·지역·사회적으로 시급한 것인가?
수행하고자하는 주제가 무엇인지 구체적이고 명료하게 정의할 수 있는가?
수행하고자하는 주제에 대해 빅데이터 포털을 통한 중복성 검토를 하였나?
모델명 활용영역 분석모델 상세내용
분석
CCTV를 설치할 우선 지역 선정을 위한 분석
- CCTV 취약 지수, 범죄 취약 지수, 유동인구 취약 지수 등을 활
용한 Cell별 가중치 생성 및 설치 포인트 도출
29.
25
제3절 데이터 확보방안검토
1. 필요 데이터의 정의
m 관련기관, 지자체, 실무자 및 외부전문가 등 이해관계자들과 업무 해결을
위한 인터뷰 등을 통하여 빅데이터 분석 목적에 적합한 데이터 목록을
작성하고 데이터별로 확보 가능여부를 점검함
2. 기관 내 데이터 확보방안 검토
m 필요 데이터에 대해 데이터 명, 데이터 설명, 데이터 형태, 용량 등 기관
보유 데이터 현황조사를 수행함
- 기관이 보유하고 있는 데이터 중 분석을 위해 필요한 데이터를 도출
- 내부 데이터라도 데이터가 잘 정제되어 품질이 좋은지, 데이터가 지속적
으로 업데이트되고 있는지, 분석에 필요한 기간만큼의 데이터가 충분히
적재되어 있는지, 코드 데이터의 과거 변경 이력이 있는지 등도 파악
m 분석대상 데이터의 관리 권한이 주관부서 이외의 타 부서에 속하는 경우,
관련 부서간 협의를 통하여 데이터의 공유가 가능한지 확인함
m 내부 데이터이지만, 관련 법, 보안, 개인정보보호 문제 등으로 사용이
어렵지는 않은지 확인이 필요하며, 개인정보의 경우 비식별화를 통해
사용하는 방안도 고려해야 함
3. 기관 외 데이터 수집 가능성 검토
m 데이터 보유기관, 데이터 명, 데이터 설명, 데이터 형태, 용량 및 데이터
제공형태 등 현황을 검토함
- 분석대상 데이터의 수집에 법률상 제약사항은 없는지 확인함
* (예시) 국세기본법 제81조의13에 명시된 사유 외에는 국세청의 과세정보 활용이 곤란함
m 법률상 제약이 없는 데이터의 경우 보유기관과의 협의를 통하여 데이터의
30.
공공 빅데이터 업무적용가이드
26
공유가 가능한지 확인함
m 외부 데이터 중, 민간 기업이 보유한 데이터의 경우 활용 대상 범위(종류,
기간 등)와 그에 따른 데이터 구매비용을 고려해야 함
4. 기타 데이터 수집 가능성 검토
4.1 빅데이터 포털 제공 데이터
m 빅데이터 포털(http://www.insight.go.kr)에서는 뉴스, 블로그, 트위터 및 각
분야별 주요 정보 사이트의 웹소셜데이터를 수집하고 있으며, 수집 대상
및 수집 방법은 다음과 같음
수집 대상 수집 단위 수량 수집 기준
News URL 384 주요 신문사/뉴스 제공사
Blog URL - 네이버에 포스팅된 블로그 전체
Twitter ID 160 영향력 및 트윗 많은 사용자 계정(ID)
[표 5: 웹소셜데이터 수집 대상 URL 및 ID 개수 (2016년 8월말 기준)]
m 빅데이터 포털에서는 수집하고 있지 않은 특정한 사이트의 데이터를
수집할 필요가 있을 경우나, 과거 특정 시점의 웹소셜 데이터가 필요한
경우에 기관의 신청을 받아 신청 내용이 승인될 경우, 해당 사이트 또는
기간의 데이터를 수집하여 제공함
m 또한, ‘데이터지도’ 메뉴를 통해 공공기관에서 생성하여 공개하였거나
보유하고 있는 데이터의 현황 정보를 분류 체계별로 시각화하여 보여주고
있으므로 검색을 통해 데이터 확인이 가능함
4.2 공공데이터포털 제공 데이터
m 공공데이터포털(http://www.data.go.kr)에서 제공하는 데이터셋 명칭과
설명, 보유기관, 원천정보시스템명, 데이터 유형 등의 내용 조회가 가능함
31.
27
순서 분류기준
공공데이터포털 데이터건수
데이터 건수 Open-API건수
1 공공행정 2,960 194
2 과학기술 595 148
3 교육 828 129
4 교통물류 975 192
5 국토관리 913 108
6 농축수산 616 136
7 문화관광 1,770 333
8 법률 31 15
9 보건의료 922 65
10 사회복지 1,192 67
11 산업고용 1,257 209
12 식품건강 398 79
13 재난안전 720 44
14 재정금융 428 58
15 통일외교안보 173 69
16 환경기상 963 107
합계 14,741 1,953
[표 6: 공공데이터포털 보유데이터 건수(2016. 5. 기준)]
4.3. 행정정보 공동이용 대상 데이터
m 행정정보공동이용센터의 행정정보 공동이용 대상 정보 목록 검토를 통하여
분석에 활용 가능한 데이터를 확인함
m 행정정보공동이용센터 홈페이지에는 ‘행정정보파일목록서비스’ 항목이 있어,
이를 통해 이용 가능한 공공정보의 소재를 안내받을 수 있음
참고 – 행정정보공동이용센터
행정정보공동이용센터(행공센)는 행정기관, 공공기관, 금융기관, 교육기관 등이 정
보들을 서로 공유하여 업무를 전자적으로 처리함으로써 국민에게는 민원 편의성
을, 정부차원에서는 효율적인 행정을 할 수 있는 전자정부의 핵심 서비스이다.
2016년 현재 주민등록표 등·초본, 토지등기사항증명서 등 148종의 행정정보를 이
용할 수 있다. 접속은 https://www.share.go.kr 를 통해 가능하며, 접근 권한을
등록하고 열람 권한을 승인 받아야 이용 가능하다.
행공센의 데이터는 대용량의 실시간 데이터가 많으므로, 데이터를 활용함에 있어
분석 인프라가 충분한 용량을 갖추고 있는지 확인하여 분석에 필요한 기간의 데
이터를 수집하여 활용한다.
32.
공공 빅데이터 업무적용가이드
28
4.4 기타 공공분야 오픈 API
m 각 공공기관별로 해당 기관 홈페이지 등을 통해 데이터를 독립적으로
지원함
제공 포털 분류 체계 주요 오픈 API (활용순)
서울 열린데이터 광장
data.seoul.go.kr
일반행정, 문화관광, 보건, 환경,
산업경제, 도시관리, 교통, 복지,
안전, 교육
1. 공공와이파이 위치정보
2. 시장마트 현황
3. 공중화장실 위치정보
4. 개인서비스 요금 정보
5. 지하철 호선별 첫차와 막차 정
보
공간정보 오픈플랫폼
www.vworld.kr
행정주제도, 3차원 영상, 기타
메타데이터
1. 2D 지도
2. 3D 지도
3. 배경지도
4. WMS/WFS
5. 데이터
6. 지도검색
7. Static Map
8. 3D 모바일
보건의료빅데이터개방
시스템
opendata.hira.or.kr
요양기관, 의료인력, 의약품,
진료비정보, 진료정보, 질병정보,
치료재료, 환자표본, 기타
1. 병원정보서비스
2. 질병정보서비스
3. 병원코드정보서비스
4. 병원약국찾기 정보
5. 병원코드정보서비스
기상자료개방 포털
data.kma.go.kr/cmmn/
main.do
지상, 고층, 해양, 황사, 레이더,
위성, 수치예보, 역사기후, 간행물,
기상자원지도, 지점정보
1. 동네예보정보조회서비스
2. 예보구역정보조회
3. 생활기상지수조회
4. 중기예보정보조회서비스
5. 보건기상지수
6. 항공기상정보
재난안전데이터 포털
data.mpss.go.kr
안전정책, 생활안전, 비상대비,
재난예방, 재난대응. 재난복구,
소방정책, 119구조구급,
해양경비안전, 해양오염방제
1. 교통사고정보
2. 낙뢰관측 정보
3. 재난상황전파 정보
4. 자연재해상황 및 복구비
지원내역
5. 습득물정보 조회 서비스
농림축산식품
공공데이터 포털
data.mafra.go.kr
농산, 산림, 농지용수, 교육,
말산업, 검역, 식품안전, 축산,
유통, 시설장비, 농촌복지,
1. 전국 도매시장 일별 경락가격
2. 전국 도매시장 일별 실시간
경락가격
[표 7: 국내 공공분야 주요 오픈 API]
33.
29
빅데이터 분석을 위한다양한 데이터 원천을 파악하고 있는가?
- 데이터가 분석 목표 달성을 위해 적절한지 검토
- 신뢰할 만한 품질의 데이터가 존재하며, 적당한 시기에 입수 가능한지 검토
- 내외부 협력체계와 같은 구체적인 데이터 확보방안 및 절차를 갖추었는지 확인
분석대상 외부데이터 확보를 위한 기관간 협의가 되어 있는가?
외부 데이터는 내부 데이터와 통합하여 분석 가능한가?
데이터 수집관련 보안사항 및 개인정보보호 관련 문제 등을 점검하였는가?
제공 포털 분류 체계 주요 오픈 API (활용순)
농축산기술, 식품산업,
품질관리
3. 낙농체험 목장 정보
4. 농촌마을별 자원정보2
5. 농업마이스터대학 현황
교통정보공개서비스
openapi.its.go.kr
교통소통정보, 공사정보,
CCTV정보, 돌발상황정보
1. 교통소통정보
2. 공사정보
3. 사고정보
4. CCTV정보
5. VMS정보
KOSIS 공유서비스
kosis.kr/openapi
국내통계 주제별, 국내통계 기관별,
광복이전통계, 작성중지통계,
지역통계(주제별), 지역통계(기관별),
e-지방투표, 대상별통계,
이슈별통계, 인기통계, 영문
KOSIS, 국제통계
1. 추계인구
2. 경제활동참가율
3. 경제성장률
4. 전산업생산지수
5. 기대수명
6. 사교육 참여율
34.
공공 빅데이터 업무적용가이드
30
제4절 분석과제 선정
1. 분석 추진 가능성 검토
m 분석과제의 추진 가능성을 검토하기 위해서는 기관이 자신의 상황에 맞는
평가 항목으로 구성한 평가 기준표를 활용하여 항목별로 점수를 부여하고
총점을 기준으로 평가하는 방법이 있음
- 평가 항목별 점수 배점은 기관의 상황에 따라서 적용. 예를 들어, 추진
시급성이 가장 중요한 항목이라면 높은 점수를 할당함
- 지금까지 조사한 내용을 바탕으로 기관 자체 평가기준을 적용한 과제
평가표를 만들고 분석과제별 타당성 평가
m 표 8의 예시는 행정자치부에서 공공 빅데이터 분석과제 후보를 평가할
때 사용하는 평가 기준표로, 분석과제의 추진 필요성, 파급효과, 추진
시급성, 구현 가능성, 데이터 수집 가능성, 모델 확장성을 검토하고 검토
결과를 기반으로 평가 항목별 점수를 부여하여 추진 가능성을 검토함
평가 항목 기준 설명
필요성 공공정책 결정이나 공공서비스 측면에서 본 분석과제가 필요한지 판단
파급효과 정성적, 정량적 기대효과의 정도 판단
추진시급성 당장 해소되어야 할 사회현안 여부 판단 : 장기과제 성격 분리
구현가능성
과제를 구현함에 있어서 어려움이 없는지 현실성 판단
(표준분석모델을 활용하거나, 빅데이터 포털에서 구현 가능한 과제는
구현가능성이 높을 수 있음)
데이터 수집
가능성
기관 협조나 데이터 확보, 데이터 구매 비용 등 제약사항 판단
(표준분석모델을 활용하거나, 빅데이터 포털에서 구현 가능한 과제는
데이터 수집 가능성이 높을 수 있음)
모델 확장성 과제가 시범과제로 끝나지 않고 전국 모델로 확장 가능한지 판단
[표 8: 과제 평가 기준표 예시]
35.
31
m 과제 선정에있어서 중요한 평가요소 중 과제의 ‘추진 시급성’과 빅데이터
분석모델의 ‘구현 가능성’으로, 경우에 따라서는 추진시급성과 구현
가능성만을 고려하여 주제를 선정할 수도 있으며 관련 내용은 아래
‘참고’에 기술함
참고 – 과제의 추진시급성/구현가능성을 고려한 주제 선정 방안
기관이 분석과제 선정을 위해 평가 기준표를 활용하여 과제 후보별로 평가하는
방식이 일반적이지만, 그림 7과 같이 과제의 추진시급성과 구현가능성만으로 평
가하여 주제를 선정하는 방안도 있다.
○ 분석과제를 추진할 때 전략적 중요도에 따른 시급성을 우선 고려해야 하며,
데이터를 생성, 저장, 가공, 분석하는 비용과 과제에 대한 분석 수준을 고려한
난이도 또한 우선순위 선정에 중요한 기준이 된다.
○ 우선순위 선정 기준을 토대로 시급성 또는 난이도를 고려해 우선 추진해야 하는
분석 과제와 제한된 자원을 고려해 단기적 또는 중장기적으로 추진해야 하는
분석 과제 등 4가지 유형으로 구분해 분석 과제의 적용 우선순위를 결정한다.
○ 그림 7의 사분면의 번호와 같이 각 과제별 시급성과 난이도를 구분하여 사분면
안에 과제를 위치하고 우선순위를 식별한다. 사분면 영역에서 가장 우선해서
분석 과제 적용이 필요한 영역은 Ⅲ 영역이다.
○ 또한 전략적 중요도가 현재 시점에는 상대적으로 낮은 편이지만 중장기적으로는
현안에 미치는 영향도가 높고, 분석 과제를 바로 적용하기 어려워 우선순위가
낮은 영역은 Ⅱ영역으로 볼 수 있다.
[그림 8: 분석 주제 시급성/난이도별 순위 선정 예시]
36.
공공 빅데이터 업무적용가이드
32
2. 분석과제 확정
m 과제 평가표에서 전체 총점이 가장 높은 과제를 최종 후보로 선정
- 단, 전체 총점이 가장 높을지라도 구현가능성 점수가 현저히 낮은 경우는
실제 추진 시 실패할 가능성이 높음
- 전체 총점은 다소 낮을지라도 추진시급성에서 가장 높은 점수를 받은 과제는
제약요소를 해소할 수 있는 방안을 찾고 과제의 범위를 보완하여 추진할
수 있음
과제 후보를 평가할 수 있는 평가 기준표를 만들고 객관적으로 평가하였나?
평가 기준표에 적절한 가중치를 적용하여 타당한 결과를 도출하였나?
확정된 분석과제는 추진 시급성이 높고 구현 가능한 주제인가?
- 난이도가 높은 주제를 선정하였다면, 기간 내에 분석결과를 도출할 수 있는 방안을
가지고 있어야 함
○ 적은 비용으로 추진하여 빠른 시일 내에 효과를 거둘 수 있는 주제를 선정하는
것이 좋지만, 기관이 처한 상황에 따라 비용이 많이 투입되어도 꼭 해야만 하는
과제의 경우에는 시급성이 매우 높게 측정될 것이므로, 난이도를 기관의 상황에
따라 조율하여 추진한다.
○ 시급성이 높고 난이도가 낮은 과제는 성공했을 때의 홍보 효과도 상당하고 이에
따라 기관의 빅데이터 추진도 탄력 받을 가능성이 크다.
* (예시) 서울시의 심야버스 사례의 경우, 심야버스 노선을 신규로 만들기 위
해 빠른 분석이 필요했고 비교적 적은 비용으로 분석을 완료하여 우수사례
로 소개되고 있으며, 이후 서울시의 빅데이터 예산이 크게 증액되고 본격적
으로 빅데이터 프로젝트를 늘려 나가게 되었음
37.
33
제5절 분석 방안수립
m 추진 가능성에 대한 검토가 완료된 과제를 명확하게 제시한 후, 보유한
데이터와 분석 방법론 등을 활용하여 해당 이슈를 해결하기 위한
분석 방안을 제시함
- 과제와 관련된 현재 이슈에 대한 기초 분석 단계를 설정하고 기초 분석
단계에서는 해당 이슈 관련 현황을 도출
- 현업 부서, 정보화 팀, 빅데이터 전문가가 함께 어떠한 데이터를 활용해서
어떻게 이슈를 해결할 것인지 분석 목표와 이에 따른 방안을 제시
- 과제 관련 학습을 통해 과제의 이해도를 높이고, 국 내외 선행 사례 또는
전문가와 함께 실현 가능한 분석 방안 구성과 성과 목표를 수립
- 데이터를 추가하거나 기존의 데이터를 변경하고, 선행 사례의 분석
방법론에 대한 변경 사항들을 고려하여 이슈해결 방안을 모색
m 분석 방안은 기술적 해결책과 무관하게 정책 결정자와 최종 사용자 위주의
관점에서 기술해야 함
제6절 분석 결과 활용계획 수립
m 이 단계에서는 빅데이터 분석 결과를 어떻게 업무에 반영할 것인지에 대한
액션 플랜을 만들고 업무 성과를 지속적으로 모니터링 할 수 있는 방안을
수립함
m 과제를 실제 추진하는 과정에서도 분석 결과 활용방안을 수립할 수 있지만,
분석 결과를 활용하여 사회적 문제를 해결하고, 기관과 국민 모두에게 가치
를 창출할 수 있는가?
과제에 대한 분석 방안이 논리적으로 이해 가능하고 구체적으로 도출되었나?
분석 목표 달성을 위하여 필요한 정보 항목을 정의하였나?
분석 결과에 대한 성과 목표와 활용 방안이 도출되었나?
38.
공공 빅데이터 업무적용가이드
34
과제 추진 전에 분석 결과의 활용 방안을 미리 고민하고 분석하고자 하는
목적을 명확히 한 후 추진하는 것이 실패할 확률을 줄일 수 있음
m 왜 빅데이터 분석을 하려고 하는지, 빅데이터 분석을 통해 어떤 결과를
도출하고, 도출된 결과를 어떻게 활용할 것인지, 활용을 통해 어떤
효과를 얻을 것인지를 고민하고 활용 활성화 방안을 수립해야 함
- 빅데이터 사용을 활성화하기 위해서 노력하는 이유는 분석을 해놓고도
분석 결과를 활용하지 않는 경우가 많기 때문임. 기관이 빅데이터 도입에
성공했다고 해서 즉시 국민의 만족도가 올라가지는 않기 때문에 기관이
지속적으로 관심을 갖고 분석 결과를 활용하고, 적용하고, 활성화하는
것이 빅데이터 분석 성과를 위해 필요함
m 과제 수행 후 분석 결과를 즉시 적용할 수 있는 단기 활용계획을 제시할
수 있어야 하며, 중장기적인 활용 계획을 수립하고 상세화 해야 함
m 빅데이터 분석이 끝나면 각 현업부서에서 분석 결과를 활용해야 하며,
이때 이전에 수립한 활용방안이 계획대로 잘 수행되고 있는지 모니터링
해야 함
[그림 9: 시내버스 효율적 운영 사업(광주시)의 분석 결과 활용방안 예시]
39.
35
- 빅데이터 분석및 활용을 위한 구체적인 업무 분담, 책임 및 권한 체계를
정의
m 분석 결과를 활용하고 확산하기 위해서 교육과 홍보를 병행할 필요가
있으며 홍보 방안으로는 홈페이지 배너광고, 버스광고, 홍보 동영상 제작,
기념품 제작, 보도자료 배포, 리플릿 제작 등의 방법을 사용할 수 있음
- 빅데이터 관련 정보화 부서와 현업 부서 구성원의 빅데이터 분석 및
활용에 대한 이해를 제고하기 위해 내외부 교육 훈련 방안을 수립하고
필요시 빅데이터 분석 및 활용을 장려할 수 있는 인센티브 정책을 마련
m 활용 성과에 대한 점검은 수립한 활용 계획에 대해 6개월이나 1년 단위로
측정하여 정량화하는 관리가 필요함
m 분석모델을 기관내외부에서 지속적으로 활용하고 발전시킬 수 있도록
기관간 데이터 연계, 데이터 통합, 분석, 결과 활용 내용을 포함한 확산
계획도 고려하여 방안을 수립함
m 이 과정은 실제 사업추진 시 성과관리 계획 단계에서 실현 가능한 방향으로
다시 한번 구체화하는 작업을 하도록 함
빅데이터 분석 및 활용에 대한 방안을 수립할 때 전체 조직 구성원들의 아
이디어와 의견이 반영되었나?
분석 결과를 활용하고, 적용하고, 활성화 하려는 계획을 갖고 있나?
- 결과를 즉시 적용할 수 있는 단기 활용계획과 중장기 활용계획 수립 및 상세화
- 빅데이터 도입 또는 활용과 관련하여 단계적이고 구체적인 계획 수립
빅데이터 분석 종료 후 결과 활용을 위한 관련부서 협조와 예산확보는 가능한가?
- 빅데이터 분석 및 활용 방안은 기술적, 경제적으로 충분히 실현가능해야 함
분석모델을 지속적으로 유지보수하고 업그레이드할 수 있나?
40.
공공 빅데이터 업무적용가이드
36
제7절 분석 추진계획 수립
m 과제를 정의하고 분석결과 활용방안을 수립한 후, 해당 분석과제의 진행
계획을 수립함
m 과제 목표를 정할 때 해당 과제의 성공 요인과 성과를 객관적으로 측정할
수 있는 성과지표를 개발함
m 요구사항 도출과 소요 비용을 산정하고 과제 추진 방법을 선정한 후, 추진
계획서를 작성함
1. 분석 목표 정의
m 빅데이터 분석을 통해 달성하고자 하는 목표를 명확히 기술함
m 성공적으로 달성할 경우의 결과를 나타내는 성과목표를 정의하고 이를
효과적으로 측정할 수 있는 성과지표를 개발함
- 빅데이터 분석과제 수행 후, 분석 결과를 활용하여 달성하고자 하는
성과 목표를 설정하고 관리하여 빅데이터 분석이 일회성으로 그치지 않고
지속적으로 업무에 활용될 수 있는 체계를 마련하기 위해 성과지표를
개발함
- 성과지표는 이후 분석과제가 추진되면 요건정의 단계에서 더욱 구체화
되고 상세화됨
* 성과지표에 대한 예시는 부록1. ‘사업추진 단계별 점검항목’의 제1절 요건정의 부분의
‘성과관리 계획’ 참조
- 추진계획 수립 시에는 과제의 목표와 배경, 분석 결과의 구체적인 활용
방안을 반영한 성과지표를 수립하여 실제 과제 수행 과정부터 관리
하도록 함
41.
37
2. 기본 요건정의
m 빅데이터 분석과 활용을 통해 해결하고자 하는 현안이 무엇인지 명확히
이해하고 정의함
m 과제에 대해 이해하기 위해서 분석 분야에 대한 상세 업무를 파악하며
분석 결과의 사용자가 누구인지, 요구사항이 무엇인지, 풀려고 하는
문제가 무엇인지, 기대효과는 무엇인지 등을 정의함
- 필요시 내·외부 수요자에 대한 사전조사(민원, 설문, 인터뷰 등)를 통해
제공하고자 하는 서비스의 내용과 범위를 구체화
3. 분석 추진 방법 선정
3.1 행정자치부 수요조사 지원
m 행정자치부는 국가적 현안 및 사회적 이슈 해결 등을 위해 매년 파급력이
큰 공공 빅데이터 분석과제를 발굴·추진하고 있음
m 각 기관 담당자는 행정자치부의 분석과제 발굴을 위한 수요조사에 참여
함으로써 빅데이터 분석사업 추진의 기회를 얻을 수 있음
* 수요조사는 매년 행자부가 중앙행정기관, 지방자치단체 및 공공기관 대상으로 실시함
m 기관별 수요조사에 대한 심사 및 과제 효과성·타당성 검토를 거쳐 과제를
확정·추진함
- 앞서 과제 후보 추진 가능성 검토 단계에서 활용한 ‘과제 평가 기준표’는
기관이 자체적으로 과제를 발굴해서 추진하는 것을 목적으로 하지만,
행정자치부 수요조사는 범정부 차원의 공공 빅데이터 분석과제 발굴을
목적으로 하므로 과제의 필요성과 목표를 포함하여 기대효과와 참여
기관의 의지도 중요한 심사기준으로 함
42.
공공 빅데이터 업무적용가이드
38
* ‘16년에는 수요조사를 거쳐 건강보험심사평가원의 “실시간 국민관심질병 예측 서비스”
등 5개의 신규 분석사업을 확정·추진 중
심사기준 심사내용
과제 필요성 및 목표 과제의 중요성, 시급성, 구체성 및 혁신성 등
분석데이터 확보방안 분석 데이터 확보를 위한 외부 기관과의 협의 여부
빅데이터 분석방법 분석과제 세부 내용의 구체성 및 명료성
과제 수행 결과물 추진 목적에 부합하는 결과물 도출 가능성
기대효과 정량적 기대효과 제시 및 지속적 활용가능성
참여 기관의 의지 사전 BPR/ISP 수행여부, 분석 결과 공유·공개 여부 등
[표 9: 수요조사의 심사기준과 심사내용]
수요조사서
접수
⇒
과제 효과성 및
타당성 검토
⇒
과제선정 및
사업계획 수립
⇒ 과제추진
[그림 10: ‘16년 신규 분석사업 선정 절차 및 일정 예시]
3.2 자체 예산 확보를 통한 사업추진
m 빅데이터 분석사업에 전문성을 가진 사업자를 선정하여 정보화사업 형태로
추진할 수 있음
- 분석 사업의 추진체계가 갖추어져 있고, 추진 예산이 확보되어 있다면
요구사항을 상세화 하여 사업 발주
* 본 가이드의 부록1. “사업추진 단계별 절차”는 정보화사업 형태로 빅데이터 분석을 추진
할 경우 담당자가 확인해야 할 사항을 체크리스트 형태로 제시
m 사업을 자체적으로 추진하는 경우, 빅데이터 분석 사업의 관리자는 조직
내에서 정보화사업과 현업 업무를 두루 경험한 자를 선정하여 사업을
총괄하고 공정관리와 실적 점검, 산출물 관리 및 검수, 데이터 현황조사
지원, 업무 분석 지원 등이 원활히 진행될 수 있도록 하여야 함
- ‘제1절 추진체계 구성’에서도 설명했듯이, 빅데이터 분석 사업은 IT 사업이
아니라는 인식이 필요하며, 기존의 정보화 사업과 달리 IT부서 단독으로
43.
39
추진할 수 없음.따라서, 분석 사업의 관리자는 IT와 현업 모두 원활한
협업을 이끌 수 있는 사람이 적임자임
m 또한, 외부 전문가를 자문조직으로 구성하여 분석 사업에 대한 자문 등
과업 수행을 지원하고, 사업이 효율적으로 추진될 수 있도록 정책적
자문을 받는 것이 필요함
3.3 빅데이터 공통기반시스템을 활용한 과제분석
[그림 11: 빅데이터 포털 활용 검토 방법]
m 추진하고자 하는 과제를 빅데이터 포털에서 검색(①)하여 과거 타기관에서
분석한 동일한 과제가 존재하는지(②), 표준분석모델에 포함된 과제가
아닌지(③) 판단
m 동일한 과제가 존재하지 않는 경우는 공공 빅데이터 분석과제로 수행한
적이 없는 신규 과제로 판단하여 추진(④)하며, 이 경우, 본 가이드의
부록1. ‘사업추진 단계별 절차’의 점검사항을 참조하여 사업을 추진함
m 동일한 과제가 존재하지만, 표준분석모델에 포함되지 않는 경우는 빅데이터
포털의 기존 과제를 활용하여 과제를 추진(⑤)할 수 있음
44.
공공 빅데이터 업무적용가이드
40
m ④, ⑤의 경우 모두 빅데이터 공통기반시스템을 활용하여 과제를 분석할 수
있는데, 이 경우 빅데이터 포털내 전문분석을 요청하여 분석을 진행할 수 있음
참고 사항 – 빅데이터 포털 전문분석 도구
빅데이터 포털에서는 사용자가 빅데이터 공통기반 내에서 데이터 처리/분석/
시각화 등을 직접 수행할 수 있도록 전문분석 도구를 제공한다.
전문분석 도구는 다음과 같이 구성되어 있다.
빅데이터 포탈의 전문분석 도구 설명
도구명 사용분야 설명
Hadoop 2. X
플랫폼 (SBP)
데이터
저장/처리
ㅇ Hadoop 2.0 기반의 Big Data 플랫폼
ㅇ 데이터 저장 및 처리 지원 도구
ㅇ GUI기반 Big Query, Workflow 등 지원
R-GUI 솔루션
(SRA)
데이터
분석
ㅇ R기반 데이터 분석을 GUI 환경으로 제공
ㅇ 분석 프로세스에 대한 Workflow화 가능
ㅇ Hadoop 데이터 연계 분석 가능
시각화 솔루션
(Tableau)
분석
시각화
ㅇ 다양한 형태의 차트를 통한 분석 시각화
ㅇ Hadoop 데이터 및 R분석 모듈 연동
m 추진하고자 하는 과제가 표준분석모델에 포함되어 있는 경우는 표준분석
모델을 활용하여 사업을 추진(⑥)할 수 있으며, 이 경우, 빅데이터 포털
환경을 사용하여 구현할 것인지의 여부에 따라서 다음과 같은 추진
방안이 있음
- 표준분석모델 모듈을 받아 직접 분석 사업을 진행하는 경우 행정자치부로
표준분석모델 모듈을 요청하여 기관이 자체적으로 추진(⑥-1)해야 하며,
이 경우도 빅데이터 공통기반시스템의 전문분석을 요청하여 추진 가능
* 빅데이터 공통기반시스템의 전문분석 절차에 관하여는 빅데이터 공통기반
가이드북 제1 권 참조 (http://www.insight.go.kr 의 공지사항)
- 빅데이터 공통기반시스템에서 표준분석모델 프로세스를 이용하여 추진
가능(⑥-2)
* 빅데이터 공통기반시스템의 표준분석모델 매뉴얼 참조
(http://www.insight.go.kr 의 공지사항)
45.
41
4. 분석 비용및 기간 산정
m 과제 분석에 소요되는 비용과 예상 추진기간을 산출하며 수행에 필요한
비용을 산정해야 함
m 비용은 공공 빅데이터 분석 사업비 대가산정 가이드(2016.08. 행정자치부)를
준수하여 작성할 것을 권고함
* 대가산정 가이드를 반드시 준수해야 하는 것은 아니므로 기관에 맞게 활용할 수 있음
- 공공 빅데이터 분석 사업비 산정 모형에는 분석사업의 세부 태스크별로
난이도와 작업자수, 작업일수를 산정(①, ②)하고 작업 단계별 난이도를
고려한 보정계수(③)와 단계별 수행률 설정(④)을 통해 전체 투입
공수를 계산하여 개발원가를 산정(⑤)
* 개발원가는 인건비, 제경비, 기술료를 포함
단계 주요 내용
사전 준비
○ 분석대상 업무와 요구사항을 명확히 정의하고, 단계별 주요활동과
태스크 도출
단계별 투입공수
산정
○ 요구사항에 근거하여 분석대상 업무의 태스크 별로 난이도,
작업자 수, 작업일수 산출
단계별 보정계수
산정
○ 분석 사업의 특성을 고려하여 보정요소별로 복잡도(보정계수) 산정
– 보정요소 : 데이터 규모 보정, 데이터 처리 기술 보정, 분석모델
수립의 난이도 보정, 빅데이터 분석 기술 적용에 따른 복잡도
보정
단계별 수행률 설정
○ 사업 단계별 수행률 설정
○ 예를 들어, 데이터 수집, 전처리를 기관의 IT담당자가 수행하는
경우, 해당 단계별 수행률을 0%로 설정 가능
보정 후 소요비용
산정
○ 식별된 보정계수에 따라 소요공수 보정
– 소요공수 = 보정 전 분석규모 × 보정계수
○ 소요 공수에서 도출된 기술등급별 투입공수로 등급별 소요비용
산정
○ 등급별 소요비용에 제경비와 기술료를 더해 소요비용 합계 산정
직접경비 산정 ○ 해당 분석 사업에 관련된 직접경비 계산
분석 사업비 산정
○ 분석 사업비 산정
– 분석 사업비 = 개발원가 + 직접경비
[표 10: 사업비 산정 단계별 주요 내용]
46.
공공 빅데이터 업무적용가이드
42
- 데이터의 구매료, 특정 소프트웨어 도구 사용료, 특정기술 도입 관련
전문가 비용, 홍보물 제작 및 배포, 컨퍼런스 개최 등의 홍보비용을
포함하는 직접경비를 계산(⑥)
- 개발원가와 직접경비를 더해 공공 빅데이터 분석 사업비를 산정(⑦)
m 분석모델을 지속적으로 활용하고 개선해 나가기 위해서 과제 완료 이후
유지관리를 위한 계획도 고려되어야 하며, 이에 필요한 인력과 예산도
별도로 수립해야 함
m 사업비용 산정 시 대가산정 기준에 포함되지 않은 변수나 고려사항이
많거나, 구축 관련 인프라의 도입이 필요한 경우 빅데이터 관련 전문
업체나 기존에 분석 사업을 진행했던 경험이 있는 업체를 통해 기초
견적을 의뢰하는 방법도 고려
빅데이터 분석을 통해 달성하고자 하는 목표는 명확히 정의하였나?
사업 목적 달성을 위해서 필요한 요구사항이 빠짐없이 정의되었나?
다양한 과제추진 방법을 인지하고, 분석과제에 적합한 추진방법을 고려하였나?
예산수립 및 기간산정의 적정성 여부는 적절히 검토되었는가?
47.
제3장 활용 및분석모델 고도화
제1절 업무 적용 및 효과 검증
제2절 분석 결과 홍보
제3절 유지관리
제4절 분석모델 고도화
48.
공공 빅데이터 업무적용가이드
44
활용 및 분석모델 고도화 개요
활용 및 분석모델 고도화 단계에서는 분석 결과 업무적용에서 효과검증, 홍보,
유지관리, 분석모델 고도화에 이르기까지의 과정을 다룬다. 기 추진한
분석과제 결과를 업무에 적용하기 위한 준비, 실제 업무에 적용 그리고 적용
후에 나타나는 효과에 대한 검증까지 자세히 안내한다. 분석 결과 홍보 및
성과결과 공유 차원에서 다양한 매체를 통한 결과 홍보가 필요하며, 아울러
분석 서비스의 안정적인 운영과 현행화된 데이터의 수집·저장 관리, 분석
결과의 정책개발 및 행정업무 지원 등의 지속적인 활용을 위해 유지관리가
필요하다. 끝으로 분석모델은 대한 주기적이고 지속적인 고도화에 대한
필요성이 제기됨에 따라 기관에서는 분석 결과에 대한 활용 및 확산,
분석모델에 대한 지속적인 고도화를 통해 빅데이터 분석과제 추진의 목적을
달성할 수 있을 것이다.
□ 추진 절차
49.
45
제1절 업무 적용및 효과 검증
1. 적용 준비
m 빅데이터 분석 결과 활용 시 기대되는 성과를 기관 내에서 충분히 공유하여
홍보함으로써 빅데이터 활용에 대한 분위기를 조성함
m 국민의 다양한 요구에 대응한 효과적인 대민서비스 제공, 정책입안을 위한
자료로의 활용 및 업무 생산성 향상 등을 위한 장·단기 활용 계획을 수립함
m 실무자들에게 분석 결과에 대한 전반적인 내용을 이해시키고, 빅데이터
분석을 통해 도출된 결과물을 제시함
- 분석 결과 활용을 위한 실무자 교육에서, 추진한 빅데이터 분석의 목표를
정확하게 전달함으로써 실제 업무에 적용하는 방법 및 활용 방안 모색
2. 업무 적용
m 실무자는 실제 업무를 수행하는 과정에서 분석 결과를 업무에 적용
하여 활용함
m 실무자가 분석 결과를 업무에 어떻게 적용 하였는지 확인하고 실제로
적용 했을 때 불편한 점이나 개선해야할 사항이 있었는지 의견을 수렴
하여 향후 고도화를 진행할 때 반영할 수 있도록 함
m 실무자의 입장에서 분석 결과를 활용하기 전과 후에 업무가 어떻게 변화
되는지 업무 적용 효과성 제고 방안을 강구해야 함
m 기관의 빅데이터 활용 효과를 지속적으로 검증하기 위해 빅데이터 장·
단기 활용 계획이 우선적으로 수립되어 있어야 하며, 활용효과 측정을
위한 성과지표도 마련되어 있어야 함
* 예시는 ’근로감독 사업장 선정 과학화(‘15)‘ 과제의 성과목표, 성과지표 및 활용계획임
50.
공공 빅데이터 업무적용가이드
46
[그림 12 : 분석 과제의 장·단기적 목표 및 활용계획 예시]
3. 효과 검증 및 결과 공유
m 효과 검증에 앞서 성과를 측정할 항목을 정하고, 항목에 따라 측정 산식,
측정주체, 기간, 주기를 결정함. 그리고 주기별로 기대성과의 목표치를
설정하고 근거를 충분히 찾을 필요가 있음
m 기 계획된 성과 측정 방법에 따라 성과를 측정하고 예상 성과지표와의
비교분석이 필요함
m 실제 성과가 좋으면 분석 결과의 타당성 및 효과를 검증하게 됨. 반대로
실제 성과가 목표치보다 부족하다면 1차로 목표치 설정 근거의 문제점이
있는지 파악하고, 2차로 분석 과제의 개선사항을 고민할 필요가 있음
m 분석과제의 성과물을 지식화하여 향후 이와 유사한 분석과제 추진시
빅데이터 공통기반을 활용할 수 있도록 분석과정과 분석과정에서 발생하는
데이터, 분석결과 및 효과를 빅데이터 포털에 공유함
51.
47
4. 효과 검증단계의 점검
m 분석 결과에 대한 업무적용을 통해 나타나는 효과검증 단계에서는 다음과
같은 항목을 기준으로 점검해야 함
- 빅데이터 분석 결과를 활용 담당자, 또는 활용 가능성이 있는 조직
구성원들에게 공유 및 배포하는 체계를 마련하고, 이해와 적용을 돕는
세미나나 워크샵 등을 마련하여야 함
- 분석 결과가 단순 업무뿐만 아니라 복잡한 업무에 실제적으로 활용이 되어,
조직의 비즈니스 프로세스 또는 서비스 개선 영역까지 전략적으로 활용되
도록 유도해야함
- 분석 결과가 조직의 총체적인 성과 향상을 위해 활용되고 있는지, 빅데이터
측정 및 분석 결과를 외부 관계기관 등과 공유 및 활용하고 있는지 확인해야함
- 분석 결과의 배포 및 추적을 위해 Open-API의 데이터 정의 및 규격을 설정
하였는지 확인해야함
분석과제 효과 검증을 위한 성과지표를 달성했는가?
분석 결과 활용 전후에 업무가 어떻게 개선되었는지 확인하였는가?
분석과제 성과공유 및 확산 차원에서 빅데이터 포털 활용 계획이 있는가?
52.
공공 빅데이터 업무적용가이드
48
제2절 분석 결과 홍보
m 빅데이터 분석 결과를 홍보하는 것은 분석과제가 1회성 사업으로 그치지
않고 관련 분야로 지속적으로 보급·확산 될 수 있도록 하는 것이 목적임
m 빅데이터 분석 결과 공유 및 홍보를 통한 기관 내 빅데이터 확산을 위해
세미나 개최, 인쇄물 제작, 언론 보도, 홍보영상 제작, 홍보 웹사이트 구축
등의 홍보 방법이 있음
- 기 추진된 빅데이터 분석 결과를 가시적이고 효과적으로 표현하고,
디자인적 요소를 고려하며, 미디어에 따라 맞춤형으로 제작하여 정보
인지도 및 관심도 증진
[그림 13: 분석결과 공유] [그림 14: 분석 전문가 세미나]
53.
49
[그림 15: 빅데이터사업 설명이 가능한 인포·모션그래픽스 제작 및 활용]
m 분석과제를 관련 분야로 지속적으로 보급·확산할 수 있도록 공공 빅데이터
우수사례 경진대회에 참여하여 홍보 활동을 실시
m 공공부문 업무담당자를 대상으로 공공 빅데이터 이론교육 등을 실시하여
빅데이터 활용 활성화 제고
빅데이터 사업 결과 홍보 대상별 차별화된 홍보전략 및 방법을 고려하였는가?
빅데이터 홍보예산 확보방안을 수립하였는가?
54.
공공 빅데이터 업무적용가이드
50
제3절 유지관리
m 분석 서비스의 안정적인 운영과 현행화된 데이터의 수집·저장 관리,
분석 결과의 정책개발 및 행정업무 지원 등의 활용, 성과 공유 등을 위해
유지관리가 필요함
m 기관 담당자는 유지관리를 위해 사업 추진 이후 제공되는 서비스에 대한
내용 파악이 필요하며, 파악된 제공 서비스 내용을 기반으로 유지관리
체크리스트를 활용하여 세부 유지관리 사항을 구체화하여 점검해야 함
m 빅데이터 분석과제가 한 번에 끝나는 원타임(One-time) 프로젝트가 아님을
감안하여 매년 ‘유지·관리 및 업그레이드’, ‘새로운 업무 반영’이라는 유지
관리 목표를 수립하고, 유지관리 대상별로 구분하여 그에 따른 유지관리
수행 내용을 작성해야 함
구분 체크리스트 확인
운영
관리
단계
- 운영 관리를 위한 전담인력을 선별하여 구성하였는가?
- 유지관리 관련 기관의 책임과 역할을 명확히 정의 하였는가?
- 인력의 업무역량 분석 및 교육훈련 방안을 마련하였는가?
- 데이터 품질, 분석, 보안 및 서비스 운영관리를 위해 협력하는가?
- 지속적인 운영관리를 위한 협력체계를 확보하였는가?
확장
단계
- 분석 서비스의 추가가 필요한가?
- 분석 범위와 항목 확대가 필요한가?
- 초기 데이터와 추가 데이터의 이질성을 고려하는가?
- 분석 품질 향상을 위해 데이터 및 서비스의 상호운용성을
고려하는가?
- 다양한 데이터의 수집, 분석 및 재활용성을 위한 변화를 관리하는가?
[표 11: 유지관리 체크리스트]
55.
51
대상 관리 포인트
정책/제도- 정부 정책/제도 개발 및 적용
업무 - 신규 업무 반영, 기존 업무 업그레이드
관련 시스템 - 빅데이터 포털 및 Open API 현행화
인력 - 업무역량, 책임과역할(R&R), 교육훈련 등
서비스 - 분석과제 발굴, 활용방안마련, 성과관리 등
분석모델 - 분석 알고리즘 주기, 변수, 소스(데이터원천) 등
데이터 - 현 시점의 현행화 데이터 확인
[표 12: 유지관리 대상별 관리 포인트]
m 유지관리에 필요한 활동을 도출하고 각 활동별 투입공수를 산정하여
유지관리 예산을 수립함
m 유지관리 수행 시 상주·비상주 여부, 특정 유지관리 항목은 전문 인력이
필요하다는 내용 등의 제약사항 관리가 필요함
m 유지관리가 제대로 수행되지 않아 분석 결과가 최신 데이터와 업무 내용을
반영하지 못한다면 현업 부서에서는 빅데이터 분석 결과를 사용할 수 없음
분석 서비스가 최신의 데이터와 업무 내용을 반영하여 결과를 도출하고 있
나?
유지관리에 필요한 활동을 정의하고 유지관리를 위한 예산 또는 내부 전문
인력을 확보하였나?
56.
공공 빅데이터 업무적용가이드
52
제4절 분석모델 고도화
1. 분석모델 고도화 필요성
m 주변 환경의 변화를 빅데이터 분석모델에 지속적으로 반영하기 위해 분석
모델의 고도화 방안이 필요함
- 분석모델에는 계속 새로운 데이터가 들어오고 기존 모델을 통해서 분석
결과가 도출되는데, 이때 어떤 것을 모니터링하고 그 의미가 무엇인지를
설명할 수 있어야 함
- 또한, 분석 대상 업무와 환경은 지속적으로 변화하고 이에 따라 관련된
데이터도 변화하거나 다양화 되어 분석모델이 변화된 업무와 데이터를
계속해서 수용할 수 있어야 함
m 빅데이터 분석모델 고도화를 위해 기관 내·외부 데이터 축적 → 업무 활용
→ 빅데이터 관련 기술 성숙 → 데이터 축적의 선순환 구조가 작동해야 함
[그림 16: 빅데이터 역량 강화의 선순환 구조와 단절 원인]
m 업무 활동에서 생성되는 데이터를 방치하지 않고 업무 효율 개선에 반복적
으로 이용해야 하며, 빅데이터 역량 강화의 선순환 구조를 가동하기 위해
위 그림의 단절 원인을 극복해야 함
57.
53
2. 분석모델 고도화수행
m 초기 분석모델 보다 더 좋은 결과물을 도출하기 위해서 분석 과정 및
결과를 보완한 분석모델의 고도화를 추진할 필요가 있음
- 고도화 범위에 반영하기 위하여, 데이터 수집, 전처리, 분석 방법론, 분석
결과까지 과제의 전반에 대하여 보완하거나 신규 추가할 사항을 정리하여
개선방안을 도출
- 분석모델의 고도화를 위해 주체(기관)별로 장·단기 제도, 운영 방안을
수립
* 예시는 ’공동주택 관리비 투명성 제고‘(‘15) 과제의 장·단기 활용방안임
m 각 방안을 단계적으로 구체화하고 분석과제의 보완사항을 반영함
- 단계별 적용 업무 작성 및 각 방안의 근거 마련
기관 단기 방안(‘16년) 장기 방안(‘17년)
국토
교통부
- 데이터 관리 기반 마련을 위한
유관기관 협조 채널 구축 방안 수립
- 전국 단위 시범단지(특별시, 특별자치시,
광역시 중심) 선정 및 서비스 기반 마련
- 주택법 및 관련 시행령 점검 및
개선사항 도출
- K-apt 공동주택 관리비 투명성 제고를
위한 시스템 고도화 및 타 시스템 연계
- 관리비 지수에 따른 모범단지 선정 및
가이드 제공
- 주택법 및 관련 시행령 정립
경기도
- 경기도 전역 서비스 기반 마련
- 타 지역(안양시 외) 시범단지 선정 및
적용
- 검증 결과 대비 모델 개선사항 도출
- 경기도 전역 서비스 실시
- 지자체 조례 및 규약 점검 및 정립
- 경기도 공동주택 관리비 투명성 제고를
위한 시스템 고도화 및 타 시스템 연계
[표 13: 분석모델의 장·단기 활용 방안 예시]
58.
공공 빅데이터 업무적용가이드
54
3. 빅데이터 서비스 확장
m 분석 결과를 지속적으로 활용하기 위해 빅데이터 서비스 확장이 필요하며,
다음과 같은 점검사항을 확인하여 계획을 수립함
- 분석모델 고도화는 모델 자체의 ‘질적’ 개선임에 반하여 빅데이터
서비스 확장은 활용기관의 범위 확대 등 모델의 ‘양적’ 확산으로
개념상 구분할 수 있음
분석 서비스 추가
· 추가되는 서비스의 유형을 고려(데이터 가시화 방법 변경, 분석 프로세스 변경, 데이터
수집/가공/분석기법 추가 적용 등)
· 비용 대비 효과에 대한 고려
분석 범위의 확장
· 분석 서비스 추가나 분석 품질의 향상이 요구되는 상황에서 분석 범위를 확장하여
달성할 수 있는지 고려
· 수집, 분석대상 데이터의 범위 및 데이터의 종류를 확대, 기존분석 결과와 결합함으로써
분석 범위 확장
· 분석대상과 분석항목을 확장하고 다양한 분석모델 적용 확대
데이터의 이질성 고려
· 초기 데이터와 추가 데이터의 구조적인 이질성과 데이터 항목간의 의미적인 이질성,
데이터 값의 이질성을 식별해야 하며 분석을 위한 통합 모델 수립
· 통합 모델에 따라 데이터 가공 및 필터링 방법의 변경이 필요한지 검토
· 통합 모델은 메타데이터 관리체계에 편입하고 관리
연차별 분석모델 고도화 및 발전방안이 수립되어 있는가?
분석모델 고도화 수행 시 애로사항은 무엇이며, 이에 대한 극복방안은 무엇
인가?
59.
부록1. 사업추진 단계별점검항목
Ⅰ. 요건 정의
Ⅱ. 데이터 수집
Ⅲ. 데이터 전처리
Ⅳ. 분석모델링
Ⅴ. 모델 구현
Ⅵ. 시각화
Ⅶ. 검증 및 안정화
60.
공공 빅데이터 업무적용가이드
56
사업추진 단계별 점검항목 개요
사업추진 단계별 점검항목을 체크리스트 형식으로 다양한 예시와 함께 제시하
였다. 실제 사업에 들어가면 선정된 사업자가 요건정의, 데이터 수집, 분석모델
링, 시각화를 진행하므로, 사업의 관리자 입장에서 각 단계별로 어떤 작업들이
수행되고 어떤 것들을 점검해야 하는지 상세히 설명하였다. 사업의 착수 이후
사업이 종료될 때까지 점검 사항 들을 미리 숙지하고 사업을 진행하면 자칫 간
과할 수 있는 수많은 시행착오를 줄일 수 있을 것이다.
□ 추진 절차
61.
57
Ⅰ. 요건 정의
m요건 정의 단계는 빅데이터 분석과 활용을 통해 해결하고자 하는 현안에
대해 명확히 이해하고 정의하며, 사업 추진을 위해 필요한 환경을 분석
하고 사업의 추진 계획을 수립하는 과정을 포함함
1. 계획 수립
m 계획 수립 단계에서는 사업의 전체 수행 일정계획을 수립하고, 요구사항을
정의하기 위한 실무자 및 관계자와의 인터뷰 계획을 수립함
일정 계획 수립
- 사업단이 제시한 일정계획(WBS)이 제안요청서 및 제안서에 기술된 내용과
일치하는가?
- 사업 추진 일정이 제안서의 내용과 불일치하는 경우, 기술협상 단계나 사
업수행계획서 제출 이전에 사전 협의를 거쳤는가?
- 사업 수행 일정의 각 단계별로 투입하고자 하는 기술자의 등급과 투입 공
수는 사업수행계획서 상의 투입 계획과 일치하는가?
인터뷰 계획 수립
- 인터뷰 수행 대상은 사업목적 달성에 적합한 인원으로 도출되었나?
- 인터뷰 수행 대상에 업무 담당자와 IT 담당자가 고르게 분포되어 있나?
- 인터뷰 수행 일정은 사전에 인터뷰 대상자와 협의하여 확정하였는가?
- 인터뷰 질의서는 사업자가 문제의 현안을 파악하고 환경을 분석하는데 적합
하게 도출되었나?
[그림 17: 요건 정의 단계의 주요 활동]
62.
공공 빅데이터 업무적용가이드
58
2. 요구사항 정의
m 요구사항 정의 단계에서는 사업의 기본적인 이해를 바탕으로 현업 및 IT
담당자와 인터뷰를 수행하고 현안을 분석하며 관련 자료를 수집, 정리하여
요구사항을 정의함
요구사항 정의
- 제안요청서의 요구사항 내용을 모두 포함하는가?
ㆍ사업계획서, 제안요청서 등 계획단계에서 제시된 목표와 추진 전략을 잘
이해하고 있는지 파악
ㆍ제안요청서의 요구사항들이 요구사항 정의서의 상세설명과 맞는지 파악
- 사업 관련자의 추가 요구사항이 잘 반영되었나?
ㆍ사업 관련자와의 인터뷰를 통한 추가 요구사항 등이 잘 반영되었는지 파악
- 요구사항이 구체적으로 잘 정의되었는가?
ㆍ요구사항들의 설명이 상세하게 되어있는지 파악
ㆍ요구사항을 구현하는 방법이 적합한지 파악
ㆍ요구사항의 전제조건 및 제약사항이 있는지 파악
ㆍ요구사항과 관련 산출물이 맞는지 파악
- 요구사항추적표는 향후 검수를 위한 항목들이 잘 관리되고 있나?
ㆍ요구사항정의서와 요구사항추적표의 내용이 일치하는지 파악
ㆍ제안요청서 요구사항 ID 및 요구사항명 그리고 산출물과 구현내용이 일치
하는지 파악
인터뷰 수행
- 인터뷰 계획서 또는 질의서의 내용을 모두 포함하여 인터뷰가 진행되었나?
- 예정된 인터뷰 대상자들과 이슈 없이 인터뷰가 진행되었나?
- 추가 인터뷰 일정이 필요한가?
ㆍ수행된 인터뷰 외에 추가 인터뷰가 필요한지 파악
- 인터뷰 결과서는 사업의 이해와 요구사항 분석을 위해서 잘 작성되었나?
ㆍ수행된 인터뷰로 사업단이 사업의 전반적인 이해를 하였는지 파악
ㆍ인터뷰가 요구사항들을 파악하기에 충분하였는지 파악
ㆍ요구사항의 추가 및 변경 사항이 잘 반영되었는지 파악
ㆍ요구사항의 세부항목들이 구체화 되었는지 파악
63.
59
3. 업무 및관련 시스템 현황 분석
m 시스템 현황 분석 단계에서는 앞으로 사업을 수행하기 위해 활용될
빅데이터 포털, 수집대상 데이터, 데이터를 수집할 환경의 현황을 분석
하여 사업 준비를 시작하는 단계임
빅데이터 포털 분석
- 빅데이터 포털을 사용하여 사업을 수행한다면 그 범위와 대상은 명확히 구분
하였나?
ㆍ빅데이터 포털을 활용할 목적이 명확한지 파악
ㆍ활용 범위가 구체적으로 어디까지인지 파악
- 빅데이터 포털의 H/W와 S/W의 현황을 파악하였는가?
- 사전 준비 사항을 점검하였나?
ㆍ빅데이터 포털의 활용 범위에 따라 작업내용을 구체화 하였는지 파악
ㆍ작업내용별 예상 소요 일정을 계획 하였는지 파악
ㆍ빅데이터 포털의 개발환경 사용을 행정자치부와 협의하였는지 파악
수집 데이터 현황분석
- 분석 목표 달성을 위해 필요한 수집 대상 데이터 목록을 정의하였나?
ㆍ선행사례 조사 및 인터뷰를 통해 필요한 데이터 목록을 정리하였는지 파악
ㆍ수집 대상 데이터의 외부 데이터 보유기관을 조사하였는지 파악
선행사업 분석 및 자료조사
- 과제 수행 시 필요한 자료는 잘 도출되고 활용되고 있나?
- 국내외 선행사례들을 연구하고 시사점을 도출하여 사업에 적용하였나?
ㆍ유사한 국내·외 선행 사례를 조사하고 필요한 내용이 잘 정리가 되었는지 파악
ㆍ선행 사례 조사를 바탕으로 수행 사업에서 필요한 데이터, 보유기관,
분석모델링 방법이 정리되었는지 파악
64.
공공 빅데이터 업무적용가이드
60
4. 성과관리 계획
m 성과관리 계획 단계에서는 사업 수행 결과를 업무에 적용하여 평가할 기준
및 계획을 세우고, 결과를 실제 업무에 적용하기 위한 단계적 활용방안과
타 지역(또는 전국) 확산을 위한 방안을 계획함
- 분석 목표 달성을 위한 분석 항목을 정의하였나?
ㆍ요구되는 분석 항목을 정의하고 각 항목별 데이터 현황을 파악하였는지 확인
ㆍ다른 유관기관이 보유하고 있는 데이터와 병합할 방법을 정의하였는지 파악
수집환경 분석
- 내부망 또는 외부망에서 데이터 수집이 가능한지 여부는 조사하였나?
- 외부망을 활용한다면 데이터 수집 루트를 정하였는가?
- 데이터 수집을 위한 개발환경 계획이 잘 되었는가?
- 데이터 수집을 위한 환경 분석이 완료되었는가?
성과관리 계획
- 사업목적에 적합한 성과목표를 세웠는가?
ㆍ성과목표가 분석과제에 합당한지 검토
ㆍ분석과제에 대하여 성과목표가 현실성이 있는지 파악
- 성과목표에 대하여 대상, 기간, 측정 항목들이 명확하고 구체적으로 작성되었는가?
- 성과 측정시기별 계획안이 마련되었는가?
ㆍ측정 시기 간격이 성과를 측정하기에 적절한지 파악
ㆍ성과측정이 단기, 장기로 계획안이 마련되었는지 파악
성과관리 지표 정의
- 성과관리 지표가 분석과제를 평가하기 위해 타당한가?
ㆍ지표의 측정주체가 정의되어 있는지 파악
ㆍ지표 측정 산식의 근거가 타당한지 검토
ㆍ측정시기별 목표치 설정근거가 타당한지 검토
65.
61
- 성과관리 운영방안을수립하였는가?
ㆍ성과점검의 기관별 역할이 명확한지 파악
ㆍ기관들 간의 성과평가 범위를 정의 하였는지 파악
ㆍ성과점검 및 성과평가의 절차가 세워졌는지 파악
성과관리 활용계획
- 성과지표의 단기/중기/장기 활용계획을 수립하였나?
- 과제 수행 결과 활용 계획을 합리적으로 세웠는가?
ㆍ활용계획의 목표가 현실성이 있는지 파악
ㆍ활용계획 설정 근거가 타당한지 점검
- 분석모형의 일반화, 확산 및 운영방안 수립 등의 활용방안을 제시하였는가?
ㆍ단기 및 중·장기 활용계획의 적용대상 업무 정의
ㆍ과제 확산으로 얻을 수 있는 기대효과 명시
ㆍ과제 확산 계획의 타당성 검토
66.
공공 빅데이터 업무적용가이드
62
Ⅱ. 데이터 수집
m 데이터 수집 단계에서는 분석 데이터를 정의하고 수집 환경을 구성하여
데이터를 수집함
[그림 18: 데이터 수집 단계의 주요 활동]
1. 분석 데이터 정의
m 분석 데이터 정의 단계에서는 분석 범위에 맞는 데이터 수집 대상 목록을
정리하고 보유기관 및 담당자를 조사함
필요 데이터 정의
- 분석 대상 범위 정의가 완료되었는가?
ㆍ분석 대상 범위 정의가 요구사항을 만족 시키는지 점검
- 데이터 수집 대상 목록을 작성하였는가?
ㆍ사전 조사 및 인터뷰를 바탕으로 수집 대상 목록 작성
ㆍ추가 수집 대상 데이터가 없는지 파악
ㆍ데이터 종류, 양, 보관 방식, 수집주기와 분석주기, 백업과 이중화 등 원시
(raw) 데이터에 대한 요구사항 도출 및 분석
- 수집 대상 데이터 보유기관 및 담당자를 조사하였는가?
- 보유기관이 데이터를 제공하는 형식을 조사하였는가?
- 보유기관으로부터 데이터 메타정보(칼럼, 건수, 크기, 길이)를 입수하였는가?
데이터 확보 방안 수립 및 점검
- 보유기관으로부터 데이터 확보 및 수집 방안을 세웠는가?
- 조사한 데이터는 사용 가능한 데이터인가?
- 조사한 데이터는 수집 가능한가?
67.
63
2. 수집 환경구성
m 수집 환경 구성 단계에서는 기관이 보유한 수집 환경이나, 빅데이터 포털
인프라를 활용하여 데이터를 수집하고 이를 위한 환경을 구성함
- 데이터 수집 항목 중 민간 기업에서 수집되는 경우가 있다면, 데이터 수집
비용은 적절한가?
개인 정보에 대한 점검
- 수집 예정 데이터에 개인정보가 포함되어있는가?
ㆍ개인정보 침해 가능성 검토를 하였는지 확인
- 수집 예정 데이터에 개인정보가 포함되어있다면, 유출될 문제에 대하여 방안을
세웠는가?
ㆍ개인정보 데이터 제공 범위 협의
ㆍ개인정보 보안 방안 협의
데이터 수집 환경 구성
- 데이터 수집 환경으로 빅데이터 포털을 활용하는가?
- 데이터 수집 환경을 구성하였는가?
ㆍ빅데이터 포털 활용 시 행정망 연계를 통하여 수집환경 구성
- 타 기관 데이터 수집 환경을 구성하였는가?
ㆍ외부 기관이 보유하고 있는 데이터의 경우 데이터 이관 및 연동 시스템 구현 필요
ㆍ데이터 연계 방안에 대하여 협의하였는지 검토
- 수집할 데이터의 크기 및 최대 저장기간 등을 고려하여 저장공간을 설계하였는가?
- 데이터 수집 기술이 웹 크롤링일 경우 수집환경 구성에 아래와 같은 사항을
검토하였는가?
ㆍ소셜 데이터와 같은 외부 공개 데이터를 자체 수집하는 경우 빅데이터
포털의 수집 환경 활용 또는 데이터 크롤링 시스템 별도 구현
- 데이터 수집을 위한 사전 테스트를 진행하였는가?
68.
공공 빅데이터 업무적용가이드
64
3. 데이터 수집
m 데이터 수집 단계에서는 수집 대상을 명확하게 정의하여 보유기관에 요청
하여 수집함
Ⅲ. 데이터 전처리
m 데이터 전처리 단계는 수집된 데이터를 파악하여 데이터의 오류를 점검하고,
데이터를 정제함과 동시에 매칭 key 값을 기준으로 여러 데이터를 융합하고
기초 통계 분석을 통해 데이터의 고유 패턴을 파악함
m 분석 대상 업무가 1회성이 아닌, 지속적으로 서비스를 수행해야 하는 경우
빅데이터 포털이나 기관 자체 인프라를 활용하여 데이터 수집, 정제,
표준화, 융합이 자동화 되도록 시스템 연계를 추진하고, 모듈을 설계하고
구현함
데이터 수집
- 데이터를 수집하기 위한 보유기관과의 협의 일정을 세웠는가?
- 데이터 수집을 위해 보유기관에 보낼 협조 공문을 준비하였는가?
- 보유기관에 요청할 데이터 리스트는 구체적으로 작성하였는가?
ㆍ대상 데이터의 시간, 공간의 범위가 명확한지 파악
ㆍ모든 보유기관에 요청 시 대상 데이터의 시간, 공간의 범위 동일한지 파악
ㆍ요청 데이터 목록을 정의하였는지 파악
- 기관 내·외부 데이터 수집을 완료하였는가?
- 데이터 수집 시 주의사항
ㆍ데이터의 품질, 수집기술, 데이터 보안 및 개인정보보호 문제 등 고려할
부분이 많으므로 전문가의 조언이 필요
ㆍ데이터 수집활동은 분석 결과의 품질을 좌우하는 중요한 과정이므로 분석에
필요한 데이터 항목들이 반드시 포함될 수 있도록 사전 점검 필요
69.
65
[그림 19: 데이터전처리 단계의 주요 활동]
1. 데이터 정제
m 데이터 정제 단계에서는 다양한 매체로부터 수집된 데이터를 기초 분석하여
오류가 있는지 파악하고, 원하는 형태로 변환하여 빅데이터화 한 후
저장하고 데이터를 활용할 수 있도록 품질을 확인하고 관리함
2. 데이터 저장
m 데이터 저장 단계에서는 데이터 구조를 표준화하고, 모든 데이터(테이블)를
융합(매칭)할 주요 key 값을 찾음
m 데이터를 융합하여 데이터의 정보 및 패턴을 파악하기 위해 기초 통계
분석을 하며, 빅데이터 포털이나 기관 자체 인프라를 활용하여 데이터
관리가 자동화되도록 함
데이터 정제
- 데이터 기초 분석을 하였는가?
- 오류데이터 제거, 캐릭터 셋 통일, 길이 체크, 날짜 포맷 통일 등 Data 검증
및 정제 과정을 거쳤는가?
- 코드 데이터가 정의된 코드값에 맞게 변환되었나?
- 데이터에 포함된 개인정보는 모두 비식별화 하였는가?
- 사용하는 모든 데이터가 개인정보보호법에 따른 제약사항을 준수하고 있나?
70.
공공 빅데이터 업무적용가이드
66
데이터 표준화 및 융합
- 수집된 데이터의 속성(칼럼명, 유형(문자형, 숫자형 등), 크기 및 길이, 필수
여부 등) 정의가 되어있는가?
- 분석에 필요한 데이터 목록과 유형이 정의 되고 변환 기준이 정의되었는가?
- 수집된 데이터는 구조를 통일하고 병합하는 표준화 과정을 거쳤는가?
ㆍ데이터 품질 측정
구분 품질요소 품질기준 검사내용
데이터
품질
완전성
개별
완전성
필수컬럼의 값 누락여부 확인
유효성
범위
유효성
컬럼 값이 주어진 범위내에 존재하는지 확인
일관성
형식
표준화
날짜, 시간, 등의 정보가 동일 형식으로 표준화 되
었는지 확인
보완성
오류
조치율
오류 및 누락 데이터의 조치 및 처리 여부 확인
[표 14: 품질관리목표]
- 여러 유관기관의 데이터 융합에 대한 설계가 되어있는가?
- 데이터 정제를 통해 데이터의 품질이 확보되었나?
데이터 관리 및 수집 자동화
- 데이터를 추출-변환-탑재(ETL, Extract–Transform- Load) 하기 위한 변환
시스템은 정상 작동하나?
- 데이터 보유기관으로부터 데이터를 주기적으로 수집이 가능하도록 연계가
이루어졌는가?
데이터 기초 통계 분석
- 정제된 데이터를 파악하기 위해 기초 통계(평균, 분산, 최소값, 최대값,
사분위수 등)를 추출하였는가?
ㆍ추출된 기초 통계가 데이터 전체를 파악하기에 적합한지 검토
- 데이터 현황 분석을 하였는가?
ㆍ데이터를 시간별, 공간별 등 다른 시각으로 접근하여 분석하였는지 검토
ㆍ데이터의 고유한 패턴을 파악하였는지 검토
71.
67
3. 시스템 연계
m시스템 연계 단계에서는 빅데이터 포털이나 기관 자체 인프라를 활용하여
데이터 정제 및 융합이 자동화 될 수 있도록 데이터 연계 개발을 수행함
[그림 20: 데이터 기초 통계분석 예시]
빅데이터 포털을 활용하는 경우
- 빅데이터 포털의 활용 범위를 정하였는가?
- 주요 연계 데이터를 정하였는가?
- 빅데이터 포털에서 활용할 데이터 저장방식을 정하였는가?
- 빅데이터 포털의 전문분석 도구(SBP SRA, Tableau)를 활용하여 연계하는가?
- 데이터 연계 방식을 설계하였는가?
- 데이터 보완 관리에 대하여 고려하였는가?
ㆍ데이터 접근 제어가 가능한지 점검
ㆍ사용자 인증 절차 기능이 있는지 점검
ㆍ분석 프로세스 단계별로 나오는 결과들이 외부의 불법적인 침입으로 유출
되지 않도록 조치가 취하여졌는지 확인
72.
공공 빅데이터 업무적용가이드
68
4. 모듈 설계 및 구현
m 모듈 설계 및 구현 단계에서는 표준화 및 융합, 정제를 위한 환경을
분석하여 모듈을 설계하고 구현함
[그림 21: 데이터 연계 구상도 예시]
표준화 모듈 설계 및 구현
- 표준화 모듈 설계를 하였는가?
- 표준화 모듈 구현이 잘 되었는가?
데이터 정제 모듈 설계 및 구현
- 데이터 정제 모듈 설계를 하였는가?
- 데이터 모듈 구현이 잘 되었는가?
73.
69
Ⅳ. 분석모델링
m 분석모델링단계에서는 분석 대상 및 범위를 정하여 분석 목적을 구현하기
위한 분석 방법론을 설계하는 단계임
m 분석모델 설계가 타당한지 자문위원회 회의를 거쳐 논의하고, 내용을 추가
반영하여 분석모델 설계를 완성함
[그림 22: 분석모델링 단계의 주요 활동]
분석시나리오 작성
- 분석 대상 및 범위가 요구사항에 맞게 정해졌는가?
- 분석에 필요한 데이터가 정의 되었는가?
- 분석 목표별 구현 모델(Ex. 분류모델, 지수모델, 예측모델 등)을 정하였는가?
[그림 23: 분석 시나리오 구성 예시]
74.
공공 빅데이터 업무적용가이드
70
분석모델 설계(초안)
- 필요한 데이터 항목이 정해졌는가?
- 데이터 항목별 표준화 방법을 정하였는가?
ㆍ데이터의 단위를 고려하여 표준화하였는지 파악
- 데이터 수집 가능 항목에 따라, 단계별로 모델이 설계 되었는가?
- 분석 검증 통계기법을 정하였는가?
ㆍ검증방법이 타당한지 판단
분석모델 설계(수정안)
- 현업, 빅데이터 전문가, 실무자들로 구성된 자문위원단과 분석모델 설계를
검토하였는가?
- 분석모델 설계(수정안)가 타탕한가?
75.
71
Ⅴ. 모델 구현
m모델 구현 단계에서는 분석모델링 설계를 알고리즘으로 구현하기 위해
알고리즘 모델링을 설계하고 모듈을 개발하여 분석 알고리즘을 구현함
[그림 24: 모델구현 단계의 주요활동]
1. 분석 알고리즘 모델링
m 분석 알고리즘 모델링 단계에서는 분석모델링 설계에 따라 알고리즘을
설계하며 만약 분석모델링 설계에 ‘텍스트 마이닝’ 분석 기법을 활용
한다면 단어 사전 구축이 매우 중요한 단계로써 사전구축에 대하여
점검할 필요가 있음
사전 구축
- 분석 대상의 언어(Ex. 한글) 사전을 구축하였는가?
- 분석 목표가 되는 키워드(Ex. 갈등 인지 단어)를 정의하였는가?
ㆍ키워드 사전으로 분석 목표를 달성할 수 있는지 검토
- 분석 목적과 거리가 먼 명사인 불용어 사전을 구축하였는가?
ㆍ불용어 사전 구축 전과 후의 분석 결과 비교
분석 알고리즘 모델링
- 분석모델에 대하여 조사하였는가?
ㆍ분석모델에서 사용한 분석기법이 알고리즘화가 가능한지 점검
- 분석 알고리즘 모델을 설계하였는가?
ㆍ분석모델을 기반으로 알고리즘을 설계하였는지 확인
76.
공공 빅데이터 업무적용가이드
72
2. 모듈 개발
m 모듈 개발 단계에서는 분석 알고리즘을 적용할 모듈을 정의하고 설계하며,
분석 알고리즘을 적용하여 동작에 문제가 없는지 확인함
모듈 기능 정의 및 설계
- 모듈에 대한 기능을 정의하였는가?
ㆍ기존에 존재하는 언어 사전이 분석에 활용이 가능한지 확인
ㆍ누락된 알고리즘이 없는지 점검
ㆍ중복되거나 누락된 모듈 기능이 없는지 검토
- 모듈 설계를 실시하였는가?
ㆍH/W와 S/W등의 제반 상황을 고려하여 모듈 구축가능성을 검토
ㆍ분석모델 프로세스와 모듈설계안이 일치하는지 검토
모듈 개발
- 모듈 개발 결과물이 모델 설계와 일치하는가?
- 구축한 모듈이 정상적으로 동작하는가?
77.
73
Ⅵ. 시각화
m 시각화단계에서는 분석 결과가 단순 수치가 아닌, 분석가 이외의 사람들이
이해하기 쉽도록 그림 및 도표를 활용하여 표현하며 수집한 데이터 및
분석 결과를 담당자 및 관련 기관들과 공유하기 위한 목적으로 필요하다면
Open-API 형태로 제공하도록 개발함
[그림 25: 시각화 단계의 주요 활동]
1. 분석 결과 시각화
m 분석 결과 시각화 단계에서는 분석 결과를 다양한 관점에서 고찰하고 패턴을
쉽게 발견할 수 있도록 시각화를 설계하고 개발함
시각화 설계
- 시각화 설계 목차로 메뉴 구조도를 작성하였는가?
- 목차마다 화면이 설계되어있는가?
- 화면 설계에 구체적인 설명이 되어있는가?
ㆍ화면 구성이 이해하기 쉽고 한 눈에 들어오는지 확인
- 화면을 스토리 보드에 맞게 구성하였는가?
ㆍ시각화에 서론, 본론, 결론과 같이 스토리가 담겨있나 검토
- 분석 결과가 잘 반영되었는가?
ㆍ분석 결과 의미가 잘 표현되었는지 검토
ㆍ분석 대상의 기본정보를 제공하여 분석의 이해를 돕고 있는지 검토
ㆍ다양한 관점의 시각화 방식이 구현 가능한 설계인지 검토
시각화 개발
- 분석 결과별로 시각화를 개발하였는가?
78.
공공 빅데이터 업무적용가이드
74
2. 분석 결과 활용
m 분석 결과 활용 단계에서는 수집 데이터 및 분석 결과를 담당자 및 관련
기관들과 공유할 수 있도록 필요하다면 Open-API를 개발함
ㆍ분석 결과를 통해 데이터를 바로 확인할 수 있도록 시각화되었는지 검토
ㆍ모든 분석 결과의 의미가 시각화로 쉽게 이해가 되는지 검토
- 시각화 화면 설계 시 실무자의 의견이 반영되었는가?
- 데이터 분석 결과를 추출, 시각화 작동되는 단계까지 작동에 오류가 없는가?
활용 계획 수립
- 빅데이터 분석 및 활용에 대한 계획을 수립할 때 전체 조직 구성원들의
아이디어와 의견이 반영되었나?
- 분석 결과를 활용하고, 적용하고, 활성화 하려는 계획을 갖고 있나?
ㆍ분석 결과의 단기 활용계획과 중장기 활용 계획 수립 및 상세화
ㆍ빅데이터 활용과 관련하여 단계적이고 구체적인 계획 수립
- 분석종료 후 결과 활용을 위한 관련부서 협조와 예산확보는 가능한가?
ㆍ수립한 빅데이터 분석 및 활용 방안은 기술적, 경제적으로 충분히 실현가능해야 함
분석 결과의 배포 및 추적
- 분석 완료된 결과를 리포트 형태로 구성하고 이를 유통, 배포했는가?
Open-API
- Open-API의 데이터 정의 및 규격을 설정하였는가?
- 데이터 수요자와 개방 방식을 정하였는가?
ㆍ데이터 수요자의 범위를 실무 담당자, 관련기관, 일반 사람들 등 접근 권한을
조정할 수 있는 기능이 존재 하는지 확인
ㆍOpen-API의 개방 방식이 수요자에게 편리한 방식인지 검토
- 데이터의 공공성을 판단하여 공공기관과 대국민에게 개방할 데이터를 구분하였는가?
테스트
- 시각화 및 Open-API 테스트 시나리오를 수립하고 테스트를 실시하였는가?
79.
75
3. 결과공유
m 결과공유단계에서는 향후 타기관이 유사한 분석과제를 수행할 때, 빅데
이터 포털을 활용할 수 있도록 분석 과정과 결과를 공유함
Ⅶ. 검증 및 안정화
m 검증 및 안정화 단계에서는 사업 전반에 대한 결과물(시각화, 분석 프로세스
자동화 등)을 통합 테스트하여 검증하고, 사용자 테스트 후 검수를 거쳐
분석 결과를 사용할 실무자를 위하여 교육을 실시하고 인수인계를 함
결과공유
- 결과공유 대상과 범위(분석 과정, 시각화 결과 등)를 정하였는가?
- 빅데이터 포털을 활용하여 결과공유를 하였는가?
- 결과공유에 분석 수행 과제의 주제 및 목적이 잘 드러났는가?
- 분석과제의 데이터 수집>정제>표준화>융합>분석>검증 단계에 맞춰 설명이
잘 되어있는가?
- 원시데이터와 분석대상 데이터의 샘플 및 속성 정보를 제공하였는가?
- 빅데이터 포털을 활용하여 분석 프로세스 절차대로 수행하였는가?
- 분석 과제의 결과공유를 위해 빅데이터 포털에 과제를 등록할 때 다음과
같은 항목들을 입력하여 빅데이터 담당자들이 참조하고 활용할 수 있도록 함
빅데이터 포털에 과제 등록 시 입력 내용
입력
항목
ㆍ과제명, 과제 필요성 및 목표, 과제 설명
ㆍ전제조건 및 제약사항
ㆍ활용 데이터
ㆍ분석 기법 및 시각화 결과
ㆍ분석결과 설명 및 시사점
ㆍ활용 계획
업로드
파일
ㆍ분석결과
ㆍ시각화 샘플
ㆍ결과 보고서
ㆍ샘플데이터
[표 15: 결과공유 항목]
80.
공공 빅데이터 업무적용가이드
76
[그림 26: 검증 단계의 주요 활동]
1. 테스트 계획
m 테스트 계획 단계에서는 프로젝트 추진과 관련된 테스트 활동 중 통합
테스트 계획을 세워 사업의 통합테스트 요구사항과 목표, 테스트 범위,
절차, 요구 되는 자원, 일정 등에 대한 계획을 수립함
2. 사용자 검수
m 사용자 검수 단계에서는 테스트 계획에 따라 통합테스트를 실시하여
프로젝트를 점검하고 검수함
테스트 계획 수립
- 테스트 대상 및 범위를 선정하였는가?
- 테스트 대상 및 범위가 사업 결과물(자동화 시스템 및 시각화 등)을 판단하는
데 적합한가?
- 테스트 유형별로 점검항목을 구체화하였는가?
- 테스트 항목을 단계적으로 정하였는가?
- 테스트 예상 결과를 도출하였는가?
- 테스트 수행 주체 및 참여자를 선정하였는가?
통합 테스트
- 테스트 계획에 따라 진행하였는가?
81.
77
3. 인수인계
m 인수인계단계에서는 실제 업무에서 분석 결과를 활용하게 될 실무자를
위한 교육을 실시함
- 테스트 결과가 예상 결과와 동일한가, 다르다면 그 원인을 찾고 해결하였는가?
- 분석결과 검증을 위해 관련 전문가와 동행한 현장 실사를 진행하였나?
ㆍ예를 들어, CCTV 사각지대의 경우, 분석 결과 사각지대로 파악된 지점을
직접 찾아가 실사하고 분석 결과와 실제가 일치하는지 검증 필요
사용자 승인 테스트
- 사용자가 통합 테스트에 참석하였는가?
- 혹은 사용자를 위한 시연을 실시하였는가?
[그림 27: 통합 테스트 절차 예시]
인수인계
- 사용자를 위한 시스템(분석 자동화 및 시각화 화면) 사용자 지침서를 작성하
였는가?
82.
공공 빅데이터 업무적용가이드
78
ㆍ분석 프로세스는 단계별 설명이 충분한지 검토
ㆍ알고리즘 단계별 주석의 설명이 이해하기 쉬운지 검토
ㆍ시각화 화면의 구성에 대한 설명이 모두 되어있는지 검토
ㆍ시스템 작동 단계별 매뉴얼이 구성되어 있는지 검토
- 사용자 및 운영자를 위한 교육을 계획하고 실시하였는가?
ㆍ교육 대상자가 적합한지 검토
ㆍ인수인계를 위해 교육 내용이 충분한지 검토
ㆍ교육 대상자의 참석률이 높았는지 확인
팀!I
공공빅더l이터
업무적용가이드
---
“a
”ι
R
·
∼
빼
뼈에
””“F
N
”·”·
、
”u싸
”감
、、
」-、、、、、、、、‘‘
What Big +뭘까?
정부기관의공공뎌|이터와 인터넷, 민긴렐 다양한 데이터를 융합하고
분석흘때 국민의 눈높이애 과학적민 정책롤 수립용}는 맞홈혈 공공서비스를
체공훌따| 위한정부3.아뻐난의 핵심과제 입니다.
케2!I필요할까?
흩쩌쳐 있몰 때는 그냥 자료.XI만 묵아서 분석하면 미래를 여I혹할 수 있는
빅데이터! 효과쩍인 정핵수립을 위한 장부의 Otol디어 발굴, 국민 맞훌형
서비스제공,미래예혹롤훌한선체적대응이가능해집니다.
+어떤효과?
모틀정책과공공서비스의 목표는국민행복률위한것!
판리비 투명성 제고, 칼둥 조기인지, 근로환영 개선, 지역관광 활성화 둥
국민챙활과 밀접한 분야에 빅데이터를 활용한 과확쩍인 정책률 수립흉때
국민행복지수를높입니다.
Why Big
How Big
.행정자1'1부
홈페이지 : http://'째vw.moi.go.kr/
벅I힘팩 : 빼p://'뻐NW.bigd없.go.kr/
NIA흔핀국정보확진흉뭔
훌퍼IO)A): http:/f빼vw.nia.or.kr/
헌화; (053)230-1562