SlideShare a Scribd company logo
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
서울시 소년범죄 발생 건수 예측 모델링
2020-1시스템종합설계
강정훈, 송휘종, 임선학, 최제윤, 신정원
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Wevelop
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
CONTENTS
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
003 예측모델소개
▪ SPSS시계열분석
▪ MarkovChain
004 예측모델평가
▪ 모델평가
001 프로젝트개요
▪ 소년범죄발생건수예측모델
002 데이터정리
▪ 데이터정리
005 결론
▪ 결론
▪ 기대효과
▪ 향후과제
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
프로젝트 개요
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
1. 청소년범죄
포털사이트에청소년범죄에대한기사약20만건
현사회에서청소년범죄에대한관심과예방대책논의증가
서론
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
1. 청소년범죄
현사회에서소년범죄의실태를통계자료로찾아정리
소년범죄를예방하고자범죄발생건수를미리예측하는모델링을구축
서론
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
데이터 정리
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
2. 데이터정리
분석을위해13년부터5개년을찾아자료를정리
18년도데이터는예측한모델의정확도를평가하기위해넣지않음
DATA
2013 2014 2015 2016 2017
1월 626 333 285 254 249
2월 374 301 219 169 240
3월 508 277 246 256 254
4월 615 336 267 289 245
5월 573 374 359 371 273
6월 530 377 425 379 311
7월 648 416 423 326 294
8월 581 445 417 351 322
9월 638 398 396 280 312
10월 602 456 554 454 262
11월 427 401 286 298 259
12월 348 313 296 266 226
2013 2014 2015 2016 2017
1월 361 334 346 305 318
2월 256 227 224 266 340
3월 290 246 230 293 300
4월 379 313 240 261 287
5월 403 310 320 327 328
6월 410 287 333 317 349
7월 425 380 343 296 354
8월 325 283 332 327 351
9월 331 333 307 305 340
10월 335 428 369 384 281
11월 346 316 296 298 312
12월 260 374 303 251 239
절도 발생 데이터 폭력 발생 데이터
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
예측모델 소개
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
1.사용할모델
Sequence chart
ACF & PACF
ARIMA Model
- 데이터가 가진 주기(패턴)을 분석하여 그래프로 나타낸 차트
- ACF(자기상관함수) : MA모형의 차수를 정하기 위한 함수
- PACF(편자기상관함수) : AR모형의 차수를 정하기 위한 함수
- AR(자기회귀)모형과 MA(이동평균)모형의 결합(I)으로 이뤄진 예측모델
- 계절성모델과 비계절성 모델을 곱해서 예측하는 모델
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
2.소년범죄데이터에대한시계열분석
1) 평균적으로 여름~가을 사이에 범죄가 많이 일어남
겨울~봄 사이에 범죄가 적게 일어남을 볼 수 있음
2) 해가 지날수록 범죄의 발생은 낮아졌으나
주기성 패턴이 사라짐을 볼 수 있음
3) 그러므로 전체적인 발생빈도가 낮아진다고 안심할 것이 아니라,
1년 내내 범죄가 균일하게 발생할 수 있음에 경각심을 가져야함
Sequence chart - 절도
1) 평균적으로 여름~겨울 사이에 범죄가 많이 일어남
봄에 범죄가 적게 일어남을 볼 수 있음
2) 해가 지날수록 범죄의 발생은 낮아졌으나
주기성 패턴이 사라짐을 볼 수 있음
3) 소년범죄를 기준으로 고찰하였을 때,
학기가 새로이 시작하는 봄에 범죄가 적게 일어나고
학기 중에 범죄가 빈번히 일어남
Sequence chart - 폭력
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
3.소년범죄데이터중절도범죄에대한예측모형
1) ARIMA 모델을 사용하기 위해 자기상관함수를 사용
2) 그래프의 모양이 사인함수의 파형과 닮아 있으므로
MA(0) 사용
ACF
1) ARIMA 모델을 사용하기 위해 편자기상관함수를 사용
2) 그래프의 모양이 지수함수의 파형과 닮아 있으므로
AR(2) 사용
PACF
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
3.소년범죄데이터중절도범죄에대한예측모형
1) ARIMA (2,1,0)(0,1,0) 사용
2) 모형의 설명력은 26%이고 예측값은 157건
3) 실제 데이터의 값은 260건으로 예측한 건수에 비해 많이 발생함
ARIMA 예측모형
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
4.소년범죄데이터중폭력범죄에대한예측모형
1) ARIMA 모델을 사용하기 위해 자기상관함수를 사용
2) 그래프의 모양이 사인함수의 파형과 닮아 있으므로
MA(0) 사용
ACF
1) ARIMA 모델을 사용하기 위해 편자기상관함수를 사용
2) 그래프의 모양이 지수함수의 파형과 닮아 있으므로
AR(2) 사용
PACF
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-1. SPSS시계열분석& 예측모형
시계열분석&예측모형
4.소년범죄데이터중폭력범죄에대한예측모형
1) ARIMA (2,1,0)(0,1,0) 사용
2) 모형의 설명력은 26%이고 예측값은 300건
3) 실제 데이터의 값은 282건으로 예측한 건수에 비해 적게 발생함
ARIMA 예측모형
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
범죄 통계자료 수집(1년 단위)
발생상태 전이행렬
초기확률 산출
범죄 발생 건수 예측
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
1.MarkovChian
Markov Chain이란?
Markov Chain 절차
- 마코프 체인이란 시간에 따른 데이터의 상태변화를 나타내는
이산 시간 확률 과정의 수학적 기법이다.
- 범죄 통계자료 중 소년범죄에서 가장 많이 발생하는
절도와 폭력에 관한 범죄 발생 건수를 예측하고자 함.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
구분 2013 2014 2015 2016 2017
1 626 333 285 254 249
2 374 301 219 169 240
3 508 277 246 256 254
4 615 336 267 289 245
5 573 374 359 371 273
6 530 377 425 379 311
7 648 416 423 326 322
8 581 445 417 351 194
9 638 398 396 280 312
10 602 456 554 454 262
11 427 401 286 298 259
12 348 313 296 266 226
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
2.MarkovChian을이용한절도범죄예측
범죄 통계자료 수집 발생상태 전이행렬
1) 표를 분석하여 상태집합의 범위를 정한다.
상태집합 범위(건수) : S1 : 0~200 S2 : 201~400 S3 : 451~700
2) 계산된 초기 상태 집합
S3 S2 S2 S2 S2
S2 S2 S2 S1 S2
S3 S2 S2 S2 S2
S3 S2 S2 S2 S2
S3 S2 S2 S2 S2
S3 S2 S3 S2 S2
S3 S3 S3 S2 S2
S3 S3 S3 S2 S1
S3 S2 S2 S2 S2
S3 S3 S3 S3 S2
S3 S3 S2 S2 S2
S2 S2 S2 S2 S2
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
2.MarkovChian을이용한절도범죄예측
3) 범죄 발생 건수와 상태집합 매핑
- 절도 범죄 발생 데이터를 시간순서대로 열거하고 각 상태에서 다음상태(1월~2월)로 전이되는
횟수를 구하여 전이행렬을 구한다.
𝑆1 𝑆2 𝑆3
𝑆1
𝑆2
𝑆3
2 0 0
0 31 0
0 0 17
𝑆1 𝑆2 𝑆3
𝑆1
𝑆2
𝑆3
0 2 0
2 39 4
0 5 7
초기상태 행렬 전이 행렬
𝑆1 𝑆2 𝑆3 𝑆𝑈𝑀
𝑆1
𝑆2
𝑆3
0 1 0
0.04 0.87 0.09
0 0.42 0.58
1
1
1
전이 행렬의 초기확률
S1 S2 S3
1
0.04
0.09
0.42
0.87
0 0.58
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
2.MarkovChian을이용한절도범죄예측
범죄 발생 건수와 상태집합 매핑
- 범죄발생 예측에 적용할 초기확률을 산출하기 위해서
2017년 8~12월까지의 데이터를 사용하였다.
초기확률
구분 17년 8월 17년 9월 17년 10
월
17년 11
월
17년 12
월
발생건수 194 312 262 259 226
상태집합 S1 S2 S2 S2 S2
-범죄 발생 건수 : (194, 312, 262, 259, 226) → (S1, S2, S2, S2, S2)
-초기확률 : P(S1 : 1, S2 : 4 , S3 : 0) → P(0.2, 0.8, 0)
𝑃 𝑆 𝑘 = ෍
𝑖=1
𝑛
𝑃 𝑆𝑖 𝑃𝑖𝑘
𝑃 𝑆𝑖 : 초기확률, 𝑃𝑖𝑘: 전이행렬
1) 범죄 발생 예측 확률
범죄발생 건수 예측
- Markove Chain 식 적용
앞에서 구한 전이행렬과 초기확률 값을 곱한다.
범죄 발생 예측 확률은 (0.04, 0.89, 0.07)로
추정할 수 있다.
- 다음달 절도 범죄의 발생 예상 확률은 위의 결과값에
따라 S2 상태일때 0.89로 가장 높다고 추정할 수 있으며,
발생 건수는 S2 상태인 201~400 사이에서
발생할 수 있다고 예측한다.
0 1 0
0.04 0.87 0.09
0 0.42 0.58
P(0.2, 0.8, 0)
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
2.MarkovChian을이용한절도범죄예측
위의 식을 적용하여 다음달 절도범죄 발생 건수를 예측한다.
P(Si) = 범죄발생 예측확률에서 가장 높은 상태집합의 값
M(Si) = 최근 5개월 (2017년 8~12월) 범죄발생 건수의 합의
평균값
= 0.89X250.6 = 223건
마코프 체인을 통해 다음달 절도범죄는 223건이 일어날 것이라
고 예측할수 있고, 실제 2018년 1월 260건의 절도범죄가 일어
났으므로 예측력을 검증할 수 있다.
෍
𝑖=1
𝑛
𝑃 𝑆𝑖 𝑀(𝑆𝑖)
2) 범죄 발생건수
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
구분 2013 2014 2015 2016 2017
1 351 334 346 305 318
2 256 227 224 266 340
3 290 246 230 293 300
4 379 313 240 261 287
5 403 310 320 327 328
6 410 287 333 317 349
7 425 380 343 296 354
8 325 283 332 327 351
9 331 333 307 305 340
10 335 428 369 384 281
11 346 316 296 298 312
12 260 374 303 251 239
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
3.MarkovChian을이용한폭력범죄예측
범죄 통계자료 수집 발생상태 전이행렬
1) 표를 분석하여 상태집합의 범위를 정한다.
상태집합 범위(건수) : S1 : 0~250 S2 : 251~400 S3 : 401~
2) 계산된 초기 상태 집합
S2 S2 S2 S2 S2
S2 S1 S1 S2 S2
S2 S1 S1 S2 S2
S2 S2 S1 S2 S2
S3 S2 S2 S2 S2
S3 S2 S2 S2 S2
S3 S2 S2 S2 S2
S2 S2 S2 S2 S2
S2 S2 S2 S2 S2
S2 S3 S2 S2 S2
S2 S2 S2 S2 S2
S2 S2 S2 S2 S1
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
3.MarkovChian을이용한폭력범죄예측
3) 범죄 발생 건수와 상태집합 매핑
- 절도 범죄 발생 데이터를 시간순서대로 열거하고 각 상태에서 다음상태(1월~2월)로 전이되는
횟수를 구하여 전이행렬을 구한다.
𝑆1 𝑆2 𝑆3
𝑆1
𝑆2
𝑆3
5 0 0
0 41 0
0 0 4
𝑆1 𝑆2 𝑆3
𝑆1
𝑆2
𝑆3
3 2 0
3 45 2
0 2 2
초기상태 행렬 전이 행렬
𝑆1 𝑆2 𝑆3 𝑆𝑈𝑀
𝑆1
𝑆2
𝑆3
0.6 0.4 0
0.06 0.9 0.04
0 0.5 0.5
1
1
1
전이 행렬의 초기확률
S1 S2 S3
0.4
0.06
0.04
0.5
0.9
0.6 0.5
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
3.MarkovChian을이용한폭력범죄예측
범죄 발생 건수와 상태집합 매핑
- 범죄발생 예측에 적용할 초기확률을 산출하기 위해서
2017년 8~12월까지의 데이터를 사용하였다.
초기확률
구분 17년 8월 17년 9월 17년 10
월
17년 11
월
17년 12
월
발생건수 351 340 281 312 239
상태집합 S2 S2 S2 S2 S1
-범죄 발생 건수 : (351, 340, 281, 312, 239) → (S2, S2, S2, S2, S1)
-초기확률 : P(S1 : 1, S2 : 4 , S3 : 0) → P(0.2, 0.8, 0)
𝑃 𝑆 𝑘 = ෍
𝑖=1
𝑛
𝑃 𝑆𝑖 𝑃𝑖𝑘
𝑃 𝑆𝑖 : 초기확률, 𝑃𝑖𝑘: 전이행렬
1) 범죄 발생 예측 확률
범죄발생 건수 예측
- Markove Chain 식 적용
앞에서 구한 전이행렬과 초기확률 값을 곱한다.
범죄 발생 예측 확률은 (0.17, 0.80, 0.03)로
추정할 수 있다.
- 다음달 절도 범죄의 발생 예상 확률은 위의 결과값에
따라 S2 상태일때 0.80로 가장 높다고 추정할 수 있으며,
발생 건수는 S2 상태인 251~400 사이에서
발생할 수 있다고 예측한다.
0.6 0.4 0
0.06 0.9 0.04
0 0.5 0.5
P(0.2, 0.8, 0)
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
3-2. MarkovChain을적용한발생건수예측모델링
MarkovChian
3.MarkovChian을이용한폭력범죄예측
위의 식을 적용하여 다음달 절도범죄 발생 건수를 예측한다.
P(Si) = 범죄발생 예측확률에서 가장 높은 상태집합의 값
M(Si) = 최근 5개월 (2017년 8~12월) 범죄발생 건수의 합의
평균값
= 0.80X304.6 = 244건
마코프 체인을 통해 다음달 절도범죄는 244건이 일어날 것이라
고 예측할수 있고, 실제 2018년 1월 282건의 절도범죄가 일어
났으므로 예측력을 검증할 수 있다.
෍
𝑖=1
𝑛
𝑃 𝑆𝑖 𝑀(𝑆𝑖)
2) 범죄 발생건수
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
예측모델 평가
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
5. 모델의평가
모델의분석
모델의평가기준
1) 예측 모델의 정확도를 평가하는 기법들을 이용하여 정확도를 계산
2) 평균 제곱근 오차(RMSE)기법과 평균 절대 백분율 오차(MAPE) 기법을 활용
3) 오차율이 더 적은 기법을 채택
𝑅𝑀𝑆𝐸 =
1
𝑇
෍
𝑡=1
𝑇
(𝑦𝑡 − 𝑓𝑡)2
𝑀𝐴𝑃𝐸 =
100
𝑇
෍
𝑡=1
𝑇
𝑦𝑡 − 𝑓𝑡
𝑦𝑡
𝑦𝑡 = 실제 값, 𝑓𝑡 = 예측 값
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
5. 모델의평가
모델의분석
모델의정확도
ARIMA Markov Chain
절도
RMSE 110 37
MAPE 42.3% 14.2%
폭력
RMSE 18 36
MAPE 6.3% 12.8%
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
결론 및 기대효과
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
5-1. 결론
프로젝트평가
프로젝트평가
1) 절도범죄에 대해선 Markov Chian의 오차율이 더 적다.
2) 폭력범죄에 대해선 ARIMA 모형의 오차율이 더 적다.
3) 전체적인 오차율을 비교해봤을 때 ARIMA모형보다 Markov Chain의 정확도가 좋다고 할 수 있다.
4) 만든 두가지 예측모델 중 Markov Chain 모델을 채택.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
5-2. 기대효과
실적용
기대효과
1) Markov Chain을 적용할 경우 오차율 15%내외의 모델을 제시
2) 20년도 데이터를 통해 21년도 청소년 범죄를 예측 가능함.
3) 이 모델을 인천시에 적용하여 향후 일어날 범죄를 예측하여
해당 연월에 경찰인력, 상담인력 등을 배치하여 사전조치를 취함.
4) 구별 데이터와 동별 데이터가 있다면 더 자세한 분석을 통해 효율적인 인력배치가
가능할 것으로 판단됨.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
2020-1시스템종합설계
5-3. 향후과제
앞으로의방안
향후과제
1) 좀 더 확률적 접근을 통한 범죄예측모델을 제시함.
2) 오차율이 더 적게 나타나는 ARIMA 모델을 구축함.
3) Markov Chain은 Outlier가 존재하고, 먼 미래의 경우 예측을 할 수 없음
그러므로 향후 이러한 단점을 보안할 예측연구가 진행되어야 함.
4) 더 자세한 데이터를 통해 구체적인 예측을 수행함.
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
Thank you!
Copyrightⓒ. Saebyeol Yu. All Rights Reserved.

More Related Content

Featured

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
Erica Santiago
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Saba Software
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
Simplilearn
 

Featured (20)

How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them wellGood Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
Good Stuff Happens in 1:1 Meetings: Why you need them and how to do them well
 
Introduction to C Programming Language
Introduction to C Programming LanguageIntroduction to C Programming Language
Introduction to C Programming Language
 

Kjh

  • 1. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 서울시 소년범죄 발생 건수 예측 모델링 2020-1시스템종합설계 강정훈, 송휘종, 임선학, 최제윤, 신정원 Copyrightⓒ. Saebyeol Yu. All Rights Reserved. Wevelop
  • 2. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. CONTENTS Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 003 예측모델소개 ▪ SPSS시계열분석 ▪ MarkovChain 004 예측모델평가 ▪ 모델평가 001 프로젝트개요 ▪ 소년범죄발생건수예측모델 002 데이터정리 ▪ 데이터정리 005 결론 ▪ 결론 ▪ 기대효과 ▪ 향후과제
  • 3. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 프로젝트 개요 Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
  • 4. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 1. 청소년범죄 포털사이트에청소년범죄에대한기사약20만건 현사회에서청소년범죄에대한관심과예방대책논의증가 서론
  • 5. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 1. 청소년범죄 현사회에서소년범죄의실태를통계자료로찾아정리 소년범죄를예방하고자범죄발생건수를미리예측하는모델링을구축 서론
  • 6. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 데이터 정리 Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
  • 7. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 2. 데이터정리 분석을위해13년부터5개년을찾아자료를정리 18년도데이터는예측한모델의정확도를평가하기위해넣지않음 DATA 2013 2014 2015 2016 2017 1월 626 333 285 254 249 2월 374 301 219 169 240 3월 508 277 246 256 254 4월 615 336 267 289 245 5월 573 374 359 371 273 6월 530 377 425 379 311 7월 648 416 423 326 294 8월 581 445 417 351 322 9월 638 398 396 280 312 10월 602 456 554 454 262 11월 427 401 286 298 259 12월 348 313 296 266 226 2013 2014 2015 2016 2017 1월 361 334 346 305 318 2월 256 227 224 266 340 3월 290 246 230 293 300 4월 379 313 240 261 287 5월 403 310 320 327 328 6월 410 287 333 317 349 7월 425 380 343 296 354 8월 325 283 332 327 351 9월 331 333 307 305 340 10월 335 428 369 384 281 11월 346 316 296 298 312 12월 260 374 303 251 239 절도 발생 데이터 폭력 발생 데이터
  • 8. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 예측모델 소개 Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
  • 9. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 1.사용할모델 Sequence chart ACF & PACF ARIMA Model - 데이터가 가진 주기(패턴)을 분석하여 그래프로 나타낸 차트 - ACF(자기상관함수) : MA모형의 차수를 정하기 위한 함수 - PACF(편자기상관함수) : AR모형의 차수를 정하기 위한 함수 - AR(자기회귀)모형과 MA(이동평균)모형의 결합(I)으로 이뤄진 예측모델 - 계절성모델과 비계절성 모델을 곱해서 예측하는 모델
  • 10. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 2.소년범죄데이터에대한시계열분석 1) 평균적으로 여름~가을 사이에 범죄가 많이 일어남 겨울~봄 사이에 범죄가 적게 일어남을 볼 수 있음 2) 해가 지날수록 범죄의 발생은 낮아졌으나 주기성 패턴이 사라짐을 볼 수 있음 3) 그러므로 전체적인 발생빈도가 낮아진다고 안심할 것이 아니라, 1년 내내 범죄가 균일하게 발생할 수 있음에 경각심을 가져야함 Sequence chart - 절도 1) 평균적으로 여름~겨울 사이에 범죄가 많이 일어남 봄에 범죄가 적게 일어남을 볼 수 있음 2) 해가 지날수록 범죄의 발생은 낮아졌으나 주기성 패턴이 사라짐을 볼 수 있음 3) 소년범죄를 기준으로 고찰하였을 때, 학기가 새로이 시작하는 봄에 범죄가 적게 일어나고 학기 중에 범죄가 빈번히 일어남 Sequence chart - 폭력
  • 11. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 3.소년범죄데이터중절도범죄에대한예측모형 1) ARIMA 모델을 사용하기 위해 자기상관함수를 사용 2) 그래프의 모양이 사인함수의 파형과 닮아 있으므로 MA(0) 사용 ACF 1) ARIMA 모델을 사용하기 위해 편자기상관함수를 사용 2) 그래프의 모양이 지수함수의 파형과 닮아 있으므로 AR(2) 사용 PACF
  • 12. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 3.소년범죄데이터중절도범죄에대한예측모형 1) ARIMA (2,1,0)(0,1,0) 사용 2) 모형의 설명력은 26%이고 예측값은 157건 3) 실제 데이터의 값은 260건으로 예측한 건수에 비해 많이 발생함 ARIMA 예측모형
  • 13. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 4.소년범죄데이터중폭력범죄에대한예측모형 1) ARIMA 모델을 사용하기 위해 자기상관함수를 사용 2) 그래프의 모양이 사인함수의 파형과 닮아 있으므로 MA(0) 사용 ACF 1) ARIMA 모델을 사용하기 위해 편자기상관함수를 사용 2) 그래프의 모양이 지수함수의 파형과 닮아 있으므로 AR(2) 사용 PACF
  • 14. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-1. SPSS시계열분석& 예측모형 시계열분석&예측모형 4.소년범죄데이터중폭력범죄에대한예측모형 1) ARIMA (2,1,0)(0,1,0) 사용 2) 모형의 설명력은 26%이고 예측값은 300건 3) 실제 데이터의 값은 282건으로 예측한 건수에 비해 적게 발생함 ARIMA 예측모형
  • 15. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 범죄 통계자료 수집(1년 단위) 발생상태 전이행렬 초기확률 산출 범죄 발생 건수 예측 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 1.MarkovChian Markov Chain이란? Markov Chain 절차 - 마코프 체인이란 시간에 따른 데이터의 상태변화를 나타내는 이산 시간 확률 과정의 수학적 기법이다. - 범죄 통계자료 중 소년범죄에서 가장 많이 발생하는 절도와 폭력에 관한 범죄 발생 건수를 예측하고자 함.
  • 16. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 구분 2013 2014 2015 2016 2017 1 626 333 285 254 249 2 374 301 219 169 240 3 508 277 246 256 254 4 615 336 267 289 245 5 573 374 359 371 273 6 530 377 425 379 311 7 648 416 423 326 322 8 581 445 417 351 194 9 638 398 396 280 312 10 602 456 554 454 262 11 427 401 286 298 259 12 348 313 296 266 226 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 2.MarkovChian을이용한절도범죄예측 범죄 통계자료 수집 발생상태 전이행렬 1) 표를 분석하여 상태집합의 범위를 정한다. 상태집합 범위(건수) : S1 : 0~200 S2 : 201~400 S3 : 451~700 2) 계산된 초기 상태 집합 S3 S2 S2 S2 S2 S2 S2 S2 S1 S2 S3 S2 S2 S2 S2 S3 S2 S2 S2 S2 S3 S2 S2 S2 S2 S3 S2 S3 S2 S2 S3 S3 S3 S2 S2 S3 S3 S3 S2 S1 S3 S2 S2 S2 S2 S3 S3 S3 S3 S2 S3 S3 S2 S2 S2 S2 S2 S2 S2 S2
  • 17. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 2.MarkovChian을이용한절도범죄예측 3) 범죄 발생 건수와 상태집합 매핑 - 절도 범죄 발생 데이터를 시간순서대로 열거하고 각 상태에서 다음상태(1월~2월)로 전이되는 횟수를 구하여 전이행렬을 구한다. 𝑆1 𝑆2 𝑆3 𝑆1 𝑆2 𝑆3 2 0 0 0 31 0 0 0 17 𝑆1 𝑆2 𝑆3 𝑆1 𝑆2 𝑆3 0 2 0 2 39 4 0 5 7 초기상태 행렬 전이 행렬 𝑆1 𝑆2 𝑆3 𝑆𝑈𝑀 𝑆1 𝑆2 𝑆3 0 1 0 0.04 0.87 0.09 0 0.42 0.58 1 1 1 전이 행렬의 초기확률 S1 S2 S3 1 0.04 0.09 0.42 0.87 0 0.58
  • 18. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 2.MarkovChian을이용한절도범죄예측 범죄 발생 건수와 상태집합 매핑 - 범죄발생 예측에 적용할 초기확률을 산출하기 위해서 2017년 8~12월까지의 데이터를 사용하였다. 초기확률 구분 17년 8월 17년 9월 17년 10 월 17년 11 월 17년 12 월 발생건수 194 312 262 259 226 상태집합 S1 S2 S2 S2 S2 -범죄 발생 건수 : (194, 312, 262, 259, 226) → (S1, S2, S2, S2, S2) -초기확률 : P(S1 : 1, S2 : 4 , S3 : 0) → P(0.2, 0.8, 0) 𝑃 𝑆 𝑘 = ෍ 𝑖=1 𝑛 𝑃 𝑆𝑖 𝑃𝑖𝑘 𝑃 𝑆𝑖 : 초기확률, 𝑃𝑖𝑘: 전이행렬 1) 범죄 발생 예측 확률 범죄발생 건수 예측 - Markove Chain 식 적용 앞에서 구한 전이행렬과 초기확률 값을 곱한다. 범죄 발생 예측 확률은 (0.04, 0.89, 0.07)로 추정할 수 있다. - 다음달 절도 범죄의 발생 예상 확률은 위의 결과값에 따라 S2 상태일때 0.89로 가장 높다고 추정할 수 있으며, 발생 건수는 S2 상태인 201~400 사이에서 발생할 수 있다고 예측한다. 0 1 0 0.04 0.87 0.09 0 0.42 0.58 P(0.2, 0.8, 0)
  • 19. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 2.MarkovChian을이용한절도범죄예측 위의 식을 적용하여 다음달 절도범죄 발생 건수를 예측한다. P(Si) = 범죄발생 예측확률에서 가장 높은 상태집합의 값 M(Si) = 최근 5개월 (2017년 8~12월) 범죄발생 건수의 합의 평균값 = 0.89X250.6 = 223건 마코프 체인을 통해 다음달 절도범죄는 223건이 일어날 것이라 고 예측할수 있고, 실제 2018년 1월 260건의 절도범죄가 일어 났으므로 예측력을 검증할 수 있다. ෍ 𝑖=1 𝑛 𝑃 𝑆𝑖 𝑀(𝑆𝑖) 2) 범죄 발생건수
  • 20. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 구분 2013 2014 2015 2016 2017 1 351 334 346 305 318 2 256 227 224 266 340 3 290 246 230 293 300 4 379 313 240 261 287 5 403 310 320 327 328 6 410 287 333 317 349 7 425 380 343 296 354 8 325 283 332 327 351 9 331 333 307 305 340 10 335 428 369 384 281 11 346 316 296 298 312 12 260 374 303 251 239 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 3.MarkovChian을이용한폭력범죄예측 범죄 통계자료 수집 발생상태 전이행렬 1) 표를 분석하여 상태집합의 범위를 정한다. 상태집합 범위(건수) : S1 : 0~250 S2 : 251~400 S3 : 401~ 2) 계산된 초기 상태 집합 S2 S2 S2 S2 S2 S2 S1 S1 S2 S2 S2 S1 S1 S2 S2 S2 S2 S1 S2 S2 S3 S2 S2 S2 S2 S3 S2 S2 S2 S2 S3 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S3 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S2 S1
  • 21. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 3.MarkovChian을이용한폭력범죄예측 3) 범죄 발생 건수와 상태집합 매핑 - 절도 범죄 발생 데이터를 시간순서대로 열거하고 각 상태에서 다음상태(1월~2월)로 전이되는 횟수를 구하여 전이행렬을 구한다. 𝑆1 𝑆2 𝑆3 𝑆1 𝑆2 𝑆3 5 0 0 0 41 0 0 0 4 𝑆1 𝑆2 𝑆3 𝑆1 𝑆2 𝑆3 3 2 0 3 45 2 0 2 2 초기상태 행렬 전이 행렬 𝑆1 𝑆2 𝑆3 𝑆𝑈𝑀 𝑆1 𝑆2 𝑆3 0.6 0.4 0 0.06 0.9 0.04 0 0.5 0.5 1 1 1 전이 행렬의 초기확률 S1 S2 S3 0.4 0.06 0.04 0.5 0.9 0.6 0.5
  • 22. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 3.MarkovChian을이용한폭력범죄예측 범죄 발생 건수와 상태집합 매핑 - 범죄발생 예측에 적용할 초기확률을 산출하기 위해서 2017년 8~12월까지의 데이터를 사용하였다. 초기확률 구분 17년 8월 17년 9월 17년 10 월 17년 11 월 17년 12 월 발생건수 351 340 281 312 239 상태집합 S2 S2 S2 S2 S1 -범죄 발생 건수 : (351, 340, 281, 312, 239) → (S2, S2, S2, S2, S1) -초기확률 : P(S1 : 1, S2 : 4 , S3 : 0) → P(0.2, 0.8, 0) 𝑃 𝑆 𝑘 = ෍ 𝑖=1 𝑛 𝑃 𝑆𝑖 𝑃𝑖𝑘 𝑃 𝑆𝑖 : 초기확률, 𝑃𝑖𝑘: 전이행렬 1) 범죄 발생 예측 확률 범죄발생 건수 예측 - Markove Chain 식 적용 앞에서 구한 전이행렬과 초기확률 값을 곱한다. 범죄 발생 예측 확률은 (0.17, 0.80, 0.03)로 추정할 수 있다. - 다음달 절도 범죄의 발생 예상 확률은 위의 결과값에 따라 S2 상태일때 0.80로 가장 높다고 추정할 수 있으며, 발생 건수는 S2 상태인 251~400 사이에서 발생할 수 있다고 예측한다. 0.6 0.4 0 0.06 0.9 0.04 0 0.5 0.5 P(0.2, 0.8, 0)
  • 23. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 3-2. MarkovChain을적용한발생건수예측모델링 MarkovChian 3.MarkovChian을이용한폭력범죄예측 위의 식을 적용하여 다음달 절도범죄 발생 건수를 예측한다. P(Si) = 범죄발생 예측확률에서 가장 높은 상태집합의 값 M(Si) = 최근 5개월 (2017년 8~12월) 범죄발생 건수의 합의 평균값 = 0.80X304.6 = 244건 마코프 체인을 통해 다음달 절도범죄는 244건이 일어날 것이라 고 예측할수 있고, 실제 2018년 1월 282건의 절도범죄가 일어 났으므로 예측력을 검증할 수 있다. ෍ 𝑖=1 𝑛 𝑃 𝑆𝑖 𝑀(𝑆𝑖) 2) 범죄 발생건수
  • 24. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 예측모델 평가 Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
  • 25. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 5. 모델의평가 모델의분석 모델의평가기준 1) 예측 모델의 정확도를 평가하는 기법들을 이용하여 정확도를 계산 2) 평균 제곱근 오차(RMSE)기법과 평균 절대 백분율 오차(MAPE) 기법을 활용 3) 오차율이 더 적은 기법을 채택 𝑅𝑀𝑆𝐸 = 1 𝑇 ෍ 𝑡=1 𝑇 (𝑦𝑡 − 𝑓𝑡)2 𝑀𝐴𝑃𝐸 = 100 𝑇 ෍ 𝑡=1 𝑇 𝑦𝑡 − 𝑓𝑡 𝑦𝑡 𝑦𝑡 = 실제 값, 𝑓𝑡 = 예측 값
  • 26. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 5. 모델의평가 모델의분석 모델의정확도 ARIMA Markov Chain 절도 RMSE 110 37 MAPE 42.3% 14.2% 폭력 RMSE 18 36 MAPE 6.3% 12.8%
  • 27. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 결론 및 기대효과 Copyrightⓒ. Saebyeol Yu. All Rights Reserved.
  • 28. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 5-1. 결론 프로젝트평가 프로젝트평가 1) 절도범죄에 대해선 Markov Chian의 오차율이 더 적다. 2) 폭력범죄에 대해선 ARIMA 모형의 오차율이 더 적다. 3) 전체적인 오차율을 비교해봤을 때 ARIMA모형보다 Markov Chain의 정확도가 좋다고 할 수 있다. 4) 만든 두가지 예측모델 중 Markov Chain 모델을 채택.
  • 29. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 5-2. 기대효과 실적용 기대효과 1) Markov Chain을 적용할 경우 오차율 15%내외의 모델을 제시 2) 20년도 데이터를 통해 21년도 청소년 범죄를 예측 가능함. 3) 이 모델을 인천시에 적용하여 향후 일어날 범죄를 예측하여 해당 연월에 경찰인력, 상담인력 등을 배치하여 사전조치를 취함. 4) 구별 데이터와 동별 데이터가 있다면 더 자세한 분석을 통해 효율적인 인력배치가 가능할 것으로 판단됨.
  • 30. Copyrightⓒ. Saebyeol Yu. All Rights Reserved. 2020-1시스템종합설계 5-3. 향후과제 앞으로의방안 향후과제 1) 좀 더 확률적 접근을 통한 범죄예측모델을 제시함. 2) 오차율이 더 적게 나타나는 ARIMA 모델을 구축함. 3) Markov Chain은 Outlier가 존재하고, 먼 미래의 경우 예측을 할 수 없음 그러므로 향후 이러한 단점을 보안할 예측연구가 진행되어야 함. 4) 더 자세한 데이터를 통해 구체적인 예측을 수행함.
  • 31. Copyrightⓒ. Saebyeol Yu. All Rights Reserved.Copyrightⓒ. Saebyeol Yu. All Rights Reserved. Thank you! Copyrightⓒ. Saebyeol Yu. All Rights Reserved.