犯罪統計と経済指標の関係分析
- 3. 2
1. 背景と目的
1. 初期仮説
2. 得られた示唆
3. 分析に利用したデータセット
2. 日本に於ける犯罪傾向
1. 日本全国の傾向
2. 北海道の傾向
3. 福岡の傾向
3. 犯罪と経済の相関
4. 犯罪と経済の回帰
1. 単回帰分析
2. 重回帰分析
5. あとがき
Appendix
目次
- 4. 3
①日本に於ける犯罪の実態、②経済との関係性を検証する
1-1. 初期仮説
利用データ 前処理・分析手法
日本全国の犯罪認知件数/検挙件数/
検挙人員数/検挙率
基礎集計
データ可視化
日本全国の犯罪は、
増加傾向にある
都道府県毎の高校/大学進学率
犯罪認知件数
相関分析
単/重回帰分析
進学率と犯罪には
相関/回帰関係がある
北海道、福岡県の犯罪認知件数/検挙件
数/検挙人員数/検挙率
基礎集計
データ可視化
北海道、福岡に於いても
犯罪は増加傾向にある
初期仮説
初期仮説と必要なデータと手法
都道府県毎の有効求人数/ラスパレイス
指数
犯罪認知件数
相関分析
単/重回帰分析
求人数/物価と犯罪には
相関/回帰関係がある
- 5. 4
18年犯罪データは、経済関連データと高い相関・回帰が見られた
1-2. 得られた示唆
観察事項 示唆
日本全国の犯罪認知件数は、経年で8%
ずつ減少傾向にある。
平均検挙率も年率3%で上昇している。
昨今の報道による治安悪化イメージとは逆
に、犯罪認知件数は減少傾向にある
平均検挙率も改善しており、警察の捜査能
力が向上していることが伺える。
日本全国の犯罪は、
増加傾向にある
大学進学率には、0.599と正の相関が認め
られた。
一方、高校進学率は-0.174と負の相関が
確認できた。
詐欺、横領などの知能犯は、大学進学率と
相関がある可能性がある。
進学率と犯罪には
相関/回帰関係がある
北海道/福岡に於いても認知件数は、経年
で減少傾向にある。
北海道は、都市毎に平均検挙率のムラが
ある。
東北、九州は平均検挙率が高く、東京、大
阪の大都市圏は低いことから、様々な属性
の人間が集る都市部の方が犯罪が起き易い
ことが伺える。
北海道、福岡に於いても
犯罪は増加傾向にある
初期仮説
初期仮説に対して得られた示唆
一人当たり平均賃金は、0.7859と強い
正の相関が見られた。
ラスパレイス指数は0.4435の正の相関があ
見られた。
平均賃金、有効求人数を上昇させつつ、
犯罪を抑止する施策が必要になる。
求人数/物価と犯罪には
相関/回帰関係がある
- 6. 5
犯罪統計データを中心に、進学率、有効求人数、ラスパレイス指数を加え
分析を行った
1-3. 分析に利用したデータセット
分析に利用した主なデータセット
変数名 データ型 概要 備考
ID 文字列(Char)
都道府県名 文字列(Char) 北海道のみ旭川、釧路、札幌、函館、北見の都市別データ有り
管轄区 文字列(Char) 警察庁が定める都道府県の分類
犯罪認知件数 (05~18年) 整数型(Integar) 被害届のあった犯罪件数を表す 回帰/重回帰分析の説明変数として、標準化して使用
犯罪検挙件数 (05~18年) 整数型(Integar) 犯人が逮捕された事件数を表す
犯罪検挙人員 (05~18年) 整数型(Integar) 逮捕された人員数を表す 再犯が同一、個別で計測されているかは不明
検挙率 (05~18年) 浮動小数点(Float) 検挙件数を認知件数で除して求める。
有効求人数(人)2018年10月 整数型(Integar) 回帰/重回帰分析の説明変数として、標準化して使用
ラスパレイス指数2018 浮動小数点(Float) 同上
一人当たり平均賃金2018 浮動小数点(Float) 同上
大学等進学率_2018 浮動小数点(Float) 同上
高等学校等進学率_2018 浮動小数点(Float) 同上
- 8. 7
一連の報道から与えられる印象とは逆に、05年から年率▲8%で認知件数
は、減少している
2-1. 日本全国の犯罪認知件数(05~18年)
05~18年の犯罪認知件数 (単位:’000件)
2015
1,827
817
2,269
1,403
20062005 2008
2,051
1,909
2007 2018
1,714
2009
1,604
2010
1,503
2011 2012
1,314
2013
1,212
2014
1,099 996
20172016
915
-8%
- 11. 10
札幌が最多、旭川、釧路が続く。経年で、全都市で認知件数は減少傾向に
ある
2-2. 北海道 都市別の犯罪認知件数(05~18年)
北海道 都市別05~18年の犯罪認知件数
西暦 旭川 釧路 札幌 函館 北見
2005 7,567 6,740 49,839 6,115 2,810
2006 6,304 6,364 44,834 5,457 2,458
2007 5,860 5,379 42,133 5,556 1,952
2008 5,730 5,110 42,078 4,864 1,951
2009 4,581 4,688 37,417 3,845 1,608
2010 4,195 4,498 37,147 3,794 1,592
2011 4,144 4,442 35,585 3,610 1,482
2012 4,302 4,497 31,998 3,389 1,303
2013 4,004 4,014 29,041 3,046 961
2014 4,113 3,979 28,171 2,975 1,121
2015 3,497 3,641 24,749 2,407 1,163
2016 3,000 2,873 22,865 2,244 1,031
2017 2,539 2,551 20,092 2,070 908
2018 2,130 2,422 17,880 2,152 875
合計 61,966 61,198 463,829 51,524 21,215
- 13. 12
都市によってムラがある。札幌では09年~15年は、検挙率が低下している
のに対し、以外の都市は13年以降の検挙率が上昇している
2-2. 北海道 都市別の検挙率推移 (05~18年)
北海道 都市別05~18年の検挙率推移(単位:%)
西暦 旭川 釧路 札幌 函館 北見
2005 40.00 26.50 30.30 25.60 27.50
2006 34.30 36.00 35.90 29.90 34.80
2007 35.10 35.00 37.80 32.50 50.70
2008 34.17 41.17 36.73 30.51 32.70
2009 37.79 36.20 31.52 39.48 40.73
2010 37.66 35.50 30.15 27.02 42.84
2011 37.79 31.49 31.23 33.46 45.07
2012 32.03 42.01 33.22 36.50 45.13
2013 44.00 42.00 35.10 39.30 66.20
2014 45.60 39.10 30.90 39.40 50.60
2015 45.44 39.00 31.31 41.38 40.58
2016 45.30 44.83 38.82 44.03 50.53
2017 51.52 48.61 41.54 38.55 57.71
2018 47.46 44.30 41.27 33.92 66.74
- 16. 15
経済関連指標の増加に伴い、犯罪認知件数が増加する結果となった
3. 犯罪統計と経済関連指標の相関(18年)
18年犯罪統計と経済関連指標の相関行列
犯罪認知件数2018 有効求人数(人)2018年10月 ラスパレイス指標2018 一人当たり平均賃金2018 大学等進学率_2018 高等学校等進学率_2018
犯罪認知件数2018 1.0000
有効求人数(人)2018年10月 0.9610 1.0000
ラスパレイス指標2018 0.4435 0.4321 1.0000
一人当たり平均賃金2018 0.7859 0.7690 0.5956 1.0000
大学等進学率_2018 0.5996 0.5571 0.4151 0.8097 1.0000
高等学校等進学率_2018 -0.1744 -0.1691 -0.0702 -0.0542 0.1181 1.0000
• 有効求人数(人)は、犯罪認知件数と0.96と高い相関が見られた。
• 一人当たり平均賃金も、0.78と高い相関が見られた。
• 大学進学率は、0.59だったのに対して高等学校進学率は-0.17と弱い負の相関が見られた。
• ラスパレイス指数も0.44の正の相関が見られた。
- 25. 24
ラスパレイス指数だけは、東京・大阪以外の都市での犯罪認知件数を予
測にも、適した変数と言えなさそうである
4-1. 東京・大阪なし 犯罪認知件数2018(Y)とラスパレイス指数 (X)の単回帰
犯罪認知件数(Y)とラスパレイス指数(X)の回帰分析
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
1.8
-4 -3 -2 -1 0 1 2
岩手
福島
兵庫
栃木岐阜
長野
茨城
埼玉
新潟
山梨
静岡
佐賀
富山
奈良
長崎
北海道
石川
愛知
鹿児島
三重
鳥取
滋賀
愛媛
京都
熊本
和歌山
広島
高知
島根
沖縄
大分
山口
徳島
香川 岡山宮崎
ラスパレイス指数2018
福井
福岡
神奈川
犯罪認知件数2018
千葉
宮城
青森 山形
秋田
群馬
観察事項
• 依然、関東、愛知、兵庫、福岡が外れ値として影響
している。
• 調整済み決定係数も、0.149に低下した。
重相関 R 0.410954876
重決定 R2 0.16888391
補正 R2 0.149555629
標準誤差 0.581204446
観測数 45
- 29. 28
反省点が多く、今後の分析の示唆になる学びが多くあった
5. あとがきにかえて
学び
• オープンデータを使った分析は、兼ねてから興味があった。プレジョブはとても良い機会になった。
• 興味のある分析テーマを選ぶことが出来、満足度が高かった。これからも犯罪や経済など、マクロ/ミ
クロの社会課題の解決に資する示唆を出す分析に取り組みたい。
• Excelで一通りの分析を完結することが出来た。データ・クレンジングから集計、可視化、相関、
回帰分析まで、一通り身に付けることが出来た。
反省点
• 犯罪統計の整理、集計、可視化と同じくらい、経済関連指標との相関・回帰分析に時間を掛け
た方が良かった。
• マクロ/ミクロ経済の知識を習得し、今後は、労働市場に関するデータだけでなく、物価指数など、、
より広範囲のデータから取捨選択できるようになりたい。
• 今後は、講義で学んだ、RやPythonを使ったモデルや分析手法の語彙を増やし、最適な分析
手法を選択出来るようになりたい。
• 相関分析、回帰分析を行う際に、判断に迷う場面があった。アカデミー修了後も、反復学習し、
知識を定着させたい。
- 30. 29
プレジョブの過程で、多くの実践的なノウハウを得られた
5. より良い分析のためのTips
Tips
• 回帰/重回帰分析を行う際は、データ・セットを標準化する。
尚、その際、Excelシートは別に作成する方が効率が良い。
• 回帰分析を行う際は、まず散布図を描き、外れ値やデータの分布を視覚的に確認した上で、
分析を行う。
• 必要に応じて、東京、大阪などの大都市は、外して分析することも必要になる。
• Excelの表をPowerPointに貼り付ける際は、エンハンスド仕様の画像(Enhanced Metafile)
形式を使うと綺麗に貼り付けることが出来る。
• 分析と同じくらい、あるいはそれ以上に、PowerPointの体裁(フォーマッティング)も重要になる。
使用するフォント、サイズ、太字などの強調表現に加えて、使用する色も成果物の質を左右する。
• 今後、データ可視化については、Excel以外のソフトウェア、例えばTableau PublicやPower BI
といったツールも使い、より語彙を増やしていきたい。
• 自らデータを探し、データマートを作るプレジョブでは、分析目的・仮説設定、仮説を検証するため
の分析設計の重要性を痛感した。
• 提出日までに、成果物を完成させるプロジェクト・マネジメント・スキルも求められる。
WBSなどを使って、作業を可視化して、体系的に進められるようにしていきたい。
• 今後も、オープンデータを使った独自の分析企画を立て、成果物を作り、公表することで継続的に
スキルアップしていきたい。
- 31. 30
出典一覧
• 株式会社D4cアカデミー データサイエンスアカデミー プレジョブ課程
• 警察庁 「犯罪統計」 平成17年~30年 犯罪統計資料
https://www.npa.go.jp/publications/statistics/sousa/statistics.html
• 内閣官房 まち・ひと・しごと創生本部事務局 RESAS 地域経済分析システム
https://resas.go.jp/
• 文部科学省 「学校基本調査」 平成30年度 調査結果の概要
http://www.mext.go.jp/component/b_menu/other/__icsFiles/afieldfile/2018/12/25/1407449_2.pdf
• e-Stat 平成30年 地方公共団体別給与等の比較
https://www.e-stat.go.jp/stat-
search/files?page=1&layout=dataset&toukei=00200211&kikan=00200&result_page=1