Saisyu

防犯カメラを用いた
ひったくり犯の
検出・追跡
徳島大学理工学部理工学科
B5研究室
矢野大暉
令和2年度情報系卒業研究発表会

• 防犯カメラの設置台数が増加している
• 今後も増えることが予想できる
1
*1
情報系卒業研究発表会
研究の背景・目的(1/4)
25450
27940
34500
44000
54000
64800
0
10000
20000
30000
40000
50000
60000
70000
2014年 2015年 2016年 2017年 2018年 2019年
防犯カメラ世界市場規模推移
カメラ台数
単位:千台
矢野経済研究所調べ

2
• 街頭での犯罪防止策
• パトロール
• 防犯カメラの使用
• 警察庁「街頭防犯カメラシステム」
ネットワーク
警視庁
各警察署で
24時間体制でモニター
事件の発生、予測は有人監視が可能な場合のみできる
*1

• これから増える従来型の防犯カメラは映像記録が主目的
• 事件の発生、予測は有人監視が可能な場合のみできる
3
犯罪行為の自動検知ができると
効果的な防犯に繋がる

4
• ひったくり
模倣性が高い
パトロールだけでは防犯は困難
被害者は高齢者が多く、負傷し、死亡する可能性

先行研究
1. 長山格, 宮原彬, 島袋航一 : 深層学習による時系列挙動
認識を用いた次世代型知的防犯カメラシステム
ひったくりの状況をモデル化して推定し、LSTMネットワークに時
系列画像データとして入力し判定
2. Debaditya Roya, C. Krishna Mohana : Snatch Theft
Detection in Unconstrained Surveillance
Videos_Using Action Attribute Modelling
大規模人物動画データセット(HMDB51, UCF101)から、低次元な
action vectorという表現にしてひったくり動作を分類する
5

先行研究との違い：映像データからのひったくり検出である
リアルタイム検出が行える
先行研究
1. 長山格, 宮原彬, 島袋航一 : 深層学習による時系列挙動
認識を用いた次世代型知的防犯カメラシステム
入力データがシルエット
2. Debaditya Roya, C. Krishna Mohana : Snatch Theft
Detection in Unconstrained Surveillance
Videos_Using Action Attribute Modelling
リアルタイム検出ができない
6
*1

提案手法(1/14)
7
データ
取得部
歩行者
検出部
歩行者
追跡部
前処理
部
ひった
くり
検出部

提案手法(1/14)
8
データ
取得部
歩行者
検出部
歩行者
追跡部
前処理
部
ひった
くり
検出部

提案手法(2/14)
9
• 動画データの取得
解像度 704*480
フレームレート 30 fps
フォーマット MPEG-2
回転角度水平±170°
垂直 -30～90°
光学ズーム 18倍
動画情報とカメラ情報
SONY EVI-D70 GV-USB2 PC
データ
取得部
*1 *2

提案手法(3/14)
10
• ひったくり
• 歩行者同士
• ハンドバッグが背後から盗難されたときとする
データ
取得部
• 制約条件
• 映像内にひったくり被害者、加害者の2名のみ

提案手法(4/14)
11
• 歩行者検出部
• リサイズ処理
• YOLOv4 (You Only Look Once v4)
歩行者
検出部

提案手法(4/14)
12
• リサイズ処理
歩行者
検出部
704
480
608
608

提案手法(5/14)
13
• YOLOv4 (You Only Look Once v4)
• 高速な物体検出が可能な深層学習モデル
歩行者
検出部
*1

提案手法(6/14)
14
• 歩行者追跡部
• DeepSORT
• 同一人物を追跡するアルゴリズム
歩行者
追跡部

提案手法(7/14)
15
• DeepSORT
歩行者
追跡部
現在のフレームでの検出領域
CNN
CNN
3 23 34 … 44
4 54 66 … 55
特徴ベクトル
CNN構造
*1

提案手法(8/14)
16
• DeepSORT
歩行者
追跡部
追跡物体の画像郡

提案手法(9/14)
17
• DeepSORT
歩行者
追跡部
3 23 34 … 44
3 23 34 … 44
3 23 34 … 44
4 24 14 … 45
3 23 34 … 44
3 23 34 … 44
3 23 34 … 44
4 24 14 … 45
追跡物体の特徴ベクトル
3 23 34 … 44
4 54 66 … 55
特徴ベクトル

提案手法(10/14)
18
• DeepSORT
歩行者
追跡部
3 23 34 … 44
3 23 34 … 44
3 23 34 … 44
4 24 14 … 45
3 23 34 … 44
3 23 34 … 44
3 23 34 … 44
4 24 14 … 45
追跡物体の特徴ベクトル
3 23 34 … 44
4 54 66 … 55
特徴ベクトル
距離が最小

提案手法(11/14)
19
• DeepSORT
歩行者
追跡部

提案手法(12/14)
20
• 前処理部
• 追跡人物を16フレームごとに保存
• リサイズ、パディング、標準化
前処理部
16フレーム
新
古
• キュー構造になっている

提案手法(13/14)
21
• 前処理部
• リサイズ、パディング、標準化
前処理部
0 …
… 0 0 0
0
0

提案手法(14/14)
22
• ひったくり検出部
• ECO Liteを転移学習
ひったくり
検出部
前処理済
データ
フレーム1
フレームn
フレーム16
2DNet
モジュール
結合
3D Net
モジュール
全結合層
2DNet
モジュール
2DNet
モジュール
……
……
＊1
16*3*244*244
(frame,ch,hei
ght,width)
400クラス

提案手法(14/14)
23
• ひったくり検出部
• ECO Liteを転移学習
ひったくり
検出部
前処理済
データ
フレーム1
フレームn
フレーム16
2DNet
モジュール
結合
3D Net
モジュール
全結合層
2DNet
モジュール
2DNet
モジュール
……
……
＊1
16*3*244*244
(frame,ch,heig
ht,width)
2クラス

24
• 撮影方向は3つ
• ひったくりがある場合、ない場合を撮影
• ひったくり動作は「歩行者同士、後ろからハンド
バッグを盗られる」とする
実験(1/5)
撮影方向A 撮影方向B 撮影方向C
• ひったくり検出部の転移学習
• データセットについて

25
• 撮影環境は3つ
• ひったくりがある場合、ない場合を撮影
• ひったくり動作は「歩行者同士、後ろからハンド
バッグを盗られる」とする
• 移動方向を2パターン
合計237本の動画データを使用
実験(2/5)
撮影方向A 撮影方向B 撮影方向C

26
実験(3/5)
ひったくりあり動画データ
ひったくり動作24フレーム
ひったくりありデータセット
ひったくりなしデータセット
ひったくりなし動画データ
YOLOv4 +
DeepSORT
119本
116本
YOLOv4 +
DeepSORT

• 4分割交差検証を使用する
• 学習時には、開始フレームがランダムな連続16フ
レームをデータセットから入力する
27
実験(4/5)
＜例＞ひったくりありデータセットから16フレーム 16フレーム入力
ひったくり前後24フレーム
ひったくりありデータセット情報系卒業研究発表会

• 事前学習済みの動画分類モデル（ECO Lite,
3DResNet18, 3DResNet50, 3DResNet101）を使用
する
• 最後の全結合層を2クラス分類に変更し、転移学習
28
実験(5/5)
エポック数 40
バッチサイズ 8
最適化アルゴリズム Momentum SGD
学習率 0.0001
モーメント項の係数 0.9
ハイパーパラメータ

29
結果
モデル精度適合率再現率 F値
ECO Lite 0.849 0.988 0.708 0.825
3DResNet18 0.818 0.898 0.719 0.799
3DResNet50 0.802 0.914 0.667 0.771
3DResNet101 0.688 0.951 0.396 0.559
• 4分割交差検証の結果を平均

30
• 誤検出について
• ECO LiteのSet2での混同行列
ひったくりありが5件間違っている
考察(1/5)

31
• 検出しないデータと正しく検出するデータを比較
目視で動きの違いがわからない
考察(2/5)
ひったくりを検出できていないデータ
ひったくりを検出できているデータ

32
• 正しく検出するデータに近づける
• バッグの削除
• 左上のブロック障害物の削除
考察(3/5)
ひったくりを検出できていないデータ

33
• 結果
• バッグ削除→検出しない（間違い）
• ブロック削除→検出しない（間違い）
考察(4/5)

34
• 今回確認したデータでは、人以外のオブジェクトの
影響は関係なかった
• 今後学習データを増やして動作のバリエーションを
増やす必要がある
考察(5/5)

結論
35
• 防犯カメラを用いたひったくり犯の検出・追跡
• ECO Liteを転移学習させることでひったくり動作
の検出ができた
• ECO Liteでの結果は以下の表の通り
モデル精度適合率再現率 F値
ECO Lite 0.849 0.988 0.708 0.825
• 課題
• ひったくり動作を検出した根拠
• 学習データの増量

参考文献
1. 矢野経済研究所, “監視カメラ世界市場に関する調査を実施（2020年）— ニュース・トピックス —
”https://www.yano.co.jp/press-
release/show/press_id/2480#:~:text=2019%E5%B9%B4%E3%81%AE%E7%9B%A3%E8
%A6%96%E3%82%AB%E3%83%A1%E3%83%A9,%E3%81%AF%E5%9B%9E%E5%BE%
A9%E3%81%99%E3%82%8B%E8%A6%8B%E8%BE%BC%E3%81%BF%EF%BD%9E.
(Accessed on 2021/01/22).
2. 警視庁,”街頭防犯カメラシステム”
https://www.keishicho.metro.tokyo.jp/kurashi/anzen/anshin/gaitocamera.html (アクセス日
2021/01/22).
3. 法務省, “令和元年版犯罪白書第 2 編/第 1 章/第 1 節/2.”
http://hakusyo1.moj.go.jp/jp/66/nfm/n66_2_2_1_1_2.html. (アクセス日2021/01/22).
4. 長山格, 宮原彬, 島袋航一. “深層学習による時系列挙動認識を用いた次世代型知的防犯カメラシステ
ム.” 電気学会論文誌Ｃ（電子・情報・システム部門誌）, Vol. 139, No. 9,pp. 986–992, 2019.
5. SONY “EVI-D70 / D70P（PAL）” https://pro.sony/en_GR/products/ptz-network-
cameras/evi-d70-d70p-pal- (アクセス日 2021/02/05)
6. IODATA アイ・オー・データ機器 , “GV-USB2 | ビデオ・オーディオキャプチャー |”
https://www.iodata.jp/product/av/capture/gv-usb2/ (アクセス日 2021/02/05)
7. Chien-Yao Wang and Alexey Bochkovskiy and Hong-Yuan Mark Liao,“Scaled-YOLOv4:
Scaling Cross Stage Partial Network” https://arxiv.org/pdf/2011.08036.pdf (アクセス日
2021/02/05)
8. Nicolai Wojke, Alex Bewley, and Dietrich Paulus. “Simple online and realtime trackingwith a
deep association metric.” In 2017 IEEE International Conference on ImageProcessing (ICIP),
pp. 3645–3649. IEEE, 2017.
9. 小川雄太郎,「つくりながら学ぶ! PyTorchによる発展ディープラーニング」,マイナビ出版, 2019
10. Mohammadreza Zolfaghari and Kamaljeet Singh and Thomas Brox “ECO: Efficient
Convolutional Network for Online Video Understanding” https://arxiv.org/abs/1804.09066
(アクセス日 2021/01/22)
36

37
付録
ECO Lite
3DResNet50
3DResNet18
3DResNet101

Saisyu

Recommended

Recommended

More Related Content

Similar to Saisyu

Similar to Saisyu (20)

Saisyu

Editor's Notes