SlideShare a Scribd company logo
株式会社オービタルネット
小林 裕治
YOLOv3 , Mask R-CNNなどの
一般物体検出技術をG空間分野に活用する
~地方自治体での活用事例をもとに~
内容
• 自己紹介
• YOLOv3を用いた地物検出の事例紹介
(岐阜県恵那市様における業務適用事例)
• Mask R-CNNを用いた地物の検出とポリゴン化の事例紹介
• まとめ
1
自己紹介
【氏名】 小林 裕治
【所属】 株式会社オービタルネット 代表取締役
(株式会社カナエジオマチックス 取締役)
・ 4年前にリアルタイム・キャバリア検出器を機械学習
(JAVA-JNI-OpenCV)で実装したのが出発点
・ 3年ほど前からディープラーニングにはまる。
【リアルタイム物体検出の取り組み】
2
OSMベースの
Vector Tile Map
試験公開しています!
一般物体検出の現状
出典: YoloV2, Yolo 9000, SSD Mobilenet, Faster RCNN NasNet comparison
https://www.youtube.com/watch?v=V4P_ptn2FF4
ここ数年、ディープラーニングを活用した一般物体検出(画像から物
体領域の検出とクラス分類)の進化が著しい。とりわけリアルタイム物体
検出に関しては Faster R-CNN, YOLO, SSDなどのアルゴリズムが
考案されており、年々検出速度と精度の向上が図られている。
3
背景と目的
リアルタイム物体検出の技術は年々進化しており、
我々は応用を考え、必要な部分のみ実装すれば良い。
もはや業務適用のフェーズに至っている
4
背景と目的
ならば、このリアルタイム・オブジェクト検出アルゴリズムを
航空写真判読に活用できないか!?
5
背景と目的
そこでリアルタイム物体検出アルゴリズムを応用して, 大量の
航空写真画像から対象地物を即時検出するシステム(以下
判読システム)を構築し地方自治体の固定資産(償却資
産)実態把握業務への適用について検討した。
具体的には恵那市役所様に提供頂いた航空写真画像を
もとに太陽光発電施設(以下 ソーラーパネル)を検出、
精度検証・評価を行い、地番レベルで土地・所有者の特定を
行った。
6
YOLO
You only livelook once (YOLO) is a state-of-
the-art, real-time object detection system.
➢ YOLOはオブジェクトの候補領域(短径)と分類を同時に実現するアルゴリズム
https://arxiv.org/abs/1506.02640
➢ 現在はYOLOv3が公開されており、ニューラルネットワークが刷新され、検出精度
の向上が図られている
https://arxiv.org/abs/1804.02767
採用した一般物体検出アルゴリズム
7
YOLOv3のネットワーク・アーキテクチャー
・ YOLOv3はResNetをベースに改良を加えたネットワーク・モデル
・ 全結合層を持たない106層の Fully Convolutional Network
・ 3層の異なるサイズの検出レイヤを持つ Feature Pyramid Network
のような構造が特徴
出典: Ayoosh Kathuria, 2018. What’s new in YOLO v3?
https://towardsdatascience.com/yolo-v3-object-detection-53fb7d3bfe6b
8
YOLOv3の物体検出の仕組み
13
13
1
1
18
Feature Map
BB(1) BB(2) BB(3)
Detect Layer 1
×B
*本件ではソーラーパネルの1クラス
Bounding Box
出力層の特徴マップはセルに分割され、セル単位で物体候補を内包
する短径(Bounding Box)を複数(本件では3)保持することが
できる。 特徴マップにはオブジェクト性スコア、 短径の中心座標
x,y,width,height,クラス確率 × 分類クラス数の情報が格納される。
9
Darknet(ディープラーニング・フレームワーク)
Darknetは
YOLOの考案者が
C言語とcudaで実装した
オープンソースの
ディープ・ラーニング
フレームワーク
https://pjreddie.com/darknet/ 10
判読システムの開発・テスト環境
CPU Core i7770K
メインメモリ 32GB
GPU NVIDIA GeForce GTX1080Ti 11GB
OS Ubuntu16.04 LTS
CUDA 8.0
cuDNN 6.0
OpenCV 3.2.0
物体検出アルゴリズム YOLOv3
ディープラーニング・フレームワーク Darknet
開発言語 C言語, Python2.7
NoSQLデータベース MongoDB v3.4.15
GIS QGIS2.8 with Mongo Connector Plugin
判読システムは、YOLO実装を含むディープラーニング・フレームワーク
Darknetを改良して構築した。
Windows用のソースコードも公開されており、Windows10においても
同様の開発・テスト環境を構築した。
11
12
判読システム・ワークフロー
『フォルダ内の画像を連続処理する機能』、『画像上の短径座標と物体
カテゴリー名、推定確率を地理空間情報に変換する機能』、『既知の
データとの差分抽出機能』、『NoSQLデータベースMongoDBに登録
する機能』及び『GeoJson、CSVに出力する機能』などを実装した。
output insert
connect
visualize
GeoJson
Object
Deep Learning
NoSQL GIS
input
オルソ画像
ワールドファイル
Data Source
Old GeoJSON
シリアライズ
v3
差分判定
地物検出
学習済モデル
(ウェイト)
GeoJSON
インスタンス
ソーラーパネルの学習
50cm~1m解像度1000枚の航空写真を反転・回転するなどして
5,000枚程度に水増し。アノテーションツール ”BBox-Label-Tool”
を使用して画像からソーラーパネルを目視判読し、ソーラーパネルを内
包する短径のピクセル座標をファイル出力し教師用データを作成。
YOLOv3のCNNモデルとウェイトの初期値にdarknet53.conv.74
を使用して教師用データを与えて学習させた。
13
学習モデル(ウェイト)の評価
教師用データから取り分けた250枚の評価用画像セットを判読システ
ムに入力し、学習で得られた学習モデル(ウェイト)をCNNのウェイトに
設定してモデルの性能評価を行った。
P = 0.981, R = 0.938, F = 0.959
Total Detection Time 4.586sec.
, ,
14
差分管理の仕組み
新たに検出したすべての地物に対して既知のソーラーパネルとの重なり
度合いをIoU(Intersection over Union)を用いて数値化し、
設定した閾値を超えた場合に新設ソーラーパネルと定義した。
差分情報はGeoJsonのプロパティに付与される。
IoU =
Area of Overlap
Area of Union
Area of Overlap Area of Union
15
検出結果
恵那市役所様に提供頂いた航空写真画像データのうち、40㎝解像度の
データセットから用意した1,000px×750px,4,780枚の検証用データを
判読システムに入力した結果 430件の検出結果(ソーラーパネル候)
が得られた。
16
検出結果
4,780枚, 面積500k㎡の処理時間は191秒と、リアルタイム物体
検出の特徴を遺憾なく発揮した結果といえる。
仮に日本全国の航空写真を対象に判読を行ったとしても2日かからず
判読と地理情報データ化及びデータベース登録が終了する計算になる。
17
検出結果
誤検出の例もあげておく。
ビニールハウス、ゴミ、畑、墓、工場の屋根、水面のハレーションなどが
誤検出の代表である。
18
検証結果
P = 0.951, R = 0.949, F = 0.950
relevant(正) not relevant(誤)
True Positive (TP) False Positive (FP)
409 21
False Negative(FN) True Negative(TN)
22 ‐
retrieved(検出)
not retrieved(未検出)
, ,
Total Detection Time 191.077sec.
19
業務での適用の可能性
目視判読と同様に検出精度での課題は残るが、ソーラーパネルの検出
と地理空間データ化の工程が即時完了するため、後工程の現地調査・
検証に工数を費やすことができる。
新規判読時、航空写真更新時などのタイミングで実施することで効
果を発揮する。
実際に、従来方式(目視判読・現地調査)で把握できていなかった
ソーラーパネルを検出し、地番で土地・所有者の特定を行った結果、
約2%の新たな課税客体の発掘、将来の税収アップにつながった。
20
Mask R-CNNとは
画像内のオブジェクトを効率的に検出すると同時に、各イン
スタンスに対して高品質のセグメンテーションマスクを生成する
21
Mask R-CNNの概要
Faster R-CNN
Instance
segmentation
Mask R-CNNは、Faster R-CNNを拡張しオブジェクト領域
を検出する既存の経路と並行して、
オブジェクトマスクを予測するための経路を追加。
22
マスク ⇒ ポリゴン化のイメージ
インスタンス・セグメンテーション・マスク画像からこんな感じでポリゴン化
23
開発・テスト環境
CPU Core i7770K
メインメモリ 32GB
GPU NVIDIA GeForce GTX1080Ti 11GB
OS Ubuntu16.04 LTS
CUDA 8.0
cuDNN 6.0
OpenCV 3.2.0
物体検出アルゴリズム Mask R-CNN
ディープラーニング・フレームワーク Keras using TensorFlow backend
開発言語 Python3.5
Mask R-CNNをベースに、検出した物体形状をトレースして
(Multi)polygon化, GeoJson出力する機能を新たに実装した。
24
Mask R-CNNの活用事例
ソーラーパネル形状ポリゴン化、GeoJson出力してGIS表示
形状をポリゴン化すること
によって面積計算など
ができる
ポリゴン化
GeoJSON出力
時間がないので、とりあえず結果だけ。
1000枚の画像から教師データを作成し、
500回の学習で生成したウェイトモデルから作成
25
画像
マスキング
実は、G空間での活用が進んでいる
GRASS GIS Addon to generate vector masks from geospatial imagery.
Mapping Challenge: Convert satellite imagery to maps
for use by humanitarian organisations.
Images to OSM: Improve OpenStreetMap by adding baseball,
soccer, tennis, football, and basketball fields.
https://github.com/matterport/Mask_RCNN
26
まとめ
1. リアルタイム物体検出は、その検出速度を大量の航空写真の判読
処理に活かせる
2. YOLOv3は検出速度に加え、精度も向上。小さな地物判読に有
効。地方自治体の業務で使用し、実際に成果が得られた。
3. Mask R-CNNはインスタンス(検出した物体)セグメンテーションの
最新技術。地物のマスク処理を行うことから、Polygon化が容易
4. Mask R-CNNを用いた地物の自動生成は今後流行りそうな予感
27
ありがとうございました!
28

More Related Content

What's hot

SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介
miyanegi
 
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware  Panoptic Segmenta...【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware  Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
Deep Learning JP
 
ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争
Yosuke Shinya
 
【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey
Deep Learning JP
 
ROSによる今後のロボティクスのあり方
ROSによる今後のロボティクスのあり方ROSによる今後のロボティクスのあり方
ROSによる今後のロボティクスのあり方
Mori Ken
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
Koichiro Mori
 
myCobotがある生活
myCobotがある生活myCobotがある生活
myCobotがある生活
Ryo Kabutan
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況
Deep Learning JP
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII
 
20180925 CV勉強会 SfM解説
20180925 CV勉強会 SfM解説20180925 CV勉強会 SfM解説
20180925 CV勉強会 SfM解説
Fujimoto Keisuke
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
Deep Learning JP
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII
 
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料
Morpho, Inc.
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
cvpaper. challenge
 
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
Masaya Kaneko
 
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
Toru Tamaki
 
Visual slam
Visual slamVisual slam
Visual slam
Takuya Minagawa
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
Deep Learning JP
 
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
Hideki Takase
 

What's hot (20)

SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介SLAM開発における課題と対策の一例の紹介
SLAM開発における課題と対策の一例の紹介
 
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware  Panoptic Segmenta...【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware  Panoptic Segmenta...
【DL輪読会】“PanopticDepth: A Unified Framework for Depth-aware Panoptic Segmenta...
 
ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争ディープラーニングのフレームワークと特許戦争
ディープラーニングのフレームワークと特許戦争
 
【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey【DL輪読会】Vision-Centric BEV Perception: A Survey
【DL輪読会】Vision-Centric BEV Perception: A Survey
 
ROSによる今後のロボティクスのあり方
ROSによる今後のロボティクスのあり方ROSによる今後のロボティクスのあり方
ROSによる今後のロボティクスのあり方
 
マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向マルチモーダル深層学習の研究動向
マルチモーダル深層学習の研究動向
 
myCobotがある生活
myCobotがある生活myCobotがある生活
myCobotがある生活
 
[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況[DL輪読会]画像を使ったSim2Realの現況
[DL輪読会]画像を使ったSim2Realの現況
 
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
20180925 CV勉強会 SfM解説
20180925 CV勉強会 SfM解説20180925 CV勉強会 SfM解説
20180925 CV勉強会 SfM解説
 
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
[DL輪読会]YOLOv4: Optimal Speed and Accuracy of Object Detection
 
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
SSII2022 [TS2] 自律移動ロボットのためのロボットビジョン〜 オープンソースの自動運転ソフトAutowareを解説 〜
 
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料JDLA主催「CVPR2023技術報告会」発表資料
JDLA主催「CVPR2023技術報告会」発表資料
 
物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)物体検知(Meta Study Group 発表資料)
物体検知(Meta Study Group 発表資料)
 
SLAM勉強会(PTAM)
SLAM勉強会(PTAM)SLAM勉強会(PTAM)
SLAM勉強会(PTAM)
 
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
3次元レジストレーションの基礎とOpen3Dを用いた3次元点群処理
 
Visual slam
Visual slamVisual slam
Visual slam
 
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
[DL輪読会]Grokking: Generalization Beyond Overfitting on Small Algorithmic Datasets
 
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
ロボットシステムのつくりかた 〜Robot Operating Systemというアプローチ〜
 

YOLOv3 , Mask R-CNNなどの一般物体検出技術をG空間分野に活用する(FOSS4G 2018 Tokyo)