YOLOv3 , Mask R-CNNなどの一般物体検出技術をG空間分野に活用する（FOSS4G 2018 Tokyo）

株式会社オービタルネット
小林裕治
YOLOv3 , Mask R-CNNなどの
一般物体検出技術をG空間分野に活用する
～地方自治体での活用事例をもとに～

内容
• 自己紹介
• YOLOv3を用いた地物検出の事例紹介
（岐阜県恵那市様における業務適用事例）
• Mask R-CNNを用いた地物の検出とポリゴン化の事例紹介
• まとめ
1

自己紹介
【氏名】小林裕治
【所属】株式会社オービタルネット代表取締役
（株式会社カナエジオマチックス取締役）
・ 4年前にリアルタイム・キャバリア検出器を機械学習
（JAVA-JNI-OpenCV）で実装したのが出発点
・ 3年ほど前からディープラーニングにはまる。
【リアルタイム物体検出の取り組み】
2
OSMベースの
Vector Tile Map
試験公開しています！

一般物体検出の現状
出典： YoloV2, Yolo 9000, SSD Mobilenet, Faster RCNN NasNet comparison
https://www.youtube.com/watch?v=V4P_ptn2FF4
ここ数年、ディープラーニングを活用した一般物体検出（画像から物
体領域の検出とクラス分類）の進化が著しい。とりわけリアルタイム物体
検出に関しては Faster R-CNN, YOLO, SSDなどのアルゴリズムが
考案されており、年々検出速度と精度の向上が図られている。
3

背景と目的
リアルタイム物体検出の技術は年々進化しており、
我々は応用を考え、必要な部分のみ実装すれば良い。
もはや業務適用のフェーズに至っている
4

背景と目的
ならば、このリアルタイム・オブジェクト検出アルゴリズムを
航空写真判読に活用できないか!?
5

背景と目的
そこでリアルタイム物体検出アルゴリズムを応用して, 大量の
航空写真画像から対象地物を即時検出するシステム（以下
判読システム）を構築し地方自治体の固定資産（償却資
産）実態把握業務への適用について検討した。
具体的には恵那市役所様に提供頂いた航空写真画像を
もとに太陽光発電施設（以下ソーラーパネル）を検出、
精度検証・評価を行い、地番レベルで土地・所有者の特定を
行った。
6

YOLO
You only livelook once (YOLO) is a state-of-
the-art, real-time object detection system.
➢ YOLOはオブジェクトの候補領域（短径）と分類を同時に実現するアルゴリズム
https://arxiv.org/abs/1506.02640
➢ 現在はYOLOv3が公開されており、ニューラルネットワークが刷新され、検出精度
の向上が図られている
https://arxiv.org/abs/1804.02767
採用した一般物体検出アルゴリズム
7

YOLOv3のネットワーク・アーキテクチャー
・ YOLOv3はResNetをベースに改良を加えたネットワーク・モデル
・全結合層を持たない106層の Fully Convolutional Network
・ 3層の異なるサイズの検出レイヤを持つ Feature Pyramid Network
のような構造が特徴
出典： Ayoosh Kathuria, 2018. What’s new in YOLO v3?
https://towardsdatascience.com/yolo-v3-object-detection-53fb7d3bfe6b
8

YOLOv3の物体検出の仕組み
13
13
1
1
18
Feature Map
BB(1) BB(2) BB(3)
Detect Layer 1
×B
*本件ではソーラーパネルの１クラス
Bounding Box
出力層の特徴マップはセルに分割され、セル単位で物体候補を内包
する短径（Bounding Box）を複数（本件では3）保持することが
できる。特徴マップにはオブジェクト性スコア、短径の中心座標
x,y,width,height,クラス確率 × 分類クラス数の情報が格納される。
9

Darknet（ディープラーニング・フレームワーク）
Darknetは
YOLOの考案者が
C言語とcudaで実装した
オープンソースの
ディープ・ラーニング
フレームワーク
https://pjreddie.com/darknet/ 10

判読システムの開発・テスト環境
CPU Core i7770K
メインメモリ 32GB
GPU NVIDIA GeForce GTX1080Ti 11GB
OS Ubuntu16.04 LTS
CUDA 8.0
cuDNN 6.0
OpenCV 3.2.0
物体検出アルゴリズム YOLOv3
ディープラーニング・フレームワーク Darknet
開発言語 C言語, Python2.7
NoSQLデータベース MongoDB v3.4.15
GIS QGIS2.8 with Mongo Connector Plugin
判読システムは、YOLO実装を含むディープラーニング・フレームワーク
Darknetを改良して構築した。
Windows用のソースコードも公開されており、Windows10においても
同様の開発・テスト環境を構築した。
11

12
判読システム・ワークフロー
『フォルダ内の画像を連続処理する機能』、『画像上の短径座標と物体
カテゴリー名、推定確率を地理空間情報に変換する機能』、『既知の
データとの差分抽出機能』、『NoSQLデータベースMongoDBに登録
する機能』及び『GeoJson、CSVに出力する機能』などを実装した。
output insert
connect
visualize
GeoJson
Object
Deep Learning
NoSQL GIS
input
オルソ画像
ワールドファイル
Data Source
Old GeoJSON
シリアライズ
v3
差分判定
地物検出
学習済モデル
（ウェイト）
GeoJSON
インスタンス

ソーラーパネルの学習
50cm～1m解像度1000枚の航空写真を反転・回転するなどして
5,000枚程度に水増し。アノテーションツール ”BBox-Label-Tool”
を使用して画像からソーラーパネルを目視判読し、ソーラーパネルを内
包する短径のピクセル座標をファイル出力し教師用データを作成。
YOLOv3のCNNモデルとウェイトの初期値にdarknet53.conv.74
を使用して教師用データを与えて学習させた。
13

学習モデル（ウェイト）の評価
教師用データから取り分けた250枚の評価用画像セットを判読システ
ムに入力し、学習で得られた学習モデル（ウェイト）をCNNのウェイトに
設定してモデルの性能評価を行った。
P = 0.981, R = 0.938, F = 0.959
Total Detection Time 4.586sec.
, ,
14

差分管理の仕組み
新たに検出したすべての地物に対して既知のソーラーパネルとの重なり
度合いをIoU（Intersection over Union）を用いて数値化し、
設定した閾値を超えた場合に新設ソーラーパネルと定義した。
差分情報はGeoJsonのプロパティに付与される。
IoU =
Area of Overlap
Area of Union
Area of Overlap Area of Union
15

検出結果
恵那市役所様に提供頂いた航空写真画像データのうち、40㎝解像度の
データセットから用意した1,000px×750px,4,780枚の検証用データを
判読システムに入力した結果 430件の検出結果（ソーラーパネル候）
が得られた。
16

検出結果
4,780枚, 面積500k㎡の処理時間は191秒と、リアルタイム物体
検出の特徴を遺憾なく発揮した結果といえる。
仮に日本全国の航空写真を対象に判読を行ったとしても2日かからず
判読と地理情報データ化及びデータベース登録が終了する計算になる。
17

検出結果
誤検出の例もあげておく。
ビニールハウス、ゴミ、畑、墓、工場の屋根、水面のハレーションなどが
誤検出の代表である。
18

検証結果
P = 0.951, R = 0.949, F = 0.950
relevant（正） not relevant（誤）
True Positive (TP) False Positive (FP)
409 21
False Negative(FN) True Negative(TN)
22 ‐
retrieved（検出）
not retrieved（未検出）
, ,
Total Detection Time 191.077sec.
19

業務での適用の可能性
目視判読と同様に検出精度での課題は残るが、ソーラーパネルの検出
と地理空間データ化の工程が即時完了するため、後工程の現地調査・
検証に工数を費やすことができる。
新規判読時、航空写真更新時などのタイミングで実施することで効
果を発揮する。
実際に、従来方式（目視判読・現地調査）で把握できていなかった
ソーラーパネルを検出し、地番で土地・所有者の特定を行った結果、
約2%の新たな課税客体の発掘、将来の税収アップにつながった。
20

Mask R-CNNとは
画像内のオブジェクトを効率的に検出すると同時に、各イン
スタンスに対して高品質のセグメンテーションマスクを生成する
21

Mask R-CNNの概要
Faster R-CNN
Instance
segmentation
Mask R-CNNは、Faster R-CNNを拡張しオブジェクト領域
を検出する既存の経路と並行して、
オブジェクトマスクを予測するための経路を追加。
22

マスク ⇒ ポリゴン化のイメージ
インスタンス・セグメンテーション・マスク画像からこんな感じでポリゴン化
23

開発・テスト環境
CPU Core i7770K
メインメモリ 32GB
GPU NVIDIA GeForce GTX1080Ti 11GB
OS Ubuntu16.04 LTS
CUDA 8.0
cuDNN 6.0
OpenCV 3.2.0
物体検出アルゴリズム Mask R-CNN
ディープラーニング・フレームワーク Keras using TensorFlow backend
開発言語 Python3.5
Mask R-CNNをベースに、検出した物体形状をトレースして
（Multi）polygon化, GeoJson出力する機能を新たに実装した。
24

Mask R-CNNの活用事例
ソーラーパネル形状ポリゴン化、GeoJson出力してGIS表示
形状をポリゴン化すること
によって面積計算など
ができる
ポリゴン化
GeoJSON出力
時間がないので、とりあえず結果だけ。
1000枚の画像から教師データを作成し、
500回の学習で生成したウェイトモデルから作成
25
画像
マスキング

実は、G空間での活用が進んでいる
GRASS GIS Addon to generate vector masks from geospatial imagery.
Mapping Challenge: Convert satellite imagery to maps
for use by humanitarian organisations.
Images to OSM: Improve OpenStreetMap by adding baseball,
soccer, tennis, football, and basketball fields.
https://github.com/matterport/Mask_RCNN
26

まとめ
1. リアルタイム物体検出は、その検出速度を大量の航空写真の判読
処理に活かせる
2. YOLOv3は検出速度に加え、精度も向上。小さな地物判読に有
効。地方自治体の業務で使用し、実際に成果が得られた。
3. Mask R-CNNはインスタンス（検出した物体）セグメンテーションの
最新技術。地物のマスク処理を行うことから、Polygon化が容易
4. Mask R-CNNを用いた地物の自動生成は今後流行りそうな予感
27

ありがとうございました！
28

YOLOv3 , Mask R-CNNなどの一般物体検出技術をG空間分野に活用する（FOSS4G 2018 Tokyo）

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

YOLOv3 , Mask R-CNNなどの一般物体検出技術をG空間分野に活用する（FOSS4G 2018 Tokyo）