なるべく楽して展示ブースの人
数の監視システムを作ろう
とした話
2018/8/24 @LT会
自己紹介
名前:長谷川哲也
所属:IoT/AIソリューション事業部
経歴など
学生時代:数値計算
入社後:ほぼ機械学習関連のお仕事
商品のレコメンド、画像の自動分類
異常検知、自然言語処理など
問題背景
弊社では定期的に展示会に出展をおこなっています
問題背景
ブースへ来られるお客様の数は時間によってバラバラ…
過剰に説明員がいると思ってバックヤードに下がっていると、
いつの間にかお客様がたくさんいることがある
自動で監視できないか?
方向性
機械学習を使って人数の監視をおこなうことを目指す
ただし、一からいろいろやるのは大変なので、楽をしたい
学習データをたくさん作るのは非常に面倒
ディープラーニングは学習に時間がかかって面倒
そもそもコードをたくさん書くのも面倒
想像上のシステム
(データが写真しかないため、
今回は写真を入力とする)
想像上の
システム
説明員の人数:8
お客様の人数:7
係員は十分と判定
入力
出力
使用するデータについて
6月におこなわれた展示会で撮影された写真が
約230枚あるので、これらを学習・検証に用いる
どうやって人を認識するか?
YOLOを使う
物体検出の手法
人や車などが検出できる学習済みのモデルが配布されている
サンプルコードを使えばいいので、特にコーディングもいらない
楽!
YOLOの適用例
誤検出もあるが、おおよそ人を検出できている
説明員かどうかの判別は?
YOLO用の学習データを用意して、自分で学習させる
人手による画像に対するラベル付け(説明員 or その他)が必要
説明員かそうでないかの分類を
ディープラーニングによっておこなうことも可能
こちらもラベルが付いたデータが必要
大変!
大変!
説明員かどうかの判別は?
外れ値検知と呼ばれる仲間はずれかどうかを判定する手法を
用いるようにすることで、説明員の画像だけを集めれば良くなる
YOLOで検出した人の画像から
説明員の画像を集めて、
外れ値検知の手法を学習させる
ちょっと楽!
仲間
仲間
はずれ
学習データ
構成
入力
YOLO
人Aの画像
︙
ResNet50
画像のベクトル化
これも
学習済み
モデル
最近傍法
人の検出
説明員の人数
お客様の人数
学習済み
モデル
結果 赤を説明員
青をお客様と判定
誤り
誤り
まとめと課題
手間はかけずにできたが、精度がそれほどは良くない
データが少ないので、増やせばある程度よくなるはず
YOLOで人を検出できない場合もあるため、チューニングが必要
ブース外の人を含めないようにするための工夫は別途必要
カメラ位置によっては考えなくても良くなる
GoogleのTensorFlowがラズベリーパイのサポートし始めたので、
ラズベリーパイに組み込んでいきたい

なるべく楽して展示ブースの人数の監視システムを作ろうとした話