Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
ミクミンP
@ksasao
第38回 コンピュータビジョン勉強会@関東
2017/2/11
 火星や月から宇宙人の顔を見つけた
 Nasa の画像をクラウドで処理
https://en.wikipedia.org/wiki
/Face_on_Moon_South_Pole
(Română தமிழ் 中文)
http://targ...
 飯テロ判定bot (Twitter @no_meshitero)
 食事を判定する bot だが、それ以外の画像も判定
 複数の画像認識クラウドサービスの結果を統合
▪ Google, IBM, Microsoft, docomo
“一...
 艦娘認識
http://bit.ly/1VEaO2H
アニメ「ご注文はうさぎですか?/??」の画像から元の動画の
再生位置を高速検索するツール
 タイムラインに流れてくるアニメ画像の
元のシーンを知りたい
TVアニメ「ご注文はうさぎですか??」公式Twitter
https://twitter.com/usagi_anime
 ご注文はうさぎですか?のスクショから
何羽・何分何秒かを高速検索(数十ms程度)
 Windows/Mac/Linux 対応
 1期・2期 合計24話 全フレーム の画像
約100万枚のインデックスを約3MBに
圧縮して保持
 画像サイズの違い、大きな劣化、ブロックノ
イズ、コントラスト、色合いの違い、一部改
変などがあっても検索できる
 実際、改変されて投稿されていることが多い
 キャプチャ職人の好みなどが反映
 縦横比は保持される
 一部切り出した画像...
http://www.hackerfactor.com/blog/?/archives/529-Kind-of-Like-That.html
 aHash (average hash, mean hash) と
同程度に高速
 pHash ...
① 元画像 ② 9x8ピクセルに縮小
③ グレースケール化 ④ 隣接画素の輝度差の符号をビット化
 比較したい64bitベクトル同士のハミング距離
を計算し、特定の値以下のものを全検索する
 8bit の場合
00010101
11000101
11010000  ハミング距離 3
64bit 中 ハミング距離4以下でほとんどの画像が...
 ハミング距離がある値以下のものを全列挙
 ハミング距離3以下の場合は 二分探索
▪ ハッシュ値でソート済みのものを対象
▪ n ビット反転させたものを二分探索で発見
 ハミング距離4以上の場合は popcnt で
ハミング距離を計算して...
 画像ハッシュ値、シリーズ番号、話数番号、先頭からの
フレーム番号を1レコードとして、画像ハッシュ値で
ソートしたものを gzip圧縮
 メモリ上に展開しても 15MB 程度
https://github.com/ksasao/Gochiu...
 アニメ1クール(四半期)はおおよそ50万
枚程度のデータセットになる
 dHash は単純なアルゴリズムだが高速で
実装が容易で正確
 データベース作成ツールなども公開して
いますのでお試しください
 https://github.c...
 Mac版
 @ailen0ada さま
 https://itunes.apple.com/jp/app/gochiusachi/id1110637036?mt=12
 Java版
 @MoeMoePig さま
 http://m...
ごちうサーチ
ごちうサーチ
ごちうサーチ
ごちうサーチ
Upcoming SlideShare
Loading in …5
×

ごちうサーチ

9,032 views

Published on

第38回 コンピュータビジョン勉強会@関東 の発表資料です

Published in: Science
  • Hello! Get Your Professional Job-Winning Resume Here - Check our website! https://vk.cc/818RFv
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

ごちうサーチ

  1. 1. ミクミンP @ksasao 第38回 コンピュータビジョン勉強会@関東 2017/2/11
  2. 2.  火星や月から宇宙人の顔を見つけた  Nasa の画像をクラウドで処理 https://en.wikipedia.org/wiki /Face_on_Moon_South_Pole (Română தமிழ் 中文) http://target.lroc.asu.edu/qm3d/ o2w_3d_617653310_153_220_20 5_44_0/
  3. 3.  飯テロ判定bot (Twitter @no_meshitero)  食事を判定する bot だが、それ以外の画像も判定  複数の画像認識クラウドサービスの結果を統合 ▪ Google, IBM, Microsoft, docomo “一蘭の飯テロ画像です”
  4. 4.  艦娘認識 http://bit.ly/1VEaO2H
  5. 5. アニメ「ご注文はうさぎですか?/??」の画像から元の動画の 再生位置を高速検索するツール
  6. 6.  タイムラインに流れてくるアニメ画像の 元のシーンを知りたい TVアニメ「ご注文はうさぎですか??」公式Twitter https://twitter.com/usagi_anime
  7. 7.  ご注文はうさぎですか?のスクショから 何羽・何分何秒かを高速検索(数十ms程度)  Windows/Mac/Linux 対応  1期・2期 合計24話 全フレーム の画像 約100万枚のインデックスを約3MBに 圧縮して保持
  8. 8.  画像サイズの違い、大きな劣化、ブロックノ イズ、コントラスト、色合いの違い、一部改 変などがあっても検索できる  実際、改変されて投稿されていることが多い  キャプチャ職人の好みなどが反映  縦横比は保持される  一部切り出した画像た対象としない  似たような画像が近いベクトルとなる ようなハッシュ値を計算 (dHash)
  9. 9. http://www.hackerfactor.com/blog/?/archives/529-Kind-of-Like-That.html  aHash (average hash, mean hash) と 同程度に高速  pHash (perceptive hash/DCTを利用)に 近い精度 dHash. Absolutely amazing... Very few false positives. For example, the image with two known matches ended up matching 6 pictures total (4 false positives). The scores were: 10, 0, 8, 10, 0, and 10. The two zeros were the correct matches; all of the false- positive matches had higher scores. As speed goes, dHash is as fast as aHash. Well, technically it is faster since it doesn't need to compute the mean color value. The dHash algorithm has all the speed of aHash with very few false-positives.
  10. 10. ① 元画像 ② 9x8ピクセルに縮小 ③ グレースケール化 ④ 隣接画素の輝度差の符号をビット化
  11. 11.  比較したい64bitベクトル同士のハミング距離 を計算し、特定の値以下のものを全検索する  8bit の場合 00010101 11000101 11010000  ハミング距離 3 64bit 中 ハミング距離4以下でほとんどの画像が 検索可能 ハミング距離10くらいになると関係のない画像も ヒットし始める XOR (排他的論理和)をとる
  12. 12.  ハミング距離がある値以下のものを全列挙  ハミング距離3以下の場合は 二分探索 ▪ ハッシュ値でソート済みのものを対象 ▪ n ビット反転させたものを二分探索で発見  ハミング距離4以上の場合は popcnt で ハミング距離を計算して全データを比較 ▪ 100万件程度であれば十分に高速 ▪ popcnt の詳細は下記 ▪ 明日使えないすごいビット演算 (@_primenumber さま) http://www.slideshare.net/KMC_JP/slide-www
  13. 13.  画像ハッシュ値、シリーズ番号、話数番号、先頭からの フレーム番号を1レコードとして、画像ハッシュ値で ソートしたものを gzip圧縮  メモリ上に展開しても 15MB 程度 https://github.com/ksasao/Gochiusearch/blob/ master/src/ImageSearchEngine/ImageInfo.cs
  14. 14.  アニメ1クール(四半期)はおおよそ50万 枚程度のデータセットになる  dHash は単純なアルゴリズムだが高速で 実装が容易で正確  データベース作成ツールなども公開して いますのでお試しください  https://github.com/ksasao/Gochiusearch
  15. 15.  Mac版  @ailen0ada さま  https://itunes.apple.com/jp/app/gochiusachi/id1110637036?mt=12  Java版  @MoeMoePig さま  http://moemoepig.webcrow.jp/Gochiusearch/  アイコンデザイン  @ticktackmobile さま

×