Image Recognition

6,959 views

Published on

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
6,959
On SlideShare
0
From Embeds
0
Number of Embeds
81
Actions
Shares
0
Downloads
0
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Image Recognition

  1. 1. Introduction to Image Recognition Nov 28, 2008
  2. 2. Contents 画像処理の目的 画像処理の歴史 画像認識に使う処理 二値化 輪郭抽出 エッジ抽出 平滑化  対応領域探索
  3. 3. 画像処理の目的 画像変換(画像 → 画像) 画質変換     ぼやかし 鮮明化 セピア レリーフ風 光の当たり方 幾何学変換     拡大・縮小 回転 平行移動 透視変換(視点変換) 画像認識(画像 → 文字・記号) 個人照合(指紋認証) 防犯侵入監視 文字認識 似ている画像検索 似ている商品検索 http://like.com CG(文字・記号 → 画像)
  4. 4. 画像処理の歴史 1960年代  主に科学に関係した画像処理         手書き郵便番号読取装置 http://kagakukan.toshiba.co.jp/history/1goki/1967postmatter/index.html         人工衛星写真の処理         泡箱の飛跡写真の処理(ハフ変換によるニュートリノ検出) http://ja.wikipedia.org/wiki/%E6%B3%A1%E7%AE%B1 1970年代  医療や工業 CT断層写真(鮮明な断層写真の提供)         リモートセンシング(遠隔探索)              宇宙資源衛星ランドサット                    地球表面の資源データを地上に伝送         工業用画像処理(不良品の自動検出、半導体組立) http://www.incom.co.jp/productnavi/index.php/product/20983 1980年代   図面認識、文書理解 複写機への応用   画像処理用サブルーチンパッケージSPIDER(電子総合研究所)
  5. 5. 画像認識でのアルゴリズム 二値化 輪郭抽出 エッジ抽出 平滑化 対応領域探索
  6. 6. 二値化(Binarization) 画像中の画素をある値(閾値)を境に白または黒のいずれかを持つような 二値画像に変換すること 不要な情報をおとすため画像処理の前処理としてよく使われる。 背景を黒画素、前景を白画素とするか、またはこの逆に変換する。 メリット 画像の単純化(不要な情報を落とす)   デメリット 情報の消失
  7. 7. 閾値をどうやって決めるか グレースケール化する際、単純には以下のように RGB から変換した値を使う。 (R + G + B) ÷ 3 これを濃度と呼び、この値に閾値を設けて二値化を行う。 場合によってはこれを使わずに、YCrCb 表色系の Y(輝度) を用いることもある。 Y = 0.299 x R + 0.587 x G + 0.114 x B 閾値の決定方法   閾値の値を適切に指定しないと、↓のような問題がある   閾値が高すぎたり低すぎたりした場合 → 全体的に白っぽくなったり                               黒っぽくなったりする 1.  濃度ヒストグラムに基づく方法    ・・・ この方法だけ説明します 2.  画像をいくつかに分割し,各領域ごとに設定する方法(レベルスライス) 3.  画像の局所性質を生かし,この性質を利用する方法       最初に濃度が急激に変わるところを取り出してから、濃度ヒストグラムの方法を使う 4.  ラプラシアン・ヒストグラム法 ...
  8. 8. 濃度ヒストグラム 画像の濃度を横軸に、ある濃度を持つ画素数を縦軸にとった統計グラフ。 p-タイル法    新聞の文字の認識の場合、文字がある面積がある程度わかっている場合に有効。 モード法    対象とする図形と背景の濃度値の差が大きく、濃度ヒストグラムにはっきりと谷が    出来るときに有効 判別分析法    ある閾値を一つ決めて二つのクラスに分割。クラス内分散とクラス間分散の分散比が 最大になるように閾値を決定。
  9. 9. 輪郭抽出(Outline Extraction) 輪郭とは物体の外形をあらわす線。 用途   ・物体の面積、周囲長、円形度、重心などの特徴量の計算   ・文字認識、指紋認証、顔認識 輪郭抽出手順 1, 入力画像を、背景を白、物体を黒にした二値画像に変換 2, 入力画像を端から順に走査し、最初の輪郭点を決定 3, 最初の輪郭点を中心として左回りに隣接する領域を調べ、   値をもつ点を次の輪郭点とする 4, 中心を新たに見つけた輪郭点に移動させ、3の処理を再度行う。 5, 開始点に戻ってくるまで繰り返し、得られた閉曲線を輪郭とする
  10. 10. エッジ抽出(Edge Extraction) エッジとは濃度が急激に変化する点 用途   ・大量生産されている部品から不良品を識別   ・自動車の自動走行(搭載されているカメラで道路の白線を抽出し、 白線をはみださないようにする。)   ・複数の深度に焦点があっている画像を作製する http://www.frontier.kyoto-u.ac.jp/rc03/omake/focused.html エッジと輪郭の違い 輪郭と見たところは同じですが、エッジの場合は得られた画素間に関係はな い。 輪郭は座標系列のリストで、輪郭の上の画素には順番がついているので一周 することができます。 以下で具体的なエッジ抽出方法を説明します。
  11. 11. エッジ抽出方法 エッジ抽出では以下のようなオペレータを各画素に対して適用してエッジの強さをはかる。 真ん中が実際にエッジを測定したい画素に対応する。 左のような濃度を持つ画素を例にすると、上のようなオ ペレータをかけて得られるエッジの強さは 57x1 + 96x1 + 34x1 + 30x1 + 165x(-4)= -443 このように一般に 0 - 255 の範囲に入らない場合もあ るので、その場合は正規化する。 エッジ抽出の種類 Sobel オペレータ Laplacian オペレータ prewitt 法 Roberts オペレータ(今回は説明しない) Gabor filter(今回は説明しない) wavelet を使った方法(今回は説明しない) ...
  12. 12. Sobel オペレータ 一次微分を基本にしたオペレータ 特徴 ・垂直方向のエッジ、水平方向のエッジを別々に抽出できる ・垂直方向の後に水平方向、または水平方向の後に垂直方向のオペレータで  エッジを抽出することでノイズに強くなる。
  13. 13. Laplacian オペレータ 二次微分を基本にしたオペレータ 特徴 ・ノイズに弱い 四方向  (Laplacian オペレータを使う前にガウス関数を 八方向   重みとして使った平滑化を行うのが一般的) ・細い線や線の端点に強く反応する 四方向 八方向
  14. 14. テンプレートマッチング法( prewitt 法) 一次微分を基本にしたオペレータ。 テンプレートマッチング法は標準パターンをいくつか用意しておき、画像の一部分と比較して最も 値が大きいものを選んでいく方法。 prewitt 法の場合、エッジに対して下記の8つのマスクパターンを用意して、それぞれを測定した い画素に適用する。測定した結果、最も大きい値のマスクを採用しエッジの大きさを決める。
  15. 15. 平滑化(Smoothing) 平滑化とは画像の濃度を平らに滑らかにする手法。 画像中のノイズを除去するために行う。 平均化フィルタ   注目画素とその周辺の輝度値に   右のようなレートを掛け合わせて濃度を求める。 ガウシアンフィルタ   平均化フィルタと違い右のような中央画素の重みを 大きくしたようなレートを掛け合わせる。 メディアンフィルタ   右の図のような濃度分布があった場合、   中心画素および周辺画素の濃度の中での中央値 41 で 165 を置き換える。   上の二つのフィルタに比べてエッジが消えにくいという   特徴がある。また、ゴマ塩ノイズの除去にも有効。
  16. 16. 対応領域探索 対応領域探索とは、例えば顔認識の場合与えられた画像の中から 顔と判断される部分を調べること。 入力画像の中にある物体があるかどうかを調べるには、物体の画像を入力画像と 重ね合わせることで対応する領域があるか調べる、マッチングという方法で行う。 また、このマッチングという方法は特定物体追跡にも使われる。
  17. 17. テンプレートマッチング法 手順 1、あらかじめ検出したい物体のテンプレート画像を用意する 2、テンプレート画像の左上端を対象画像の左上端にセットし、類似度を計算 3、テンプレート画像を1pixel 右に動かし、テンプレート画像との類似度を計算 4、右端まで行ったら、 一つ下のピクセルに移動し、テンプレート画像を左端に移動 5、テンプレート画像の右下端が対象画像の右下端に一致するまで繰り返し、類似度が   高い領域を調べる。 類似度の候補 濃度差の絶対値の総和(SAD: Sum of Absolute Difference) 濃度差の二乗和(SSD: Sum of Squared Difference) 正規化相互相関関数(NCC: Normalized Cross-Correlation) ... SAD, SSD は値が小さいほど類似度が高い。 NCC は値が大きいほど類似度が高い。 NCC は SAD, SSD に比べて濃度の相対的な違いなどの影響を 受けにくい。
  18. 18. また、テンプレート画像の作り方によっても検出精度は大きく変わる。 グラスゴー大学 顔検出 http://www.itmedia.co.jp/news/articles/0801/26/news005.html 照合方法 RGBのそれぞれの画素を比較する方法 グレースケールに変換してから比較する方法 ヒストグラムを作成し比較する方法(ヒストグラムインタセクション)
  19. 19. まとめ 画像処理、画像認識についての方法をいくつかまとめてみた。 二値化 輪郭抽出 エッジ抽出 平滑化 対応領域探索 他にも紹介したいものがあったが、時間の関係でできなかった。 表色系 幾何学変換(回転、拡大・縮小) ハフ変換 オープニング・クロージング 形状特徴抽出
  20. 20. ご清聴ありがとうございました。

×