ラドン変換と非線型マッチング
によるアフィン変形不変な
文字認識方法の提案
長谷川誠†,石原聖司††,古川貴雄‡,滝口孝志‡‡
†東京電機大学工学部,††東京電機大学理工学部
‡共立女子大学家政学部
‡‡防衛大学校数学教育室
目次
1. はじめに
1. 携帯カメラを用いた文字認識
2. パターンマッチング法(従来方法)
2. ラドン変換(定義と性質)
3. 振幅限定対数ラドン変換(定義と性質)
4. 文字照合方法
5. 技術的課題(せん断の影響)
6. 提案方法(非線型弾性マッチング)
7. 実験(類似度比較)
8. まとめ
文字「春」 せん断変形
携帯カメラを用いた文字認識
モバイル文字認識(携帯カメラを用いた文字認識)
• 外部環境(光源など)の変動に強い
• 文字の変形に頑健(回転・拡大縮小・平行移動・せん断など)
• 雑音・オクルージョンへの耐性
• 識別能力が高い(低い他人受入率・低い本人拒否率)
• 高速な照合(照合計算量・インデックス技術)
道路案内標識:正面からの撮影,斜めからの撮影
パターンマッチング法(従来方法)
• 位相限定相関法(平行移動に頑健)
画像のフーリエ変換,位相成分の抽出;相関画像の生成;
同一被写体の場合:鋭いピークの出現
• フーリエ・メリン変換法(回転・拡大縮小・平行移動に頑健)
画像をフーリエ変換;振幅成分の対数極座標マッピング;
変換結果の位相限定相関算出
• Geometric Hashing法(回転・拡大縮小・平行移動・せん断に頑健)
• 振幅限定ラドン変換法(回転・拡大縮小・平行移動に頑健)
画像をラドン変換;変換係数の振幅成分抽出;対数マッピング;
変換結果の位相限定相関算出
ラドン変換
2 次元𝑋𝑌 平面上の座標(𝑥, 𝑦):X 原画像:𝑓(X)
(定義)原画像𝑓(X)のラドン変換𝑅𝑓(𝜃, 𝜌):
𝑅𝑓 𝜃, 𝜌 = 𝑓(X)𝛿(X ∙ 𝜉 − 𝜌) dX (1)
𝜉:単位ベクトル(cos𝜃, sin𝜃)
𝛿(∙):デルタ関数
(解釈)輝度値𝑓(X)を,直線
𝐿 𝜃𝜌 = {X ∈ 𝑅2
|X ∙ 𝜉 = 𝜌} (2)
に沿って線積分した結果
𝜌:直線𝐿 𝜃𝜌の原点からの距離
𝜃:直線𝐿 𝜃𝜌の傾き
𝐿 𝜃𝜌
x
y
𝜃
𝜉 = (sin𝜃, cos𝜃)
𝜌
𝜌
𝜃
原画像
ラドン変換結果
ラドン変換の性質(被写体の回転)
被写体の回転→偏角軸方向(横方向)の平行移動
原画像 ラドン変換結果
ラドン変換の性質(被写体の拡大縮小)
被写体の拡大縮小→動径軸𝜌方向の拡大縮小
原画像 ラドン変換結果
ラドン変換の性質(被写体の平行移動)
被写体の平行移動→波をうつような上下移動
原画像 ラドン変換結果
振幅限定対数ラドン変換
被写体の平行移動に不変,被写体の回転や拡大縮小が2 次元の平
行移動に置換される変換(振幅限定対数ラドン変換)
(変換ステップ)
1. 原画像の入力
2. ラドン変換
3. 動径方向に1 次元フーリエ変換し,振幅成分を抽出(被写体の平
行移動不変)
4. 動径方向に対数マッピング(被写体の拡大縮小が動径方向の平
行移動に置換)
5. 微分フィルタによる先鋭化(特徴抽出のため)
(次ページで解説)
振幅限定対数ラドン変換(振幅成分抽出)
動径方向に1 次元フーリエ変換;振幅成分の抽出(位相成分の除去
→被写体の平行移動に不変);下半分の切り出し(上下線対称)
振幅限定対数ラドン変換(振幅成分抽出)
動径の対数マッピング(動径方向の拡大縮小→平行移動);被写体の
回転→水平方向移動;微分フィルタを適用(特徴抽出)
振幅限定対数ラドン変換の性質
(被写体の回転と拡大縮小)
被写体の回転と拡大縮小→2 次元の平行移動
原画像 振幅限定対数ラドン変換結果
振幅限定対数ラドン変換の性質
(被写体の平行移動)
被写体の平行移動→不変
原画像 振幅限定対数ラドン変換結果
振幅限定対数ラドン変換を用いた文字照合
被写体の平行移動に不変なマッチング方法(位相限定相関法)の適
用;文字の回転・拡大縮小・平行移動に頑健な照合
2 つの原画像の振幅限定対数ラドン変換結果: 𝐷𝑓(𝜃, 𝜌),
𝐷𝑔(𝜃, 𝜌)のフーリエ変換:
𝐺 𝑢, 𝑣 = 𝐷(𝜃, 𝜌)𝑒−𝑖 𝑢𝜃+𝑣𝜌
d𝜃d𝜌 (3)
位相限定相関𝑃(𝜃, 𝜌):
𝑃 𝜃, 𝜌 =
1
(2𝜋)2
𝐺 𝑓(𝑢,𝑣)𝐺 𝑔(𝑢,𝑣)
|𝐺 𝑓 𝑢,𝑣 𝐺 𝑔 𝑢,𝑣 |
𝑒 𝑖 𝑢𝜃+𝑣𝜌 d𝑢d𝑣 (4)
照合(同一文字の場合)
文字が等しい場合:鋭いピークの出現;ピークの位置:回転ずれ(回
転角),拡大縮小ずれ(拡大率);ピーク値:類似度
照合(非同一文字の場合)
文字が異なる場合:ピークなし;低い類似度(最大値)
技術的課題(せん断の影響)
被写体のせん断→水平方向の粗密変形,垂直方向の上下移動
原画像 振幅限定対数ラドン変換結果
アフィン歪みへの耐性
アフィン変換:回転,拡大縮小,平行移動,せん断,鏡像で網羅;文字
がせん断している場合:非線型マッチング(弾性マッチング)の適用
文字の変形 変換結果への影響 照合方法
回転 水平移動 位相限定相関法
拡大縮小 垂直移動 位相限定相関法
平行移動 不変 位相限定相関法
せん断 水平方向の粗密変形
上下移動
非線型マッチング
鏡像 偏角方向の反転 位相限定相関法
非線型弾性マッチング
(コストマトリックスの生成)照合対象の2つの変換結果から列ベクト
ルを抽出;1 次元位相限定相関による列ごとの類似度算出;類似度
の逆数→コスト
非線型弾性マッチング
累積コストマトリックスの算出;ワーピングパスの追跡;マッチングスコ
アの算出
実験(類似度比較)
テンプレート クエリ 提案方法
(非線型弾性マッチング)
振幅限定ラドン変換
「春」 「春」 1.00 1.00
「春」 回転「春」 0.88 0.88
「春」 拡大縮小「春」 0.77 0.66
「春」 平行移動「春」 0.99 0.97
「春」 せん断「春」 0.66 0.10
「春」 「夏」 0.30 0.07
(テンプレート)
まとめ
(提案)ラドン変換と非線型マッチングによるアフィン変形不変な文字
認識方法
(振幅限定ラドン変換)
• 文字の平行移動→不変
• 文字の回転・拡大縮小→2次元の平行移動
• 文字のせん断→水平方向の粗密変形,上下移動
(非線形マッチング:弾性マッチング)
• せん断を含むアフィン変形に不変な文字認識を実現
(今後の課題)
• 日本語文字(ひらがな,かたかな,数字,教育漢字)を対象に文字
照合
• 従来方法との性能比較

ラドン変換と非線型マッチングによるアフィン変形不変な文字認識方法の提案