Tesseract-OCR in iOS

5,365 views

Published on

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,365
On SlideShare
0
From Embeds
0
Number of Embeds
470
Actions
Shares
0
Downloads
13
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Tesseract-OCR in iOS

  1. 1. 0@reiji10200 長崎県立大学シーボルト校 国際情報学部 情報メ ディア学科 2年0 Obj-C/Unity4/JavaScript/C#0 http://reiji1020.hatenablog.com/
  2. 2. 文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね
  3. 3. ShotNote(KING JIM製)0 ノートタイプ、付箋タイプ、ホワイトボードタイプ が用意されている。0 日時、ページを読み取りデータに付加することがで きる
  4. 4. 0 OCRすごい!0 企業発Appにしか搭載されていないのが残念…0 日本語を読んでほしいとは言わないから英語だけで も読めるとすごい
  5. 5. Tesseract-OCR0 フリーの文字認識ライブラリ0 最初はHPが開発していたが今はGoogleが支援・開発を行なっている0 生い立ちなど詳しいことはGoogle先生に聞いてみてね
  6. 6. 0 ダウンロードは以下のURLからhttp://code.google.com/p/tesseract-ocr/
  7. 7. 0 インストールはWindowsだととても簡単。インストーラがあるので一発インストール0 Macはmacportに対応しているのでこれまたインストールは簡単 sudo port install tesseract
  8. 8. 0 Tesseract-OCRのライブラリはC/C++で書かれている →Objective-Cでも使うことができる!但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)
  9. 9. OpenCVと比較して0 OpenCVでパターンマッチングを行おうと試みたが、 実用的な精度が出ず断念0 IplImageとUIImageの変換を行わなければならない 0 UIImageはRGBAの4チャンネル 0 IplImageはBGRの3チャンネルで扱う0 アプリ内で撮った写真を処理にかけるときは少々面 倒である
  10. 10. 0 カメラ起動ボタンをタップするとカメラが起動0 必要部分をトリミング(自由に切り出せるように改良の余地あり)0 Useボタンを押すと処理開始
  11. 11. 0 処理が終わると下に結果が表示される
  12. 12. 0 メリット 0 処理速度がとても速い 0 英数の精度はとても良い 0 日本語も中々精度が高い 0 フリー0 デメリット 0 角度を調整してあげないと誤認識が生じる(1→/) 0 数字と英語が混じっている文章では(フォントによっ て)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる 0 読み取りたい文章に合わせて言語ライブラリを絞ろう。
  13. 13. 0 参考スライド:http://www.slideshare.net/takmin/tesseract-ocr

×