Tesseract-OCR in iOS
Upcoming SlideShare
Loading in...5
×
 

Tesseract-OCR in iOS

on

  • 4,253 views

 

Statistics

Views

Total Views
4,253
Views on SlideShare
3,906
Embed Views
347

Actions

Likes
3
Downloads
8
Comments
0

1 Embed 347

http://reiji1020.hatenablog.com 347

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Tesseract-OCR in iOS Tesseract-OCR in iOS Presentation Transcript

  • 0@reiji10200 長崎県立大学シーボルト校 国際情報学部 情報メ ディア学科 2年0 Obj-C/Unity4/JavaScript/C#0 http://reiji1020.hatenablog.com/
  • 文具メーカーからはスマホやタブレット用アプリと連動した商品が続々と発売されていますね
  • ShotNote(KING JIM製)0 ノートタイプ、付箋タイプ、ホワイトボードタイプ が用意されている。0 日時、ページを読み取りデータに付加することがで きる
  • 0 OCRすごい!0 企業発Appにしか搭載されていないのが残念…0 日本語を読んでほしいとは言わないから英語だけで も読めるとすごい
  • Tesseract-OCR0 フリーの文字認識ライブラリ0 最初はHPが開発していたが今はGoogleが支援・開発を行なっている0 生い立ちなど詳しいことはGoogle先生に聞いてみてね
  • 0 ダウンロードは以下のURLからhttp://code.google.com/p/tesseract-ocr/
  • 0 インストールはWindowsだととても簡単。インストーラがあるので一発インストール0 Macはmacportに対応しているのでこれまたインストールは簡単 sudo port install tesseract
  • 0 Tesseract-OCRのライブラリはC/C++で書かれている →Objective-Cでも使うことができる!但しObj-Cソースコードの拡張子を*.mからObj-C++ソースコードの*.mmに変えなければならない(obj-C++形式で書いていないソースコードも*.mmに変えておかないとビルドが通らない)
  • OpenCVと比較して0 OpenCVでパターンマッチングを行おうと試みたが、 実用的な精度が出ず断念0 IplImageとUIImageの変換を行わなければならない 0 UIImageはRGBAの4チャンネル 0 IplImageはBGRの3チャンネルで扱う0 アプリ内で撮った写真を処理にかけるときは少々面 倒である
  • 0 カメラ起動ボタンをタップするとカメラが起動0 必要部分をトリミング(自由に切り出せるように改良の余地あり)0 Useボタンを押すと処理開始
  • 0 処理が終わると下に結果が表示される
  • 0 メリット 0 処理速度がとても速い 0 英数の精度はとても良い 0 日本語も中々精度が高い 0 フリー0 デメリット 0 角度を調整してあげないと誤認識が生じる(1→/) 0 数字と英語が混じっている文章では(フォントによっ て)0(ゼロ)とO(オー)、1とI(アイ)の誤認識が生じる 0 読み取りたい文章に合わせて言語ライブラリを絞ろう。
  • 0 参考スライド:http://www.slideshare.net/takmin/tesseract-ocr