Eggplant Functional - Lesson 3 (Japanese slides)3. What Is OCR?
• 解釈アルゴリズムによる、画面上の文字を解読
• テキストは、指定された言語の辞書定義と比較
• 何百もの限度をサポート
Optical Character Recognition
© Copyright 2019 Eggplant
4. A Simple OCR Search
• OCR検索の構文は、画像検索での参照可能
• インラインで宣言されているテキストプロパティを参照
© Copyright 2019 Eggplant
5. A Simple OCR Read
• OCRを使用し、画面からテキスト読み取りが可能
• 次レッスンで詳細説明実施する。
© Copyright 2019 Eggplant
6. OCR Search Properties
© Copyright 2019 Eggplant
OCRのパフォーマンスと精度を向上方法
・ searchRectangleプロパティを追加
・ searchRectangleグローバルプロパティの使用
7. More OCR Search Properties
・CaseSensitiveプロパティを使用し、ケースマッチングを制御(適用/無視)
・コントラストプロパティを使用し、難しいテキスト処理可能
(低コントラスト、小さいフォントサイズなどの処理)
© Copyright 2019 Eggplant
8. More OCR Search Properties
・英語以外の言語の場合は、Languageプロパティの指定が必要
・各モバイルデバイスにおいて、画面サイズと解像度が異なるため、
使用するデバイスのDPIと一致するようにDPIを設定して、OCRの信頼性を高める必要がある。
© Copyright 2019 Eggplant
10. the SearchRectangle: Hard Coordinates
ターゲットUI要素が安定している場合に使用するアプローチ
ヒント:Viewerウィンドウから座標情報をコピーし、スクリプトに貼り付ける
© Copyright 2019 Eggplant
12. OCR and Hot Spots
• ホットスポットは、画像の範囲指定をする際の基準点です。(デフォルト位置は中央)
• ImageLocation()関数を使用してホットスポットの場所にアクセスする。
• locationOCR検索のホットスポットを使用して、 ホットスポットの場所に関連するアクションを実行できる。
© Copyright 2019 Eggplant
13. 画像検索 vs OCR検索
© Copyright 2019 Eggplant
OCR検索のパフォーマンスと信頼性は、アプリケーションにより異なる。
OCRは通常、最初により多くのスクリプト作成作業を必要としますが、
テキスト間の違い(フォントサイズ、書体など)に敏感ではない。
一般的に、テキストのいくつかの異なる外観のみを処理する必要がある場合は、
画像検索を使用する。 多くの異なる外観の場合は、OCRを使用する。
テキストが非常に小さいか、読みにくい書体の場合、OCRは十分に信頼できない
可能性がある。 (画像検索推奨)
画像を適切にキャプチャできない場合は、OCR検索を利用する。
たとえば、数百の異なる顧客住所の表示を検証する必要がある場合など。
OCR検索を頻繁に使用する場合は、SearchRectangleを設定してパフォーマンスを
最適化し、精度を向上させる。
17. Using the ReadText() Return
© Copyright 2019 Eggplant
・”ReadText() “は、OCRを利用して画面からテキストを読み取る。
・”Pass ReadText()”は、point もしくは rectangleでの範囲指定が可能。
19. RemoteClipboard() vs. ReadText()
・ 可能であれば、”ReadText()”の代わりに”RemoteClipboard()”を使用する
- “RemoteClipboard()”は、より優れたパフォーマンスと信頼性を提供
・ テキストの選択やコピーをサポートしていないコンテキスト(AndroidやiOSなど)では、
“ReadText()”関数を使用する
© Copyright 2019 Eggplant
21. 演習: OCR
演習:
• Web browserを開く。
• 以下へアクセスする。 http://nopcommerce.eggplant.io
• Select the “Electronics”カテゴリ内の“Camera & photo” サブカテゴリを選択する。
- OCRのみを使用する。
• 製品「Apple iCam」の価格を確認する
- OCRのみを使用する。
• RemoteClipboardを使用して価格を読み取り、ログに記録する。
© Copyright 2019 Eggplant
Editor's Notes NOTES FOR PRESENTER
-- To avoid confusions right from the start, OCR should be used as a compliment to image searches, not the other way around.
-- It is important to let people know that OCR can never reach even close to 100% recognition rate.
NOTES FOR PRESENTER
-- People should always use a search rectangle
NOTES FOR PRESENTER
-- On desktop, remoteclipboard() can only copy&paste eastern languages when using RDP. This is because UltraVNC and RealVNC (desktop version) does not support any other languages outside of English and European.
NOTES FOR PRESENTER
-- Regular expressions in eggPlant should be explained here