4. Сьогодні
13.05.2020 Оптичне розпізнавання тексту
Оптичне розпізнавання
тексту (англ. optical character
recognition, OCR) — це
механічне або електронне
переведення зображень
рукописного, машинописного
або друкованого тексту в
послідовність кодів, що
використовуються для
представлення в текстовому
редакторі.
5. Сьогодні
13.05.2020 Принцип роботи OCR
Для кожного з них програма
створює кілька припущень
Фотографія з текстом, отримана
від сканера, розбивається на
безліч фрагментів
Перевіряючи і порівнюючи їх з
еталонами, кожного фрагменту
дає оцінку, відповідну до ступеня
збігу
Вибираючи найбільшу з них,
програма «бачить» символ і
виводить його в полі вбудованого
текстового редактора.
7. Сьогодні
13.05.2020
Сучасні програми з OCR вміють:
Розпізнавати
таблиці
Pозпізнавати тексти, набрані не лише
різними шрифтами, але й написані
екзотичними, у тому числі і
рукописними
Коректно працювати з
текстами, які містять
слова на декількох мовах
Розпізнавати нечітко
набрані чи написані
тексти
15. Повторюємо
Сьогодні
13.05.2020
1. Що означає абревіатура OCR?
2. Технологія для розпізнавання паперових докмуентів - це…
3. Які етапи розпізнавання документів?
4. Який принцип роботи OCR?
5. Які модулі OCR?
6. Яке ПЗ використовується для OCR?
16. Завантажити один із запропонованих
додатків для розпізнавання тексту.
Розпізнати текст будь-якого підручника (1 сторінка).
Результат розпізнавання оцінити на наявність посилань.
Зробити скріншоти етапів розпізнавання.
Визначити переваги та недоліки.
Результат оформити в колективну презентацію Google
(на слайді повинна бути назва додатку, скріншоти
етапів розпізнавання, переваги та недоліки додатку).
Домашнє завдання
Сьогодні
13.05.2020