SlideShare a Scribd company logo
1 of 4
Лабораторно-практична робота № 6.
Тема: «Системи розпізнавання тексту».
Мета: допомогти учням отримати уявлення про OCR – програмах розпізнавання тексту,
познайомитися з можливостями даних програми, навчити сканувати та
розпізнавати відсканований текст, передавати і редагувати його в Word.
Хід роботи
I. Теоретична частина.
При створенні електронних бібліотек і архівів шляхом перекладу книг і документів в цифровий комп'ютерний
формат, під час переходу підприємств від паперового до електронного документообігу, при необхідності відредагувати
отриманий факсом документ використовуються системи оптичного розпізнавання символів.
На цьому уроці ми навчимося створювати перетворювати відскановане зображення в текст.
За допомогою сканера достатньо просто отримати зображення сторінки тексту в графічному файлі. Проте
працювати з таким текстом неможливо: як будь-яке скануюче зображення, сторінка з текстом є графічним файлом -
звичайну картинку. Текст можна буде читати і роздруковувати, але не можна буде його редагувати і форматувати. Для
отримання документа у форматі текстового файлу необхідно провести розпізнавання тексту, тобто перетворити
елементи графічного зображення в послідовності текстових символів.
Перетворенням графічного зображення в текст займаються спеціальні програми розпізнавання тексту (Optical
Character Recognition - OCR).
Сучасна OCR повинна уміти багато що: розпізнавати тексти, набрані не тільки певними шрифтами (саме так
працювали OCR першого покоління), але і самими екзотичними, аж до рукописних. Уміти коректно працювати з
текстами, що містять слова на декількох мовах, коректно розпізнавати таблиці. І найголовніше — коректно
розпізнавати не тільки чітко набрані тексти, але і такі, якість яких, м'яко кажучи, далеко від ідеалу. Наприклад, текст з
газетної вирізки або третьої машинописної копії, що пожовтіла. Саме собою, розпізнати текст — це ще півсправи. Не
менше важливо забезпечити можливість збереження результату у файлі популярного текстового (або табличного)
формату — скажемо, формату Microsoft Word.
Як бачимо, для того, щоб отримати електронну, готову до редагування копію будь-якого друкарського тексту,
програмі OCR необхідно виконати «ланцюжок» з безлічі окремих операцій.
Спочатку необхідно розпізнати структуру розміщення тексту на сторінці: виділити колонки, таблиці,
зображення і так далі. Далі виділені текстові фрагменти графічного зображення сторінки необхідно перетворити в
текст.
Можливо, сама відома програма для розпізнавання текстів – це FineReader від компанії ABBYY. Саме цю
програму частіше за все згадують, коли мова заходить про системи розпізнавання.
FineReader - омнифонтова система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати
тексти, набрані практично будь-якими шрифтами, без попереднього навчання. Особливістю програми FineReader є
висока точність розпізнавання і мала чутливість до дефектів друку, що досягається завдяки застосуванню технології
"цілісного цілеспрямованого адаптивного розпізнавання".
FineReader має маси додаткових функцій, які простому користувачу, можливо, і без потреби, та зате
справляють враження на певні групи покупців. Так, одним з козирів FineReader є підтримка неймовірної кількості мов
розпізнавання — 176, в числі яких ви знайдете екзотичні і стародавні мови, і навіть популярні мови програмування.
Всі версії FineReader, від найпростішої до наймогутнішої, об'єднує зручний інтерфейс. Для запуску процесу
розпізнавання вам достатньо просто покласти документ в сканер і натискувати єдину кнопку (майстер Scan & Read) на
панелі інструментів програми. Всі подальші операції — сканування, розбиття зображення на «блоки» і, нарешті, власне
розпізнавання програма виконає автоматично. Користувачу залишиться тільки встановити потрібні параметри
сканування.
Якість розпізнавання багато в чому залежить від того, наскільки добре зображення отримано при скануванні.
Якість зображення регулюється установкою основних параметрів сканування: типу зображення, дозволу і яскравості.
Сканування в сірому є оптимальним режимом для системи розпізнавання. У разі сканування в сірому режимі
здійснюється автоматичний підбір яскравості. Якщо Ви хочете, щоб що містяться в документі кольорові елементи
(картинки, колір букв і фону) були передані в електронний документ із збереженням кольору, необхідно вибрати
кольоровий тип зображення. В інших випадках використовуйте сірий тип зображення.
Оптимальним дозволом для звичайних текстів є - 300 dpi і 400-600 dpi для текстів, набраних дрібним шрифтом
(9 і менш пунктів).
Перш ніж приступити до розпізнавання, програма повинна знати, які ділянки зображення треба розпізнавати.
Для цього проводиться аналіз макета сторінки, під час якого виділяються блоки з текстом, картинки і таблиці. В
більшості випадків FineReader сам успішно справляється з аналізом складних сторінок та дуже зручним є і ручний
режим роботи.
Блоки - це укладені в рамку ділянки зображення. Блоки виділяють для того, щоб вказати системі, які ділянки,
відсканованої сторінки, треба розпізнавати і в якому порядку. Також по них відтворюється початкове оформлення
сторінки. Блоки різних типів мають різні кольори рамок.
1
Текст - блок використовується для позначення тексту. Він повинен містити тільки одноколонковий текст. Якщо
усередині тексту містяться картинки, виділіть їх в окремі блоки.
Таблиця - цей блок використовується для позначення таблиць або тексту, що має табличну структуру. При
розпізнаванні програма розбиває даний блок на рядки і стовпці і формує табличну структуру. У вихідному тексті
даний блок передається таблицею.
Картинка - цей блок використовується для позначення картинок. Він може містити картинку або будь-яку
іншу частину тексту, яку Ви хочете передати в розпізнаний текст як картинка.
Після завершення розпізнавання сторінки FineReader запропонує користувачу вибір: сканувати і розпізнавати
далі (для багатосторінкового документа) або зберегти отриманий текст в одному з безлічі популярних форматів — від
документів Microsoft Office до HTML або PDF. Можна, втім, зразу ж перекинути документ в Word або Excel, і вже там
виправити всі огріхи розпізнавання (без ні обійтися просто неможливо). При цьому FineReader повністю зберігає всі
особливості форматування документа і його графічне оформлення.
III. Практична частина.
Тепер потренуємося працювати з програмою ABBYY FineReader.
1. Завантажуємо програму.
2. Розміщуємо документ у сканері.
3. Натискуємо кнопку Сканировать.
4. Коли сторінка завантажиться у вікно сканера, необхідно буде встановити режим,
розширення сканування та виділити область сканування.
2
5. Після виділення області сканування необхідно натиснути
“Сейчас отправить сканированое изображение”.
6. Самостійно виділіть блоки зображення.
3
7. Виберіть мову розпізнавання та натисніть Распознать.
8. Після розпізнавання виберіть спосіб збереження документу.
Контрольні запитання
1. Навіщо потрібні програми розпізнавання тексту?
2. Як відбувається розпізнавання тексту?
3. Який дозвіл є оптимальним для сканування тексту, зображень?
4. Який оптимальний режим сканування?
5. Які типи блоків ви знаєте і якими кольорами вони виділяються?
6. Що таке блок?
7. На які етапи поділяється розпізнавання документу у FineReader?
8. Що можна зробити з розпізнаним документом?
9. Як повернути зображення у FineReader?
10. Як зменшити кількість темних цяток на зображенні в FineReader?
Оформлення роботи: робота оформляється на стандартних листах (ф. А4) в папках.
Звіт повинен містити:
1. Номер роботи, тему, мету.
2. Відповіді на контрольних запитань (непарні номери – І підгрупа, парні номери –
ІІ підгрупа)
3. Вкінці роботи має бути написаний висновок.
Оцінка роботи: робота оцінюється за кінцевими результатами за 12-бальною системою (при захисті
необхідно знати відповіді на всі контрольні запитання).
Література:
 Інформатика та комп´ютерна техніка. Пос. для ВНЗ. – К.: “Академвидав”, 2002.
 Глинський Я.М. Практикум з інформатики. Навч.посібник. – Львів: Деол, СПД Глинський, 2003.
4

More Related Content

Viewers also liked

Створеня публікацій
Створеня публікаційСтвореня публікацій
Створеня публікацій
slavinskiy
 
Макетування газети
Макетування газетиМакетування газети
Макетування газети
slavinskiy
 
презентация Microsoft power point (2)
презентация Microsoft power point (2)презентация Microsoft power point (2)
презентация Microsoft power point (2)
satana111
 
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yuteraOznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
VASAVASYLEC1
 
кросворд отр та от
кросворд отр та откросворд отр та от
кросворд отр та от
slavinskiy
 

Viewers also liked (17)

Створеня публікацій
Створеня публікаційСтвореня публікацій
Створеня публікацій
 
Макетування газети
Макетування газетиМакетування газети
Макетування газети
 
презентация Microsoft power point (2)
презентация Microsoft power point (2)презентация Microsoft power point (2)
презентация Microsoft power point (2)
 
1
11
1
 
2
22
2
 
Evaluation activity 3
Evaluation activity 3Evaluation activity 3
Evaluation activity 3
 
チャリさがさいせい in ecocon2010
チャリさがさいせい in ecocon2010チャリさがさいせい in ecocon2010
チャリさがさいせい in ecocon2010
 
лп р1-2 мр
лп р1-2 мрлп р1-2 мр
лп р1-2 мр
 
лп р7-8мр
лп р7-8мрлп р7-8мр
лп р7-8мр
 
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yuteraOznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
Oznayomlennya z-komp-8217-yuterom-zagaln-uyavlennya-pro-skladov-komp-8217-yutera
 
лп р7-9
лп р7-9лп р7-9
лп р7-9
 
лп р4-5
лп р4-5лп р4-5
лп р4-5
 
обслуговування жорсткого диска пк
обслуговування жорсткого диска пкобслуговування жорсткого диска пк
обслуговування жорсткого диска пк
 
лп р3-4 мр
лп р3-4 мрлп р3-4 мр
лп р3-4 мр
 
Carta Náutica do Porto de Lisboa - fevereiro 2017
Carta Náutica do Porto de Lisboa - fevereiro 2017Carta Náutica do Porto de Lisboa - fevereiro 2017
Carta Náutica do Porto de Lisboa - fevereiro 2017
 
Performance appraisal ppt
Performance appraisal pptPerformance appraisal ppt
Performance appraisal ppt
 
кросворд отр та от
кросворд отр та откросворд отр та от
кросворд отр та от
 

Similar to лп р6

10 информ ривкинд_лысенко_станд_2010_рус
10 информ ривкинд_лысенко_станд_2010_рус10 информ ривкинд_лысенко_станд_2010_рус
10 информ ривкинд_лысенко_станд_2010_рус
Aira_Roo
 

Similar to лп р6 (20)

FineReader
FineReaderFineReader
FineReader
 
FineReader
FineReaderFineReader
FineReader
 
18
1818
18
 
4 клас урок 6 як працювати в середовищі текстового редактора
4 клас урок 6 як працювати в середовищі текстового редактора4 клас урок 6 як працювати в середовищі текстового редактора
4 клас урок 6 як працювати в середовищі текстового редактора
 
6 i b_2019_ua
6 i b_2019_ua6 i b_2019_ua
6 i b_2019_ua
 
Informatyka 6-klas-bondarenko-2019
Informatyka 6-klas-bondarenko-2019Informatyka 6-klas-bondarenko-2019
Informatyka 6-klas-bondarenko-2019
 
9kl urok 21_tema
9kl urok 21_tema9kl urok 21_tema
9kl urok 21_tema
 
6 клас 21 урок. Форматування сторінок текстового документа та його друк. Дові...
6 клас 21 урок. Форматування сторінок текстового документа та його друк. Дові...6 клас 21 урок. Форматування сторінок текстового документа та його друк. Дові...
6 клас 21 урок. Форматування сторінок текстового документа та його друк. Дові...
 
4
44
4
 
МОДУЛЬ 1 ОСНОВИ КОМП’ЮТЕРНОЇ ГРАМОТНОСТІ. ОСНОВИ РОБОТИ В ІНТЕРНЕТІ ДЛЯ БІБЛІ...
МОДУЛЬ 1 ОСНОВИ КОМП’ЮТЕРНОЇ ГРАМОТНОСТІ. ОСНОВИ РОБОТИ В ІНТЕРНЕТІ ДЛЯ БІБЛІ...МОДУЛЬ 1 ОСНОВИ КОМП’ЮТЕРНОЇ ГРАМОТНОСТІ. ОСНОВИ РОБОТИ В ІНТЕРНЕТІ ДЛЯ БІБЛІ...
МОДУЛЬ 1 ОСНОВИ КОМП’ЮТЕРНОЇ ГРАМОТНОСТІ. ОСНОВИ РОБОТИ В ІНТЕРНЕТІ ДЛЯ БІБЛІ...
 
Програмне забезпечення (1).pptx
Програмне забезпечення (1).pptxПрограмне забезпечення (1).pptx
Програмне забезпечення (1).pptx
 
Знайомство з предметом "Інформатика в 6 класі"
Знайомство з предметом "Інформатика в 6 класі"Знайомство з предметом "Інформатика в 6 класі"
Знайомство з предметом "Інформатика в 6 класі"
 
лп р1-3
лп р1-3лп р1-3
лп р1-3
 
Програмне забезпечення
Програмне забезпеченняПрограмне забезпечення
Програмне забезпечення
 
10 информ ривкинд_лысенко_станд_2010_рус
10 информ ривкинд_лысенко_станд_2010_рус10 информ ривкинд_лысенко_станд_2010_рус
10 информ ривкинд_лысенко_станд_2010_рус
 
Підручник з інформатики для 10 класу. Ривкінд Й.Я
Підручник з інформатики для 10 класу. Ривкінд Й.ЯПідручник з інформатики для 10 класу. Ривкінд Й.Я
Підручник з інформатики для 10 класу. Ривкінд Й.Я
 
Informatyka stand-10-klas-ryvkind
Informatyka stand-10-klas-ryvkindInformatyka stand-10-klas-ryvkind
Informatyka stand-10-klas-ryvkind
 
вам6мі5
вам6мі5вам6мі5
вам6мі5
 
10 in r_stan
10 in r_stan10 in r_stan
10 in r_stan
 
10 in r_stan
10 in r_stan10 in r_stan
10 in r_stan
 

More from slavinskiy

тема 4 технологія комп’ютерної обробки інформації
тема 4  технологія комп’ютерної обробки інформаціїтема 4  технологія комп’ютерної обробки інформації
тема 4 технологія комп’ютерної обробки інформації
slavinskiy
 
Excel готова
Excel готоваExcel готова
Excel готова
slavinskiy
 
самостійна робота
самостійна роботасамостійна робота
самостійна робота
slavinskiy
 
Ecxel підсумкова2в
Ecxel підсумкова2вEcxel підсумкова2в
Ecxel підсумкова2в
slavinskiy
 
Ecxel підсумкова
Ecxel   підсумковаEcxel   підсумкова
Ecxel підсумкова
slavinskiy
 
практичні роботи № 1 10 ms excel 2003
практичні роботи № 1 10 ms excel 2003практичні роботи № 1 10 ms excel 2003
практичні роботи № 1 10 ms excel 2003
slavinskiy
 
функції в Microsoft excel
функції в Microsoft excelфункції в Microsoft excel
функції в Microsoft excel
slavinskiy
 
функцииMs excel
функцииMs excelфункцииMs excel
функцииMs excel
slavinskiy
 
формули і функції
формули і функціїформули і функції
формули і функції
slavinskiy
 

More from slavinskiy (20)

Акційні товари
Акційні товариАкційні товари
Акційні товари
 
тема 4 технологія комп’ютерної обробки інформації
тема 4  технологія комп’ютерної обробки інформаціїтема 4  технологія комп’ютерної обробки інформації
тема 4 технологія комп’ютерної обробки інформації
 
Lect excel
Lect excelLect excel
Lect excel
 
Excel готова
Excel готоваExcel готова
Excel готова
 
самостійна робота
самостійна роботасамостійна робота
самостійна робота
 
Excel 2
Excel 2Excel 2
Excel 2
 
Ecxel підсумкова2в
Ecxel підсумкова2вEcxel підсумкова2в
Ecxel підсумкова2в
 
Ecxel підсумкова
Ecxel   підсумковаEcxel   підсумкова
Ecxel підсумкова
 
л п№8-9
л п№8-9л п№8-9
л п№8-9
 
практичні роботи № 1 10 ms excel 2003
практичні роботи № 1 10 ms excel 2003практичні роботи № 1 10 ms excel 2003
практичні роботи № 1 10 ms excel 2003
 
л п№13
л п№13л п№13
л п№13
 
л п№12
л п№12л п№12
л п№12
 
л п№10-11
л п№10-11л п№10-11
л п№10-11
 
л п№6-7
л п№6-7л п№6-7
л п№6-7
 
л п№5
л п№5л п№5
л п№5
 
л п№3-4
л п№3-4л п№3-4
л п№3-4
 
л п№1-2
л п№1-2л п№1-2
л п№1-2
 
функції в Microsoft excel
функції в Microsoft excelфункції в Microsoft excel
функції в Microsoft excel
 
функцииMs excel
функцииMs excelфункцииMs excel
функцииMs excel
 
формули і функції
формули і функціїформули і функції
формули і функції
 

Recently uploaded

Recently uploaded (10)

Відкрита лекція на тему: "Сидерати - як спосіб виживання"
Відкрита лекція на тему: "Сидерати - як спосіб виживання"Відкрита лекція на тему: "Сидерати - як спосіб виживання"
Відкрита лекція на тему: "Сидерати - як спосіб виживання"
 
Супрун презентація_presentation_for_website.pptx
Супрун презентація_presentation_for_website.pptxСупрун презентація_presentation_for_website.pptx
Супрун презентація_presentation_for_website.pptx
 
psychologistpresentation-230215175859-50bdd6ed.ppt
psychologistpresentation-230215175859-50bdd6ed.pptpsychologistpresentation-230215175859-50bdd6ed.ppt
psychologistpresentation-230215175859-50bdd6ed.ppt
 
Проблеми захисту лісу в Україні та шляхи вирішення
Проблеми захисту лісу в Україні та шляхи вирішенняПроблеми захисту лісу в Україні та шляхи вирішення
Проблеми захисту лісу в Україні та шляхи вирішення
 
Габон
ГабонГабон
Габон
 
Defectolog_presentation_for_website.pptx
Defectolog_presentation_for_website.pptxDefectolog_presentation_for_website.pptx
Defectolog_presentation_for_website.pptx
 
Супрун презентація_presentation_for_website.pptx
Супрун презентація_presentation_for_website.pptxСупрун презентація_presentation_for_website.pptx
Супрун презентація_presentation_for_website.pptx
 
Балади про Робіна Гуда. Аналіз образу Робіна Гуда
Балади про Робіна Гуда. Аналіз образу Робіна ГудаБалади про Робіна Гуда. Аналіз образу Робіна Гуда
Балади про Робіна Гуда. Аналіз образу Робіна Гуда
 
Роль українців у перемозі в Другій світовій війні
Роль українців у перемозі в Другій світовій війніРоль українців у перемозі в Другій світовій війні
Роль українців у перемозі в Другій світовій війні
 
Горбонос 2024_presentation_for_website.pptx
Горбонос 2024_presentation_for_website.pptxГорбонос 2024_presentation_for_website.pptx
Горбонос 2024_presentation_for_website.pptx
 

лп р6

  • 1. Лабораторно-практична робота № 6. Тема: «Системи розпізнавання тексту». Мета: допомогти учням отримати уявлення про OCR – програмах розпізнавання тексту, познайомитися з можливостями даних програми, навчити сканувати та розпізнавати відсканований текст, передавати і редагувати його в Word. Хід роботи I. Теоретична частина. При створенні електронних бібліотек і архівів шляхом перекладу книг і документів в цифровий комп'ютерний формат, під час переходу підприємств від паперового до електронного документообігу, при необхідності відредагувати отриманий факсом документ використовуються системи оптичного розпізнавання символів. На цьому уроці ми навчимося створювати перетворювати відскановане зображення в текст. За допомогою сканера достатньо просто отримати зображення сторінки тексту в графічному файлі. Проте працювати з таким текстом неможливо: як будь-яке скануюче зображення, сторінка з текстом є графічним файлом - звичайну картинку. Текст можна буде читати і роздруковувати, але не можна буде його редагувати і форматувати. Для отримання документа у форматі текстового файлу необхідно провести розпізнавання тексту, тобто перетворити елементи графічного зображення в послідовності текстових символів. Перетворенням графічного зображення в текст займаються спеціальні програми розпізнавання тексту (Optical Character Recognition - OCR). Сучасна OCR повинна уміти багато що: розпізнавати тексти, набрані не тільки певними шрифтами (саме так працювали OCR першого покоління), але і самими екзотичними, аж до рукописних. Уміти коректно працювати з текстами, що містять слова на декількох мовах, коректно розпізнавати таблиці. І найголовніше — коректно розпізнавати не тільки чітко набрані тексти, але і такі, якість яких, м'яко кажучи, далеко від ідеалу. Наприклад, текст з газетної вирізки або третьої машинописної копії, що пожовтіла. Саме собою, розпізнати текст — це ще півсправи. Не менше важливо забезпечити можливість збереження результату у файлі популярного текстового (або табличного) формату — скажемо, формату Microsoft Word. Як бачимо, для того, щоб отримати електронну, готову до редагування копію будь-якого друкарського тексту, програмі OCR необхідно виконати «ланцюжок» з безлічі окремих операцій. Спочатку необхідно розпізнати структуру розміщення тексту на сторінці: виділити колонки, таблиці, зображення і так далі. Далі виділені текстові фрагменти графічного зображення сторінки необхідно перетворити в текст. Можливо, сама відома програма для розпізнавання текстів – це FineReader від компанії ABBYY. Саме цю програму частіше за все згадують, коли мова заходить про системи розпізнавання. FineReader - омнифонтова система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати тексти, набрані практично будь-якими шрифтами, без попереднього навчання. Особливістю програми FineReader є висока точність розпізнавання і мала чутливість до дефектів друку, що досягається завдяки застосуванню технології "цілісного цілеспрямованого адаптивного розпізнавання". FineReader має маси додаткових функцій, які простому користувачу, можливо, і без потреби, та зате справляють враження на певні групи покупців. Так, одним з козирів FineReader є підтримка неймовірної кількості мов розпізнавання — 176, в числі яких ви знайдете екзотичні і стародавні мови, і навіть популярні мови програмування. Всі версії FineReader, від найпростішої до наймогутнішої, об'єднує зручний інтерфейс. Для запуску процесу розпізнавання вам достатньо просто покласти документ в сканер і натискувати єдину кнопку (майстер Scan & Read) на панелі інструментів програми. Всі подальші операції — сканування, розбиття зображення на «блоки» і, нарешті, власне розпізнавання програма виконає автоматично. Користувачу залишиться тільки встановити потрібні параметри сканування. Якість розпізнавання багато в чому залежить від того, наскільки добре зображення отримано при скануванні. Якість зображення регулюється установкою основних параметрів сканування: типу зображення, дозволу і яскравості. Сканування в сірому є оптимальним режимом для системи розпізнавання. У разі сканування в сірому режимі здійснюється автоматичний підбір яскравості. Якщо Ви хочете, щоб що містяться в документі кольорові елементи (картинки, колір букв і фону) були передані в електронний документ із збереженням кольору, необхідно вибрати кольоровий тип зображення. В інших випадках використовуйте сірий тип зображення. Оптимальним дозволом для звичайних текстів є - 300 dpi і 400-600 dpi для текстів, набраних дрібним шрифтом (9 і менш пунктів). Перш ніж приступити до розпізнавання, програма повинна знати, які ділянки зображення треба розпізнавати. Для цього проводиться аналіз макета сторінки, під час якого виділяються блоки з текстом, картинки і таблиці. В більшості випадків FineReader сам успішно справляється з аналізом складних сторінок та дуже зручним є і ручний режим роботи. Блоки - це укладені в рамку ділянки зображення. Блоки виділяють для того, щоб вказати системі, які ділянки, відсканованої сторінки, треба розпізнавати і в якому порядку. Також по них відтворюється початкове оформлення сторінки. Блоки різних типів мають різні кольори рамок. 1
  • 2. Текст - блок використовується для позначення тексту. Він повинен містити тільки одноколонковий текст. Якщо усередині тексту містяться картинки, виділіть їх в окремі блоки. Таблиця - цей блок використовується для позначення таблиць або тексту, що має табличну структуру. При розпізнаванні програма розбиває даний блок на рядки і стовпці і формує табличну структуру. У вихідному тексті даний блок передається таблицею. Картинка - цей блок використовується для позначення картинок. Він може містити картинку або будь-яку іншу частину тексту, яку Ви хочете передати в розпізнаний текст як картинка. Після завершення розпізнавання сторінки FineReader запропонує користувачу вибір: сканувати і розпізнавати далі (для багатосторінкового документа) або зберегти отриманий текст в одному з безлічі популярних форматів — від документів Microsoft Office до HTML або PDF. Можна, втім, зразу ж перекинути документ в Word або Excel, і вже там виправити всі огріхи розпізнавання (без ні обійтися просто неможливо). При цьому FineReader повністю зберігає всі особливості форматування документа і його графічне оформлення. III. Практична частина. Тепер потренуємося працювати з програмою ABBYY FineReader. 1. Завантажуємо програму. 2. Розміщуємо документ у сканері. 3. Натискуємо кнопку Сканировать. 4. Коли сторінка завантажиться у вікно сканера, необхідно буде встановити режим, розширення сканування та виділити область сканування. 2
  • 3. 5. Після виділення області сканування необхідно натиснути “Сейчас отправить сканированое изображение”. 6. Самостійно виділіть блоки зображення. 3
  • 4. 7. Виберіть мову розпізнавання та натисніть Распознать. 8. Після розпізнавання виберіть спосіб збереження документу. Контрольні запитання 1. Навіщо потрібні програми розпізнавання тексту? 2. Як відбувається розпізнавання тексту? 3. Який дозвіл є оптимальним для сканування тексту, зображень? 4. Який оптимальний режим сканування? 5. Які типи блоків ви знаєте і якими кольорами вони виділяються? 6. Що таке блок? 7. На які етапи поділяється розпізнавання документу у FineReader? 8. Що можна зробити з розпізнаним документом? 9. Як повернути зображення у FineReader? 10. Як зменшити кількість темних цяток на зображенні в FineReader? Оформлення роботи: робота оформляється на стандартних листах (ф. А4) в папках. Звіт повинен містити: 1. Номер роботи, тему, мету. 2. Відповіді на контрольних запитань (непарні номери – І підгрупа, парні номери – ІІ підгрупа) 3. Вкінці роботи має бути написаний висновок. Оцінка роботи: робота оцінюється за кінцевими результатами за 12-бальною системою (при захисті необхідно знати відповіді на всі контрольні запитання). Література:  Інформатика та комп´ютерна техніка. Пос. для ВНЗ. – К.: “Академвидав”, 2002.  Глинський Я.М. Практикум з інформатики. Навч.посібник. – Львів: Деол, СПД Глинський, 2003. 4