Ocr

705 views

Published on

Системы оптического распознавания текста

Published in: Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
705
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Ocr

  1. 1. Оптическое распознавание символов<br />Боровикова Ксения ФЛ-401<br />г. Ростов-на-Дону<br />2011г.<br />
  2. 2. Оптическое распознавание<br /> - это механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.<br />
  3. 3. Плюсы<br />Перевод в текстовый вид очень сложных текстовых документов, включая таблицы, формы, диаграммы, рисунки<br />Проверка орфографии<br />Сохранение файла в любом текстовом формате, а также в форматах электронных таблиц и баз данных<br />
  4. 4. OCR<br />- opticalcharacterrecognition (оптическое распознавание символов)<br />
  5. 5. История OCR<br />Программы появились сначала в США, а затем, и в России. OCR - opticalcharacterrecognition (оптическое распознавание символов)<br />1978 год - компания «Курцвейл Компьютер Продактс» начала продажи коммерческой версии компьютерной программы оптического распознавания символов<br />
  6. 6. Программы OCR<br />Recognita Plus DTK фирмыRecognita Corporation †, Венгрия <br />TextBridgeфирмы †Xerox Imaging Systems<br />TypeReaderфирмы ExperVision †, США <br />СharacterEyes фирмы Ligature, Израиль<br />IRIS OCR фирмы I.R.I.S.,Бельгия <br />Easy Reader фирмы†Inovatic International, Франция<br />WordScan Plus и OmniPage Professional †фирмыCaera, США<br />
  7. 7. Системы OCR в России<br />OCR CuneiForm; †<br />† ABBYY FineReader<br />
  8. 8. Этапы преобразования документа в электронный вид OCR-системами<br />Сканирование и предварительная обработка изображения<br />Анализ структуры документа<br />Распознавание<br />Проверка результатов<br />Реконструкция документа (воссоздание его исходного вида)<br />Экспорт<br />
  9. 9. Описание OCR-процедуры<br />Предварительная обработка изображения<br />Распознавание объектов высших уровней. Бинаризация<br />Распознавание символов<br />Структурирование гипотез. Словарная проверка<br />Синтез электронного документа<br />
  10. 10. Базовые принципы технологий распознания текста<br />Принципы IPA:<br />Целостность (integrity)<br />Целенаправленность (purposefulness)<br />Адаптивность (Adaptability)<br />Многоуровневый анализ документа<br />
  11. 11. Принципы IPA<br />Согласно принципу целостности (integrity), созерцаемый объект рассматривается как целое, состоящее из связанных частей<br />
  12. 12. Принципы IPA<br />Принцип целенаправленности (purposefulness) - любая интерпретация данных преследует определенную цель. Согласно этому принципу, распознавание представляет собой процесс выдвижения гипотез о целом объекте и целенаправленной их проверки<br />
  13. 13. Принципы IPA<br />Принцип адаптивности (adaptability) подразумевает способность системы к самообучению. <br />

×