SlideShare a Scribd company logo
1 of 14
Системы оптического
распознавания документов
Оптическое распознавание символов — это механический
или электронный перевод изображений рукописного,
машинописного или печатного текста в последовательность
кодов, использующихся для представления в текстовом
редакторе
Системы оптического распознавания символов
используются при создании электронных
библиотек и архивов путем перевода книг и
документов в цифровой компьютерный формат.
Оптическое распознавание текста
позволяет редактировать текст,
осуществлять поиск слова или фразы,
хранить его в более компактной форме,
демонстрировать или распечатывать
материал, не теряя качества,
анализировать информацию, а также
применять к тесту электронный перевод,
форматирование или преобразование в
речь.
Программы распознавания
1) ABBYY FineReader
2) Readiris
3) Kirtas Technologies Arabic OCR
4) Zonal OCR
5) CuneiForm
6) Brainware
ABBYY FineReader
Позволяет извлекать
текстовые данные из
цифровых изображений
(фотографий,
результатов
сканирования, PDF-
файлов)
Readiris
Содержит региональные пакеты для
распознавания азиатских языков и
языков среднего востока.
Kirtas Technologies Arabic OCR
Может распознавать арабские
и английские символы на одной
странице.
Zonal OCR
Помогает автоматизировать извлечение
данных из компьютерных изображений.
CuneiForm
Промышленная многоязычная система, умеет
сохранять форматирование текста и распознаёт
запутанные таблицы произвольной структуры
Brainware
Извлечение данных из документов и их
обработка — например, счета, извещения,
накладные и платёжки
Принцип работы сканера состоит в следующем: в
результате преобразования света получается
электрический сигнал, содержащий информацию об
активности цвета в исходной точке сканируемого
изображения. После оцифровки аналогового сигнала
в АЦП цифровой сигнал через аппаратный
интерфейс сканера идет в компьютер, где его
получает и анализирует программа для работы со
сканером. После окончания одного такого цикла
(освещение оригинала — получение сигнала —
преобразование сигнала — получение его
программой) источник света и приемник светового
отражения перемещается относительно оригинала.
Принцип работы сканера
Литература
 http://ru.wikipedia.org/wiki/Оптическое_расп
ознавание_символов
 http://www.5byte.ru/8/0011.php
 http://www.friends-forum.com
 http://dammlab.com
 http://life-prog.ru

More Related Content

Viewers also liked

Viewers also liked (11)

Kurs - Google Analytics
Kurs - Google AnalyticsKurs - Google Analytics
Kurs - Google Analytics
 
Trabajo de carlos salazar
Trabajo de carlos salazarTrabajo de carlos salazar
Trabajo de carlos salazar
 
Catalog elena ww 19 августа
Catalog elena ww 19 августаCatalog elena ww 19 августа
Catalog elena ww 19 августа
 
Final engaging diversity
Final engaging diversityFinal engaging diversity
Final engaging diversity
 
Timeline part 2
Timeline part 2Timeline part 2
Timeline part 2
 
Composer Tutorial (PHP Hampshire Sept 2013)
Composer Tutorial (PHP Hampshire Sept 2013)Composer Tutorial (PHP Hampshire Sept 2013)
Composer Tutorial (PHP Hampshire Sept 2013)
 
Arquitectura
ArquitecturaArquitectura
Arquitectura
 
Do ityoutube copy
Do ityoutube copyDo ityoutube copy
Do ityoutube copy
 
Visual resume
Visual resumeVisual resume
Visual resume
 
Инструкция по настройке сервиса Daas для Windows
Инструкция по настройке сервиса  Daas для WindowsИнструкция по настройке сервиса  Daas для Windows
Инструкция по настройке сервиса Daas для Windows
 
4c Hair Chick Media Kit
4c Hair Chick Media Kit4c Hair Chick Media Kit
4c Hair Chick Media Kit
 

Similar to Системы оптического распознавания документов

Текстовые редакторы
Текстовые редакторыТекстовые редакторы
Текстовые редакторыIrina11
 
программное обеспечение компьютера
программное обеспечение компьютерапрограммное обеспечение компьютера
программное обеспечение компьютераЕлена Ключева
 
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...Tetyana Struk TrainStation
 

Similar to Системы оптического распознавания документов (6)

Ocr
OcrOcr
Ocr
 
4.5 (1)
4.5 (1)4.5 (1)
4.5 (1)
 
Текстовые редакторы
Текстовые редакторыТекстовые редакторы
Текстовые редакторы
 
Maleev
MaleevMaleev
Maleev
 
программное обеспечение компьютера
программное обеспечение компьютерапрограммное обеспечение компьютера
программное обеспечение компьютера
 
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
VoxTran: первый и второй мастер-классы Александра Поддубного «HARDware. SOFTw...
 

More from Сергей Балан

Кодирование звуковой информации
Кодирование звуковой информацииКодирование звуковой информации
Кодирование звуковой информацииСергей Балан
 
Кодирование и обработка графической информации
Кодирование и обработка графической информацииКодирование и обработка графической информации
Кодирование и обработка графической информацииСергей Балан
 
Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Сергей Балан
 
Форматирование документа в текстовом редакторе
Форматирование документа в текстовом редактореФорматирование документа в текстовом редакторе
Форматирование документа в текстовом редактореСергей Балан
 
Создание документов в текстовых редакторах
Создание документов в текстовых редакторахСоздание документов в текстовых редакторах
Создание документов в текстовых редакторахСергей Балан
 
Кодирование текстовой информации
Кодирование текстовой информацииКодирование текстовой информации
Кодирование текстовой информацииСергей Балан
 
Информация и информационные процессы
Информация и информационные процессыИнформация и информационные процессы
Информация и информационные процессыСергей Балан
 

More from Сергей Балан (7)

Кодирование звуковой информации
Кодирование звуковой информацииКодирование звуковой информации
Кодирование звуковой информации
 
Кодирование и обработка графической информации
Кодирование и обработка графической информацииКодирование и обработка графической информации
Кодирование и обработка графической информации
 
Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов Компьютерные словари и системы машинного перевода текстов
Компьютерные словари и системы машинного перевода текстов
 
Форматирование документа в текстовом редакторе
Форматирование документа в текстовом редактореФорматирование документа в текстовом редакторе
Форматирование документа в текстовом редакторе
 
Создание документов в текстовых редакторах
Создание документов в текстовых редакторахСоздание документов в текстовых редакторах
Создание документов в текстовых редакторах
 
Кодирование текстовой информации
Кодирование текстовой информацииКодирование текстовой информации
Кодирование текстовой информации
 
Информация и информационные процессы
Информация и информационные процессыИнформация и информационные процессы
Информация и информационные процессы
 

Системы оптического распознавания документов