SlideShare a Scribd company logo
1 of 11
Intellectual character recognition system
the new algorithm - new opportunities
Программы распознавания текста
Системы оптического распознавания текста (Optical character recognition – OCR) широко
используются как на бытовом так и на промышленном уровне. В настоящее время на рынке
имеется довольно широкий спектр программ такого назначения. Однако наиболее широкую
известность получили такие OCR-программы как:
 RecognitaPlusDTK;
 TextBridge;
 TypeReader;
 СharacterEyes;
 IRIS OCR;
 EasyReader;
 OmniPageProfessional и WordScanPlus;
 ABBYY FineReader;
 OCR CuneiForm
Все эти программы используют самые различные алгоритмы распознавания каждый из
которых обладает как преимуществами так и определенными недостатками. Не редкостью
является использование комбинации нескольких алгоритмов в одной программе. Однако не
смотря на это проблема качества распознавания графического текста остается по-прежнему
актуальной, так как пока ни одна из программ не дает абсолютного качества.
Основные алгоритмы распознавания текста
 Растровый
пиксельное сравнение изображения с шаблоном
Преимущества:
- Простота реализации;
- Быстродействие;
- Устойчивость к случайным дефектам изображения при распозновании.
Недостатки:
- Невысокая точность распознавания.
 Признаковый
определение типичных признаков символа отличающих его от других символов.
Преимущества:
- Высокая точность распознавания;
- Усложненная реализация.
Недостатки:
- Низкое быстродействие.
Основные алгоритмы распознавания текста
Основные алгоритмы распознавания текста
 Структурный
определение основных линий буквы, их направления и взаимного расположения
Преимущества:
- Простота реализации;
- Устойчивость к искажениям формы символа;
- Хорошее качество распознавания;
Недостатки:
- Низкая устойчивость к дефектам изображения.
A-sense
Алгоритм который планируется использовать в программе A-sense не имеет
ничего общего с алгоритмами описанными в предыдущих слайдах.
Его реализация была опробована в опытной программе (детальная разработка
которой еще предстоит). Результаты испытаний показали что данный
алгоритм распознавания:
- Более устойчив к различным дефектам букв;
- Более качественно определяет элементы текста (строки, слова, буквы);
- Имеет значительный потенциал для дальнейшего совершенствования;
- Прост в реализации;
- Обладает высоким быстродействием.
Тест алгоритма проводился с использованием только 30 букв русского
алфавита. Цифры, спецсимволы, знаки пунктации и т.д. в тестовой
программе не использовались (шаблоны пока не заданы). Вывод текста после
распознавания осуществлялся без разделения букв на строчные и прописные.
Результаты тестирования отражены в последующих слайдах. Для сравнения
результатов тестирования представлены также результаты полученные при
использовании других OCR-программ.
Часть исходной тестируемой на распознавание страницы
Результат распознавания 7-й версией Abbyy Finereader
Результат распознавания одной из on-line OCR-программой
Результат распознавания экспериментальным прототипом алгоритма
A-sense
Контактная информация
 email: isca1@yandex.ru

More Related Content

What's hot

Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»
Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»
Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»Sigma Software
 
Don't worry, do automation
Don't worry, do automationDon't worry, do automation
Don't worry, do automationVitebsk Miniq
 
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...SQALab
 
Тестирование мобильных API: Behind The Scenes
Тестирование мобильных API: Behind The ScenesТестирование мобильных API: Behind The Scenes
Тестирование мобильных API: Behind The ScenesSQALab
 
Automation Overview
Automation OverviewAutomation Overview
Automation OverviewKiraKeiss
 
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...Lviv Startup Club
 
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...COMAQA.BY
 
Правила хорошего тона для тестировщиков
Правила хорошего тона для тестировщиковПравила хорошего тона для тестировщиков
Правила хорошего тона для тестировщиковRina Uzhevko
 
Особенности разработки требований для мобильных приложений
Особенности разработки требований для мобильных приложенийОсобенности разработки требований для мобильных приложений
Особенности разработки требований для мобильных приложенийSQALab
 
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисов
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисовCodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисов
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисовCodeFest
 
Кому следует писать автоматические тесты?
Кому следует писать автоматические тесты?Кому следует писать автоматические тесты?
Кому следует писать автоматические тесты?Igor Khrol
 
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...CodeFest
 
Автоматизация тестирования ролей и привилегий
Автоматизация тестирования ролей и привилегийАвтоматизация тестирования ролей и привилегий
Автоматизация тестирования ролей и привилегийSQALab
 
Security Tesint: Sql injection
Security Tesint: Sql injectionSecurity Tesint: Sql injection
Security Tesint: Sql injectionSergey Polazhenko
 
Roman Marinsky "Ретроспектива вивчення UI автоматизації"
Roman Marinsky "Ретроспектива вивчення UI автоматизації"Roman Marinsky "Ретроспектива вивчення UI автоматизації"
Roman Marinsky "Ретроспектива вивчення UI автоматизації"Dakiry
 

What's hot (15)

Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»
Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»
Володимир Дем’яненко, «How to become a Test Automation Engineer. My way»
 
Don't worry, do automation
Don't worry, do automationDon't worry, do automation
Don't worry, do automation
 
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...
Как мы добавляли UX-исследования в мобильные приложения Aviasales и что из эт...
 
Тестирование мобильных API: Behind The Scenes
Тестирование мобильных API: Behind The ScenesТестирование мобильных API: Behind The Scenes
Тестирование мобильных API: Behind The Scenes
 
Automation Overview
Automation OverviewAutomation Overview
Automation Overview
 
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...
Дов Німрац “Що таке проблемний продукт і як з цим боротись?” Kharkiv Project ...
 
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...
Автоматизация визуального тестирования адаптивного дизайна на примере Galen F...
 
Правила хорошего тона для тестировщиков
Правила хорошего тона для тестировщиковПравила хорошего тона для тестировщиков
Правила хорошего тона для тестировщиков
 
Особенности разработки требований для мобильных приложений
Особенности разработки требований для мобильных приложенийОсобенности разработки требований для мобильных приложений
Особенности разработки требований для мобильных приложений
 
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисов
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисовCodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисов
CodeFest 2010. Исаенко И. — Автоматизация тестирования web-сервисов
 
Кому следует писать автоматические тесты?
Кому следует писать автоматические тесты?Кому следует писать автоматические тесты?
Кому следует писать автоматические тесты?
 
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...
CodeFest 2011. Андреев C. — Эффективные методики автоматизированного тестиров...
 
Автоматизация тестирования ролей и привилегий
Автоматизация тестирования ролей и привилегийАвтоматизация тестирования ролей и привилегий
Автоматизация тестирования ролей и привилегий
 
Security Tesint: Sql injection
Security Tesint: Sql injectionSecurity Tesint: Sql injection
Security Tesint: Sql injection
 
Roman Marinsky "Ретроспектива вивчення UI автоматизації"
Roman Marinsky "Ретроспектива вивчення UI автоматизації"Roman Marinsky "Ретроспектива вивчення UI автоматизації"
Roman Marinsky "Ретроспектива вивчення UI автоматизації"
 

Similar to Intellectual character recognition system1

Как мы тестируем анализатор кода
Как мы тестируем анализатор кодаКак мы тестируем анализатор кода
Как мы тестируем анализатор кодаTatyanazaxarova
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в ScrumDenis Petelin
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в ScrumDenis Petelin
 
Автоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОАвтоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОSQALab
 
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...Tatyanazaxarova
 
Проблемы и решения проектирования и прототипирования программных интерфейсов
Проблемы и решения проектирования и прототипирования программных интерфейсовПроблемы и решения проектирования и прототипирования программных интерфейсов
Проблемы и решения проектирования и прототипирования программных интерфейсовRustem Gayfutdinov
 
Платформа SmartActors
Платформа SmartActorsПлатформа SmartActors
Платформа SmartActorsetyumentcev
 
QA Fes 2016. Анастасия Асеева. Роль тестирования в Devops
QA Fes 2016. Анастасия Асеева. Роль тестирования в DevopsQA Fes 2016. Анастасия Асеева. Роль тестирования в Devops
QA Fes 2016. Анастасия Асеева. Роль тестирования в DevopsQAFest
 
Mva stf module 1 - rus
Mva stf module 1 - rusMva stf module 1 - rus
Mva stf module 1 - rusMaxim Shaptala
 
автоматизация тестирования веб приложений павел липский
автоматизация тестирования веб приложений   павел липскийавтоматизация тестирования веб приложений   павел липский
автоматизация тестирования веб приложений павел липскийMedia Gorod
 
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...Обнаружение уязвимостей логики приложений методом статического анализа. Где п...
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...Andrew Petukhov
 
Использование анализатора кода SonarQube
Использование анализатора кода SonarQubeИспользование анализатора кода SonarQube
Использование анализатора кода SonarQubePositive Hack Days
 
Аналитика мобильных приложений
Аналитика мобильных приложенийАналитика мобильных приложений
Аналитика мобильных приложенийAnatoly Sharifulin
 
Заблуждения и стереотипы относительно анализа кода
Заблуждения и стереотипы относительно анализа кодаЗаблуждения и стереотипы относительно анализа кода
Заблуждения и стереотипы относительно анализа кодаRISSPA_SPb
 
Презентация по дисциплине технология разработки программного обеспечения
Презентация по дисциплине технология разработки программного обеспеченияПрезентация по дисциплине технология разработки программного обеспечения
Презентация по дисциплине технология разработки программного обеспеченияRauan Ibraikhan
 
презентация по дисциплине технология разработки программного обеспечения
презентация по дисциплине технология разработки программного обеспеченияпрезентация по дисциплине технология разработки программного обеспечения
презентация по дисциплине технология разработки программного обеспеченияRauan Ibraikhan
 
CAM Esprit по-русски
CAM Esprit по-русскиCAM Esprit по-русски
CAM Esprit по-русскиAlexei Fedotov
 

Similar to Intellectual character recognition system1 (20)

Как мы тестируем анализатор кода
Как мы тестируем анализатор кодаКак мы тестируем анализатор кода
Как мы тестируем анализатор кода
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в Scrum
 
Внедрение тестирования в Scrum
Внедрение тестирования в ScrumВнедрение тестирования в Scrum
Внедрение тестирования в Scrum
 
Автоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПОАвтоматизация тестирования встроенного ПО
Автоматизация тестирования встроенного ПО
 
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...
Поиск ловушек в Си/Си++ коде при переносе приложений под 64-битную версию Win...
 
Проблемы и решения проектирования и прототипирования программных интерфейсов
Проблемы и решения проектирования и прототипирования программных интерфейсовПроблемы и решения проектирования и прототипирования программных интерфейсов
Проблемы и решения проектирования и прототипирования программных интерфейсов
 
Платформа SmartActors
Платформа SmartActorsПлатформа SmartActors
Платформа SmartActors
 
QA Fes 2016. Анастасия Асеева. Роль тестирования в Devops
QA Fes 2016. Анастасия Асеева. Роль тестирования в DevopsQA Fes 2016. Анастасия Асеева. Роль тестирования в Devops
QA Fes 2016. Анастасия Асеева. Роль тестирования в Devops
 
QAFest. Роль тестирования в Devops
QAFest. Роль тестирования в DevopsQAFest. Роль тестирования в Devops
QAFest. Роль тестирования в Devops
 
Mva stf module 1 - rus
Mva stf module 1 - rusMva stf module 1 - rus
Mva stf module 1 - rus
 
CodeFest
CodeFest CodeFest
CodeFest
 
автоматизация тестирования веб приложений павел липский
автоматизация тестирования веб приложений   павел липскийавтоматизация тестирования веб приложений   павел липский
автоматизация тестирования веб приложений павел липский
 
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...Обнаружение уязвимостей логики приложений методом статического анализа. Где п...
Обнаружение уязвимостей логики приложений методом статического анализа. Где п...
 
Использование анализатора кода SonarQube
Использование анализатора кода SonarQubeИспользование анализатора кода SonarQube
Использование анализатора кода SonarQube
 
Аналитика мобильных приложений
Аналитика мобильных приложенийАналитика мобильных приложений
Аналитика мобильных приложений
 
Заблуждения и стереотипы относительно анализа кода
Заблуждения и стереотипы относительно анализа кодаЗаблуждения и стереотипы относительно анализа кода
Заблуждения и стереотипы относительно анализа кода
 
Презентация по дисциплине технология разработки программного обеспечения
Презентация по дисциплине технология разработки программного обеспеченияПрезентация по дисциплине технология разработки программного обеспечения
Презентация по дисциплине технология разработки программного обеспечения
 
презентация по дисциплине технология разработки программного обеспечения
презентация по дисциплине технология разработки программного обеспеченияпрезентация по дисциплине технология разработки программного обеспечения
презентация по дисциплине технология разработки программного обеспечения
 
CAM Esprit по-русски
CAM Esprit по-русскиCAM Esprit по-русски
CAM Esprit по-русски
 
Qt tool evaluation
Qt tool evaluationQt tool evaluation
Qt tool evaluation
 

Intellectual character recognition system1

  • 1. Intellectual character recognition system the new algorithm - new opportunities
  • 2. Программы распознавания текста Системы оптического распознавания текста (Optical character recognition – OCR) широко используются как на бытовом так и на промышленном уровне. В настоящее время на рынке имеется довольно широкий спектр программ такого назначения. Однако наиболее широкую известность получили такие OCR-программы как:  RecognitaPlusDTK;  TextBridge;  TypeReader;  СharacterEyes;  IRIS OCR;  EasyReader;  OmniPageProfessional и WordScanPlus;  ABBYY FineReader;  OCR CuneiForm Все эти программы используют самые различные алгоритмы распознавания каждый из которых обладает как преимуществами так и определенными недостатками. Не редкостью является использование комбинации нескольких алгоритмов в одной программе. Однако не смотря на это проблема качества распознавания графического текста остается по-прежнему актуальной, так как пока ни одна из программ не дает абсолютного качества.
  • 3. Основные алгоритмы распознавания текста  Растровый пиксельное сравнение изображения с шаблоном Преимущества: - Простота реализации; - Быстродействие; - Устойчивость к случайным дефектам изображения при распозновании. Недостатки: - Невысокая точность распознавания.
  • 4.  Признаковый определение типичных признаков символа отличающих его от других символов. Преимущества: - Высокая точность распознавания; - Усложненная реализация. Недостатки: - Низкое быстродействие. Основные алгоритмы распознавания текста
  • 5. Основные алгоритмы распознавания текста  Структурный определение основных линий буквы, их направления и взаимного расположения Преимущества: - Простота реализации; - Устойчивость к искажениям формы символа; - Хорошее качество распознавания; Недостатки: - Низкая устойчивость к дефектам изображения.
  • 6. A-sense Алгоритм который планируется использовать в программе A-sense не имеет ничего общего с алгоритмами описанными в предыдущих слайдах. Его реализация была опробована в опытной программе (детальная разработка которой еще предстоит). Результаты испытаний показали что данный алгоритм распознавания: - Более устойчив к различным дефектам букв; - Более качественно определяет элементы текста (строки, слова, буквы); - Имеет значительный потенциал для дальнейшего совершенствования; - Прост в реализации; - Обладает высоким быстродействием. Тест алгоритма проводился с использованием только 30 букв русского алфавита. Цифры, спецсимволы, знаки пунктации и т.д. в тестовой программе не использовались (шаблоны пока не заданы). Вывод текста после распознавания осуществлялся без разделения букв на строчные и прописные. Результаты тестирования отражены в последующих слайдах. Для сравнения результатов тестирования представлены также результаты полученные при использовании других OCR-программ.
  • 7. Часть исходной тестируемой на распознавание страницы
  • 8. Результат распознавания 7-й версией Abbyy Finereader
  • 9. Результат распознавания одной из on-line OCR-программой