Information Systems Design: License Plate Recognition

Государственное образовательное учреждение высшего профессионального образования
«Московский государственный технический университет
имени Н.Э. Баумана»
(МГТУ им. Н.Э. Баумана)
ФАКУЛЬТЕТ _________Информатика и Системы управления______________
КАФЕДРА ___________Системы автоматического управления_____________
______________________________________________________________________
Р А С Ч Ё Т Н О - П О Я С Н И Т Е Л Ь Н А Я З А П И С К А
к квалификационной работе бакалавра на тему:
______________Разработка системы контроля доступом____________________
________на основании системы распознавания номерных знаков___________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
Студент ___________________________ __________________ ___________________
(Подпись, дата) (И.О.Фамилия)
Руководитель квалификационной работы __________________ __________________
(Подпись, дата) (И.О.Фамилия)
Москва, 2009
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.
А.В. Бобков
А.В. Симкин

2
Содержание
стр.
Обозначения и сокращения.............................................................................................................................................6
Аннотация.................................................................................................................................................................................8
Введение ....................................................................................................................................................................................9
1 Постановка задачи и первичное исследование............................................................................................. 10
1.1 Постановка задачи ................................................................................................................................................ 10
1.2 Оценка современного состояния решаемой научно-технической проблемы ..................... 10
1.3 Обоснование необходимости проведения работы.............................................................................. 12
1.4 Назначение и цели создания автоматизированной системы....................................................... 12
2 Исследование и проектирование подсистем АС ........................................................................................... 13
2.1 Структура подсистем АС.................................................................................................................................... 13
2.2 Программное обеспечение АС......................................................................................................................... 14
2.3 Постановка задачи на реализацию подсистем АС ............................................................................... 15
3 Выбор направления исследований ...................................................................................................................... 16
3.1 Обоснование направления исследований ............................................................................................... 16
3.2 Методы решения задач и их сравнительная оценка.......................................................................... 18
3.2.1 Основные этапы распознавания изображений ............................................................................ 20
3.2.1.1 Восприятие изображения................................................................................................................. 20
3.2.1.2 Сегментация ............................................................................................................................................ 20
3.2.1.3 Фильтрация.............................................................................................................................................. 25
3.2.1.4 Распознавание........................................................................................................................................ 27
3.3 Выбор и описание методики выполнения НИР.................................................................................... 30
3.3.1 Выводы о сравнительной оценке методов решения................................................................. 30
3.3.2 Структура обработки изображения в поставленной задаче................................................. 31
4 Теоретические исследования.................................................................................................................................. 33
4.1 Получение изображения.................................................................................................................................... 33
4.1.1 Источники получения изображений.................................................................................................. 33
4.1.1.1 IP-камеры .................................................................................................................................................. 34
4.1.1.2 PC-камеры................................................................................................................................................. 35
4.1.1.3 Сравнительный анализ IP- и PC-камер..................................................................................... 36
4.1.2 Компрессия и размеры изображения................................................................................................. 36
4.1.2.1 Сравнительный анализ MJPG и MPEG-4 форматов сжатия............................................ 37
4.1.2.2 Выводы по сравнительному анализу ........................................................................................ 39
4.1.3 Выводы по теоретическому анализу получения изображения........................................... 39
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

3
4.2 Сегментация номерного знака....................................................................................................................... 40
4.2.1 Исследование входных данных............................................................................................................. 40
4.2.2 Методы выделения границ...................................................................................................................... 41
4.2.2.1 Градиентные методы ......................................................................................................................... 43
4.2.2.2 Использование вторых производных........................................................................................ 45
4.2.2.3 Причины усиления мелкомасштабного шума дифференциальными
операторами........................................................................................................................................................... 47
4.2.2.4 Дифференциально-сглаживающий оператор....................................................................... 48
4.2.2.5 Детектор границ Canny...................................................................................................................... 49
4.2.3 Поиск номерного знака на изображении......................................................................................... 52
4.2.3.1 Сравнение контуров............................................................................................................................ 53
4.2.3.2 Алгоритм сравнения контуров ..................................................................................................... 53
4.3 Бинаризация изображения .............................................................................................................................. 54
4.3.1 Общие подходы к фильтрации изображений................................................................................ 54
4.3.2 Методы бинаризации изображений................................................................................................... 55
4.3.2.1 Пороговая бинаризация.................................................................................................................... 56
4.3.2.2 Гистограмма яркости ......................................................................................................................... 56
4.3.2.3 Особенности пороговой бинаризации...................................................................................... 58
4.3.2.4 Методы определения порогового значения при бинаризации .................................. 58
4.3.3 Алгоритм пороговой бинаризации ..................................................................................................... 62
4.3.3.1 Исследование задачи и модификация существующих алгоритмов ......................... 62
4.3.3.2 Разработанный алгоритм ................................................................................................................ 62
4.4 Сегментация символов....................................................................................................................................... 63
4.4.2 Методы сегментации .................................................................................................................................. 64
4.4.2.1 Методы наращивания областей................................................................................................... 64
4.4.2.2 Признаковый метод сегментации............................................................................................... 65
4.5 Изменение размера изображения ................................................................................................................ 67
4.5.2 Интерполяция изображений .................................................................................................................. 68
4.5.3 Сжатие символов в матрицу.................................................................................................................... 68
4.6 Корреляционное распознавание................................................................................................................... 69
4.6.2 Математическое описание корреляции............................................................................................ 69
4.6.3 Задача корреляционного распознавания........................................................................................ 70
4.6.4 Корреляционный алгоритм распознавания .................................................................................. 71
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

4
4.6.5 Разработанные алгоритмы распознавания.................................................................................... 73
4.6.5.1 Корреляционно-признаковый алгоритм ................................................................................ 73
4.6.5.2 Корреляционный алгоритм сегментации............................................................................... 74
4.7 Выводы по проведенным исследованиям ............................................................................................... 75
5 Экспериментальные исследования...................................................................................................................... 77
5.1 Описание программного стенда.................................................................................................................... 77
5.1.1 Интерфейс программного стенда ........................................................................................................ 77
5.1.2 Описание разработанной библиотеки .............................................................................................. 78
5.2 Эксперименты ......................................................................................................................................................... 78
5.2.1 Влияние искажений на качество распознавания........................................................................ 79
5.2.1.1 Влияние линейного шума на качество распознавания ................................................... 79
5.2.1.2 Влияние яркости на качество распознавания...................................................................... 80
5.2.1.3 Влияние геометрических искажений на качество распознавания........................... 81
5.2.1.4 Влияние размера изображения на качество распознавания........................................ 81
5.2.1.5 Среднее влияние искажений на качество распознавания............................................. 82
5.2.2 Влияние методов бинаризации на качество распознавания................................................ 83
5.2.2.1 Влияние процентного порога метода P-tile ........................................................................... 83
5.2.2.2 Влияние сглаживания в методе пороговой бинаризации ............................................. 84
5.2.3 Влияние размера матрицы на качество распознавания.......................................................... 84
5.2.4 Тесты производительности ................................................................................................................... 85
5.2.4.1 Влияние методов бинаризации на производительность............................................... 85
5.2.4.2 Влияние размера матрицы на производительность......................................................... 87
5.2.4.3 Влияние метода интерполяции на производительность .............................................. 88
5.3 Обобщение и оценка результатов исследований ................................................................................ 89
Заключение ........................................................................................................................................................................... 91
Список использованных источников...................................................................................................................... 92
Приложения.......................................................................................................................................................................... 95
Приложение А: Общие принципы и история создания фотокамеры............................................... 95
А.1 История создания............................................................................................................................................. 95
А.1.1 Камера-обскура ......................................................................................................................................... 95
А.1.2 Линза............................................................................................................................................................... 96
А.2 Современная фототехника.......................................................................................................................... 98
А.2.1 Фотоаппарат ............................................................................................................................................... 98
А.2.2 Цифровая фотокамера.........................................................................................................................100
А.2.3 Другие параметры и характеристики фотокамер ...............................................................102
Приложение Б: Сплайн-интерполяция............................................................................................................103
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

5
Б.1 Математическая интерполяция .............................................................................................................103
Б.1.1 Определение .............................................................................................................................................103
Б.1.2 Методы интерполяции........................................................................................................................104
Б.2 Одномерная сплайн-интерполяция .....................................................................................................104
Б.2.1 Сплайн-функция .....................................................................................................................................104
Б.2.2 Интерполяция сплайном третьей степени..............................................................................105
Б.3 Двухмерная сплайн-интерполяция ......................................................................................................109
Б.3.1 Билинейный сплайн.............................................................................................................................109
Б.3.2 Бикубический сплайн ..........................................................................................................................109
Б.3.3 Билинейное и бикубическое ресемплирование....................................................................110
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

6
Обозначения и сокращения
АС – Автоматизированная система;
АРМ – Автоматизированное рабочее место;
Алгоритм функционирования АС – Алгоритм функционирования
автоматизированной системы;
АПК – Аппаратно-программный комплекс;
БП – Бизнес-процесс;
БПФ – Быстрое преобразование Фурье;
Входная информация АС – Входная информация автоматизированной
системы;
Выходная информация АС – Выходная информация автоматизированной
системы;
ГИП (англ. GUI) – Графический интерфейс пользователя (англ. Graphical user
interface);
Жизненный цикл АС – Жизненный цикл автоматизированной системы;
Задача АС – Задача автоматизированной системы;
Информационная база АС – Информационная база автоматизированной
системы;
Информационное обеспечение АС – Информационное обеспечение
КПП – Контрольно-пропускной пункт;
КСА АС – Комплекс средств автоматизации автоматизированной системы;
Компонент АС – Компонент автоматизированной системы;
Математическое обеспечение АС – Математическое обеспечение
Методическое обеспечение АС – Методическое обеспечение
Надежность АС – Надежность автоматизированной системы;
НСД к информации – Несанкционированный доступ к информации;
НСИ АС – Нормативно-справочная информация автоматизированной
системы;
Оперативная информация АС – Оперативная информация
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

7
ОПО АС – Общее программное обеспечение автоматизированной системы;
Оперативная информация – АС Оперативная информация
ОС – Операционная система;
ПЗС – Прибор с зарядовой связью;
Пользователь АС – Пользователь автоматизированной системы;
ПТК АС – Программно-технический комплекс автоматизированной системы;
Программное обеспечение АС – Программное обеспечение
Промышленная эксплуатация АС – Промышленная эксплуатация
Процесс создания АС – Процесс создания автоматизированной системы;
СУБД – Система управления базами данных;
Сопровождение АС – Сопровождение автоматизированной системы;
СПО АС – Специальное программное обеспечение автоматизированной
системы;
Техническое обеспечение АС – Техническое обеспечение
ТЗ – Техническое задание на автоматизированную систему;
ТП – Технический проект на автоматизированную систему;
Функция АС – Функция автоматизированной системы;
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

8
Аннотация
В данной работе рассмотрена задача разработки системы контроля доступом
на основании системы распознавания номерных знаков.
Для поставленной задачи была разработана структура системы, модулей и
схемы их взаимодействия. Предложена среда разработки и реализации
автоматизированной системы. Сделан выбор технических и трудовых средств и
ресурсов, обслуживающих автоматизированную систему.
Исследованы и приведены алгоритмы решения задачи распознавания
автомобильных номерных знаков. Разработаны две процедуры решения данной
задачи. Проведены их экспериментальные исследования зависимости качества
распознавания от шума, изменения яркости и геометрических искажений. Сделаны
выводы по полученным результатам и предложена наиболее оптимальная
процедура распознавания.
На основании экспериментов были сделаны выводы о том, что система
обладает хорошими качеством распознавания и отличной скоростью работы
(реализованной части задач), что позволяет использовать эту систему в режиме
реального времени. Однако система требует продолжения исследований и
разработке, с целью полного решения поставленной в ТЗ задачи.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

9
Введение
Рост интенсивного развития человеческой деятельности в области
современных информационных технологий влечет за собой необходимость
упрощения способов идентификации и обработки различных данных. На
сегодняшний день одним из актуальных классов задач, являются задачи
автоматического обнаружения и распознания данных, содержащихся на
графических изображениях. Результаты решения подобного класса задач могут
быть использованы в современных системах компьютерного зрения: системы
идентификации изображений (рукописный текст, параметры лиц, отпечатки
пальцев, номерной знак автомобиля), зрение роботов, компьютерная анимация,
видеосъемка (автоматическое слежение за движущимися объектами).
В процессе биологической эволюции многие животные с помощью
зрительного и слухового аппарата решили задачи распознавания образов
достаточно хорошо. Создание искусственных систем распознавания образов
остаётся сложной теоретической и технической проблемой. Необходимость в таком
распознавании возникает в самых разных областях – от военного дела и систем
безопасности до оцифровки всевозможных аналоговых сигналов. Традиционно
задачи распознавания образов включают в круг задач искусственного интеллекта.
В связи с последними достижениями в области развития интеллектуальных
разработок, появляется возможность решения многих задач путем создания
прикладных систем интеллектуального анализа данных.
Таким образом, данная работа посвящена исследованию методов
распознавания образов.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

10
1 Постановка задачи и первичное исследование
1.1 Постановка задачи
Наименование задачи (НИР): Разработка системы контроля доступом на
основании системы распознавания номерных знаков.
Входные данные: Изображение с фото- или видеокамеры содержащее объект
распознавания (номерной знак).
Выходные данные: Цифровые данные (текст) содержащие информацию и
характеристики объекта распознавания.
Задача заключается в том, чтобы разработать автоматизированную систему
(АС) целью которой будет стандартизация и унификация процесса получения,
обработки и хранения информации по объектам распознавания.
Формализация имеющихся данных приводит к более полной (расширенной)
постановке задачи, которая заключается в следующих тезисах.
Постановка задачи: Разработка автоматизированной системы, целью которой
является автоматизация механизма контроля доступа на основании системы
распознавания номерных знаков.
Входная информация АС: Цифровые данные, содержащие изображение с
информаций по объекту распознавания (номерной знак).
Выходная информация АС: Цифровые данные, содержащие информацию и
характеристики объекта распознавания.
Оперативная информация АС: Цифровые данные, содержащие информацию о
текущем состоянии объекта автоматизации, взятые из информационной базы АС.
1.2 Оценка современного состояния решаемой научно-технической
проблемы
Исследование современного рынка решений поставленной задачи приводит к
выводу о том, что существует два подхода к решению подобных задач.
1) Системы контроля проезда и управления доступом автотранспорта
 Детектирование (диагностика) появления автотранспорта в зоне
контроля;
 Распознавание всех автомобильных государственных знаков
транспортных средств пересекающих зону контроля;
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

11
 Пропуск на территорию автотранспорта, государственные номерные
знаки, которых присутствуют в базе разрешенных к въезду
автомобилей;
 Управление любыми внешними устройствами;
 Ведение и хранение журналов въезда и выезда;
 Визуальная и звуковая сигнализации о регистрации проезда
транспорта.
2) Автоматизированные системы контроля проезда автотранспорта
 Автоматизация контроля въезда (выезда) транспортных средств на
автостоянку;
 Автоматизация системы оплаты на основе билетов со штрих кодом и
бесконтактных карт доступа;
 Удобный контроль и анализ финансовой деятельности парковочного
комплекса;
 Сокращение числа злоупотреблений со стороны клиентов и персонала
автостоянки;
 Мониторинг событий системы в режиме реального времени;
 Комфортность пользования услугами парковочного комплекса для
клиентов.
Общий анализ технологической базы существующих прикладных решений
приводит к следующим выводам:
 Все современные решения выполнены по принципу аппаратно-
программных комплексов (АПК);
 Стоимость решений высокая;
 Практически все организации предлагающие решения обладают
большим количеством клиентов и проведенных внедрений;
 Реализация решений выполнена таким образом, что может быть
адаптирована под различный класс задач.
Таким образом, можно сделать вывод о том, существующие системы обладают
хорошей и универсальной технологической базой, но не обладают достаточной
универсальностью. В существующих прикладных решениях нет «коробочного»
решения для полной автоматизации автостоянки.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

12
1.3 Обоснование необходимости проведения работы
В результате оценки современного состояния решаемой задачи мы приходим
к выводу о том, что существующие решения, не дают полной возможности (без
доработок) построить автоматизированную систему учета и контроля доступа на
основании системы распознавания номерных знаков для автостоянки. Это
свидетельствует о том, что эта часть рынка не занята. Проведение НИР в области
исследования и разработки универсальной автоматизированной системы, которая
будет обладать всеми преимуществами различных видов решений, является на
сегодняшний день очень актуальной задачей.
1.4 Назначение и цели создания автоматизированной системы
Назначение АС – автоматизация деятельности организации или ее части
основная цель, которой состоит в контроле проезда автотранспортных средств на
объект.
Основная цель создания автоматизированной системы – повышение
эффективности учета автотранспортных средств на контрольно-пропускном пункте
общего назначения. Эффективность выражается в упрощении регистрации и
контроля автотранспортных средств, пересекающих контрольно-пропускной пункт
за счет автоматизации процесса. Данный процесс обеспечивает своевременность и
актуальность получения информации всем участникам процесса о текущем
состоянии объекта автоматизации.
В современных условиях функционирование любых участников
экономической деятельности, в качестве которых выступают предприятия и
организации и прочие учреждения, невозможно без наличия эффективной
автоматизированной системы управления. Создание современной
автоматизированной системы решающей конкретные задачи деятельности объекта
позволяет:
 Упростить управление объектом;
 Повысить удобство управления объектом;
 Повысить конкурентоспособность организации;
 Эффективно и своевременно управлять деятельностью организации.
Подробное описание назначения и целей создания АС имеется в ТЗ.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

13
2 Исследование и проектирование подсистем АС
В ТЗ на разработку автоматизированной системы сформулированы
требования к подсистемам и функциям АС (см. раздел 4 ТЗ). На основании данного
документа проведем исследование и спроектируем подсистемы АС.
2.1 Структура подсистем АС
В автоматизированную систему должны входить следующие подсистемы:
 Управление контрольно-пропускным пунктом;
 Управление внешним оборудованием;
 Управление паркингом;
 Операционное управление;
o Управление клиентской базой;
o Управление денежными средствами;
o Управление персоналом;
o Управление ценовой политикой.
 Регламентированная отчетность;
 Хранение данных.
Управление
контрольно-
пропускным
пунктом
внешним
оборудованием
паркингом
Операционное
управление
Хранение данных
Регламентированная
отчетность
Общий
интерфейс
Рисунок 2.1 Декомпозиция подсистем АС
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

14
Задачи и роль каждой подсистемы в АС детально описана в ТЗ. Согласно
поставленным в ТЗ требованиям к структуре и функциям АС, спроектируем
взаимосвязь подсистем. Приближенная декомпозиция систем показана на рисунке
2.1.
2.2 Программное обеспечение АС
контрольно-
пропускным
пунктом
внешним
оборудованием
паркингом
Операционное
управление
Хранение данных
Регламентированная
отчетность
Общий
интерфейс
Детектирование
движения
Поиск номерного
знака
автотранспорта
Распознавание
номерного знака
Корректировка
результатов
распознавания
Принятие решения по
контролю для управления
внешним оборудованием
Управление контрольно-пропускным пунктом Delphi
1Cv8
MS SQL EXP
Рисунок 2.2. Декомпозиция реализации подсистем на соответствуем ПО
В разделе 4.3.4.2 документа ТЗ («Требования к информационному
обеспечению системы») сформулированы требования к ОПО АС. Согласно этим
требованиям необходимо определить используемое ОПО или СПО и разделить
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

15
задачи и подсистемы АС на реализацию наиболее подходящим им программным
средствам.
На рисунке 2.2 подсистемы АС разделены на блоки, каждый из которых будет
реализован на соответствующем ПО.
В данном разделе мы определили и декомпозировали поставленную в ТЗ
задачу на разработку АС на подсистемы и описали их взаимосвязь.
2.3 Постановка задачи на реализацию подсистем АС
В поставленной задаче НИР стоит разработка системы контроля доступом на
основании системы распознавания номерных знаков. В виду сложности и
необходимости большого времени для реализации всей системы, реализуем лишь
часть подсистем входящих в поставленную задачу.
Наибольший практический интерес представляет собой задача распознавания
номерных знаков, входящая в подсистему «Управление контрольно-пропускным
пунктом». В данную подсистему входят следующие задачи:
1. Детектирование движения;
2. Поиск номерного знака автотранспорта;
3. Распознавание номерного знака;
4. Корректировка результатов распознавания;
5. Принятие решения по контролю для управления внешним оборудованием.
Детектирование
движения
Поиск номерного
знака
автотранспорта
Распознавание
номерного знака
Корректировка
результатов
распознавания
Принятие решения по
контролю для управления
внешним оборудованием
Управление контрольно-пропускным пунктом
Рисунок 2.3. Задачи подсистемы «Управление КПП»
Требования к функциям (задачам) подсистемы детально описаны в ТЗ на
разработку АС (см. раздел 4.2.2 ТЗ). Опираясь на данные требования, проведем
исследования и решим поставленную задачу.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

16
3 Выбор направления исследований
Основная задача исследований заключается в изучении и применении или
разработке новых алгоритмов обработки информации, удовлетворяющие
требованиям, указанным в ТЗ (см. раздел 4 ТЗ).
В данном разделе отчета о НИР рассматриваются методы обработки
информации, относящиеся к распознаванию образов. Таким образом, далее следует
описание проведенных исследований и разработанных алгоритмов для решения
задач подсистемы «Управление КПП».
3.1 Обоснование направления исследований
Все большее распространение получили системы автоматизированного ввода
информации через различные типы сканеров (ручные, листовые, барабанные,
графические планшеты, дигитайзеры, факс-модемы), а также цифровые фото- и
видеокамеры. При этом по разрешающей способности такие системы ввода вполне
приближаются к зрению человека или животных, а с учетом быстродействия
ближайшей технической моделью глаза, очевидно, являются видео- и цифровые
фотокамеры. Так ПЗС матрица цифровой фотокамеры обеспечивает разрешение до 3
млн. пикселей на кадр, а современным высокопроизводительным компьютерам
вполне доступна несложная обработка в реальном масштабе времени.
Тем не менее, возможности интеллектуального анализа изображений с
помощью компьютеров оставляют желать большего. Необходимость углубленной их
обработки и распознавания требуют, по крайней мере, две области технических
приложений; робототехника и автоматизированные системы. Автоматизированные
системы, опирающиеся на базы данных, включающие изображения, для поиска и
распознавания заданных объектов требуют быстрого и надежного анализа
оцифрованной видеоинформации в специализированных архивах изображений,
получаемой непрерывно из внешних источников либо в базах Интернет.
Под обработкой изображений следует понимать совокупность методов и
задач, где входной информацией являются изображения [1]. Круг решаемых задач
очень широк и используется в различных областях, таких как математика,
нейробиология, оптическая физика и других. Можно назвать две основные
прикладные области, активно развиваемые в последнее время, это «Машинное
зрение» и «Компьютерное зрение». Данные области достаточно близки и часто
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

17
пересекаются по классу задач, поэтому иногда их объединяют в одну (см. рисунок
3.1).
Современные исследования и развития данных областей, позволяют
сформулировать их основные задачи [1].
 Обработка изображений фокусируется на обработке двумерных (2D)
изображений.
 Машинное зрение - это решение промышленных и производственных задач
(робототехника и прочее).
 Компьютерное зрение включает в себя класс задач связанных с
восстановлением трехмерного изображения (3D) по входным двумерным (2D)
изображениям.
Рисунок 3.1. Области применения методов обработки изображений
Достижения в области обработке изображений, а именно класса задач
распознавания букв и цифр в документах и текстах впечатляют, также как и другие
значительные достижения по анализу изображений специального вида, в том числе
и распознавание автомобильных номерных знаков.
Однако, универсальных методов обработки изображений, сравнимых по
эффективности с интеллектуальными возможностями человека, еще не найдено, что
стимулирует активную деятельность ученых в этом направлении.
Машинное зрение
•Machine vision
Компьютерное
зрение
•Computer vision
Обработка
изобржений
•Image processing
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

18
Обработка изображений с целью их распознавания является одной из
центральных и практически важных задач при создании систем искусственного
интеллекта.
3.2 Методы решения задач и их сравнительная оценка
Проблема распознавания изображений носит явно выраженный комплексный
иерархический характер и включает ряд основных этапов [2]:
1. восприятие изображения;
2. сегментация;
3. фильтрация;
4. распознавание.
Такой важный обязательный этап как понимание (интерпретация)
изображений включается частично в этап сегментации и окончательно решается на
этапе распознавания. Так же необходимо учитывать, что этап нормализации, может
выполняться, как и до сегментации, так и после, включая необходимые методы
фильтрации.
Основным элементом любой задачи распознавания изображений является
ответ на вопрос: относятся ли данные (входные) изображения к классу
изображений, который представляет данный эталон? Казалось бы, ответ можно
получить, сравнивая непосредственно изображение с эталонами (или их признаки).
Однако возникает ряд трудностей и проблем, специфических, в особенности, при
создании систем распознавания номерных знаков:
 Изображения предъявляются на сложном и динамичном фоне (освещение,
погодные условия и прочее);
 Изображения эталона и входное изображение (номерной знак) могут
отличаться положением и масштабом в поле зрения, а также содержать
геометрические преобразования, включая такие сложные как аффинные и
проективные;
 Входное изображение может не содержать полностью совпадающий эталон
за счет случайных помех;
 Отличия символов номерных знаков и эталонных изображений (шрифта)
возникает за счет изменения освещенности, подсветки и прочих локальных
помех.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

19
Рисунок 3.2. Основные процедуры и методы распознавания изображений
Для решения подобных задач в целом и на отдельных ее этапах применяются
различные методы сегментации, нормализации и распознавания. В литературном
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

20
источнике [2], основанном на многолетнем опыте работы в области обработки
зрительных картин, приведена классификация основных методов обработки и
распознавания объектов на изображении. Данная схема, приведенная на рисунке 3.2,
указывает основные процедуры и методы обработки от начального этапа
восприятия поля зрения посредством датчиков, например, фотокамеры до
конечного этапа, которым является распознавание.
3.2.1 Основные этапы распознавания изображений
3.2.1.1 Восприятие изображения
Восприятие изображения или снятие информации с датчика является
фактически только технической задачей, и ее реализация сильно зависит от
используемой техники.
Операция предобработки часто включается в этап восприятия изображения.
Она применяется практически всегда и преследует цель снижения помех на
изображении, возникших в результате дискретизации и квантования, а также
подавления внешних шумов. Как правило, это операции усреднения и выравнивания
гистограмм.
3.2.1.2 Сегментация
Рисунок 3.3. Методы сегментации изображений
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

21
Под сегментацией изображения обычно понимается процесс поиска и
выделения однородных областей на изображении, содержащие определенные
признаки (геометрические и прочие). Этот этап весьма трудный и в общем виде не
алгоритмизированный до конца для произвольных изображений.
3.2.1.2.1 Пороговые методы
Наиболее распространены методы сегментации, основанные на определении
однородных яркостей (цветов) или однородностей типа текстур [3]. При
существовании стабильных различий в яркостях отдельных областей поля зрения
применяются пороговые методы, одни из наиболее простых методов сегментации.
При этом значение яркости каждого пикселя сравнивается с некоторым порогом, и в
зависимости от результата сравнения этот пиксель относится к одной из двух групп.
Определение порога в таких алгоритмах является ключевой задачей.
3.2.1.2.2 Методы наращивания областей
Методы выделения областей путем наращивания основаны на поиске групп
пикселей с близкими значениями яркости. В простейшем варианте такой метод
заключается в выборе пикселя, просмотре его соседей на предмет близости
значений яркости и включении близких по яркости пикселей в формирующуюся
область. Наиболее простой критерий однородности области основывается на оценке
максимальной разности значения яркости отдельного пикселя и средней яркости
формируемой области. Такой критерий будет надежно работать только тогда, когда
размер области уже достаточно большой, чтобы оценка средней яркости была
достоверной.
К методам наращивания областей относятся:
 Центроидное связывание
В алгоритмах центроидного связывания априорная информация об объектах
учитывается на этапе выбора стартовых точек. На каждом последующем шаге
рассматриваются точки соседние с размеченными пикселями, и если разность
их яркостей меньше порога, то они присоединяются к области. Данный
алгоритм является одним из самых эффективных алгоритмов наращивания
областей.
 Слияние-расщепление
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

22
Алгоритмы слияния-расщепления направлены на выделение в поле зрения
однородных областей как можно больших размеров. Предварительно
выделенные однородные области интерпретируются как один элемент
изображения.
 Водоразделов
Этот подход предусматривает предварительное вычисление градиента
яркости изображения. Если представить его, как рельеф, то низменности
(малые значения градиента) будут соответствовать однородным участкам
исходного изображения, а хребты (большие значения градиента)
соответствуют областям сильного изменения яркости, т.е. границам на
исходном изображении. Такая аналогия позволяет рассматривать
однородные области как водосборные бассейны, а границы как водоразделы.
Причем водоразделы, по определению, обязательно представляют собой
замкнутые линии, т.к. они ограничивают водосборные бассейны.
 Деформируемые шаблоны
Часто для моделирования всего лица или его элементов (глаз, губ и т.п.) в
задачах распознавания лиц и визуального распознавания речи используются
деформируемые шаблоны [3]. Эти шаблоны имеют определенные
структурные характеристики. Например, голова представляется эллипсом, а
губы четырьмя параболами. Для шаблона записывается функция энергии,
которая часто является просто суммой энергии, связанной с изображением, и
внутренней энергии шаблона img sampleE E E  . Связанная с изображением
энергия imgE обычно представляется функцией границ, областей максимумов
и минимумов изображения. Внутренняя энергия sampleE обеспечивает
сохранение параметров шаблона в приемлемых диапазонах. Она моделирует
сопротивление шаблона изгибу и растяжению. Минимизация функции
энергии дает шаблон, который лучше всего соответствует изображению.
Основной недостаток подхода с деформируемыми шаблонами то, что функции
энергии разрабатываются заранее, исходя из общих соображений, и могут
плохо соответствовать конкретному изображению.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

23
3.2.1.2.3 Выделение границ
Многие методы сегментации изображений основаны на обнаружении границ.
Существует множество различных подходов к обнаружению границ на
изображениях, и постоянно разрабатываются новые методы.
К этим методам относятся:
 Градиентные методы
Основанные на принципе того, что различным объектам на изображениях
соответствуют области с более или менее одинаковыми значениями яркости.
На границах же яркость существенно меняется. Мерой изменения некоторой
величины является ее производная. На изображении величина яркости
изменяется в пространстве. Пространственная производная — это градиент,
который кроме величины имеет еще и направление, т.е. представляет собой
вектор.
 Использование вторых производных
Для подчеркивания перепадов яркости изображения используются вторые
производные. Вторые производные, в отличие от градиента, не детектируют,
а подчеркивают перепад яркости. Для получения положения границы надо
найти точки, в которых вторая производная равна нулю. Данный метод дает
возможность более эффективно проследить границу.
 Дифференциально-сглаживающий оператор
Для одновременного подчеркивания полезных границ и ослабления шумов
используют объединенные операторы Гаусса и Лапласа. Но т.к. операторы
ненаправленные, то в результате наложения вместе с полезным откликом
границы в перпендикулярном к ней направлении, измеряется также отклик в
параллельном направлении, что уменьшает соотношение сигнал/шум.
 Детектор границ Canny
Классический алгоритм в области обнаружения границ [4]. Положительные
стороны алгоритма:
o хорошее обнаружение (повышение отношения сигнал/шум);
o хорошая локализация (правильное определение положения границы);
o единственный отклик на одну границу.
К основным недостаткам относятся вычислительные затраты и разрушение
границ в точках соединений.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

24
 Оператор стохастического градиента
В его основе лежит оптимальная для определенного шума маска градиента,
которая определяется с учетом автокорреляционной функции изображения и
отношения сигнал/шум.
 Метод активных контуров
Использование для обнаружения границ на изображении кривых
минимальной энергии, называемых «снейками». Предполагается, что искомая
граница на изображении представляет собой гладкую линию (речь идет о
плоском изображении). Основными недостатками метода активных контуров
является необходимость знания начального приближения к искомой границе
и большие вычислительные затраты, тем большие, чем меньше точность
этого начального приближения. Алгоритм подробно описан в книге [5].
 Алгоритм SUSAN
Создатели алгоритма Smith и Brady обратили внимание на то, что соседи
каждой точки в однородной области имеют близкую к ней яркость, а вблизи
границы число соседей с одинаковой яркостью уменьшается. В соответствии с
такой трактовкой границы и был разработан алгоритм детектора границ
SUSAN. Кроме границ этот метод обнаруживает и другие особенности на
изображении (углы, тонкие линии и т.п.). Данный алгоритм подробно описан
в книге [6].
3.2.1.2.4 Текстурные методы
Для описания и сегментации свойств изображений, именно, однородности,
шероховатости, регулярности, применяют текстурные методы, делящиеся условно
на две категории: статистические и структурные. Примером статистического
подхода является использование матриц совпадений, формируемых из исходных
изображений, с последующим подсчетом статистических моментов и энтропии. При
структурном подходе, например, на основе мозаики Вороного, строится множество
многоугольников. Многоугольники с общими свойствами объединяют в области.
Для исследования общих свойств часто используют признаки – моменты
многоугольников.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

25
3.2.1.2.5 Выводы сравнительной оценки методов сегментации
Все методы весьма приемлемы с точки зрения вычислительных затрат,
однако, для каждого из них характерна неоднозначность разметки точек в реальных
ситуациях из-за необходимости применения эвристик (выбор порогов совпадения
яркостей, выбор цифровых масок и т.д.). Заслуживает внимания в связи с этим
предложенный метод многозначной разметки, основанный на комбинации
различных приемов для снижения неопределенности. Важное практическое
значение имеют допускающие параллельную обработку алгоритмы ускорения
процесса разметки на основе логического анализа соседних элементов [2].
3.2.1.3 Фильтрация
После сегментации возникают помехи в виде, как разрозненных изменений
изолированных элементов изображения, так и в виде искажений некоторых связных
областей. Чаще всего эти искажения называют «шумом». Шум может вноситься в
изображение многими путями, начиная от условий его формирования и заканчивая
преобразованием захваченного изображения в цифровую форму. По способу
искажения изображения шум можно разделить на несколько разновидностей:
 Аддитивный шум – к значению цвета или яркости каждого пикселя
добавляется некоторая случайная величина, значения которой в каждой
точке различны.
 Мультипликативный шум – значение цвета или яркости каждого пикселя
умножается на некоторую случайную величину, значения которой близки к
единице и в каждой точке различны.
 Импульсный шум – значения цвета или яркости некоторых отдельных
пикселей искажаются настолько, что теряют всякую информацию об их
неискаженных значениях.
Уменьшение шума без снижения качества исходного изображения всегда
привлекало внимание многих исследователей [7]. Методов шумоподавления
разработано очень много, и постоянно появляются новые. Связанно такое
многообразие с тем, что существует множество источников и, соответственно, видов
шума. Кроме того, различные задачи налагают свои требования и ограничения на
качество необходимых им изображений.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

26
Для подавления шума используются следующие методы:
 Линейные алгоритмы
Наиболее простые алгоритмы подавления шума на изображении. Каждый
пиксель обработанного изображения получается линейной комбинацией
нескольких пикселей исходного изображения.
 Ранговые алгоритмы
Существует большое количество нелинейных фильтров относящихся к
категории операторов ранговой или порядковой статистики соседей. Суть
алгоритмов в том, что ближайшие соседи сортируются в порядке возрастания
их значений, и яркость пикселя отфильтрованного изображения получается
на основе анализа этого упорядоченного списка.
 Локально-адаптивные алгоритмы
Основная идея состоит в том, чтобы для каждого пикселя (или небольшой
группы) получать лучший результат путем постоянной подстройки под
различные виды шумов. Лучшим результатом в этом случае считается
отсутствие недостатка многих фильтров, который заключается в сглаживание
полезных деталей (границ, тонких линий и т.п.).
 «Экспертные» алгоритмы
Дальнейшее развитие локально-адаптивных алгоритмов привело к
необходимости использования нескольких параметров адаптации
одновременно и применением экспертной системы для предварительного
распознавания принадлежности точки к одному из заданных типов объектов.
Затем, в соответствии с принятым решением используется тот или иной тип
фильтра.
 Эволюционные алгоритмы
Методы фильтрации изображения, основанные на представлении его
изменения, как эволюции в искусственном времени.
 Алгоритмы, основанные на группировке пикселей по яркости
Методы сглаживания изображения, основанные на группировке пикселей в
зависимости от их близости по яркости к центральному пикселю.
 Другие алгоритмы
Если известно, что должно представлять собой изображение, и можно
сформировать некую модель, которой оно должно соответствовать, то можно
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

27
построить учитывающие это обстоятельство фильтры. Успешность такого
подхода ограничивается используемой моделью изображения: структура
изображения не соответствующая модели не будет хорошо сохранена.
В общем случае на практике наибольшее распространение получили
цифровые фильтры-маски и нелинейные фильтры, например медианные [7]. При
этом в случае сегментации путем выделения границ использование усредняющих
фильтров-масок невозможно, так как границы при этом не подчеркиваются, а
размываются. Для подчеркивания контуров применяются специальные операторы
интегрального типа.
3.2.1.4 Распознавание
Распознавание – это, чаще всего, конечный этап обработки, лежащий в основе
процессов интерпретации и понимания [8]. Входными данными для распознавания
являются изображения, выделенные в результате сегментации и фильтрации. Они
могут существенно отличаться от эталонных изображений не только
геометрическими и яркостными искажениями, но и сохранившимися шумами.
Для реальных задач распознавания применяются, в основном, четыре
подхода, использующие методы: корреляционные, основанные на принятии
решений по критерию близости с эталонами; признаковые и синтаксические -
наименее трудоемкие и нормализации, занимающие промежуточное положение по
объему вычислений.
Все подходы достаточно хорошо распространены и в рамках каждого подхода
есть свои конкретные алгоритмы, имеющие определенную область применения,
которая зависит от характера различий входных и эталонных изображений, от
наличия и интенсивности помех, требований к объемам вычислений и скорости
принятия решений.
3.2.1.4.1 Корреляционные методы
Корреляционные методы нашли широкое применение при обнаружении и
распознавании изображений в системах навигации, слежения, промышленных
роботах [2]. При полностью заданном эталоне многошаговая корреляция путем
сканирования входного изображения (или поля зрения) является, фактически,
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

28
полным перебором в пространстве сигналов. Данный метод можно считать базовым
и потенциально наиболее помехоустойчивым, хотя и самым трудоемким.
С точки зрения вычислительной сложности более простые методы основаны
на переходе в пространство признаков, которые характеризуются существенно
меньшей размерностью по сравнению с пространством сигналов (изображений). В
зависимости от поставленной цели (например, достижения заданной точности)
выполняется корреляционная обработка признаков, полученных от эталона и
входного изображения как с использованием порогов по величине сходства, так и
без установления порога (когда ищется максимум сходства). При этом актуальной
является задача комплексирования разнотипных и разно шкальных признаков
(метрических, статистических, логических, текстурных, структурно-
лингвистических и др.), полученных различными измерительными средствами с
целью решения задачи распознавания или обнаружения.
Наибольшей помехоустойчивостью обладают алгоритмы, основанные на
методе частных корреляций. В методе используются частные коэффициенты
корреляций, которые получаются для отдельных фрагментов эталона в сигнальном
пространстве и рассматриваются как различные признаки. Обработка таких
признаков, т.е. их свертка, зависит от типа изображений (например, степени
заслонения полезного изображения, наличия ложных объектов на изображении) и
может быть осуществлена методами проверки статистических гипотез.
Методы корреляционного обнаружения объектов подробно рассмотрены в
[9].
3.2.1.4.2 Признаковые и синтаксические методы
Данные методы обладают большой популярностью и наиболее проработаны
и исследованы в теории распознавания образов [2]. Они основаны как на
статистических, так и детерминированных подходах. Главную трудность в
признаковых методах составляет выбор признаков. При этом исходят из
естественных правил:
1. признаки изображений одного класса могут различаться лишь незначительно
(за счет влияния помех);
2. признаки изображений разных классов должны существенно различаться;
3. набор признаков должен быть минимально возможным, т.к. от их количества
зависит и надежность, и сложность обработки.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

29
В первом приближении синтаксические методы можно отнести к
признаковым методам, т.к. они основаны на получении структурно-
лингвистических признаков, когда изображение дробится на части, каждая
содержит определенный признак. Вводятся правила соединения частей, одинаковые
для эталона и входного изображения. Анализ полученной таким образом
грамматики (признаки и правила) обеспечивает принятие решений.
Алгоритмы корреляционно-признаковых и признаковых методов достаточно
близки, поэтому часто первые рассматриваются как частный случай вторых. Хотя и
признаковые методы не обладают такой помехозащищенностью, как чисто
корреляционные или методы частных корреляций (в сигнальных пространствах),
однако, благодаря меньшим трудозатратам, их применение полезно на первом
этапе, когда решается задача о неэквивалентности. При этом часть входных
изображений, признаки которых не соответствуют ни одному из эталонов,
отбрасываются сразу.
3.2.1.4.3 Методы нормализации
Методы нормализации при распознавании занимают промежуточное место
между сигнальными корреляционными и признаковыми алгоритмами. В отличие от
признаковых при нормализации изображение не «теряется», а только замещается
изображением того же класса эквивалентности, а в отличие от корреляционных
методов, множество входных изображений заменяется множеством
нормализованных изображений. Таким образом, каждое нормализованное
изображение, в общем случае, находится гораздо ближе к своему эталону (с позиции
групповых преобразований), что значительно сокращает количество корреляций на
завершающем этапе распознавания.
Суть нормализации заключается в автоматическом вычислении неизвестных
параметров преобразований, которым подвергнуты входные изображения, и
последующем приведении их к эталонному виду. Процедура преобразований
производится с помощью операторов нормализации, а вычисление параметров
выполняется функционалами, действующими на множестве изображений. В
монографии [2] подробно излагаются параллельные и последовательные,
параметрические и следящие операторы нормализации, которые нашли
эффективное применение для базовых преобразований: смещений, поворотов,
растяжений, косых сдвигов и некоторых их комбинаций.
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

30
Определенный интерес представляет применение инвариантных процедур по
полю зрения [3]. Так применение преобразований по модулю Фурье позволяет
произвести автоматическое центрирование изображений. Однако эксперименты
показывают, что их эффективное использование возможно только для хорошо
сегментированных изображений. При этом объемы вычислений в реальных
системах часто выходят за рамки допустимых.
Нормализация проективных преобразований представляет собой трудную и
еще не решенную до конца задачу. Прогресс, достигнут по отдельным подгруппам
проективной группы, которая характеризуется в общем 8 независимыми
параметрами.
Однако, несмотря на большое количество трудностей [3], нет
принципиальных ограничений на построение операторов нормализации
проективных преобразований, которые лежат в основе монокулярного восприятия
окружающего мира органом зрения человека и задача эта будет, в конце концов,
решена. Это будет очень важным моментом и шагом вперед в решении проблемы
распознавания изображений.
3.3 Выбор и описание методики выполнения НИР
3.3.1 Выводы о сравнительной оценке методов решения
Процесс распознавания изображений является сложной многоэтапной
задачей. Иерархичность и последовательность решения задачи обусловлена тем, что
различные этапы обработки очень тесно связаны и качество решения одной из них
влияет на выбор метода решения остальных. Например, выбор метода
распознавания зависит от свойств изображения (характера фона, помех) и связан с
выбором методов предобработки, сегментации, фильтрации.
Однако, для типичных ситуаций, на основе проведенного выше анализа (см.
раздел 3.2), можно предложить универсальную иерархическую структуру
распознавания (см. рисунок 3.4).
После предварительных этапов обработки изображений, таких как получение
изображения, сегментация и фильтрация, рекомендуется применять несколько
методов распознавания. На первом этапе распознавания рекомендуется применять
наименее трудоемкие признаковые алгоритмы для решения задачи о
неэквивалентности входных изображений и эталонов. Входное множество
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

31
изображений или эталонов при этом существенно сокращается (в зависимости от
типа задачи). Если входные изображения содержат геометрические и аморфные
искажения, на следующем этапе необходимо применять нормализацию. После
классифицируют входные изображения одним из конструктивных способов,
например корреляционным. При такой структуре распознавания время решения
задач сокращается в сотни раз.
Рисунок 3.4. Наиболее оптимальная структура распознавания
3.3.2 Структура обработки изображения в поставленной задаче
Опираясь на полученные выше выводы и поставленную в НИР задачу,
получим структуру обработки изображения с использованием изученных методов и
алгоритмов. Основная задача НИР состоит в распознавании автомобильного
номерного знака находящегося на сложном изображении.
В результате предварительного исследования особенностей поставленной
задачи составим более детальную структуру обработки изображения.
1. Получение изображения;
2. Сегментация области содержащей номерной знак;
Данная задача состоит из следующих этапов
 Предварительная шумовая фильтрация;
 Сегментация;
Восприятие изображения
Сегментация
Фильтрация
Простые признавые методы
Нормализация
Корреляция
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

32
 Корреляционное распознавание по эталону.
3. Бинаризация;
Последующая обработка изображения проводится только с бинарными
образами, поэтому для правильной бинаризации необходимо
предварительно использовать сложные методы фильтрации.
4. Сегментация символов;
5. Сжатие символов в матрицы;
Для применения корреляционного распознавания необходимо
привести входное множество изображений символов к единому типу,
определенному эталонами.
6. Применение простых признаковых методов распознавания;
На данном этапе сокращается количество сопоставляемых эталонов.
7. Корреляционное распознавание.
Сопоставление наиболее точного эталона к каждому из входного
множества изображений символов.
Рисунок 3.5. Структура обработки изображения в поставленной задаче
В данную структуру (см. рисунок 3.5) не включена задача детектирования1
изображения.
1 Данная задача была вынесена за рамки данного исследования.
Получение изображения
Сегментация номерного знака
Бинаризация
Сегментация символов
Сжатие символов в матрицы
Простые признаковые методы
Корреляция
Forpersonaluse
only.
Reproduce
w
ith
perm
ission
from
author.

Information Systems Design: License Plate Recognition

Information Systems Design: License Plate Recognition

Recommended

Recommended

More Related Content

What's hot

What's hot (17)

Similar to Information Systems Design: License Plate Recognition

Similar to Information Systems Design: License Plate Recognition (20)

More from Anatoly Simkin

More from Anatoly Simkin (20)

Information Systems Design: License Plate Recognition