Введение в цифровую обработку изображений Сайт курса: http://cvbeginner.blogspot.com/
О лекторе Виктор Куликов ИАиЭ СО РАН Лаборатория цифровых методов обработки изображений Научный сотрудник, к.т.н. E-mail:  [email_address]
Учебники (Теория) Л. Шапиро Дж. Стокман Компьютерное зрение Р. Гонсалес Р. Вудс Цифровая обработка изображений R. Szeliski Computer vision: Algorithms and application Форсайт Понс Компьютерное зрение современный подход
Учебники (Практика) R. Laganiere OpenCV 2.0 Computer Vision application programming cookbook G. Bradski A.Kaehler Learning OpenCV: Computer vision with the OpenCV Library
План лекции План курса Трудности обработки изображений Перерыв Задачи компьютерного зрения Формирование изображения
План курса Обработка изображений Сегментация изображений Бинарное компьютерное зрение Поиск локальных особенностей Поиск изображений Анализ последовательностей 3 D  обработка Kinect  и анализ облаков точек
Трудности обработки изображений Мы видим Компьютер видит
Что означает видеть? Понимать что мы хотим увидеть Вопрос : Какая информация содержится на изображении?
Семантическая  ( что есть на изображении) [Russell et al. LabelMe IJCV,2008]
Метрическая (геометрия и описание сцены)
Стерео реконструкция Slide credit:Marc Pollefeys
Структура из движения I1 I2 I10 Slide credit:Marc Pollefeys
Актуальность Полезно – позволяет упростить человеческий труд Выгодно – быстро развивающаяся область; много интересных стартапов Интересно – большие объемы тестовых данных, результат виден сразу Но сложно...
Метрические трудности Точка наблюдения Освещение Масштаб Деформация Перекрытия
Точка наблюдения
Освещение
Масштаб
Деформации
Перекрытия
Семантические трудности Внутриклассовые различия Контекст Локальные неоднозначности
Внутриклассовые различия
Контекст Slide credit:  Антон Конушин
Локальные неоднозначности
Задача ученого Найти признаки исходя из решаемой задачи Правильно ими воспользоваться Вопрос : Какие признаки можно использовать?
Цвет
Тени
Текстура
Группировка
Проекция
Итого Метрические задачи в основном разрешимы Необходимо знать модель сцены т.к. отображение из 3Д в 2Д неоднозначное Семантические задачи = Задачи ИИ Для решения семантических задач необходимо их превратить в метрические
Перерыв Вопросы?
Распространение изображений Slide credit:  Антон Конушин
Практическое применение Огромное количество данных Flickr, YouTube, TV, Security ... Быстро растущая область Обработка – фильтрация, удаление шума, композиция Безопасность – трассировка людей, обнаружение оставленных предметов и внештатных ситуаций Наука – анализ данных геологии, микроскопии ... Кино – спецэффекты, запись движения человека ... Интернет – поиск изображений, аннотация и автоматическая сортировка контента... Мобильные технологии – реконструкция, дополненная реальность,  Google Goggles ...
Фильтрация
Композиция
Безопасность Обнаружение внештатных ситуаций Трассировка людей Сложное внедрение
Улучшение качества
Обнаружение лиц Demo facedetect.exe [Viola Jones ICCV 2001]
Оставленные предметы На основе  RGB На основе  RGBD
Обнаружение и трассировка людей
Наука Большой спектр задач Разнообразные источники данных Простое внедрение
Трассировка животных
Сканирование  PCR  гелей
Получение  HDR [Devebec’ SIGGRAPH 97]
Видеомонтаж
Захват движения Source: A. Fitzgibbon
Поиск изображений Slide credit: A. Zisserman
3D  Реконструкция Slide credit:  Антон Конушин
Распознавание действий Slide credit: Laptev
Сегментация Slide credit:  Антон Конушин
Семантическая сегментация Slide credit:  Антон Конушин
Мобильные технологии
Google Goggles
Дополненная реальность
Формирование изображения Камера-обскура
Цветовая модель Цвет Психологическое свойство человека Описывается спектром Сетчатка глаза Колбочки 3х типов 3 канала для пикселей
Организация памяти
Программные библиотеки OpenCV  http://opencv.itseez.com/ Itk  http://www.itk.org/ FreeImage  http://freeimage.sourceforge.net/ PCL  http://www.pointclouds.org/
Вопросы

Лекция 1