CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.Anton Konushin
Курс "Введение в компьютерное зрение", читаемый на
ВМК МГУ имени М.В. Ломоносова в весеннем семестре 2015 года. Лектор - Конушин Антон. Лекция 1. Темы - понятие о компьютерном зрение, сложности, связь с искусственным интеллектом. История и достижения компьютерного зрения. Свет и цвет, модели цвета, цифровое изображение.
CV2015. Лекция 2. Простые методы распознавания изображений.Anton Konushin
Курс "Введение в компьютерное зрение", читаемый на
ВМК МГУ имени М.В. Ломоносова в весеннем семестре 2015 года. Лектор - Конушин Антон. Лекция 2. Простые методы распознавания изображений. Рассматриваются методы бинаризации изображений, основы математической морфологии, медианная фильтрация, выделение связанных компонент, метод последовательного сканирования, метод К-средних, оценка характеристик сегментов.
3. Формирование изображения
• Мы представляем изображение как композицию объекта и фона,
причём какие-то пиксели изображения есть результат смешения
объекта и фона (следствие дискретизации)
• I = * F + (1 - ) * B
= * + *
• Карта прозрачности (opacity map) из [0,1], где 0 - фон, 1 –
непрозрачный объект
• Она же альфа-канал
4. Композиция изображений
• Выделенный объект можем встроить в другое
изображение
• Если провели мягкую сегментацию, то при
встраивании смешиваем (blending) изображения
объекта и фона:
5. Подход к решению
• Для изображений, полученных в обычных
условиях, задача раскладывается в несколько
более простых задач
• Интерактивная «жесткая» сегментация объекта
– Пользовательский ввод
– из {0,1}
• Мягкая сегментация объекта (собственно маттирование)
– Результат жесткой сегментации используется как
начальное приближение для расчета из [0,1]
+
7. Natural Image Matting
Средний цвет
объекта
Средний цвет
фона
Ruzon and Tomasi, Alpha estimation in natural images, 2000
Slide by C. Rother
8. Natural Image Matting
Идея:
• интерполируем с гауссианы цвета фона и объекта
• выбираем , на которой достигается максимум цвета пикселя
объекта
Jue Wang and Michael Cohen. Image and Video Matting: A Survey. Foundations
and Trends in Computer Graphics and Vision, Vol. 3, No.2, 2007.
9. Обычное маттирование
Без регуляризации по альфа
Вход Bayes Matting Knockout 2
Chuang et. al. (2001) Photoshop Plug-In
11. Динамическое программирование
t+1
t
DP
Результат после DP Border
Matting
Сглаживанием параметры сплайна с помощью
динамического программирования по контуру
26. Упрощение
• Можно использовать только 2 полосы – высокие и
низкие частоты
• Низкие частоты плавно смешивать (цветовые
переходы)
• Высокие не смешивать, использовать «жесткую»
сегментацию
30. Poisson editing
• Задача: встроить объект из
изображения s в изображение t
• Идея:
• Возьмём поле градиента из
изображения s (и только!)
• Вычислим цвета в новой области так,
чтобы новое поле градиента
совпадало с s, и цвета на границе
совпадали с цветами t
• «Направленная интерполяция»
• Guided interpolation
PEREZ, P., GANGNET, M., AND BLAKE, A. 2003. Poisson image editing.
Proceedings of ACM SIGGRAPH, 313-318.
31. Подход
• Вычисляем функцию f в области Ω такую, чтобы
её градиент в Ω соответствовал векторному полю
v, которое может быть (а может и не быть)
градиентом исходной функции g c заданными
граничными условиями
32. Уравнение Пуассона для изображения
• Задача: найти f, такое что
2
min f f v f s
f
f t*
• Решение этой задачи – это решение
уравнения Пуассона:
ft
f divv f
f t*
• Решаются 3 задачи независимо по 0
каждому каналу RGB
• Дискретизация уравнений приводит к
системе линейных уравнений, которая
решается методом Гаусса-Зиделя ft f s
34. Смешение полей градиентов
• Вместо полного
копирования поля
градиента из исходного
изображения, можно
сделать их композицию
• Пр: взять максимумы
градиентов из исходного
и целевого полей
40. Проблемы метода по Пуассону
• Направляющее поле v f s , обозначим f f f s
• Тогда исходное уравнение эквивалентно:
2 2
*
min f f v f
ft
min f f f f t f s
• Что эквивалентно решению уравнения Лапласа:
f 0 f f t f s
• Свойство уравнения Лапласа:
2
• Энергия f будет близка нулю тогда и только
тогда, если ft fs k , где k - константа
41. Проблемы метода по Пуассону
• Разные границы дают
разный результат в
зависимости от
равномерности цвета на
границе
+
fs ft
'
f
42. Уравнение Пуассона
• Где проходит оптимальная граница ∂Ω ?
• Внутри обозначенной пользователем области
• Вне объекта интереса
– Его находим через GrabCut
• Как мы её будем оптимизировать?
• Минимизируем отклонение цветов
2 blue
min f f t ( p )
p
f s ( p) k
43. Оптимизация границы
2
E (, k ) f ( p) f ( p ) k
p
t s blue
• ∂Ω и k - неизвестные
• Итеративная оптимизация
• Инициализируем ∂Ω по отмеченной пользователем границе
• По ∂Ω вычисляем оптимальное k :
E (, k ) Задача кратчайшего
0 пути
k
• По k, оптимизируем границу ∂Ω.
• Повторяем оба шага до сходимости
44. Оптимизация границы
• В 2D графе, вычисляем кратчайший путь между
двумя точками – Динамическое Программирование
• Алгоритм Дейкстры
• В нашем случае – вычисляем замкнутый путь
45. Оптимизация границы
• Оптимальность
• Избегаем ситуации изгиба пути вокруг разреза за
счёт выбора начального положения разреза
• Как выбрать начальный разрез?
• Выбираем короткий, чтобы минимизировать
сложность O(MN)
• Должен проходить через гладкую область
48. Учёт дробной границы
• Альфа-смешение и смешение по Пуассону в
предыдущих работах являются двумя разными
методами.
• Альфа-смешение обеспечивает дробную границу, но не может
изменять цвет исходного объекта.
• Смешение по Пуассону модифицирует цвет объекта, но использует
только бинарную границу.
• Объединим оба подхода.
50. Учёт дробной границы
• Где нужно учитывать дробные значения?
• Только там, где найденная линия сшива (граница) проходит по
голубой (дробной) области объекта
∂Ω
51. Учёт дробной границы
• Где нужно учитывать дробные значения?
• Только там, где найденная линия сшива (граница) проходит по
голубой (дробной) области объекта
Учет дробной границы:
зеленая область
или:
желтая область
52. Учёт дробной границы
• Как учесть дробные границы в методе Пуассона?
• Построить смешанное направляющее поле
x f s ( x , y ) f ( x 1, y ) f ( x, y )
xff s((xx,yy))
, ( x ,, y ), ((x 1, y )) yellow
( x y), x 1, y yellow
x s
' v ( x, y ) x ( af s (1 a ) f t ) ( x, y ), ( x 1, y ) green
vx ( x, y) x ( f s (1 ) f t ) ( x, y), ( x 1, y) green
x
0 otherwise
0 otherwise
53. Учёт дробной границы
• Как учесть дробные границы в методе Пуассона?
• Построить смешанное направляющее поле
x f s ( x, y ) ( x, y ), ( x 1, y ) yellow
v ( x, y ) x ( af s (1 a ) ft ) ( x, y ), ( x 1, y ) green
x
0 otherwise
54. Учёт дробной границы
• Как учесть дробные границы в методе Пуассона?
• Построить смешанное направляющее поле
x f s ( x, y ) ( x, y ), ( x 1, y ) yellow
v ( x, y ) x ( af s (1 a ) ft ) ( x, y ), ( x 1, y ) green
x
0 otherwise
55. Учёт дробной границы
• Финальная минимизация:
2
min f *
f v dp f *
ft
p *
• Решаем соответствующее уравнение Пуассона.
66. Inpainting
• Задача: качество закрыть дырку в изображении
• Царапины, трещины, текст
• Вырезанный объект
• Как это делают эксперты:
• Структура изображения продолжается внутрь области дефекта
– Т.е. контура объектов продолжаются внутрь области
• Области внутри дефекта заливаются цветом согласно
соседним областям
• Текстура искусственно добавляется (синтезируется в области)
M. Bertalmio, G. Sapiro, V. Caselles, C. Ballester. Image inpainting. In
Proc. Siggraph 2000.
67. Идея метода
• Вычислить изменение изображения вдоль нормали к
границе области
• Продолжить за границу
• «Края» изображения обычно не соответствуют нормалям к
границам
• Поэтому будем вычислять градиенты около границы, и в
качестве направления интерполяции будем выбирать
ортогональное к вектору градиента
• Далее используем anisotropic diffusion
72. Exemplar-based inpainting
A. Criminisi, P. Perez, K. Toyama. Region filling and object removal by exemplar-
based inpainting. In IEEE Transactions on Image Processing, 2004
73. Идея
• Объединить все 3 основные идеи по реконструкции
изображений художниками
• Используем синтез текстур по шаблону
• Приоритет даём продолжению линейных структур
74. Алгоритм - шаг 1
• Назначим каждому пикселю на границе приоритет
• Линейным структурам назначим больший
приоритет
75. Алгоритм - шаг 2
• Распространяем «структуру» путём копирования
фрагментов изображения вдоль направления
распространения структуры
79. Развитие методов
• Методы на основе диффузии
• Более сложные уравнения диффузии (Навье-Стокса,
вариационные методы и т.д.)
• Учёт статистики естественных изображений (S. Roth and
M. J. Black, 2005)
• Методы на основе фрагментов
• Усовершенствование метрик выбора фрагментов
• Смешение нескольких фрагментов
• Использование разреженных методов для оценки
фрагментов
80. Сравнение
Z. Xu, J. Sun Image Inpainting by Patch Propagation Using Patch Sparsity, IEEE
Trans. of Image Processing, 2010
83. Некоторые подходы
• Клонирование объектов
• Поиск похожих фрагментов
• Монтаж объектов
• Оценка уровня шума
• Оценка освещённости
• Передискретизация фрагментов
• Оценка корреляции соседних пикселей
• Оценка JPEG
• Оценка гистограмма коэффициентов после повторного
сохранения
• Поиск границ блоков после обрезания и сохранения
фрагмента
H. Farid A Survey of Image Forgery Detection IEEE Signal Processing Magazine,
26(2):16-25, 2009
84. Поиск клонирования
• Вычисление инвариантов(признаков) для каждого блока
• Поиск похожих блоков по всему изображению (kd-дерево)