Анализ изображений и видео
Наталья Васильева
nvassilieva@hp.com
HP Labs Russia
12 октября 2012, Computer Science Center
Лекция 4: Построение признаков и сравнение
изображений: глобальные признаки
2 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Вопросы:
1. К исходному изображению применяется усредняющая маска для подавления
шума, а затем маска лапласиана для улучшения мелких деталей. Изменится ли
результат, если поменять очередность этих операций?
2. С помощью какой операции можно полностью удалить из изображения
изолированные темные или светлые небольшие области? Каким должен быть
размер маски, если известно, что размер таких областей не превосходит n
пикселей?
3. Покажите, что второй проход операции эквализации гистограммы даст точно
тот же результат, что и после первого прохода.
4. Совместное использование процедур фильтрации с усилением высоких частот и
эквализации гистограммы является эффективным методом повышения резкости и
улучшения контраста. Влияет ли порядок на окончательный результат? Почему?
3 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Зачем сравнивать изображения?
• Поиск
• Классификация
• indoor/outdoor
• landscape/city/forest/desert/…
• Аннотирование
• Image parsing
4 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 4
Запрос - образец
Картинка
Эскиз
Результат поиска
сравнение представлений
изображений
Коллекция изображений
Поиск изображений
Зачем сравнивать изображения?
5 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Классификация, кластеризация
Зачем сравнивать изображения?
Обучающее множество:
изображения и метки класса
Модель
классификатора
Обучение классификатора:
сопоставление особенностей
изображений меткам классов
Обучение
Тестирование
Тестовое изображение
Сопоставление тестового
изображения модели
классификатора
Предсказанные
классификатором
классы:
– open outdoor
6 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Обрнаружение объектов
Зачем сравнивать изображения?
7 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Аннотирование
Зачем сравнивать изображения?
• Небо, гора, дом, трамвай, пикап, набережная, трава, солнечно,
день, дорога,...
8 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Как сравнивать?
• Представить каждое изображение в виде набора
признаков
• компактность
• описательность
• Сравнивать наборы признаков между собой =>
сравнивать изображения
9 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Признаки изображений
Признаки изображений
Текстовые Визуальные
Аннотации и метаданные:
− тэги, аннотации;
− дата создания;
− геотэги;
− названия файла;
− параметры съемки
(выдержка, диафрагма, наличие
вспышки…).
Признаки, полученные по
значениям пикселей:
− цветовые;
− текстурные;
− формы;
− пространственного
расположения.
10 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Признаки изображений
Признаки
Глобальные Локальные
Описывают картинку целиком:
− средняя яркость;
− среднее значение по
красному каналу;
− …
Описывают часть картинки:
− средняя яркость верхней левой
четверти;
− среднее значение по красному
каналу в окрестности центра
изображения;
− …
Обычно, признаки вычисляются
по всем пикселям изображения
Сегментация, поиск точек интереса,
построение признаков по
окрестностям точек интереса
11 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Пространства признаков
Вектор признаков – набор числовых параметров, отражающих
особенности изображения
Пространство признаков – пространство векторов признаков с заданной
функцией подобия (расстояния) для их сравнения.
…
…
Image A Image B
yA
1 …yA
2 yA
M
xA
1 …xA
2 xA
N
zA
1 …zA
2 zA
K
yB
1 …yB
2 yB
M
xB
1 …xB
2 xB
N
zB
1 …zB
2 zB
K
yA
1 …yA
2 yA
M
xA
1 …xA
2 xA
N
zA
1 …zA
2 zA
K
yB
1 …yB
2 yB
M
xB
1 …xB
2 xB
N
zB
1 …zB
2 zB
K
Similarity measure
Similarity measure
Similarity measure
yA
1 … yA
MxA
1 … xA
N zA
1 … zA
K
Similarity measure
yA
1 … yA
MxA
1 … xA
N zA
1 … zA
K
12 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Комбинирование признаков
…
…
Image A Image B
yA
1 …yA
2 yA
M
xA
1 …xA
2 xA
N
zA
1 …zA
2 zA
K
yB
1 …yB
2 yB
M
xB
1 …xB
2 xB
N
zB
1 …zB
2 zB
K
Similarity measure
Similarity measure
Similarity measure
d1
d2
d3
…
∑=
i
ii dcD
13 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Поиск по содержанию
(content retrieval)
Признаки текстуры
(texture features)
Признаки формы
(shape features)
Пространственные признаки
(spatial layout)
Признаки цвета
(color features)
Признаки по содержанию
Признаки текстуры
(texture features)
Признаки формы
(shape features)
Пространственные признаки
(spatial layout)
Признаки цвета
(color features)
14 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Цвет
h2 hNh1
F(I) = (h1
I, h2
I, …, hN
I)
Метрики: L1, L2, L∞, χ2,
EMD (earth mover's distance), …
F(I) = (E1
I,E2
I,E3
I,
σ1
I,σ2
I,σ3
I,
s1
I,s2
I,s3
I)
Мат. ожидание, дисперсия, 3-
ий момент: для каждого
цветового канала
Метрики: ~L1
Stricker M., Orengo M. Similarity of Color Images. Proceedings of the SPIE Conference,
vol. 2420, p. 381-392, 1995
Признаки цвета
(color features)
Гистограммы Статистическая модель
15 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Популярные функции расстояния для гистограмм
( )∑=
−=
K
m
jiji mhmhhh
1
)(),(min1),histint(
∑= +
−
=
K
m ji
ji
ji
mhmh
mhmh
hh
1
2
2
)()(
)]()([
2
1
),(χ
− Пересечение гистограмм (Histogram intersection)
− Гистограммы должны быть нормализованы
− Эквивалента L1
− Chi-squared Histogram matching distance
16 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Квантование пространства при построении
гистограмм
− Схема квантования влияет на размер вектора признаков
− Если метрика не учитывает подобие цветов:
• Много промежутков – расстояние между близкими по цвету
может быть большим
• Мало промежутков – расстояние между далекими по цвету
может быть маленьким
17 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Квантование в случае многомерных признаков
18 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Квантование пространства при помощи
кластеризации
− Построение кластеров по признакам обучающего множества
− Определение центров кластеров
− Для пикселя тестового изображения – принадлежность промежутку
квантования по ближайшему центру
19 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 19
Выбор схемы квантования цветового пространства
Пространства и схемы квантования,
участвовавшие в экспериментах
• Равномерное квантование с граничными
условиями пространств семейства HSV
Проверка существования пороговых значений шага квантования, таких что выбор
меньших шагов не приводит к повышению качества результатов поиска
• Равномерное квантование
20 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: James Hays
21 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Цветовые гистограммы – недостатки
1. Не учитывается подобие цветов:
d(H1, H2) > d(H1, H3)
Niblack W., Barber R., et al. The QBIC project:
Querying images by content using color, texture and
shape. In IS&T/SPIE International Symposium on
Electronic Imaging: Science & Technology,
Conference 1908, Storage and Retrieval for Image
and Video Databases, Feb. 1993
 Кумулятивные гистограммы

T
HHAHHHHd )()(),( 212121 −⋅⋅−=
А – матрица с коэффициентами
«подобия» цветов
22 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Цветовые гистограммы – недостатки
2. Не учитывается пространственное расположение цветов:
HA= HB = HC
A B C
23 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Slide credit: James Hays
24 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Пространственное расположение цветов
Stricker M., Dimai A. Spectral Covariance
and Fuzzy Regions for Image Indexing.
Machine Vision and Applications, vol. 10.,
p. 66-73, 1997
 Разбиение изображения на фиксированные блоки
 «Нечеткие области»
 Сегментация
25 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 25
Цветовая гистограмма с информацией о
пространственном расположении цветов
Niiiiii yxpccIHistSP ..)},,(|{)( 1===
N – число цветовых диапазонов,
Pi – доля пикселей i-го диапазона,
(xi, yi) – нормированные координаты центра масс
пикселей i-го диапазона.
Вектор признаков
Функция подобия
5010 .,. == βα
26 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Эффективность поиска по цветовым гистограммам
Добавление граничных условий позволило повысить показатели точности и полноты для
схем с небольшим числом цветовых диапазонов (выигрыш в точности до 10%).
При равномерном квантовании оптимально использование порядка 500 цветовых
диапазонов.
При равномерном квантовании с граничными условиями близкие по точности и полноте
результаты при 41 диапазоне.
• Превосходство признаков HistSP вкупе с функцией DHistSP над классическими
гистограммами с манхеттенской метрикой
ImageDB-1000:
1000 изображений,
100 запросов
27 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Гистограммы или моменты? (1)
Stricker M., Orengo M. Similarity of Color Images. ... (3000 изображений)
28 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Гистограммы или моменты? (2)
ColorHist
ColorMoment
Полнота Точность
56,77 %
55,98 %
23,02 %
25,06 %
База Corel Photo Set (285 изображений)
29 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Признаки по содержанию
Признаки текстуры
(texture features)
Признаки формы
(shape features)
Пространственные признаки
(spatial layout)
Признаки цвета
(color features)
30 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Текстура
Гладкая Грубая Периодичная
31 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Текстура
Voronoi tesselation features
Structural methods
General statistics parameters
Haralick’s co-occurrence matrices
Tamura features
Текстурные признаки
(texture features)
Статистические
Геометрические
PWT
TWT
DCT, DST, DHT
Complex wavelets
Gabor filters
ICA filters
Спектральные
Markov random fields
Fractals
Модельные
 Матрицы смежности – Haralik’s co-occurrence matrices
 Признаки Tamura – Tamura features (Tamura image)
32 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Матрицы смежности
Grey Level Co-occurrence Matrices (GLCM):
∑∑= = 

 =∆+∆+=
=
N
p
M
q иначе
jyqxpIiqpIесли
jiC
1 1 ,0
),(,),(,1
),(
Матрица частот пар пикселей определенной яркости, расположенных на
изображении определенным образом относительно друг друга.
),( yx ∆∆ – параметр сдвига, задающий взаимное расположение пикселей;
I(p,q) – уровень яркости пикселя изображения, расположенного в точке (p, q).
33 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Матрицы смежности: пример
)0,1(),( =∆∆ yx
34 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Матрицы смежности: характеристики
∑∑=
i j
jiCEnergy ),(2
∑∑−=
i j
jiCjiCEntropy ),(log),( 2
∑∑ −=
i j
jiCjiContrast ),()( 2
∑∑ −+
=
i j ji
jiC
MomentDifferenceInverse 2
)(1
),(
Статистические параметры, вычисленные по матрицам:
- минимален, когда все элементы равны
- мера хаотичности, максимален,
когда все элементы равны
- мал, когда большие элементы
вблизи главной диагонали
- мал, когда большие элементы
далеки от главной диагонали
35 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Признаки Tamura
Характеристики, существенные для зрительного восприятия:
 Зернистость (coarseness)
 Контрастность (contrast)
 Направленность (directionality)
 Линейность (line-likeness)
 Регулярность (regularity)
 Грубость (roughness)
Coarseness-coNtrast-Directionality
– точки в трехмерном
пространстве CND
Tamura image:
 Евклидово расстояние в 3D
(QBIC)
 3D гистограмма (Mars)
Признаки:
36 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Текстура: спектральные
Voronoi tesselation features
Structural methods
General statistics parameters
Haralick’s co-occurrence matrices
Tamura features
Текстурные признаки
(texture features)
Статистические
Геометрические
PWT
TWT
DCT, DST, DHT
Complex wavelets
Gabor filters
ICA filters
Спектральные
Markov random fields
Fractals
Модельные
 Вейвлет-признаки, фильтры Габора
 Фильтры ICA
37 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Вейвлет-признаки
)()( ,
,
xxf kj
kj
kψα∑=
Вейвлет-анализ – разложение сигнала по специальному базису:
)()(,,
)2(2
2
2/
,
RLxkj
kxjj
kj
∈Ζ∈
−=
ϕ
ϕψ
38 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Вейвлет-функция Хаара:
Масштабирующая
функция Хаара:
39 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Вейвлет-признаки
Набор базисных функций – банк фильтров
Фильтр 1
Фильтр 2
Фильтр N
Изображение
Энергия 1
Энергия 2
Энергия N
вектор признаков
40 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Фильтры Габора
Масштабирующая функция: функция Габора








+








+−








= jWx
yx
yxg
yxyx
π
σσσπσ
2
2
1
exp
2
1
),( 2
2
2
2
),cossin(
),sincos(
1,-S0,1,...,minteger,,,1),,(),(
Θ+Θ−=′
Θ+Θ=′
==>′′=
−
−
−
yxay
yxax
nmayxgayxg
m
m
m
mn
Набор фильтров:
Kn /π=Θ
)1/(1
)/( −−
= S
lh UUa
К – общее число направлений,
S – число масштабов,
Uh, Ul – максимум и минимум
рассматриваемых частот.
41 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Фильтры ICA
H. Borgne, A. Guerin-Dugue, A.
Antoniadis. Representation of images
for classification with independent
features. Pattern Recognition Letters,
vol. 25, p. 141-154, 2004
I1
I2
…
N фильтров
dist(I1,I2) = KLH(H1i , H2i)Σi=1
N
Фильтры получены при помощи анализа независимых компонент
42 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Сравнение текстурных признаков
P. Howarth, S. Rüger. Robust texture features for still image retrieval.
In Proc. IEE Vis. Image Signal Processing, vol. 152, No. 6, December 2006
В контексте задачи поиска
43 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Сравнение текстурных признаков (2)
Snitkowska, E. Kasprzak, W. Independent Component Analysis of Textures
in Angiography Images. Computational Imaging and Vision, vol. 32,
pages 367-372, 2006.
Фильтры Габора v. s. фильтры ICA
Эксперименты по классификации изображений:
 Коллекция ангиографических снимков
 Фильтры ICA лучше на 13%
 Коллекция текстур Brodatz
 Фильтры ICA лучше на 4%
44 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Признаки по содержанию
Признаки текстуры
(texture features)
Признаки формы
(shape features)
Пространственные признаки
(spatial layout)
Признаки цвета
(color features)
45 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Форма объектов
Периметр
Эксцентриситет
Кривизна
Направление осей
Признаки формы
(shape features)
Дескрипторы границ
(boundary-based methods)
Centroid Distance
Complex Coordinates
Curvature signature
Turning Angle
Дескрипторы областей
(region-based methods)
Геометрические Сигнатуры
Fourier Descriptors
UNL-Fourier
NFD
Wavelet Descriptors
B-Splines
Представление
сигнатур
Площадь
Компактность
Число Эйлера
Геометрические
Moment invariants
Zernike moments
Pseudo Zernike moments
Grid method
Глобальные
Triangulation
Medial Axis Transform
(Skeleton Transform)
Декомпозиция
Цепные коды
Прочие
Спектральные
дескрипторы (spectral
descriptors)
46 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Требования к признакам формы
 Инвариантность к параллельному переносу
 Инвариантность к изменению масштаба
 Инвариантность к повороту
 Устойчивость к незначительным изменениям формы
 Простота вычисления
 Простота сравнения
47 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Форма объектов: границы
Fourier Descriptors
NFD
...
Признаки формы
(shape features)
Дескрипторы границ
(boundary-based methods) Дескрипторы областей
(region-based methods)
Геометрические
Сигнатуры
Представление
сигнатур
Геометрические
Глобальные
Декомпозиция
Цепные коды
Прочие
 Цепные коды (Chain Codes)
 Дескрипторы Фурье (Fourier Descriptors)
48 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Цепные коды
А: 03001033332322121111
Б: 70016665533222
Нумерация направлений для 4-связного и 8-связного цепных кодов:
Пример:
0 0
0 0
22
22
3 1 3
3
3
3
31
1
1
1
1
0 0
1 6
6
6
5
53
3
2
2
2 7
a) б) в)
А Б
Инвариантность к выбору
начальной точки: минимальный код
Инвариатность к повороту:
разности цифр кода
70016665533222 -> 00166655332227
00166655332227 -> 01500706070051
49 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Дескрипторы Фурье
1. Вычисление сигнатуры (2D -> 1D):
 Расстояние от центроида до границы
 Комплексные координаты: z(t) = x(t) + iy(t)
 ...
2. Вычисление коэффициентов Фурье (s(t) – сигнатура):
∑
−
=
−
=
1
0
/2
)(
1 N
t
Nntj
n ets
N
u π
0
1
0
2
0
1
,...,,
u
u
u
u
u
u N−
3. Нормализация (NFD – Normalized Fourier Descriptors):
2
1
0
2
)(∑=
−=
cN
n
n
J
n
I ffd
4. Сравнение:
50 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Форма объектов: области
Признаки формы
(shape features)
Дескрипторы границ
(boundary-based methods) Дескрипторы областей
(region-based methods)
Геометрические
Сигнатуры
Представление
сигнатур
Геометрические
Moment invariants
Zernike moments
Pseudo Zernike moments
Grid method
Глобальные
Декомпозиция
Прочие
 Грид-метод (Grid-method)
 Инвариантные моменты (Moment invariants)
51 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Грид-метод
А: 001111000 011111111 111111111 111111111 111110111 0111000011
Б: 001100000 011100000 111100000 111101111 111111110 001111000
А
Б
Инвариантность:
Нормализация по главной оси:
 направление;
 размер;
 позиционирование на гриде.
52 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Инвариантные моменты
∫∫= dxdyyxfyxm qp
pq ),(
Момент порядка (p+q) двумерной непрерывной функций:
Центральные моменты для f(x,y) – дискретного изображения:
00
01
00
10
,),,()()(
m
m
y
m
m
xyxfyyxx
x y
qp
pq ==−−= ∑∑µ
С использованием нормированных центральных моментов был выведен
набор из 7 инвариантных к параллельному переносу, повороту и
изменению масштаба моментов.
Вектор признаков:
53 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Сравнение признаков формы
Mehtre B. M., Kankanhalli M. S., Lee W. F. Shape measures for content based image
retrieval: a comparison. Inf. Processing and Management, vol. 33, No. 3, pages 319-
337, 1997.
54 © Copyright 2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice.
Заключение
 Большой выбор различных способов представления изображений
 Цвет: гистограммы или статистическая модель?
 Текстура: фильтры Габора, фильтры ICA
 Форма: дескрипторы Фурье, инвариантные моменты
 При сравнении изображений часто необходимо комбинировать
различные признаки

Анализ изображений и видео. Построение признаков и сравнение изображений: глобальные признаки

  • 1.
    Анализ изображений ивидео Наталья Васильева nvassilieva@hp.com HP Labs Russia 12 октября 2012, Computer Science Center Лекция 4: Построение признаков и сравнение изображений: глобальные признаки
  • 2.
    2 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Вопросы: 1. К исходному изображению применяется усредняющая маска для подавления шума, а затем маска лапласиана для улучшения мелких деталей. Изменится ли результат, если поменять очередность этих операций? 2. С помощью какой операции можно полностью удалить из изображения изолированные темные или светлые небольшие области? Каким должен быть размер маски, если известно, что размер таких областей не превосходит n пикселей? 3. Покажите, что второй проход операции эквализации гистограммы даст точно тот же результат, что и после первого прохода. 4. Совместное использование процедур фильтрации с усилением высоких частот и эквализации гистограммы является эффективным методом повышения резкости и улучшения контраста. Влияет ли порядок на окончательный результат? Почему?
  • 3.
    3 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Зачем сравнивать изображения? • Поиск • Классификация • indoor/outdoor • landscape/city/forest/desert/… • Аннотирование • Image parsing
  • 4.
    4 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 4 Запрос - образец Картинка Эскиз Результат поиска сравнение представлений изображений Коллекция изображений Поиск изображений Зачем сравнивать изображения?
  • 5.
    5 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Классификация, кластеризация Зачем сравнивать изображения? Обучающее множество: изображения и метки класса Модель классификатора Обучение классификатора: сопоставление особенностей изображений меткам классов Обучение Тестирование Тестовое изображение Сопоставление тестового изображения модели классификатора Предсказанные классификатором классы: – open outdoor
  • 6.
    6 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Обрнаружение объектов Зачем сравнивать изображения?
  • 7.
    7 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Аннотирование Зачем сравнивать изображения? • Небо, гора, дом, трамвай, пикап, набережная, трава, солнечно, день, дорога,...
  • 8.
    8 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Как сравнивать? • Представить каждое изображение в виде набора признаков • компактность • описательность • Сравнивать наборы признаков между собой => сравнивать изображения
  • 9.
    9 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Признаки изображений Признаки изображений Текстовые Визуальные Аннотации и метаданные: − тэги, аннотации; − дата создания; − геотэги; − названия файла; − параметры съемки (выдержка, диафрагма, наличие вспышки…). Признаки, полученные по значениям пикселей: − цветовые; − текстурные; − формы; − пространственного расположения.
  • 10.
    10 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Признаки изображений Признаки Глобальные Локальные Описывают картинку целиком: − средняя яркость; − среднее значение по красному каналу; − … Описывают часть картинки: − средняя яркость верхней левой четверти; − среднее значение по красному каналу в окрестности центра изображения; − … Обычно, признаки вычисляются по всем пикселям изображения Сегментация, поиск точек интереса, построение признаков по окрестностям точек интереса
  • 11.
    11 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Пространства признаков Вектор признаков – набор числовых параметров, отражающих особенности изображения Пространство признаков – пространство векторов признаков с заданной функцией подобия (расстояния) для их сравнения. … … Image A Image B yA 1 …yA 2 yA M xA 1 …xA 2 xA N zA 1 …zA 2 zA K yB 1 …yB 2 yB M xB 1 …xB 2 xB N zB 1 …zB 2 zB K yA 1 …yA 2 yA M xA 1 …xA 2 xA N zA 1 …zA 2 zA K yB 1 …yB 2 yB M xB 1 …xB 2 xB N zB 1 …zB 2 zB K Similarity measure Similarity measure Similarity measure yA 1 … yA MxA 1 … xA N zA 1 … zA K Similarity measure yA 1 … yA MxA 1 … xA N zA 1 … zA K
  • 12.
    12 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Комбинирование признаков … … Image A Image B yA 1 …yA 2 yA M xA 1 …xA 2 xA N zA 1 …zA 2 zA K yB 1 …yB 2 yB M xB 1 …xB 2 xB N zB 1 …zB 2 zB K Similarity measure Similarity measure Similarity measure d1 d2 d3 … ∑= i ii dcD
  • 13.
    13 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Поиск по содержанию (content retrieval) Признаки текстуры (texture features) Признаки формы (shape features) Пространственные признаки (spatial layout) Признаки цвета (color features) Признаки по содержанию Признаки текстуры (texture features) Признаки формы (shape features) Пространственные признаки (spatial layout) Признаки цвета (color features)
  • 14.
    14 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Цвет h2 hNh1 F(I) = (h1 I, h2 I, …, hN I) Метрики: L1, L2, L∞, χ2, EMD (earth mover's distance), … F(I) = (E1 I,E2 I,E3 I, σ1 I,σ2 I,σ3 I, s1 I,s2 I,s3 I) Мат. ожидание, дисперсия, 3- ий момент: для каждого цветового канала Метрики: ~L1 Stricker M., Orengo M. Similarity of Color Images. Proceedings of the SPIE Conference, vol. 2420, p. 381-392, 1995 Признаки цвета (color features) Гистограммы Статистическая модель
  • 15.
    15 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Популярные функции расстояния для гистограмм ( )∑= −= K m jiji mhmhhh 1 )(),(min1),histint( ∑= + − = K m ji ji ji mhmh mhmh hh 1 2 2 )()( )]()([ 2 1 ),(χ − Пересечение гистограмм (Histogram intersection) − Гистограммы должны быть нормализованы − Эквивалента L1 − Chi-squared Histogram matching distance
  • 16.
    16 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Квантование пространства при построении гистограмм − Схема квантования влияет на размер вектора признаков − Если метрика не учитывает подобие цветов: • Много промежутков – расстояние между близкими по цвету может быть большим • Мало промежутков – расстояние между далекими по цвету может быть маленьким
  • 17.
    17 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Квантование в случае многомерных признаков
  • 18.
    18 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Квантование пространства при помощи кластеризации − Построение кластеров по признакам обучающего множества − Определение центров кластеров − Для пикселя тестового изображения – принадлежность промежутку квантования по ближайшему центру
  • 19.
    19 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 19 Выбор схемы квантования цветового пространства Пространства и схемы квантования, участвовавшие в экспериментах • Равномерное квантование с граничными условиями пространств семейства HSV Проверка существования пороговых значений шага квантования, таких что выбор меньших шагов не приводит к повышению качества результатов поиска • Равномерное квантование
  • 20.
    20 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: James Hays
  • 21.
    21 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Цветовые гистограммы – недостатки 1. Не учитывается подобие цветов: d(H1, H2) > d(H1, H3) Niblack W., Barber R., et al. The QBIC project: Querying images by content using color, texture and shape. In IS&T/SPIE International Symposium on Electronic Imaging: Science & Technology, Conference 1908, Storage and Retrieval for Image and Video Databases, Feb. 1993  Кумулятивные гистограммы  T HHAHHHHd )()(),( 212121 −⋅⋅−= А – матрица с коэффициентами «подобия» цветов
  • 22.
    22 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Цветовые гистограммы – недостатки 2. Не учитывается пространственное расположение цветов: HA= HB = HC A B C
  • 23.
    23 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Slide credit: James Hays
  • 24.
    24 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Пространственное расположение цветов Stricker M., Dimai A. Spectral Covariance and Fuzzy Regions for Image Indexing. Machine Vision and Applications, vol. 10., p. 66-73, 1997  Разбиение изображения на фиксированные блоки  «Нечеткие области»  Сегментация
  • 25.
    25 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. 25 Цветовая гистограмма с информацией о пространственном расположении цветов Niiiiii yxpccIHistSP ..)},,(|{)( 1=== N – число цветовых диапазонов, Pi – доля пикселей i-го диапазона, (xi, yi) – нормированные координаты центра масс пикселей i-го диапазона. Вектор признаков Функция подобия 5010 .,. == βα
  • 26.
    26 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Эффективность поиска по цветовым гистограммам Добавление граничных условий позволило повысить показатели точности и полноты для схем с небольшим числом цветовых диапазонов (выигрыш в точности до 10%). При равномерном квантовании оптимально использование порядка 500 цветовых диапазонов. При равномерном квантовании с граничными условиями близкие по точности и полноте результаты при 41 диапазоне. • Превосходство признаков HistSP вкупе с функцией DHistSP над классическими гистограммами с манхеттенской метрикой ImageDB-1000: 1000 изображений, 100 запросов
  • 27.
    27 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Гистограммы или моменты? (1) Stricker M., Orengo M. Similarity of Color Images. ... (3000 изображений)
  • 28.
    28 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Гистограммы или моменты? (2) ColorHist ColorMoment Полнота Точность 56,77 % 55,98 % 23,02 % 25,06 % База Corel Photo Set (285 изображений)
  • 29.
    29 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Признаки по содержанию Признаки текстуры (texture features) Признаки формы (shape features) Пространственные признаки (spatial layout) Признаки цвета (color features)
  • 30.
    30 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Текстура Гладкая Грубая Периодичная
  • 31.
    31 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Текстура Voronoi tesselation features Structural methods General statistics parameters Haralick’s co-occurrence matrices Tamura features Текстурные признаки (texture features) Статистические Геометрические PWT TWT DCT, DST, DHT Complex wavelets Gabor filters ICA filters Спектральные Markov random fields Fractals Модельные  Матрицы смежности – Haralik’s co-occurrence matrices  Признаки Tamura – Tamura features (Tamura image)
  • 32.
    32 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Матрицы смежности Grey Level Co-occurrence Matrices (GLCM): ∑∑= =    =∆+∆+= = N p M q иначе jyqxpIiqpIесли jiC 1 1 ,0 ),(,),(,1 ),( Матрица частот пар пикселей определенной яркости, расположенных на изображении определенным образом относительно друг друга. ),( yx ∆∆ – параметр сдвига, задающий взаимное расположение пикселей; I(p,q) – уровень яркости пикселя изображения, расположенного в точке (p, q).
  • 33.
    33 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Матрицы смежности: пример )0,1(),( =∆∆ yx
  • 34.
    34 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Матрицы смежности: характеристики ∑∑= i j jiCEnergy ),(2 ∑∑−= i j jiCjiCEntropy ),(log),( 2 ∑∑ −= i j jiCjiContrast ),()( 2 ∑∑ −+ = i j ji jiC MomentDifferenceInverse 2 )(1 ),( Статистические параметры, вычисленные по матрицам: - минимален, когда все элементы равны - мера хаотичности, максимален, когда все элементы равны - мал, когда большие элементы вблизи главной диагонали - мал, когда большие элементы далеки от главной диагонали
  • 35.
    35 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Признаки Tamura Характеристики, существенные для зрительного восприятия:  Зернистость (coarseness)  Контрастность (contrast)  Направленность (directionality)  Линейность (line-likeness)  Регулярность (regularity)  Грубость (roughness) Coarseness-coNtrast-Directionality – точки в трехмерном пространстве CND Tamura image:  Евклидово расстояние в 3D (QBIC)  3D гистограмма (Mars) Признаки:
  • 36.
    36 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Текстура: спектральные Voronoi tesselation features Structural methods General statistics parameters Haralick’s co-occurrence matrices Tamura features Текстурные признаки (texture features) Статистические Геометрические PWT TWT DCT, DST, DHT Complex wavelets Gabor filters ICA filters Спектральные Markov random fields Fractals Модельные  Вейвлет-признаки, фильтры Габора  Фильтры ICA
  • 37.
    37 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Вейвлет-признаки )()( , , xxf kj kj kψα∑= Вейвлет-анализ – разложение сигнала по специальному базису: )()(,, )2(2 2 2/ , RLxkj kxjj kj ∈Ζ∈ −= ϕ ϕψ
  • 38.
    38 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Вейвлет-функция Хаара: Масштабирующая функция Хаара:
  • 39.
    39 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Вейвлет-признаки Набор базисных функций – банк фильтров Фильтр 1 Фильтр 2 Фильтр N Изображение Энергия 1 Энергия 2 Энергия N вектор признаков
  • 40.
    40 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Фильтры Габора Масштабирующая функция: функция Габора         +         +−         = jWx yx yxg yxyx π σσσπσ 2 2 1 exp 2 1 ),( 2 2 2 2 ),cossin( ),sincos( 1,-S0,1,...,minteger,,,1),,(),( Θ+Θ−=′ Θ+Θ=′ ==>′′= − − − yxay yxax nmayxgayxg m m m mn Набор фильтров: Kn /π=Θ )1/(1 )/( −− = S lh UUa К – общее число направлений, S – число масштабов, Uh, Ul – максимум и минимум рассматриваемых частот.
  • 41.
    41 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Фильтры ICA H. Borgne, A. Guerin-Dugue, A. Antoniadis. Representation of images for classification with independent features. Pattern Recognition Letters, vol. 25, p. 141-154, 2004 I1 I2 … N фильтров dist(I1,I2) = KLH(H1i , H2i)Σi=1 N Фильтры получены при помощи анализа независимых компонент
  • 42.
    42 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Сравнение текстурных признаков P. Howarth, S. Rüger. Robust texture features for still image retrieval. In Proc. IEE Vis. Image Signal Processing, vol. 152, No. 6, December 2006 В контексте задачи поиска
  • 43.
    43 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Сравнение текстурных признаков (2) Snitkowska, E. Kasprzak, W. Independent Component Analysis of Textures in Angiography Images. Computational Imaging and Vision, vol. 32, pages 367-372, 2006. Фильтры Габора v. s. фильтры ICA Эксперименты по классификации изображений:  Коллекция ангиографических снимков  Фильтры ICA лучше на 13%  Коллекция текстур Brodatz  Фильтры ICA лучше на 4%
  • 44.
    44 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Признаки по содержанию Признаки текстуры (texture features) Признаки формы (shape features) Пространственные признаки (spatial layout) Признаки цвета (color features)
  • 45.
    45 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Форма объектов Периметр Эксцентриситет Кривизна Направление осей Признаки формы (shape features) Дескрипторы границ (boundary-based methods) Centroid Distance Complex Coordinates Curvature signature Turning Angle Дескрипторы областей (region-based methods) Геометрические Сигнатуры Fourier Descriptors UNL-Fourier NFD Wavelet Descriptors B-Splines Представление сигнатур Площадь Компактность Число Эйлера Геометрические Moment invariants Zernike moments Pseudo Zernike moments Grid method Глобальные Triangulation Medial Axis Transform (Skeleton Transform) Декомпозиция Цепные коды Прочие Спектральные дескрипторы (spectral descriptors)
  • 46.
    46 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Требования к признакам формы  Инвариантность к параллельному переносу  Инвариантность к изменению масштаба  Инвариантность к повороту  Устойчивость к незначительным изменениям формы  Простота вычисления  Простота сравнения
  • 47.
    47 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Форма объектов: границы Fourier Descriptors NFD ... Признаки формы (shape features) Дескрипторы границ (boundary-based methods) Дескрипторы областей (region-based methods) Геометрические Сигнатуры Представление сигнатур Геометрические Глобальные Декомпозиция Цепные коды Прочие  Цепные коды (Chain Codes)  Дескрипторы Фурье (Fourier Descriptors)
  • 48.
    48 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Цепные коды А: 03001033332322121111 Б: 70016665533222 Нумерация направлений для 4-связного и 8-связного цепных кодов: Пример: 0 0 0 0 22 22 3 1 3 3 3 3 31 1 1 1 1 0 0 1 6 6 6 5 53 3 2 2 2 7 a) б) в) А Б Инвариантность к выбору начальной точки: минимальный код Инвариатность к повороту: разности цифр кода 70016665533222 -> 00166655332227 00166655332227 -> 01500706070051
  • 49.
    49 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Дескрипторы Фурье 1. Вычисление сигнатуры (2D -> 1D):  Расстояние от центроида до границы  Комплексные координаты: z(t) = x(t) + iy(t)  ... 2. Вычисление коэффициентов Фурье (s(t) – сигнатура): ∑ − = − = 1 0 /2 )( 1 N t Nntj n ets N u π 0 1 0 2 0 1 ,...,, u u u u u u N− 3. Нормализация (NFD – Normalized Fourier Descriptors): 2 1 0 2 )(∑= −= cN n n J n I ffd 4. Сравнение:
  • 50.
    50 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Форма объектов: области Признаки формы (shape features) Дескрипторы границ (boundary-based methods) Дескрипторы областей (region-based methods) Геометрические Сигнатуры Представление сигнатур Геометрические Moment invariants Zernike moments Pseudo Zernike moments Grid method Глобальные Декомпозиция Прочие  Грид-метод (Grid-method)  Инвариантные моменты (Moment invariants)
  • 51.
    51 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Грид-метод А: 001111000 011111111 111111111 111111111 111110111 0111000011 Б: 001100000 011100000 111100000 111101111 111111110 001111000 А Б Инвариантность: Нормализация по главной оси:  направление;  размер;  позиционирование на гриде.
  • 52.
    52 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Инвариантные моменты ∫∫= dxdyyxfyxm qp pq ),( Момент порядка (p+q) двумерной непрерывной функций: Центральные моменты для f(x,y) – дискретного изображения: 00 01 00 10 ,),,()()( m m y m m xyxfyyxx x y qp pq ==−−= ∑∑µ С использованием нормированных центральных моментов был выведен набор из 7 инвариантных к параллельному переносу, повороту и изменению масштаба моментов. Вектор признаков:
  • 53.
    53 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Сравнение признаков формы Mehtre B. M., Kankanhalli M. S., Lee W. F. Shape measures for content based image retrieval: a comparison. Inf. Processing and Management, vol. 33, No. 3, pages 319- 337, 1997.
  • 54.
    54 © Copyright2012 Hewlett-Packard Development Company, L.P. The information contained herein is subject to change without notice. Заключение  Большой выбор различных способов представления изображений  Цвет: гистограммы или статистическая модель?  Текстура: фильтры Габора, фильтры ICA  Форма: дескрипторы Фурье, инвариантные моменты  При сравнении изображений часто необходимо комбинировать различные признаки