SlideShare a Scribd company logo
1 of 65
Download to read offline
Детектирование объектов
переднего плана в видео
Александр Новиков
Video Group
CS MSU Graphics & Media Lab
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной и цветовой
информации
 Использование информации о смене цветов
на областях открытия
 Заключение
2
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Постановка задачи
Задача — выделить объекты переднего плана в видео
Проблемы:
 Движение камеры
 Необходимость сохранения временной целостности
 Изменение внешнего вида объекта во времени
3F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
Кадр последовательности Выделенный объект
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Применения
 Редактирование видео
 Слежение за объектами
 Удаление объектов
 Конвертация 2D видео в 3D
4
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных
срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной и цветовой
информации
 Использование информации о смене цветов
на областях открытия
 Заключение
5
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Пространственно-
временные срезы (1)
 Пространственно-временные
срезы — это изображения,
получаемые при перемещении
в (x,t) [(y,t)] измерениях
при фиксированном y [x]
 Срезы разделяются на
 — горизонтальные,
фиксирован y=i
 — вертикальные,
фиксирован x=j
6
),(H txiy
),(V tyjx
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
Горизонтальный срез видео
t
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Пространственно-
временные срезы (2)
Структура
пространственно-
временных срезов
позволяет определить
вид и направление
движения камеры
7
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
t
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Идея метода
1) Разбиение видео на участки с однородным
движением камеры и классификация:
 Отсутствие движения
 Панорамирование
 Приближение/отдаление
 Сложное движение
2) Восстановление фона сцены
3) Background subtraction и выделение движущихся
объектов
8
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Структура среза H в точке представляется
матрицей Г
9
Алгоритм
Локальная структура срезов







ttxt
xtxx
JJ
JJ
Г









wtx
ttt
wtx
txxt
wtx
xxx
ttxx
ttxxttxx
ttxx
,
,
,
2
),(HˆJ
),(Hˆ),(HˆJ
),(HˆJ
t
G
x
G
tx






H)(
Hˆ,
H)(
Hˆ — частные производные срезов,
__сглаженных фильтром Гаусса
w — окно 3x3 с центром в некотором пикселе
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Вычисляется локальная ориентация ϕ в окне w
 c — мера того, насколько точно
ϕ оценивает локальную
ориентацию,
с = 1 — точная направленность
Алгоритм
Локальная направленность
10
xxtt
xt
JJ
J2
tan
2
1 1

 
















2
,
2
,
2
0,
2 







otherwise
]1,0[,
)J(J
J4)J(J
2
22



 cc
ttxx
xtttxx
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Гистограмма направленностей
 Строится двумерная гистограмма локальных
направленностей
 На кадрах [k,k+N] выделяется доминирующая
траектория {ϕ}, если для них выполняется
11





 
,0
,),(
),ˆ( i x
iytxc
tM 
T
t
tp
Nk
kt
Nk
kt








 ),M(
)(  ),M(max)(
2/2/
ttp 
 

Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
TN, — константы, в статье 15 и 0.6
 ˆ),( iytx
otherwise
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Неподвижная камера
 Панорамирование
 Отдаление/приближение
 Иначе — сложное
движение
t
y
ϕ
Алгоритм
Классификация движения камеры
12
],[ aa  
1
),M(
),M(
0
0





t
t
t
t




aa   ,
0a
t
y
ϕ
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
2

2

2


2


CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Выделение фона на срезах
 Дискретизация гистограммы
 Выделение на срезах пикселей с движением
близким к основному (LoS — layer of support)
13
]90,45(
]45,25(
]25,5(
]5,5[
)5,25[
)25,45[
)45,90[
7
6
5
4
3
2
1







 

ki t
ik t

 ),M()N(





 

)N(maxargˆ k
k
otherwise
txLoS iy





ˆ
,0
,1
),(

t
y
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Восстановление панорамы фона
 Пиксели с LoS = 1 считаются принадлежащими фону
 Для каждого кадра t выбирается сдвиг
где — выбранный для кадра t срез с наибольшим
количеством текстурной информации
14













 1)1()(
)1()(
maxargHˆ
H
iyiy
iyiy
tntn
tCtC
iy
  
x
iyiyiy txLoStxctС ),(),()(   
x
iyiy txLoStn ),()(
iyHˆ
},)1,(Hˆ),(Hˆmed{minarg)( iyiy
xd
tdxtxtd  
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Color back-projection
 По LoS для фона инвертированием вычисляется LoS
для переднего плана
 Строится дискретизованная гистограмма C цветов
пикселей со значениями LoS переднего плана = 1
 Передний план F вычисляется по формуле:
15
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
),()),(Rˆ)),((Сˆ(
2
1
),F( tXImagetXtXImagetX 
Сˆ
),(Rˆ tX — нормализованная карта разницы |Image-Background|
— нормализованная гистограмма C
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
Background subtraction
16
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
Color back-projection
17
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Скорость работы
 Восстановление фона
Недостатки:
 Отсутствие временной целостности
 Недостаточно точная сегментация
18
Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis
and Segmentation Through Spatio-Temporal Slices Processing”,
IEEE ToIP, 2003
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной и цветовой
информации
 Использование информации о смене цветов
на областях открытия
 Заключение
19
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Схема работы алгоритма
1) Восстановление структуры сцены по движению
2) Оценка движения и глубины
 При фиксированной сегментации оцениваются движение
и области открытия
 Строится карта глубины и карта ошибок геометрии
3) Выделение фона и переднего плана
4) Повторение второго и третьего шагов k (2-3) раз
5) Matting границ выделенных объектов
20
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Structure From Motion
 Выполняется поиск 3D-feature points
 Для каждого кадра вычисляются матрицы камеры
21
)( tttt
X TXRKu 
ttt
TRK ,, — матрицы камеры для кадра t
t
Xu — проекция 3D-точки X на кадр t
G. Zhang, X. Qin, W. Hua, T.-T. Wong, P.-A. Heng, H. Bao,
“Robust metric reconstruction from challenging video sequences”,
IEEE CVPR, 2007
Вставленные объекты демонстрируют определенную геометрию сцены
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Оценка движения и поиск областей закрытия
выполняется решением задачи минимизации
Алгоритм
Оценка движения (1)
22





1
1
,11,
,
)),(),((minarg
n
t
tttt
od
odEodE
 





t
ifi
tt
Nj
tttttt
DQjisimodE )()],()([),( 1,1,1,1,
)(
),,(),(
1,
1,1,
DQ
jisim
tt
tttt


— условия соответствия данных, гладкости поля motion-
векторов и соответствия 3D-feature points
iN — множество 8 пикселей, соседних с i-м
)(1,
io tt
i
 — индикатор принадлежности пикселя i области открытия
при переходе от кадра t к t+1
)(1,
id tt 
— motion-вектор пикселя i при переходе с кадра t к t+1
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 





t
ifi
tt
Nj
ttt,ttt
DQjisimodE )()],()([),( 1,1,11,
Алгоритм
Оценка движения (2)
Условие соответствия данных:
23
1
,0
,0
,
},),(min{
),(
)(
1,
11,
11,
1,
1,
1,



















tt
i
t
i
t
i
tt
i
t
i
t
i
tt
i
o
o
tt
d
tt
d
tt
o
o
o
i
i
im 




21
21
1,
)()(
)()(
)(
ifif
ifif
i
tt
d
tt
tt
d








G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
do  , — константы, в статье 0.5 и 400 соответственно
)(it
i — индикатор принадлежности пикселя i кадра t переднему
плану
)(if t
— цвет пикселя i кадра t
i — пиксель кадра t +1 соответствующий i-тому по dt,t+1
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Условие гладкости поля motion-векторов:
1, tt
iW
Алгоритм
Оценка движения (3)
24
1,1,1,1,1,1,
),(),( 
 tt
i
tt
iw
tt
j
tt
io
tt
ss
tt
Wooojijis 
1
121,1,
1,
,0
},)()(min{
),( 







 
 t
j
t
i
t
j
t
is
tttt
tt
s
jdid
ji



— 1, если для пикселя f t(i) нет соответствующего по dt+1,t
///пикселя в f t+1, 0 — иначе
),(1,
jitt
s

 — мера сонаправленности векторов dt,t+1(i) и dt,t+1(j)
s
wos  ,, — балансирующие коэффициенты, 0.1, 0.21 и 0.6 в статье
— ограничение сверху, 4 в статье
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
 





t
ifi
tt
Nj
ttt,ttt
DQjisimodE )()],()([),( 1,1,11,
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Условие соответствия 3D-feature points:
— проекция 3D-точки X на кадр t
Алгоритм
Оценка движения (4)
25
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
t
Xu
)(X
D
— множество кадров, на которых X имеет
соответствующую feature point
— коэффициент, берется большим, в статье равен 100
  



DX Xff
t
X
t
X
t
X
tt
D
tt
tt
uuudQ
)(,
211,1,
1
)()(


D — множество всех 3D-feature points
 





t
ifi
tt
Nj
ttt,ttt
DQjisimodE )()],()([),( 1,1,11,
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Трек — последовательность пикселей видео,
связанных по векторам движения
 Связь между пикселями i и i′ разрывается, если:
 Хотя бы один из них отмечен как область открытия
 Ошибка согласованности optical flow
выше некоторого предела (2.0 в статье)
27
Алгоритм
Карта глубины и карта ошибок (1)
)()()( ,11,1,
ididie tttttt
flow
 
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
Красные стрелки —
motion-векторы
Синим отмечены
пиксели трека
Кадр 1 Кадр 2 Кадр 3
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Карта глубины и карта ошибок (2)
 Все пиксели трека p от кадра fl до fr должны соответствовать одной
3D-точке Xp
 Xp оценивается минимизацией среднеквадратического отклонения (RMSE)
 Карта глубины для кадров берется из z координат точек треков,
для всех пикселей записывается RMSE в карту ошибок
28
t
px
)( t
p
ttt
p TXRKx 
t
p
tt
p
t
p
t
p Xzyx TR],,[ 



r
lt
t
p
ttt
p
X
Xx
lrp
2
)T(RK
1
1
minarg
t

G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Большое значение ошибки — пиксель находится
на объекте переднего плана
 Проблема — карта ошибок зашумлена на границах
объектов
Алгоритм
Результаты (1)
29
Кадр
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
Полученная карта глубины Карта ошибок
Ярче — дальше Ярче — больше
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
В случае слежения камеры за объектом строится
неверная карта глубины, и по карте ошибок нельзя
выделить объект
Алгоритм
Результаты (2)
30
Полученная карта глубины Карта ошибокКадр
Ярче — дальше Ярче — больше
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
3D-warping
Выполняется 3D-warping кадров 2l
соседних кадров на текущий с
использованием карты глубины
Красным отмечены точки, не имеющие проекции
31
Различия между полученными
кадрами и текущим позволяют
выявить движущиеся объекты
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Разделение на фон и передний план выполняется
минимизацией функции энергии по α:
Алгоритм
Сегментация
34
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
   

n
t fi Nj
t
SS
t
TT
t
B
t
i
jiGiGiLE
1
)),()()(()( 
t
L
t
SG
t
TG
— функция правдоподобия данных
— условие пространственной гладкости
— условие временной гладкости
ST  , — балансирующие коэффициенты
iN — множество 8 соседних с i-м пикселей
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
37
Кадр последовательности Выделенный объект переднего плана
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
38
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
Кадр последовательности Выделенный объект переднего плана
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Высокая точность сегментации
 Восстановление фона за объектами
Недостатки:
 Очень низкая скорость работы
 Основан на Structure From Motion
39
G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao,
“Moving object extraction with a hand-held camera”, IEEE ICCV,
2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной
и цветовой информации
 Использование информации о смене цветов
на областях открытия
 Заключение
40
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
41
Идея метода
 Выделить кадры со значительными областями
с движением, отличным от глобального
 Выделить на них двигающиеся части объектов
переднего плана (подобъекты)
 Собрав информацию о цвете и расположении
подобъектов, распространить их во времени
F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Motion cues
Motion cue – разница между локальным движением
и глобальным смещением камеры
 Оценка движения
 Глобального (ищутся feature points алгоритмом SIFT,
устанавливаются соответствия и строится
преобразование) — mo(x,y)
 Локального (optical flow) — mg(x,y)
 Вычисление motion cues
42F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
2
2
),(),(),( yxmyxmyxmc go 
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Выделение ключевых кадров
Ключевым называется кадр, на котором объект, либо
его часть совершает заметное движение, отличное
от глобального
Критерии:
 Большое количество пикселей с движением, отличным
от глобального
 Их компактное расположение
43
maxSpanyxmcyx  )),(|),Var(( 
  minAreayxmc )),(( 
— константы
F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
,,minAreamaxSpan
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Выделение движущихся подобъектов (1)
Для каждого кадра строится функция правдоподобия
для произвольного распределения меток “фон”
и “движущийся объект”
На основании информации о цвете:
44
  

},,1{
),ψ(),,1|p(
Mi Nj
jii
i
llMil

 )
)),d((
exp(),ψ(
ji
ll
ll
ji
ji




F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
— множество 8 пикселей, соседних с i-м
),d( ji — разница по цвету между пикселями i и j
il — метка i-го пикселя (-1 — движущийся объект, 1 — фон)
, — константы
iN
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Выделение движущихся подобъектов (2)
На основании информации о движении:
45
),(p}),,1,{|p(
},,1{
m i
Mi
ii lmcMilI 



))(exp()|(pm miiii mcllmc 
F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
m — константа
М — количество пикселей в изображении
— множество 8 пикселей, соседних с i-м
il — метка i-го пикселя (-1 — движущийся объект, 1 — фон)
iN
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Выделение движущихся подобъектов (3)
 Объединяя информацию о цвете и движении, получим
функцию правдоподобия
 Для каждого ключевого кадра находится набор меток
li, её максимизирующий
 Выделяются подобъекты — движущиеся на конкретном
ключевом кадре части объектов
46
   

Ii Ii Nj
jiii
i
lllmc ),ψ()|(pI)|P(L m
— множество всех меток
— множество всех пикселей кадра
L
I
F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Ключевые кадры и motion cues
47F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
Motion cues
Key frames
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Ключевые кадры и подобъекты
48F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
Key frames
Moving sub-objects
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Функция близости пикселя с цветом
c к цветовой модели
 Функция правдоподобия
сегментации с точки зрения
цветовой модели
 Строится распределение цветов в виде Gaussian Mixture Model (GMM)
Алгоритм
Близость по цвету
49
  nigG if ,,1, 
)(max)(affic cgc j
Gg fj

)))((log(affiexp()|(p cc ciiii cllc 
с — константа
Распределение
цветов объектов
F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Удаление фоновых компонент из GMM
 Из-за ошибок выделения
подобъектов в GMM могли
появиться компоненты gi,
связанные с фоном
 Вычисляется мера близости
компоненты GMM к фону
сцены
 Из GMM исключаются все gi
со значениями близости,
превышающими порог
50F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
 Вводится мера пространственной близости точки к выделенным
подобъектам и пространственная функция правдоподобия сегментации
 Вводится обновлённая функция правдоподобия, и еще раз выполняется
сегментация ключевых кадров
Алгоритм
Пространственная близость
51F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
)
2
)()(
exp(max
2
1
)(affi 22s

ji
T
ji
Fj
i
t
xxxx
x



)))((log(affiexp()|(p ss si
t
iii
t
xllx 
s, — константы
F — движущийся объект
)|(logp)|(logp)|(logp)|(logp scm ii
t
sii
t
cii
t
ii
t
lxlclmclf  
cs  , — балансирующие коэффициенты
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Распространение пространственной
информации
Для каждого ключевого кадра k:
 Распространить пространственную информацию
на кадры k+1, k+2, … следующим образом:
1. Инициализировать пространственную функцию
правдоподобия на кадре t+1 функцией кадра t
2. Выделить движущиеся объекты обновленной функцией
правдоподобия
3. По выделенным объектам обновить пространственную
информацию и функцию правдоподобия кадра t+1
4. Если кадр t+1 ключевой и выделенные на шаге 2 объекты
покрывают выделенные ранее, удалить кадр из ключевых
 Аналогично распространить на кадры k-1, k-2, …
52F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
53F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
Кадры последовательности
Результаты сегментации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
54F. Liu, M. Gleicher, “Learning color and locality cues for moving
object detection and segmentation”, IEEE CVPR, 2009
Кадры последовательности
Результаты сегментации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинства:
 Качество сегментации
 Временная целостность выделенных объектов
Недостатки:
 Время работы
 Проблемы при близости объектов к фону по цвету
55
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной и цветовой
информации
 Использование информации о смене
цветов на областях открытия
 Заключение
56
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
T-Junctions
T-Junction — это фигура из двух отрезков,
формирующих букву T, расположенная на местах
резкой смены градиентов на изображении
57N. Apostoloff, A. W. Fitzgibbon, “Learning spatiotemporal T-
junctions for occlusion detection”, IEEE CVPR, 2005
t
y
Пример выделенных T-Junctions. Заметим, что красные отрезки лежат на фоне
сцены, зеленые — на движущихся объектах
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Поиск T-Junctions
 Первым шагом выполняется поиск T-Junctions,
которые выступают как индикаторы областей
открытия
 Таким образом получены спаренные пробы
пикселей из переднего плана и фона
58
t
y
N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Алгоритм
Использование цветовой информации
По выделенным T-Junctions строятся GMM-модели
 Распределения цветов фона и переднего плана сцены
 Смены цвета на областях открытия
59
Кадры последовательности
Модель областей закрытия: каждый
столбец соответствует одному варианту
смены цвета
N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Разделение на фон и передний план происходит
минимизацией для каждого кадра функции энергии:
— условие соответствия модели смены цветов пикселей
///на областях открытия
Алгоритм
Сегментация
60
VWUE 
U — отвечает за близость выделенных объектов по цвету
///к цветовой модели
V — условие пространственной гладкости
W
N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (1)
61
Кадр последовательности
Сегментация без условия
смены цветов
Сегментация с использованием
всех условий
N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (2)
62N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
Исходное видео Результат сегментации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Результаты (3)
63
Исходное видео
Результат сегментации
N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using
spatiotemporal T-junctions”, BMVC, 2007
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Выводы
Достоинство:
 Скорость работы
 Интересная идея решения задачи
Недостатки:
 Основное движение должно быть горизонтальным
 Проблемы с временной целостностью
64
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Содержание
 Введение
 Обработка пространственно-временных срезов
 Проверка условий 3D-геометрии сцены
 Распространение пространственной и цветовой
информации
 Использование информации о смене цветов
на областях открытия
 Заключение
65
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дальнейшие планы (1)
Алгоритм:
1. Оценка движения
2. Построение гистограммы векторов ME
3. Кластеризация гистограммы (Mean-shift)
4. Наибольший кластер — фон, остальные — движущиеся объекты
66
Визуализация гистограммы (высоты соответствуют
количеству векторов с направлением)
Ортогональная проекция гистограммы
(белые – векторы движения фона,
синие – переднего плана)
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дальнейшие планы (2)
67
Результаты сегментации
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Дальнейшие планы (3)
Решить проблемы:
 Разбиения на чрезмерно большое количество
кластеров (пространственным объединением
кластеров)
 Отсутствия временной целостности
68
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Литература
1. Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation
Through Spatio-Temporal Slices Processing”, IEEETransactions on Image
Processing, vol. 2, 2003
2. G. Zhang, X. Qin, W. Hua, T.-T. Wong, P.-A. Heng, H. Bao, “Robust metric
reconstruction from challenging video sequences”, IEEE CVPR, 2007
3. G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object
extraction with a hand-held camera”, IEEE ICCV, 2007
4. F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection
and segmentation”, IEEE CVPR, 2009
5. N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal
T-junctions”, BMVC, 2007
6. N. Apostoloff, A. W. Fitzgibbon, “Learning spatiotemporal T-junctions for
occlusion detection”, IEEE CVPR, 2005
7. V. Kolmogorov, R. Zabih, “What energy functions can be minimized via graph
cuts”, IEEE ECCV, 2002
69
CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus 
Лаборатория компьютерной
графики и мультимедиа
Видеогруппа — это:
 Выпускники в аспирантурах Англии,
Франции, Швейцарии (в России в МГУ и
ИПМ им. Келдыша)
 Выпускниками защищено 5 диссертаций
 Наиболее популярные в мире сравнения
видеокодеков
 Более 3 миллионов скачанных фильтров
обработки видео
70

More Related Content

What's hot

Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоMSU GML VideoGroup
 
Методы повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаМетоды повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаMSU GML VideoGroup
 
Сегментация видео на основе Mean-shift
Сегментация видео на основе Mean-shiftСегментация видео на основе Mean-shift
Сегментация видео на основе Mean-shiftMSU GML VideoGroup
 
Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоMSU GML VideoGroup
 
Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоMSU GML VideoGroup
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)MSU GML VideoGroup
 
Получение глубины из движения камеры
Получение глубины из движения камерыПолучение глубины из движения камеры
Получение глубины из движения камерыMSU GML VideoGroup
 
Некоторые методы матирования видео
Некоторые методы матирования видеоНекоторые методы матирования видео
Некоторые методы матирования видеоMSU GML VideoGroup
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидеоMSU GML VideoGroup
 
Обработка границ объектов при генерации стерео
Обработка границ объектов при генерации стереоОбработка границ объектов при генерации стерео
Обработка границ объектов при генерации стереоMSU GML VideoGroup
 
Точное выделение границ объектов
Точное выделение границ объектовТочное выделение границ объектов
Точное выделение границ объектовMSU GML VideoGroup
 
Способы построения saliency map
Способы построения saliency mapСпособы построения saliency map
Способы построения saliency mapMSU GML VideoGroup
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012MSU GML VideoGroup
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныMSU GML VideoGroup
 
Обзор методов сегментации видео
Обзор методов сегментации видеоОбзор методов сегментации видео
Обзор методов сегментации видеоMSU GML VideoGroup
 
Способы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиСпособы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиMSU GML VideoGroup
 
Использование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоИспользование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоMSU GML VideoGroup
 
Вычитание фона с использованием карт глубины
Вычитание фона с использованием карт глубиныВычитание фона с использованием карт глубины
Вычитание фона с использованием карт глубиныMSU GML VideoGroup
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоMSU GML VideoGroup
 
Обзор методов оценки True-motion
Обзор методов оценки True-motionОбзор методов оценки True-motion
Обзор методов оценки True-motionMSU GML VideoGroup
 

What's hot (20)

Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видео
 
Методы повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаМетоды повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фона
 
Сегментация видео на основе Mean-shift
Сегментация видео на основе Mean-shiftСегментация видео на основе Mean-shift
Сегментация видео на основе Mean-shift
 
Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видео
 
Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видео
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)
 
Получение глубины из движения камеры
Получение глубины из движения камерыПолучение глубины из движения камеры
Получение глубины из движения камеры
 
Некоторые методы матирования видео
Некоторые методы матирования видеоНекоторые методы матирования видео
Некоторые методы матирования видео
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидео
 
Обработка границ объектов при генерации стерео
Обработка границ объектов при генерации стереоОбработка границ объектов при генерации стерео
Обработка границ объектов при генерации стерео
 
Точное выделение границ объектов
Точное выделение границ объектовТочное выделение границ объектов
Точное выделение границ объектов
 
Способы построения saliency map
Способы построения saliency mapСпособы построения saliency map
Способы построения saliency map
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубины
 
Обзор методов сегментации видео
Обзор методов сегментации видеоОбзор методов сегментации видео
Обзор методов сегментации видео
 
Способы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиСпособы построения и оценки карт салиентности
Способы построения и оценки карт салиентности
 
Использование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоИспользование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видео
 
Вычитание фона с использованием карт глубины
Вычитание фона с использованием карт глубиныВычитание фона с использованием карт глубины
Вычитание фона с использованием карт глубины
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стерео
 
Обзор методов оценки True-motion
Обзор методов оценки True-motionОбзор методов оценки True-motion
Обзор методов оценки True-motion
 

Similar to Детектирование объектов переднего плана в видео

Вычисление глубины по одному изображению
Вычисление глубины по одному изображениюВычисление глубины по одному изображению
Вычисление глубины по одному изображениюMSU GML VideoGroup
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матированияMSU GML VideoGroup
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видеоMSU GML VideoGroup
 
Обзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовОбзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовMSU GML VideoGroup
 
Восстановление старых фильмов
Восстановление старых фильмовВосстановление старых фильмов
Восстановление старых фильмовMSU GML VideoGroup
 
Обработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныОбработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныMSU GML VideoGroup
 
Новые методы деинтерлейсинга
Новые методы деинтерлейсингаНовые методы деинтерлейсинга
Новые методы деинтерлейсингаMSU GML VideoGroup
 
Обзор артефактов стерео видео. Временная синхронизация
Обзор артефактов стерео видео. Временная синхронизацияОбзор артефактов стерео видео. Временная синхронизация
Обзор артефактов стерео видео. Временная синхронизацияMSU GML VideoGroup
 
Методы деинтерлейсинга
Методы деинтерлейсингаМетоды деинтерлейсинга
Методы деинтерлейсингаMSU GML VideoGroup
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияMSU GML VideoGroup
 
Исправление стерео видео
Исправление стерео видеоИсправление стерео видео
Исправление стерео видеоMSU GML VideoGroup
 
Разведочный анализ данных: создание графиков в системе R
Разведочный анализ данных: создание графиков в системе RРазведочный анализ данных: создание графиков в системе R
Разведочный анализ данных: создание графиков в системе RSergey Mastitsky
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стереоMSU GML VideoGroup
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Mail.ru Group
 
Обзор методов сравнения фильмов
Обзор методов сравнения фильмовОбзор методов сравнения фильмов
Обзор методов сравнения фильмовMSU GML VideoGroup
 
Обзор некоторОбзор методов поиска и сопровождения особых точек
Обзор некоторОбзор методов поиска и сопровождения особых точекОбзор некоторОбзор методов поиска и сопровождения особых точек
Обзор некоторОбзор методов поиска и сопровождения особых точекMSU GML VideoGroup
 

Similar to Детектирование объектов переднего плана в видео (17)

Вычисление глубины по одному изображению
Вычисление глубины по одному изображениюВычисление глубины по одному изображению
Вычисление глубины по одному изображению
 
Optical Flow на GPU
Optical Flow на GPUOptical Flow на GPU
Optical Flow на GPU
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матирования
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видео
 
Обзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовОбзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектов
 
Восстановление старых фильмов
Восстановление старых фильмовВосстановление старых фильмов
Восстановление старых фильмов
 
Обработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубиныОбработка областей открытия при распространении карт глубины
Обработка областей открытия при распространении карт глубины
 
Новые методы деинтерлейсинга
Новые методы деинтерлейсингаНовые методы деинтерлейсинга
Новые методы деинтерлейсинга
 
Обзор артефактов стерео видео. Временная синхронизация
Обзор артефактов стерео видео. Временная синхронизацияОбзор артефактов стерео видео. Временная синхронизация
Обзор артефактов стерео видео. Временная синхронизация
 
Методы деинтерлейсинга
Методы деинтерлейсингаМетоды деинтерлейсинга
Методы деинтерлейсинга
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображения
 
Исправление стерео видео
Исправление стерео видеоИсправление стерео видео
Исправление стерео видео
 
Разведочный анализ данных: создание графиков в системе R
Разведочный анализ данных: создание графиков в системе RРазведочный анализ данных: создание графиков в системе R
Разведочный анализ данных: создание графиков в системе R
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стерео
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
 
Обзор методов сравнения фильмов
Обзор методов сравнения фильмовОбзор методов сравнения фильмов
Обзор методов сравнения фильмов
 
Обзор некоторОбзор методов поиска и сопровождения особых точек
Обзор некоторОбзор методов поиска и сопровождения особых точекОбзор некоторОбзор методов поиска и сопровождения особых точек
Обзор некоторОбзор методов поиска и сопровождения особых точек
 

Детектирование объектов переднего плана в видео

  • 1. Детектирование объектов переднего плана в видео Александр Новиков Video Group CS MSU Graphics & Media Lab
  • 2. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 2
  • 3. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Постановка задачи Задача — выделить объекты переднего плана в видео Проблемы:  Движение камеры  Необходимость сохранения временной целостности  Изменение внешнего вида объекта во времени 3F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 Кадр последовательности Выделенный объект
  • 4. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Применения  Редактирование видео  Слежение за объектами  Удаление объектов  Конвертация 2D видео в 3D 4
  • 5. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 5
  • 6. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Пространственно- временные срезы (1)  Пространственно-временные срезы — это изображения, получаемые при перемещении в (x,t) [(y,t)] измерениях при фиксированном y [x]  Срезы разделяются на  — горизонтальные, фиксирован y=i  — вертикальные, фиксирован x=j 6 ),(H txiy ),(V tyjx Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003 Горизонтальный срез видео t
  • 7. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Пространственно- временные срезы (2) Структура пространственно- временных срезов позволяет определить вид и направление движения камеры 7 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003 t
  • 8. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Идея метода 1) Разбиение видео на участки с однородным движением камеры и классификация:  Отсутствие движения  Панорамирование  Приближение/отдаление  Сложное движение 2) Восстановление фона сцены 3) Background subtraction и выделение движущихся объектов 8 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 9. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Структура среза H в точке представляется матрицей Г 9 Алгоритм Локальная структура срезов        ttxt xtxx JJ JJ Г          wtx ttt wtx txxt wtx xxx ttxx ttxxttxx ttxx , , , 2 ),(HˆJ ),(Hˆ),(HˆJ ),(HˆJ t G x G tx       H)( Hˆ, H)( Hˆ — частные производные срезов, __сглаженных фильтром Гаусса w — окно 3x3 с центром в некотором пикселе Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 10. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Вычисляется локальная ориентация ϕ в окне w  c — мера того, насколько точно ϕ оценивает локальную ориентацию, с = 1 — точная направленность Алгоритм Локальная направленность 10 xxtt xt JJ J2 tan 2 1 1                    2 , 2 , 2 0, 2         otherwise ]1,0[, )J(J J4)J(J 2 22     cc ttxx xtttxx Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 11. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Гистограмма направленностей  Строится двумерная гистограмма локальных направленностей  На кадрах [k,k+N] выделяется доминирующая траектория {ϕ}, если для них выполняется 11        ,0 ,),( ),ˆ( i x iytxc tM  T t tp Nk kt Nk kt          ),M( )(  ),M(max)( 2/2/ ttp     Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003 TN, — константы, в статье 15 и 0.6  ˆ),( iytx otherwise
  • 12. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Неподвижная камера  Панорамирование  Отдаление/приближение  Иначе — сложное движение t y ϕ Алгоритм Классификация движения камеры 12 ],[ aa   1 ),M( ),M( 0 0      t t t t     aa   , 0a t y ϕ Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003 2  2  2   2  
  • 13. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Выделение фона на срезах  Дискретизация гистограммы  Выделение на срезах пикселей с движением близким к основному (LoS — layer of support) 13 ]90,45( ]45,25( ]25,5( ]5,5[ )5,25[ )25,45[ )45,90[ 7 6 5 4 3 2 1           ki t ik t   ),M()N(         )N(maxargˆ k k otherwise txLoS iy      ˆ ,0 ,1 ),(  t y Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 14. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Восстановление панорамы фона  Пиксели с LoS = 1 считаются принадлежащими фону  Для каждого кадра t выбирается сдвиг где — выбранный для кадра t срез с наибольшим количеством текстурной информации 14               1)1()( )1()( maxargHˆ H iyiy iyiy tntn tCtC iy    x iyiyiy txLoStxctС ),(),()(    x iyiy txLoStn ),()( iyHˆ },)1,(Hˆ),(Hˆmed{minarg)( iyiy xd tdxtxtd   Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 15. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Color back-projection  По LoS для фона инвертированием вычисляется LoS для переднего плана  Строится дискретизованная гистограмма C цветов пикселей со значениями LoS переднего плана = 1  Передний план F вычисляется по формуле: 15 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003 ),()),(Rˆ)),((Сˆ( 2 1 ),F( tXImagetXtXImagetX  Сˆ ),(Rˆ tX — нормализованная карта разницы |Image-Background| — нормализованная гистограмма C
  • 16. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) Background subtraction 16 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 17. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) Color back-projection 17 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 18. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Скорость работы  Восстановление фона Недостатки:  Отсутствие временной целостности  Недостаточно точная сегментация 18 Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEE ToIP, 2003
  • 19. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 19
  • 20. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Схема работы алгоритма 1) Восстановление структуры сцены по движению 2) Оценка движения и глубины  При фиксированной сегментации оцениваются движение и области открытия  Строится карта глубины и карта ошибок геометрии 3) Выделение фона и переднего плана 4) Повторение второго и третьего шагов k (2-3) раз 5) Matting границ выделенных объектов 20 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 21. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Structure From Motion  Выполняется поиск 3D-feature points  Для каждого кадра вычисляются матрицы камеры 21 )( tttt X TXRKu  ttt TRK ,, — матрицы камеры для кадра t t Xu — проекция 3D-точки X на кадр t G. Zhang, X. Qin, W. Hua, T.-T. Wong, P.-A. Heng, H. Bao, “Robust metric reconstruction from challenging video sequences”, IEEE CVPR, 2007 Вставленные объекты демонстрируют определенную геометрию сцены
  • 22. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Оценка движения и поиск областей закрытия выполняется решением задачи минимизации Алгоритм Оценка движения (1) 22      1 1 ,11, , )),(),((minarg n t tttt od odEodE        t ifi tt Nj tttttt DQjisimodE )()],()([),( 1,1,1,1, )( ),,(),( 1, 1,1, DQ jisim tt tttt   — условия соответствия данных, гладкости поля motion- векторов и соответствия 3D-feature points iN — множество 8 пикселей, соседних с i-м )(1, io tt i  — индикатор принадлежности пикселя i области открытия при переходе от кадра t к t+1 )(1, id tt  — motion-вектор пикселя i при переходе с кадра t к t+1 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 23. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus         t ifi tt Nj ttt,ttt DQjisimodE )()],()([),( 1,1,11, Алгоритм Оценка движения (2) Условие соответствия данных: 23 1 ,0 ,0 , },),(min{ ),( )( 1, 11, 11, 1, 1, 1,                    tt i t i t i tt i t i t i tt i o o tt d tt d tt o o o i i im      21 21 1, )()( )()( )( ifif ifif i tt d tt tt d         G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 do  , — константы, в статье 0.5 и 400 соответственно )(it i — индикатор принадлежности пикселя i кадра t переднему плану )(if t — цвет пикселя i кадра t i — пиксель кадра t +1 соответствующий i-тому по dt,t+1
  • 24. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Условие гладкости поля motion-векторов: 1, tt iW Алгоритм Оценка движения (3) 24 1,1,1,1,1,1, ),(),(   tt i tt iw tt j tt io tt ss tt Wooojijis  1 121,1, 1, ,0 },)()(min{ ),(            t j t i t j t is tttt tt s jdid ji    — 1, если для пикселя f t(i) нет соответствующего по dt+1,t ///пикселя в f t+1, 0 — иначе ),(1, jitt s   — мера сонаправленности векторов dt,t+1(i) и dt,t+1(j) s wos  ,, — балансирующие коэффициенты, 0.1, 0.21 и 0.6 в статье — ограничение сверху, 4 в статье G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007        t ifi tt Nj ttt,ttt DQjisimodE )()],()([),( 1,1,11,
  • 25. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Условие соответствия 3D-feature points: — проекция 3D-точки X на кадр t Алгоритм Оценка движения (4) 25 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 t Xu )(X D — множество кадров, на которых X имеет соответствующую feature point — коэффициент, берется большим, в статье равен 100       DX Xff t X t X t X tt D tt tt uuudQ )(, 211,1, 1 )()(   D — множество всех 3D-feature points        t ifi tt Nj ttt,ttt DQjisimodE )()],()([),( 1,1,11,
  • 26. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Трек — последовательность пикселей видео, связанных по векторам движения  Связь между пикселями i и i′ разрывается, если:  Хотя бы один из них отмечен как область открытия  Ошибка согласованности optical flow выше некоторого предела (2.0 в статье) 27 Алгоритм Карта глубины и карта ошибок (1) )()()( ,11,1, ididie tttttt flow   G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 Красные стрелки — motion-векторы Синим отмечены пиксели трека Кадр 1 Кадр 2 Кадр 3
  • 27. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Карта глубины и карта ошибок (2)  Все пиксели трека p от кадра fl до fr должны соответствовать одной 3D-точке Xp  Xp оценивается минимизацией среднеквадратического отклонения (RMSE)  Карта глубины для кадров берется из z координат точек треков, для всех пикселей записывается RMSE в карту ошибок 28 t px )( t p ttt p TXRKx  t p tt p t p t p Xzyx TR],,[     r lt t p ttt p X Xx lrp 2 )T(RK 1 1 minarg t  G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 28. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Большое значение ошибки — пиксель находится на объекте переднего плана  Проблема — карта ошибок зашумлена на границах объектов Алгоритм Результаты (1) 29 Кадр G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 Полученная карта глубины Карта ошибок Ярче — дальше Ярче — больше
  • 29. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  В случае слежения камеры за объектом строится неверная карта глубины, и по карте ошибок нельзя выделить объект Алгоритм Результаты (2) 30 Полученная карта глубины Карта ошибокКадр Ярче — дальше Ярче — больше G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 30. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм 3D-warping Выполняется 3D-warping кадров 2l соседних кадров на текущий с использованием карты глубины Красным отмечены точки, не имеющие проекции 31 Различия между полученными кадрами и текущим позволяют выявить движущиеся объекты G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 31. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Разделение на фон и передний план выполняется минимизацией функции энергии по α: Алгоритм Сегментация 34 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007      n t fi Nj t SS t TT t B t i jiGiGiLE 1 )),()()(()(  t L t SG t TG — функция правдоподобия данных — условие пространственной гладкости — условие временной гладкости ST  , — балансирующие коэффициенты iN — множество 8 соседних с i-м пикселей
  • 32. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) 37 Кадр последовательности Выделенный объект переднего плана G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 33. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) 38 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 Кадр последовательности Выделенный объект переднего плана
  • 34. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Высокая точность сегментации  Восстановление фона за объектами Недостатки:  Очень низкая скорость работы  Основан на Structure From Motion 39 G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007
  • 35. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 40
  • 36. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  41 Идея метода  Выделить кадры со значительными областями с движением, отличным от глобального  Выделить на них двигающиеся части объектов переднего плана (подобъекты)  Собрав информацию о цвете и расположении подобъектов, распространить их во времени F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009
  • 37. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Motion cues Motion cue – разница между локальным движением и глобальным смещением камеры  Оценка движения  Глобального (ищутся feature points алгоритмом SIFT, устанавливаются соответствия и строится преобразование) — mo(x,y)  Локального (optical flow) — mg(x,y)  Вычисление motion cues 42F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 2 2 ),(),(),( yxmyxmyxmc go 
  • 38. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Выделение ключевых кадров Ключевым называется кадр, на котором объект, либо его часть совершает заметное движение, отличное от глобального Критерии:  Большое количество пикселей с движением, отличным от глобального  Их компактное расположение 43 maxSpanyxmcyx  )),(|),Var((    minAreayxmc )),((  — константы F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 ,,minAreamaxSpan
  • 39. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Выделение движущихся подобъектов (1) Для каждого кадра строится функция правдоподобия для произвольного распределения меток “фон” и “движущийся объект” На основании информации о цвете: 44     },,1{ ),ψ(),,1|p( Mi Nj jii i llMil   ) )),d(( exp(),ψ( ji ll ll ji ji     F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 — множество 8 пикселей, соседних с i-м ),d( ji — разница по цвету между пикселями i и j il — метка i-го пикселя (-1 — движущийся объект, 1 — фон) , — константы iN
  • 40. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Выделение движущихся подобъектов (2) На основании информации о движении: 45 ),(p}),,1,{|p( },,1{ m i Mi ii lmcMilI     ))(exp()|(pm miiii mcllmc  F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 m — константа М — количество пикселей в изображении — множество 8 пикселей, соседних с i-м il — метка i-го пикселя (-1 — движущийся объект, 1 — фон) iN
  • 41. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Выделение движущихся подобъектов (3)  Объединяя информацию о цвете и движении, получим функцию правдоподобия  Для каждого ключевого кадра находится набор меток li, её максимизирующий  Выделяются подобъекты — движущиеся на конкретном ключевом кадре части объектов 46      Ii Ii Nj jiii i lllmc ),ψ()|(pI)|P(L m — множество всех меток — множество всех пикселей кадра L I F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009
  • 42. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Ключевые кадры и motion cues 47F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 Motion cues Key frames
  • 43. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Ключевые кадры и подобъекты 48F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 Key frames Moving sub-objects
  • 44. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Функция близости пикселя с цветом c к цветовой модели  Функция правдоподобия сегментации с точки зрения цветовой модели  Строится распределение цветов в виде Gaussian Mixture Model (GMM) Алгоритм Близость по цвету 49   nigG if ,,1,  )(max)(affic cgc j Gg fj  )))((log(affiexp()|(p cc ciiii cllc  с — константа Распределение цветов объектов F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009
  • 45. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Удаление фоновых компонент из GMM  Из-за ошибок выделения подобъектов в GMM могли появиться компоненты gi, связанные с фоном  Вычисляется мера близости компоненты GMM к фону сцены  Из GMM исключаются все gi со значениями близости, превышающими порог 50F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009
  • 46. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus   Вводится мера пространственной близости точки к выделенным подобъектам и пространственная функция правдоподобия сегментации  Вводится обновлённая функция правдоподобия, и еще раз выполняется сегментация ключевых кадров Алгоритм Пространственная близость 51F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 ) 2 )()( exp(max 2 1 )(affi 22s  ji T ji Fj i t xxxx x    )))((log(affiexp()|(p ss si t iii t xllx  s, — константы F — движущийся объект )|(logp)|(logp)|(logp)|(logp scm ii t sii t cii t ii t lxlclmclf   cs  , — балансирующие коэффициенты
  • 47. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Распространение пространственной информации Для каждого ключевого кадра k:  Распространить пространственную информацию на кадры k+1, k+2, … следующим образом: 1. Инициализировать пространственную функцию правдоподобия на кадре t+1 функцией кадра t 2. Выделить движущиеся объекты обновленной функцией правдоподобия 3. По выделенным объектам обновить пространственную информацию и функцию правдоподобия кадра t+1 4. Если кадр t+1 ключевой и выделенные на шаге 2 объекты покрывают выделенные ранее, удалить кадр из ключевых  Аналогично распространить на кадры k-1, k-2, … 52F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009
  • 48. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) 53F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 Кадры последовательности Результаты сегментации
  • 49. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) 54F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 Кадры последовательности Результаты сегментации
  • 50. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинства:  Качество сегментации  Временная целостность выделенных объектов Недостатки:  Время работы  Проблемы при близости объектов к фону по цвету 55
  • 51. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 56
  • 52. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  T-Junctions T-Junction — это фигура из двух отрезков, формирующих букву T, расположенная на местах резкой смены градиентов на изображении 57N. Apostoloff, A. W. Fitzgibbon, “Learning spatiotemporal T- junctions for occlusion detection”, IEEE CVPR, 2005 t y Пример выделенных T-Junctions. Заметим, что красные отрезки лежат на фоне сцены, зеленые — на движущихся объектах
  • 53. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Поиск T-Junctions  Первым шагом выполняется поиск T-Junctions, которые выступают как индикаторы областей открытия  Таким образом получены спаренные пробы пикселей из переднего плана и фона 58 t y N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007
  • 54. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Алгоритм Использование цветовой информации По выделенным T-Junctions строятся GMM-модели  Распределения цветов фона и переднего плана сцены  Смены цвета на областях открытия 59 Кадры последовательности Модель областей закрытия: каждый столбец соответствует одному варианту смены цвета N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007
  • 55. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Разделение на фон и передний план происходит минимизацией для каждого кадра функции энергии: — условие соответствия модели смены цветов пикселей ///на областях открытия Алгоритм Сегментация 60 VWUE  U — отвечает за близость выделенных объектов по цвету ///к цветовой модели V — условие пространственной гладкости W N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007
  • 56. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (1) 61 Кадр последовательности Сегментация без условия смены цветов Сегментация с использованием всех условий N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007
  • 57. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (2) 62N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007 Исходное видео Результат сегментации
  • 58. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Результаты (3) 63 Исходное видео Результат сегментации N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007
  • 59. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Выводы Достоинство:  Скорость работы  Интересная идея решения задачи Недостатки:  Основное движение должно быть горизонтальным  Проблемы с временной целостностью 64
  • 60. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Содержание  Введение  Обработка пространственно-временных срезов  Проверка условий 3D-геометрии сцены  Распространение пространственной и цветовой информации  Использование информации о смене цветов на областях открытия  Заключение 65
  • 61. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дальнейшие планы (1) Алгоритм: 1. Оценка движения 2. Построение гистограммы векторов ME 3. Кластеризация гистограммы (Mean-shift) 4. Наибольший кластер — фон, остальные — движущиеся объекты 66 Визуализация гистограммы (высоты соответствуют количеству векторов с направлением) Ортогональная проекция гистограммы (белые – векторы движения фона, синие – переднего плана)
  • 62. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дальнейшие планы (2) 67 Результаты сегментации
  • 63. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Дальнейшие планы (3) Решить проблемы:  Разбиения на чрезмерно большое количество кластеров (пространственным объединением кластеров)  Отсутствия временной целостности 68
  • 64. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Литература 1. Ch.-W. Ngo, T.-Ch. Pong, H.-J. Zhang, “Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing”, IEEETransactions on Image Processing, vol. 2, 2003 2. G. Zhang, X. Qin, W. Hua, T.-T. Wong, P.-A. Heng, H. Bao, “Robust metric reconstruction from challenging video sequences”, IEEE CVPR, 2007 3. G. Zhang, J. Jia, W. Xiong, T.-T. Wong, P.-A. Heng, H. Bao, “Moving object extraction with a hand-held camera”, IEEE ICCV, 2007 4. F. Liu, M. Gleicher, “Learning color and locality cues for moving object detection and segmentation”, IEEE CVPR, 2009 5. N. Apostoloff, A. Fitzgibbon, “Automatic video segmentation using spatiotemporal T-junctions”, BMVC, 2007 6. N. Apostoloff, A. W. Fitzgibbon, “Learning spatiotemporal T-junctions for occlusion detection”, IEEE CVPR, 2005 7. V. Kolmogorov, R. Zabih, “What energy functions can be minimized via graph cuts”, IEEE ECCV, 2002 69
  • 65. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/ Only for Maxus  Лаборатория компьютерной графики и мультимедиа Видеогруппа — это:  Выпускники в аспирантурах Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)  Выпускниками защищено 5 диссертаций  Наиболее популярные в мире сравнения видеокодеков  Более 3 миллионов скачанных фильтров обработки видео 70