SlideShare a Scribd company logo
Опять признаки: “Сompact” vs “Sparse”




 D. J. Field, “What is the goal of sensory coding?,” Neural
 Computation, vol. 6, no. 4, pp. 559–601, 1994.
Разреженное кодирование
Биологические причины
• Поиск особенностей и сопоставление
  • Веро
    Вероятность отклика каждой отдельной клетки
           ос о        а а ой о е      ой е
    (переменной) низка
  • Вероятность случайного (ложного) повторения того же
    самого шаблона тоже низка
• Хранение данных в ассоциативной памяти
  • Если данных разрежены (sparcified), то сети позволяют
    хранить больше данных, и извлекать их быстрее
Формализация

                        x ∈ ℜn                            n ×m
  y ∈ℜ                                             D ∈ℜ
         m
             - сигнал            - представление


                          y = Dx
                            x0<L


• 0-норма – «псевдонорма», равна количеству ненулевых
      р          д    р   ,р               у    у
элементов вектора x
• Поскольку точного равенства достичь нельзя, ищем
минимум нормы ||Dx y|| при условии разреженного
                ||Dx-y||
представления x
Свойства простых клеток

• Рецептивные поля простых клеток в
  визуальной коре головного мозга
           й
  обладают следующими свойствами
    •   Пространственно локализованные
        П
    •   Ориентированные
    •   Заданная полоса частот (bandpass)
         – Чувствительны к структуре на определенном
           пространственном масштабе


• Гипотеза: стратегия кодирования сигнала,
  максимизирующая разреженность,
  достаточна для объяснения этих свойств
B.A. Olshausen and B.J. Field, Emergence of simple-cell receptive field
                                              simple cell
properties by learning a sparse code for natural images, Nature, 381
(1996), pp. 607–609.
Разреженное представление




 • Словарь, полученный с помощью обучения без
 учителя (кластеризации) с учётом
         (кластеризации),
 предположения (условия) разреженности
 представления
Сравнение с фильтрами Габора




Фильтры            Обученный «словарь»
                     у             р
 Габора
Алгоритмы выбора x

y = Dx            x0<L

• В общем случае при 0-норме задача NP-
  сложная
• Разработан ряд приближенных жадных
  методов
  •   Basis Pursuit
  •   Matching Pursuit
  •   Orthogonal M t hi P
      O th      l Matching Pursuit
                                it
  •   LARS-Lasso
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
Matching Pursuit
К-SVD
  • Обобщение метода K-средних для
    обучения словаря
  • Задача:

  • Итеративный алгоритм:
      •   Инициализация словаря
      •   Повторяем:
           – Получаем разреженное представление X по D, Y
                у     р р            р
              » Orthogonal matching pursuit
           – Для каждого k=1,K
              » Обновляем атом dk с помощью SVD разложения


M. Ah
M Aharon, M El d and A M B k t i “Th K SVD an algorithm f designing
           M. Elad, d A. M. Bruckstein, “The K-SVD:          l ith for d i i
of overcomplete dictionaries for sparse representation,” IEEE Trans. Signal
Process., vol. 54, no. 11, pp. 4311–4322, 2006.
Image-Signature Dictionary




M. Aharon and M. Elad, “Sparse and redundant modeling of image
content using an image-signature-dictionary,” SIAM Journal on Imaging
Sciences, vol. 1, no. 3, pp. 228–247, 2008.
Применение
• Шумоподавление, реконструкция
  изображений,
  изображений распознавание
• Схема шумоподавления:
  • Построение словаря
    – По исходному изображениям (или даже по
      зашумленным!)
    – Примеры: ISD размером 75x75, патчи 8x8, L=2, 110000
      примеров
  • Кодирование
    – Использование OMP
    – Добавляем атомы, пока ошибка не превысит 1.1 * sigma
    – Sigma – оценка шума в исходном изображении
Пример
Реконструкция
Реконструкция изображений
Реконструкция изображений
Использование для классификации
   • Идея:
       • Обучим по словарю д каждого класса объектов
            у           р для      д
       • Новому сигналу назначим класс, реконструкция по
         которому наиболее точная
   • Детали:
       • Построим ROC-кривую по параметру L для
         реконструкции по каждому словарю
       • Построим словари для разных разрешений и разных
         классов
       • Набор ROC-кривых составит вектор-признак для
         классификации



J. Mairal, M. Leordeanu, F. Bach, M. Hebert,
J Mairal M Leordeanu F Bach M Hebert and J Ponce Discriminative sparse
                                               J. Ponce.
image models for class-specic edge detection and image interpretation. In
Proceedings of the European Conference on Computer Vision (ECCV), 2008b
Многомасштабный классификатор
Поиск краёв




•   Обучающая выборка – результат C
    Об             б                Canny, выбор хороших/плохих
                                             б           /
    краёв по отсегментированным пользователем изображениям
•   14 классификаторов, 7 р
             ф       р , размеров фр
                                р фрагментов, 2 р р
                                               , разрешения ( (макс
    и половина), k=256, по 150000 фрагментов для хороших / плохих
    краёв, L=6
Поиск краев




Исходное      Канни   По
 словарю
Поиск краев




Исходное      Канни   По словарю
Детектор краёв для класса




         One vs All классификатор
Аутентификация картин




J. M. Hugues, D. J. Graham, and D. N. Rockmore. Quantication of artistic style through sparse
coding analysis in the drawings of Pieter Bruegel the Elder. Proceedings of the National Academy
of Science, TODO USA, 107(4):1279-1283, 2009
Аутентификация картин
Аутентификация картин
Аутентификация картин

More Related Content

Viewers also liked

20081109 structuralcomplexitytheory lecture07-08
20081109 structuralcomplexitytheory lecture07-0820081109 structuralcomplexitytheory lecture07-08
20081109 structuralcomplexitytheory lecture07-08Computer Science Club
 
20090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture0220090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture02Computer Science Club
 
20071021 verification konev_lecture06
20071021 verification konev_lecture0620071021 verification konev_lecture06
20071021 verification konev_lecture06
Computer Science Club
 
20081005 auctions nikolenko_lecture02
20081005 auctions nikolenko_lecture0220081005 auctions nikolenko_lecture02
20081005 auctions nikolenko_lecture02Computer Science Club
 
20090222 parallel programming_lecture01-07
20090222 parallel programming_lecture01-0720090222 parallel programming_lecture01-07
20090222 parallel programming_lecture01-07Computer Science Club
 
20080217 efficientalgorithms kulikov_lecture13
20080217 efficientalgorithms kulikov_lecture1320080217 efficientalgorithms kulikov_lecture13
20080217 efficientalgorithms kulikov_lecture13Computer Science Club
 
20070930 efficientalgorithms kulikov_lecture02
20070930 efficientalgorithms kulikov_lecture0220070930 efficientalgorithms kulikov_lecture02
20070930 efficientalgorithms kulikov_lecture02Computer Science Club
 
20081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-1220081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-12Computer Science Club
 
20110224 systems of_typed_lambda_calculi_moskvin_lecture01
20110224 systems of_typed_lambda_calculi_moskvin_lecture0120110224 systems of_typed_lambda_calculi_moskvin_lecture01
20110224 systems of_typed_lambda_calculi_moskvin_lecture01Computer Science Club
 
20110522 systems of typed lambda_calculi_moskvin_lecture11
20110522 systems of typed lambda_calculi_moskvin_lecture1120110522 systems of typed lambda_calculi_moskvin_lecture11
20110522 systems of typed lambda_calculi_moskvin_lecture11Computer Science Club
 

Viewers also liked (11)

20081109 structuralcomplexitytheory lecture07-08
20081109 structuralcomplexitytheory lecture07-0820081109 structuralcomplexitytheory lecture07-08
20081109 structuralcomplexitytheory lecture07-08
 
20090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture0220090920 cryptoprotocols nikolenko_lecture02
20090920 cryptoprotocols nikolenko_lecture02
 
20071021 verification konev_lecture06
20071021 verification konev_lecture0620071021 verification konev_lecture06
20071021 verification konev_lecture06
 
20081005 auctions nikolenko_lecture02
20081005 auctions nikolenko_lecture0220081005 auctions nikolenko_lecture02
20081005 auctions nikolenko_lecture02
 
20090222 parallel programming_lecture01-07
20090222 parallel programming_lecture01-0720090222 parallel programming_lecture01-07
20090222 parallel programming_lecture01-07
 
20080217 efficientalgorithms kulikov_lecture13
20080217 efficientalgorithms kulikov_lecture1320080217 efficientalgorithms kulikov_lecture13
20080217 efficientalgorithms kulikov_lecture13
 
20070930 efficientalgorithms kulikov_lecture02
20070930 efficientalgorithms kulikov_lecture0220070930 efficientalgorithms kulikov_lecture02
20070930 efficientalgorithms kulikov_lecture02
 
20081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-1220081123 structuralcomplexitytheory lecture11-12
20081123 structuralcomplexitytheory lecture11-12
 
20100926 ontology konev_lecture05
20100926 ontology konev_lecture0520100926 ontology konev_lecture05
20100926 ontology konev_lecture05
 
20110224 systems of_typed_lambda_calculi_moskvin_lecture01
20110224 systems of_typed_lambda_calculi_moskvin_lecture0120110224 systems of_typed_lambda_calculi_moskvin_lecture01
20110224 systems of_typed_lambda_calculi_moskvin_lecture01
 
20110522 systems of typed lambda_calculi_moskvin_lecture11
20110522 systems of typed lambda_calculi_moskvin_lecture1120110522 systems of typed lambda_calculi_moskvin_lecture11
20110522 systems of typed lambda_calculi_moskvin_lecture11
 

Similar to 20100919 computer vision_konushin_lecture04

CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrievalAnton Konushin
 
CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.
Anton Konushin
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03Computer Science Club
 
CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.
Anton Konushin
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»seik0ixtem
 
20100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture0220100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture02Computer Science Club
 
CV2011-2. Lecture 12. Face models.
CV2011-2. Lecture 12.  Face models.CV2011-2. Lecture 12.  Face models.
CV2011-2. Lecture 12. Face models.Anton Konushin
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01Computer Science Club
 
CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.Anton Konushin
 
CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.Anton Konushin
 
Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)Pavel Egorov
 
Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017
Nikita Zhiltsov
 
Презентация "О распознавании образов в искусственном интеллекте"
Презентация "О распознавании образов в искусственном интеллекте"Презентация "О распознавании образов в искусственном интеллекте"
Презентация "О распознавании образов в искусственном интеллекте"
ph.d. Dmitry Stepanov
 
Логические алгоритмы классификации
Логические алгоритмы классификацииЛогические алгоритмы классификации
Логические алгоритмы классификации
yaevents
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Mail.ru Group
 
L05 features
L05 featuresL05 features
L05 features
Victor Kulikov
 
Классификация изображений
Классификация изображенийКлассификация изображений
Классификация изображенийLiloSEA
 
Классификация изображений
Классификация изображенийКлассификация изображений
Классификация изображенийLiloSEA
 
word2vec (part 1)
word2vec (part 1)word2vec (part 1)
word2vec (part 1)
Denis Dus
 
L06 detection
L06 detectionL06 detection
L06 detection
Victor Kulikov
 

Similar to 20100919 computer vision_konushin_lecture04 (20)

CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrieval
 
CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.CV2015. Лекция 6. Нейросетевые алгоритмы.
CV2015. Лекция 6. Нейросетевые алгоритмы.
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03
 
CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»
 
20100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture0220100919 computer vision_konushin_lecture02
20100919 computer vision_konushin_lecture02
 
CV2011-2. Lecture 12. Face models.
CV2011-2. Lecture 12.  Face models.CV2011-2. Lecture 12.  Face models.
CV2011-2. Lecture 12. Face models.
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01
 
CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.
 
CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.
 
Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)Машинное обучение (Открытый семинар по средам)
Машинное обучение (Открытый семинар по средам)
 
Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017Современные средства NLP в поисковых задач - Стачка 2017
Современные средства NLP в поисковых задач - Стачка 2017
 
Презентация "О распознавании образов в искусственном интеллекте"
Презентация "О распознавании образов в искусственном интеллекте"Презентация "О распознавании образов в искусственном интеллекте"
Презентация "О распознавании образов в искусственном интеллекте"
 
Логические алгоритмы классификации
Логические алгоритмы классификацииЛогические алгоритмы классификации
Логические алгоритмы классификации
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
 
L05 features
L05 featuresL05 features
L05 features
 
Классификация изображений
Классификация изображенийКлассификация изображений
Классификация изображений
 
Классификация изображений
Классификация изображенийКлассификация изображений
Классификация изображений
 
word2vec (part 1)
word2vec (part 1)word2vec (part 1)
word2vec (part 1)
 
L06 detection
L06 detectionL06 detection
L06 detection
 

More from Computer Science Club

20141223 kuznetsov distributed
20141223 kuznetsov distributed20141223 kuznetsov distributed
20141223 kuznetsov distributed
Computer Science Club
 
Computer Vision
Computer VisionComputer Vision
Computer Vision
Computer Science Club
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
Computer Science Club
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs
Computer Science Club
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
Computer Science Club
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12Computer Science Club
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
Computer Science Club
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10Computer Science Club
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09Computer Science Club
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02Computer Science Club
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01Computer Science Club
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04Computer Science Club
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01Computer Science Club
 

More from Computer Science Club (20)

20141223 kuznetsov distributed
20141223 kuznetsov distributed20141223 kuznetsov distributed
20141223 kuznetsov distributed
 
Computer Vision
Computer VisionComputer Vision
Computer Vision
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04
 
20140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-0320140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-03
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01
 
20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 

20100919 computer vision_konushin_lecture04

  • 1. Опять признаки: “Сompact” vs “Sparse” D. J. Field, “What is the goal of sensory coding?,” Neural Computation, vol. 6, no. 4, pp. 559–601, 1994.
  • 3. Биологические причины • Поиск особенностей и сопоставление • Веро Вероятность отклика каждой отдельной клетки ос о а а ой о е ой е (переменной) низка • Вероятность случайного (ложного) повторения того же самого шаблона тоже низка • Хранение данных в ассоциативной памяти • Если данных разрежены (sparcified), то сети позволяют хранить больше данных, и извлекать их быстрее
  • 4. Формализация x ∈ ℜn n ×m y ∈ℜ D ∈ℜ m - сигнал - представление y = Dx x0<L • 0-норма – «псевдонорма», равна количеству ненулевых р д р ,р у у элементов вектора x • Поскольку точного равенства достичь нельзя, ищем минимум нормы ||Dx y|| при условии разреженного ||Dx-y|| представления x
  • 5. Свойства простых клеток • Рецептивные поля простых клеток в визуальной коре головного мозга й обладают следующими свойствами • Пространственно локализованные П • Ориентированные • Заданная полоса частот (bandpass) – Чувствительны к структуре на определенном пространственном масштабе • Гипотеза: стратегия кодирования сигнала, максимизирующая разреженность, достаточна для объяснения этих свойств B.A. Olshausen and B.J. Field, Emergence of simple-cell receptive field simple cell properties by learning a sparse code for natural images, Nature, 381 (1996), pp. 607–609.
  • 6. Разреженное представление • Словарь, полученный с помощью обучения без учителя (кластеризации) с учётом (кластеризации), предположения (условия) разреженности представления
  • 7. Сравнение с фильтрами Габора Фильтры Обученный «словарь» у р Габора
  • 8. Алгоритмы выбора x y = Dx x0<L • В общем случае при 0-норме задача NP- сложная • Разработан ряд приближенных жадных методов • Basis Pursuit • Matching Pursuit • Orthogonal M t hi P O th l Matching Pursuit it • LARS-Lasso
  • 20. К-SVD • Обобщение метода K-средних для обучения словаря • Задача: • Итеративный алгоритм: • Инициализация словаря • Повторяем: – Получаем разреженное представление X по D, Y у р р р » Orthogonal matching pursuit – Для каждого k=1,K » Обновляем атом dk с помощью SVD разложения M. Ah M Aharon, M El d and A M B k t i “Th K SVD an algorithm f designing M. Elad, d A. M. Bruckstein, “The K-SVD: l ith for d i i of overcomplete dictionaries for sparse representation,” IEEE Trans. Signal Process., vol. 54, no. 11, pp. 4311–4322, 2006.
  • 21. Image-Signature Dictionary M. Aharon and M. Elad, “Sparse and redundant modeling of image content using an image-signature-dictionary,” SIAM Journal on Imaging Sciences, vol. 1, no. 3, pp. 228–247, 2008.
  • 22. Применение • Шумоподавление, реконструкция изображений, изображений распознавание • Схема шумоподавления: • Построение словаря – По исходному изображениям (или даже по зашумленным!) – Примеры: ISD размером 75x75, патчи 8x8, L=2, 110000 примеров • Кодирование – Использование OMP – Добавляем атомы, пока ошибка не превысит 1.1 * sigma – Sigma – оценка шума в исходном изображении
  • 27. Использование для классификации • Идея: • Обучим по словарю д каждого класса объектов у р для д • Новому сигналу назначим класс, реконструкция по которому наиболее точная • Детали: • Построим ROC-кривую по параметру L для реконструкции по каждому словарю • Построим словари для разных разрешений и разных классов • Набор ROC-кривых составит вектор-признак для классификации J. Mairal, M. Leordeanu, F. Bach, M. Hebert, J Mairal M Leordeanu F Bach M Hebert and J Ponce Discriminative sparse J. Ponce. image models for class-specic edge detection and image interpretation. In Proceedings of the European Conference on Computer Vision (ECCV), 2008b
  • 29. Поиск краёв • Обучающая выборка – результат C Об б Canny, выбор хороших/плохих б / краёв по отсегментированным пользователем изображениям • 14 классификаторов, 7 р ф р , размеров фр р фрагментов, 2 р р , разрешения ( (макс и половина), k=256, по 150000 фрагментов для хороших / плохих краёв, L=6
  • 30. Поиск краев Исходное Канни По словарю
  • 31. Поиск краев Исходное Канни По словарю
  • 32. Детектор краёв для класса One vs All классификатор
  • 33. Аутентификация картин J. M. Hugues, D. J. Graham, and D. N. Rockmore. Quantication of artistic style through sparse coding analysis in the drawings of Pieter Bruegel the Elder. Proceedings of the National Academy of Science, TODO USA, 107(4):1279-1283, 2009