Антон Конушин_Введение

950 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
950
On SlideShare
0
From Embeds
0
Number of Embeds
367
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Смотрим, какие объекты перекрывают другие
  • It is commonly accepted that the father of Computer Vision is Larry Roberts, who in his Ph.D. thesis (cir. 1960) at MIT discussed the possibilities of extracting 3D geometrical information from 2D perspective views of blocks (polyhedra) [1]. Many researchers, at MIT and elsewhere, in Artificial Intelligence, followed this work and studied computer vision in the context of the blocks world.
  • Low-level image processing algorithms are applied to 2D images to obtain the ``primal sketch” (directed edge segments, etc.), from which a 2.5 D sketch of the scene is obtained using binocular stereo. Finally, high-level (structural analysis, a priori knowledge) techniques are used to get 3D model representations of the objects in the scene. This is probably the single most influential work in computer vision ever. Many researchers cried: ``From the paradigm created for us by Marr, no one can drive us out.”
  • ИИ-полная задача
  • Why would this be useful? Main reason is focus. Also enables “smart” cropping.
  • Amnon Shashua
  • Антон Конушин_Введение

    1. 1. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ Конушин Антон CSEDays-2010
    2. 2. Задача <ul><li>Понять, что запечатлено на изображении </li></ul>Мы видим Компьютер видит Source: S. Narasimhan
    3. 3. Что мы можем сказать про изображение?
    4. 4. Категория изображения <ul><li>outdoor </li></ul><ul><li>city </li></ul><ul><li>… </li></ul>
    5. 5. Найти интересные объекты (людей)
    6. 6. Семантическая сегментация mountain building tree people street lamp tree sky
    7. 7. Идентификация: что это за здание?
    8. 8. Почему это сложно?
    9. 9. Michelangelo 1475-1564 slide credit: Fei-Fei, Fergus & Torralba Проблемы : точка наблюдения
    10. 10. Проблемы : освещение Source: J. Koenderink
    11. 11. Проблемы: масштаб Slide credit: Fei-Fei, Fergus & Torralba
    12. 12. Проблемы: деформации Xu, Beihong 1943 Slide credit: Fei-Fei, Fergus & Torralba
    13. 13. Проблемы: перекрытия Magritte, 1957 slide credit: Fei-Fei, Fergus & Torralba
    14. 14. Проблемы: текстуры и беспорядок
    15. 15. Проблемы: движение
    16. 16. Проблемы: внутриклассовая изменчивость slide credit: Fei-Fei, Fergus & Torralba
    17. 17. Проблемы: локальная неоднозначность slide credit: Fei-Fei, Fergus & Torralba
    18. 18. Сложности или возможности? <ul><li>Изображение запутывает, но дает много подсказок </li></ul><ul><li>Наша задача – интерпретировать подсказки </li></ul>Image source: J. Koenderink
    19. 19. Цвет и текстура
    20. 20. Тени и освещение Source: J. Koenderink
    21. 21. Отбрасываемые тени Source: J. Koenderink
    22. 22. Перспектива
    23. 23. Дымка
    24. 24. Упорядочивание по глубине Source: J. Koenderink
    25. 25. Форма: текстурный градиент
    26. 26. Резюме <ul><li>Распознавание изображений изначально нечеткая задача </li></ul><ul><ul><li>Разные 3 D сцены дают одно и то же 2 D изображение </li></ul></ul>Image source: F. Durand
    27. 27. История: Л.Дж. Робертс 1960 г: L. G. Roberts, Machine Perception of Three Dimensional Solids, Ph.D. thesis, MIT Department of Electrical Engineering, 1963.
    28. 28. История: Давид Марр (1980) <ul><li>« Primal sketch » </li></ul><ul><ul><li>Низкоуровневые (« low-level » ) свойства изображения: направленные края, отрезки и т.д. </li></ul></ul><ul><li>«2.5 D sketch » </li></ul><ul><ul><li>Упорядочивание по глубине (бинокулярное стерое), учёт текстуры и т.д. </li></ul></ul><ul><li>« 3D model » </li></ul><ul><ul><li>Распознавание объектов и представление о 3х мерном мире </li></ul></ul><ul><li>Marr prize (!) </li></ul>
    29. 29. Зрение человека <ul><ul><li>25+% мозга отвечает за зрение </li></ul></ul>
    30. 30. Как человек видит…
    31. 31. Устройство глаза
    32. 32. Что мы на самом деле видим
    33. 33. Движения глаз
    34. 34. Что сейчас работает? <ul><li>Изображения и видео повсюду </li></ul><ul><li>Бурно растущая область </li></ul><ul><ul><li>Распознавание текста, лиц, улыбки </li></ul></ul><ul><ul><li>Идентификация по отпечаткам пальцев, радужке, лицу (лицу – плохо) </li></ul></ul><ul><ul><li>Распознавание пола, возраста человека </li></ul></ul><ul><ul><li>Классификация изображений (сотни классов) </li></ul></ul><ul><ul><li>Поиск изображений в базах </li></ul></ul><ul><ul><li>Распознавание человека, машин в видео </li></ul></ul>
    35. 35. Распространение изображений 29.03.10 Slide Personal photo albums Surveillance and security Movies, news, sports
    36. 36. Распознавание текста Digit recognition, AT&T labs http:// www.research.att.com/~yann / License plate readers http:// en.wikipedia.org/wiki/Automatic_number_plate_recognition Source: S. Seitz
    37. 37. Поиск лиц <ul><li>В бытовых фотокамерах! </li></ul><ul><ul><li>Canon, Sony, Fuji, … </li></ul></ul>Source: S. Seitz
    38. 38. Поиск улыбки Sony Cyber-shot® T70 Digital Still Camera Source: S. Seitz
    39. 39. Распознавание лиц Кто она? Source: S. Seitz
    40. 40. Биометрия “ How the Afghan Girl was Identified by Her Iris Patterns ” Read the story Source: S. Seitz
    41. 41. Идентификация пользователя Fingerprint scanners on many new laptops, other devices Face recognition systems now beginning to appear more widely http:// www.sensiblevision.com / Source: S. Seitz
    42. 42. Распознавание объектов <ul><li>Microsoft Research </li></ul>Source: S. Seitz
    43. 43. iPhone Apps (www.kooaba.com)
    44. 44. Умные машины <ul><li>Mobileye </li></ul><ul><ul><li>Топ-модели от BMW, GM, Volvo </li></ul></ul><ul><ul><li>К 2010: 70% производителей машин </li></ul></ul>Source: S. Seitz
    45. 45. <ul><li>Посмотрим, как работает классификация изображений…. </li></ul>

    ×