Your SlideShare is downloading. ×
Антон Конушин_Введение
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Антон Конушин_Введение

743

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
743
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
16
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Смотрим, какие объекты перекрывают другие
  • It is commonly accepted that the father of Computer Vision is Larry Roberts, who in his Ph.D. thesis (cir. 1960) at MIT discussed the possibilities of extracting 3D geometrical information from 2D perspective views of blocks (polyhedra) [1]. Many researchers, at MIT and elsewhere, in Artificial Intelligence, followed this work and studied computer vision in the context of the blocks world.
  • Low-level image processing algorithms are applied to 2D images to obtain the ``primal sketch” (directed edge segments, etc.), from which a 2.5 D sketch of the scene is obtained using binocular stereo. Finally, high-level (structural analysis, a priori knowledge) techniques are used to get 3D model representations of the objects in the scene. This is probably the single most influential work in computer vision ever. Many researchers cried: ``From the paradigm created for us by Marr, no one can drive us out.”
  • ИИ-полная задача
  • Why would this be useful? Main reason is focus. Also enables “smart” cropping.
  • Amnon Shashua
  • Transcript

    • 1. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ Конушин Антон CSEDays-2010
    • 2. Задача
      • Понять, что запечатлено на изображении
      Мы видим Компьютер видит Source: S. Narasimhan
    • 3. Что мы можем сказать про изображение?
    • 4. Категория изображения
      • outdoor
      • city
    • 5. Найти интересные объекты (людей)
    • 6. Семантическая сегментация mountain building tree people street lamp tree sky
    • 7. Идентификация: что это за здание?
    • 8. Почему это сложно?
    • 9. Michelangelo 1475-1564 slide credit: Fei-Fei, Fergus & Torralba Проблемы : точка наблюдения
    • 10. Проблемы : освещение Source: J. Koenderink
    • 11. Проблемы: масштаб Slide credit: Fei-Fei, Fergus & Torralba
    • 12. Проблемы: деформации Xu, Beihong 1943 Slide credit: Fei-Fei, Fergus & Torralba
    • 13. Проблемы: перекрытия Magritte, 1957 slide credit: Fei-Fei, Fergus & Torralba
    • 14. Проблемы: текстуры и беспорядок
    • 15. Проблемы: движение
    • 16. Проблемы: внутриклассовая изменчивость slide credit: Fei-Fei, Fergus & Torralba
    • 17. Проблемы: локальная неоднозначность slide credit: Fei-Fei, Fergus & Torralba
    • 18. Сложности или возможности?
      • Изображение запутывает, но дает много подсказок
      • Наша задача – интерпретировать подсказки
      Image source: J. Koenderink
    • 19. Цвет и текстура
    • 20. Тени и освещение Source: J. Koenderink
    • 21. Отбрасываемые тени Source: J. Koenderink
    • 22. Перспектива
    • 23. Дымка
    • 24. Упорядочивание по глубине Source: J. Koenderink
    • 25. Форма: текстурный градиент
    • 26. Резюме
      • Распознавание изображений изначально нечеткая задача
        • Разные 3 D сцены дают одно и то же 2 D изображение
      Image source: F. Durand
    • 27. История: Л.Дж. Робертс 1960 г: L. G. Roberts, Machine Perception of Three Dimensional Solids, Ph.D. thesis, MIT Department of Electrical Engineering, 1963.
    • 28. История: Давид Марр (1980)
      • « Primal sketch »
        • Низкоуровневые (« low-level » ) свойства изображения: направленные края, отрезки и т.д.
      • «2.5 D sketch »
        • Упорядочивание по глубине (бинокулярное стерое), учёт текстуры и т.д.
      • « 3D model »
        • Распознавание объектов и представление о 3х мерном мире
      • Marr prize (!)
    • 29. Зрение человека
        • 25+% мозга отвечает за зрение
    • 30. Как человек видит…
    • 31. Устройство глаза
    • 32. Что мы на самом деле видим
    • 33. Движения глаз
    • 34. Что сейчас работает?
      • Изображения и видео повсюду
      • Бурно растущая область
        • Распознавание текста, лиц, улыбки
        • Идентификация по отпечаткам пальцев, радужке, лицу (лицу – плохо)
        • Распознавание пола, возраста человека
        • Классификация изображений (сотни классов)
        • Поиск изображений в базах
        • Распознавание человека, машин в видео
    • 35. Распространение изображений 29.03.10 Slide Personal photo albums Surveillance and security Movies, news, sports
    • 36. Распознавание текста Digit recognition, AT&T labs http:// www.research.att.com/~yann / License plate readers http:// en.wikipedia.org/wiki/Automatic_number_plate_recognition Source: S. Seitz
    • 37. Поиск лиц
      • В бытовых фотокамерах!
        • Canon, Sony, Fuji, …
      Source: S. Seitz
    • 38. Поиск улыбки Sony Cyber-shot® T70 Digital Still Camera Source: S. Seitz
    • 39. Распознавание лиц Кто она? Source: S. Seitz
    • 40. Биометрия “ How the Afghan Girl was Identified by Her Iris Patterns ” Read the story Source: S. Seitz
    • 41. Идентификация пользователя Fingerprint scanners on many new laptops, other devices Face recognition systems now beginning to appear more widely http:// www.sensiblevision.com / Source: S. Seitz
    • 42. Распознавание объектов
      • Microsoft Research
      Source: S. Seitz
    • 43. iPhone Apps (www.kooaba.com)
    • 44. Умные машины
      • Mobileye
        • Топ-модели от BMW, GM, Volvo
        • К 2010: 70% производителей машин
      Source: S. Seitz
    • 45.
      • Посмотрим, как работает классификация изображений….

    ×