SlideShare a Scribd company logo
1 of 31
Построение гендерного классификатора  Результаты экспериментов и пути дальнейшего улучшения алгоритма Лев Шмаглит Ярославский государственный университет им. П.Г. Демидова 150000, г. Ярославль, ул. Советская, 14 Физический факультет Кафедра динамики электронных систем
План доклада: ,[object Object],[object Object],[object Object]
Понимание изображений Небо Дорога Знак Машина Машина Машина Машина Машина Машина Здание [ Ivan  Laptev . Human Action Recognition // MCVS 2011 ]
Понимание изображений [ Andrew Zisserman. Visual Search and Recognition // MCVS 2011 ] Набор классов Детектирование Автобус Машина Распознавание Классификация
Детектирование ,[object Object],K K K «не лицо» «лицо» ,[object Object],[object Object]
Классификация Машинное обучение
Понимание изображений (компьютерное зрение) Детектирование + Распознавание Классификация (машинное обучение) Оптимизация
Сколько пикселей относится к «людям»? [ Ivan  Laptev . Human Action Recognition // MCVS 2011 ]
Сколько пикселей относится к «людям»? [ Ivan  Laptev . Human Action Recognition // MCVS 2011 ]
Сколько пикселей относится к «людям»? [ Ivan  Laptev . Human Action Recognition // MCVS 2011 ]
План доклада: ,[object Object],[object Object],[object Object]
Постановка задачи Исходное  изображение Изображение с  выделенными  лицами Распознавание  пола м м м ж ж Применение: ,[object Object],[object Object]
Пример работы алгоритма
Схема работы алгоритма
Алгоритм на базе  SNoW ,[object Object],001010010 Представление в виде вектора 82 Пересчет в виде индекса Классификатор Процедура обновления весов
Классификаторы  KDDA  и  SVM Линейные классификаторы с использованием ядра для внесения нелинейности: ядерная функция Гаусса KDDA   SVM
Методика обучения и тестирования
База обучающих изображений ,[object Object],[object Object],[object Object],[object Object],Мужчины Женщины Дети
Результаты экспериментов Классификатор  KDDA 81,5% Классификатор  SVM 89%
План доклада: ,[object Object],[object Object],[object Object]
Подходы связанные с модификацией схемы алгоритма ,[object Object],Выделенная область квадратная, она наложена на лицо не точно,   как по положению, так и по масштабу Реализация:   а) оценка положения глаз  б) выделение овальной маской, захватывающей определенный процент лицевых пикселей, классифицированных до этого по цвету;   в) фильтрация краевых эффектов. Потенциальный выигрыш:  3 - 5 %
Подходы связанные с модификацией схемы алгоритма ,[object Object],Лица могут быть очень похожи, в то время как другие части тела и одежда могут сильно отличаться Реализация:   эмпирическое задание рамки, захватывающей нужные области,  исходя из размера и положения детектированного лица Потенциальный выигрыш:  5 - 10%
Подходы связанные с модификацией схемы алгоритма ,[object Object],Переход в пространство признаков позволяет достичь:  а) инвариантности к масштабу, освещенности, положению и т.п.; б) выделения особенностей, характерных тому или иному классу. Реализация:   дескрипторы  SIFT, PHOW, HOG,  реализованные в библиотеках  VL-Feet  и  OpenCV Потенциальный выигрыш:  5 - 15%
SIFT  дескрипторы [ Andrew Zisserman. Visual Search and Recognition // MCVS 2011 ] Вектор  SIFT  размерностью 128 Визуальное слово Построение гистограммы визуальных слов
HOG  дескрипторы [ Andrew Zisserman. Visual Search and Recognition // MCVS 2011 ] ,[object Object],[object Object]
Подходы связанные с модификацией схемы алгоритма ,[object Object],Три – лучше, чем одна Реализация:   а) переход в пространство  HSV  б) вычисление признаков независимо для каждой из компонент   Потенциальный выигрыш:  1 - 5%
Подходы связанные с модификацией схемы алгоритма ,[object Object],Никогда заранее не известно, какое ядро будет лучше работать при конкретной задаче (полиномиальное, RBF, хи-квадрат и т.д.)  Кроме того, произведение (сложение) нескольких ядер, существенно увеличивает силу классификатора .   Реализация:   SVM  библиотеки :   libSVM, SVMlight  и т.д. Потенциальный выигрыш:  5 - 10%
Подходы связанные с модификацией схемы обучения ,[object Object],Обучающих изображений всегда не хватает  Реализация:   а) поиск новых изображений  б) размножение изображений путем применения ротации, аффинного преобразования, изменения яркости / контраста Потенциальный выигрыш:  100%
Подходы связанные с модификацией схемы обучения ,[object Object],Оптимизация ядра необходима, чтобы избежать переобучения и достигнуть наилучшей обобщающей способности  Реализация:   а) кроссвалидация  б) алгоритмы оптимизации ( GA ) Потенциальный выигрыш:  1 - 10%
Подходы связанные с модификацией схемы обучения ,[object Object],Объединение решений нескольких классификаторов всегда дает преимущество в итоговой вероятности распознавания Следующий слой классификатора можно обучать на ошибках предыдущего Реализация:   а) каскадная структура  б) дерево (решающий лес) Потенциальный выигрыш:  5 - 10%
Построение гендерного классификатора  Результаты экспериментов и пути дальнейшего улучшения алгоритма Лев Шмаглит Ярославский государственный университет им. П.Г. Демидова 150000, г. Ярославль, ул. Советская, 14 Физический факультет Кафедра динамики электронных систем

More Related Content

Similar to Построение гендерного классификатора

Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Uralcsclub
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияMSU GML VideoGroup
 
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...Ontico
 
Automating Canvas: difficult but possible
Automating Canvas: difficult but possibleAutomating Canvas: difficult but possible
Automating Canvas: difficult but possibleCOMAQA.BY
 
Разработка программно-математических средств биометрической идентификации лич...
Разработка программно-математических средств биометрической идентификации лич...Разработка программно-математических средств биометрической идентификации лич...
Разработка программно-математических средств биометрической идентификации лич...Vasilev A.V.
 
Microsoft Visual Studio 2010
Microsoft Visual Studio 2010Microsoft Visual Studio 2010
Microsoft Visual Studio 2010Alexander Babich
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииNikolay Khivrin
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеруМихаил Кокорев
 
С.Ковалёв -- теория категорий как математическое основание MBSE
С.Ковалёв -- теория категорий как математическое основание MBSEС.Ковалёв -- теория категорий как математическое основание MBSE
С.Ковалёв -- теория категорий как математическое основание MBSEAnatoly Levenchuk
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстурMSU GML VideoGroup
 
Benchmark сканеров SQL injection
Benchmark сканеров SQL injectionBenchmark сканеров SQL injection
Benchmark сканеров SQL injectionAndrew Petukhov
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеруmiiihus
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеруМихаил Кокорев
 
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt) “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)Alina Vilk
 
Mihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningMihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningOdessaJS Conf
 
Mihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningMihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningMaria Kuneva
 
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!SPB SQA Group
 
Дмитрий Сошников Искусственный интеллект и нейросети для .NET-разработчиков
Дмитрий Сошников    Искусственный интеллект и нейросети для .NET-разработчиковДмитрий Сошников    Искусственный интеллект и нейросети для .NET-разработчиков
Дмитрий Сошников Искусственный интеллект и нейросети для .NET-разработчиковMskDotNet Community
 
Machine Learning as a Service
Machine Learning as a ServiceMachine Learning as a Service
Machine Learning as a Serviceelpisglobal
 
Исследование и разработка алгоритмов распознавания номерных знаков
Исследование и разработка алгоритмов распознавания номерных знаковИсследование и разработка алгоритмов распознавания номерных знаков
Исследование и разработка алгоритмов распознавания номерных знаковAnatoly Simkin
 

Similar to Построение гендерного классификатора (20)

Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображения
 
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
Определение атрибутов и визуальный поиск в UGC-фотографиях одежды / Дмитрий С...
 
Automating Canvas: difficult but possible
Automating Canvas: difficult but possibleAutomating Canvas: difficult but possible
Automating Canvas: difficult but possible
 
Разработка программно-математических средств биометрической идентификации лич...
Разработка программно-математических средств биометрической идентификации лич...Разработка программно-математических средств биометрической идентификации лич...
Разработка программно-математических средств биометрической идентификации лич...
 
Microsoft Visual Studio 2010
Microsoft Visual Studio 2010Microsoft Visual Studio 2010
Microsoft Visual Studio 2010
 
Новые технологии в поисковом ранжировании
Новые технологии в поисковом ранжированииНовые технологии в поисковом ранжировании
Новые технологии в поисковом ранжировании
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеру
 
С.Ковалёв -- теория категорий как математическое основание MBSE
С.Ковалёв -- теория категорий как математическое основание MBSEС.Ковалёв -- теория категорий как математическое основание MBSE
С.Ковалёв -- теория категорий как математическое основание MBSE
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстур
 
Benchmark сканеров SQL injection
Benchmark сканеров SQL injectionBenchmark сканеров SQL injection
Benchmark сканеров SQL injection
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеру
 
Дополненная реальность через веб камеру
Дополненная реальность через веб камеруДополненная реальность через веб камеру
Дополненная реальность через веб камеру
 
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt) “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 
Mihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningMihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine Learning
 
Mihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine LearningMihail Zachepilo - WebAssembly powered Machine Learning
Mihail Zachepilo - WebAssembly powered Machine Learning
 
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!
ITGM8. Илья Коробицын (Grid Dinamics) Автоматизатор, копай глубже, копай шире!
 
Дмитрий Сошников Искусственный интеллект и нейросети для .NET-разработчиков
Дмитрий Сошников    Искусственный интеллект и нейросети для .NET-разработчиковДмитрий Сошников    Искусственный интеллект и нейросети для .NET-разработчиков
Дмитрий Сошников Искусственный интеллект и нейросети для .NET-разработчиков
 
Machine Learning as a Service
Machine Learning as a ServiceMachine Learning as a Service
Machine Learning as a Service
 
Исследование и разработка алгоритмов распознавания номерных знаков
Исследование и разработка алгоритмов распознавания номерных знаковИсследование и разработка алгоритмов распознавания номерных знаков
Исследование и разработка алгоритмов распознавания номерных знаков
 

Построение гендерного классификатора