Машинное обучение в электронной коммерции — практика использования и подводны...Ontico
HighLoad++ 2017
Зал «Найроби+Касабланка», 7 ноября, 16:00
Тезисы:
http://www.highload.ru/2017/abstracts/2851.html
Анализ, проектирование, разработка и эксплуатация моделей предиктивной аналитики в Битрикс24.
В докладе расскажем, как мы создали несколько хайлоад-моделей для предсказания платных клиентов, потенциальной прибыли клиентов и клиентов, вероятно покидающих сервис. Поделимся опытом выбора алгоритмов, библиотек, тонкой настройки моделей в Spark MLib, фильтрации и обработки бигдаты на кластерах Spark в Amazon Web Services и всем тем, что необходимо для доведения "предиктивных" моделей до работающего при высоких нагрузках сервиса.
Самое важное в докладе - опыт доведения алгоритмов до прикладного бизнес-применения, тонкости и техники выжимания из данных самой ценной информации.
Основы машинного обучения, базовые понятия (например переобучение и способы его предотвращения), различные архитектуры сетей, и, в частности, сверточные сети. Так же рассмотрены методы оптимизации вычислений в подобных архитектурах: quantization, binary-net и другие.
Data Science and Machine learning overview by CleverDATA Data Scientist Konstantin Obukhov for meet up with Moscow Economics and Statistic Institute's students in Dec 2014
Машинное обучение в электронной коммерции — практика использования и подводны...Ontico
HighLoad++ 2017
Зал «Найроби+Касабланка», 7 ноября, 16:00
Тезисы:
http://www.highload.ru/2017/abstracts/2851.html
Анализ, проектирование, разработка и эксплуатация моделей предиктивной аналитики в Битрикс24.
В докладе расскажем, как мы создали несколько хайлоад-моделей для предсказания платных клиентов, потенциальной прибыли клиентов и клиентов, вероятно покидающих сервис. Поделимся опытом выбора алгоритмов, библиотек, тонкой настройки моделей в Spark MLib, фильтрации и обработки бигдаты на кластерах Spark в Amazon Web Services и всем тем, что необходимо для доведения "предиктивных" моделей до работающего при высоких нагрузках сервиса.
Самое важное в докладе - опыт доведения алгоритмов до прикладного бизнес-применения, тонкости и техники выжимания из данных самой ценной информации.
Основы машинного обучения, базовые понятия (например переобучение и способы его предотвращения), различные архитектуры сетей, и, в частности, сверточные сети. Так же рассмотрены методы оптимизации вычислений в подобных архитектурах: quantization, binary-net и другие.
Data Science and Machine learning overview by CleverDATA Data Scientist Konstantin Obukhov for meet up with Moscow Economics and Statistic Institute's students in Dec 2014
Мы практически не замечаем этого, но сферы применения искусственного интеллекта растет с каждым годом. И это не только самоуправляемые автомобили или приложения по стилизации фотографий под Ван Гога. Нейронные сети дают конкурентное преимущество во многих сферах.
Когда же нужны нейронные сети?
https://pureso.com/
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub-IT-School
Hub IT School 26/12/15
Подпишитесь на нас в соц. сетях, чтобы не пропустить новые мероприятия!
https://www.facebook.com/Hub.IT.School/
https://vk.com/hub.itschool
О современном состоянии дел в Data Science (в Украине и в мире). О задачах, которые решают специалисты по анализу данных и планах ЖГТУ по подготовке таких специалистов.
Инсайдеры: стороны взаимодействия - Сергей КавунHackIT Ukraine
Презентация с форума http://hackit-ukraine.com/
Сергей Кавун
Зав. каф. ИТ, д.э.н., к.т.н., доц. / ХИБС УБС
Инсайдеры: стороны взаимодействия
О спикере: Основатель (с 2008) международной научно-технической конференции "Информационная и экономическая безопасность (INFECO)". Гл. редактор журналов “Information Security and Computer Fraud”, “American Journal of Information Systems”, “Journal of Computer Networks”. Опыт работы в сфере безопасности – 15 лет. Член оргкомитетов конференций: «Securіtatea іnformationala» (Молдова, с 2008), «European Intelligence and Security Informatics Conference (EISIC)» (Европа, с 2012), “Information Security - Today and Tomorrow” (Словения, с 2013), IEEE International Conference on Intelligence and Security Informatics (IEEE ISI, США, 2015). Имеет 13 публикаций в сфере безопасности за рубежом на англ. языке.
This is the slide deck of lectures "Predictive Analytic Basics".The Base and Machine Learning Technic using R scripts is presented. The slides can be useful for Russian language students. The slides serve the part one of the lectures. Next part will be uploaded soon.
Искусственный интеллект и Big Data в бизнесеExpasoft
Презентация семинара по анализу больших данных и машинному обучению 16.11.2016 г.
- Чем искусственный интеллект может помочь бизнесу?
- Что такое глубинное обучение и какие инновационные технологии можно создать на его основе?
- Почему аналитик больших данных самая сексуальная профессия XXI века?
Организаторы семинара:
Лаборатория аналитики потоковых данных и машинного обучения НГУ,
Центр обучения Big Data Analytics "НГУ-Экспасофт". Евгений Павловский — сертифицированный EMC Data Science Associate, Кандидат физико-математических наук, старший преподаватель Кафедры Общей Информатики НГУ, заведующий лабораторией аналитики потоковых данных и машинного обучения НГУ-Экспасофт,
Business Development Director в «ExpaSoft».
https://expasoft.com/edu/
Big Data Science in Scala ( Joker 2017, slides in Russian)Anastasia Bobyreva
«Нужно бежать со всех ног, чтобы только оставаться на месте, а чтобы куда-то попасть, надо бежать как минимум вдвое быстрее!» — data scientist в Стране Чудес.
Наука о данных вынуждена, как минимум, идти в ногу с постоянно увеличивающимися объемами и сложностью данных, а в идеальном случае стараться опережать и предупреждать потенциальные проблемы, возникающие при их обработке.
В этом докладе вы увидите, как Scala-библиотеки Saddle, Smile и Spark помогают науке о данных отвечать постоянно эволюционирующим требованиям инфраструктуры, облегчая анализ и расширяя возможности описательной статистики, обработки данных и машинного обучения. В этом им помогают функциональные аспекты языка Scala, его благоприятная экосистема больших данных и гибридность с объектно-ориентированным программированием.
На примере предсказания кликов на рекламных пространствах интернета мы исследуем с вами возможности, преимущества и пути развития Scala для науки о данных.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.Anton Konushin
Курс "Введение в компьютерное зрение", читаемый на
ВМК МГУ имени М.В. Ломоносова в весеннем семестре 2015 года. Лектор - Конушин Антон. Лекция 1. Темы - понятие о компьютерном зрение, сложности, связь с искусственным интеллектом. История и достижения компьютерного зрения. Свет и цвет, модели цвета, цифровое изображение.
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...Yandex
Свёрточные нейронные сети позволяют получать потрясающие результаты во многих задачах компьютерного зрения. В этом докладе я расскажу о нашем опыте обучения и применения свёрточных нейронных сетей. Отдельно будет затронут актуальный вопрос сжатия и ускорения нейросетевых моделей.
Машинное обучение в электронной коммерции - практика использования и подводны...Ontico
РИТ++ 2017, секция ML + IoT + ИБ
Зал Белу-Оризонти, 5 июня, 16:00
Тезисы:
http://ritfest.ru/2017/abstracts/2532.html
Простыми словами расскажем о популярных, эффективных и используемых в нашей компании техниках применения машинного обучения для привлечения и удержания клиентов:
- кластеризации товарного каталога,
- классификации клиентов (готовых перейти на платный тариф, готовых уйти, способных принести прибыль),
- повышении релевантности e-mail-рассылок.
Особое внимание уделим технике использования популярных платформ и библиотек:
- Apache Spark,
- Spark MLlib,
- Hadoop,
- Amazon Kinesns.
Отдельно остановимся на особенностях обработки "больших данных", выборе и разработке параллельных алгоритмов.
#АналитикаРешает - обзорная лекция про аналитикуKadimov Mansur
#АналитикаРешает - так называлась лекция в НИУ-ВШЭ, которую я прочитал в субботу (05.10). Её слушали магистранты Департамента интегрированных коммуникаций, а вы её можете просто скачать по ссылке.
Лекция содержит обзор тем: почему аналитика решает и так востребована, какая аналитика бывает, как она работает и как сделать так, чтоб у вас она получилась. Это вводная компиляция материалов из нашего интенсива про аналитику для менеджеров и предпринимателей. Мы решили, что будет здорово просто поделиться нашим трудом. Надеюсь вам материал понравится и будет для вас полезным.
Если вам тема интересна, вы хотите в неё системно на один день погрузиться в формате интенсива, пишите мне, у нас есть интересное для вас предложение.
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...SkillFactory
Сергей Кучеренко – инструктор онлайн-школы SkillFactory, CCIE Security – делится личным опытом и рекомендациями по продвижению к вершинам карьеры посредством программ сертификации специалистов Cisco.
В докладе попытка ответить на вопрос «Кто такой data scientist». На самом деле этим словом разные IT-компании называют принципиально разных специалистов, совместить работу которых сможет в себе лишь утопический data scientist. Рассматривается структура специальностей и академических инициатив в области анализа данных, которые есть в мире, обсудим их программы. На уровне компетенций объясняется, почему читаются именно такие курсы, соответствует ли их содержание ожиданиям индустрии.
Сети и системы телекоммуникаций. Интерфейс сокетовAndrey Sozykin
Презентация лекции "Интерфейс сокетов".
План лекции:
Место сокетов в моделях OSI и TCP/IP
Сокеты Беркли
Основные операции над сокетами
Работа сокетов
Пример на Python
More Related Content
Similar to Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
Мы практически не замечаем этого, но сферы применения искусственного интеллекта растет с каждым годом. И это не только самоуправляемые автомобили или приложения по стилизации фотографий под Ван Гога. Нейронные сети дают конкурентное преимущество во многих сферах.
Когда же нужны нейронные сети?
https://pureso.com/
Hub AI&BigData meetup / Дмитрий Сподарец: Введение в машинное обучениеHub-IT-School
Hub IT School 26/12/15
Подпишитесь на нас в соц. сетях, чтобы не пропустить новые мероприятия!
https://www.facebook.com/Hub.IT.School/
https://vk.com/hub.itschool
О современном состоянии дел в Data Science (в Украине и в мире). О задачах, которые решают специалисты по анализу данных и планах ЖГТУ по подготовке таких специалистов.
Инсайдеры: стороны взаимодействия - Сергей КавунHackIT Ukraine
Презентация с форума http://hackit-ukraine.com/
Сергей Кавун
Зав. каф. ИТ, д.э.н., к.т.н., доц. / ХИБС УБС
Инсайдеры: стороны взаимодействия
О спикере: Основатель (с 2008) международной научно-технической конференции "Информационная и экономическая безопасность (INFECO)". Гл. редактор журналов “Information Security and Computer Fraud”, “American Journal of Information Systems”, “Journal of Computer Networks”. Опыт работы в сфере безопасности – 15 лет. Член оргкомитетов конференций: «Securіtatea іnformationala» (Молдова, с 2008), «European Intelligence and Security Informatics Conference (EISIC)» (Европа, с 2012), “Information Security - Today and Tomorrow” (Словения, с 2013), IEEE International Conference on Intelligence and Security Informatics (IEEE ISI, США, 2015). Имеет 13 публикаций в сфере безопасности за рубежом на англ. языке.
This is the slide deck of lectures "Predictive Analytic Basics".The Base and Machine Learning Technic using R scripts is presented. The slides can be useful for Russian language students. The slides serve the part one of the lectures. Next part will be uploaded soon.
Искусственный интеллект и Big Data в бизнесеExpasoft
Презентация семинара по анализу больших данных и машинному обучению 16.11.2016 г.
- Чем искусственный интеллект может помочь бизнесу?
- Что такое глубинное обучение и какие инновационные технологии можно создать на его основе?
- Почему аналитик больших данных самая сексуальная профессия XXI века?
Организаторы семинара:
Лаборатория аналитики потоковых данных и машинного обучения НГУ,
Центр обучения Big Data Analytics "НГУ-Экспасофт". Евгений Павловский — сертифицированный EMC Data Science Associate, Кандидат физико-математических наук, старший преподаватель Кафедры Общей Информатики НГУ, заведующий лабораторией аналитики потоковых данных и машинного обучения НГУ-Экспасофт,
Business Development Director в «ExpaSoft».
https://expasoft.com/edu/
Big Data Science in Scala ( Joker 2017, slides in Russian)Anastasia Bobyreva
«Нужно бежать со всех ног, чтобы только оставаться на месте, а чтобы куда-то попасть, надо бежать как минимум вдвое быстрее!» — data scientist в Стране Чудес.
Наука о данных вынуждена, как минимум, идти в ногу с постоянно увеличивающимися объемами и сложностью данных, а в идеальном случае стараться опережать и предупреждать потенциальные проблемы, возникающие при их обработке.
В этом докладе вы увидите, как Scala-библиотеки Saddle, Smile и Spark помогают науке о данных отвечать постоянно эволюционирующим требованиям инфраструктуры, облегчая анализ и расширяя возможности описательной статистики, обработки данных и машинного обучения. В этом им помогают функциональные аспекты языка Scala, его благоприятная экосистема больших данных и гибридность с объектно-ориентированным программированием.
На примере предсказания кликов на рекламных пространствах интернета мы исследуем с вами возможности, преимущества и пути развития Scala для науки о данных.
CV2015. Лекция 1. Понятия и история компьютерного зрения. Свет и цвет.Anton Konushin
Курс "Введение в компьютерное зрение", читаемый на
ВМК МГУ имени М.В. Ломоносова в весеннем семестре 2015 года. Лектор - Конушин Антон. Лекция 1. Темы - понятие о компьютерном зрение, сложности, связь с искусственным интеллектом. История и достижения компьютерного зрения. Свет и цвет, модели цвета, цифровое изображение.
Классификация изображений с помощью нейронных сетей. Сжатие и ускорение обуче...Yandex
Свёрточные нейронные сети позволяют получать потрясающие результаты во многих задачах компьютерного зрения. В этом докладе я расскажу о нашем опыте обучения и применения свёрточных нейронных сетей. Отдельно будет затронут актуальный вопрос сжатия и ускорения нейросетевых моделей.
Машинное обучение в электронной коммерции - практика использования и подводны...Ontico
РИТ++ 2017, секция ML + IoT + ИБ
Зал Белу-Оризонти, 5 июня, 16:00
Тезисы:
http://ritfest.ru/2017/abstracts/2532.html
Простыми словами расскажем о популярных, эффективных и используемых в нашей компании техниках применения машинного обучения для привлечения и удержания клиентов:
- кластеризации товарного каталога,
- классификации клиентов (готовых перейти на платный тариф, готовых уйти, способных принести прибыль),
- повышении релевантности e-mail-рассылок.
Особое внимание уделим технике использования популярных платформ и библиотек:
- Apache Spark,
- Spark MLlib,
- Hadoop,
- Amazon Kinesns.
Отдельно остановимся на особенностях обработки "больших данных", выборе и разработке параллельных алгоритмов.
#АналитикаРешает - обзорная лекция про аналитикуKadimov Mansur
#АналитикаРешает - так называлась лекция в НИУ-ВШЭ, которую я прочитал в субботу (05.10). Её слушали магистранты Департамента интегрированных коммуникаций, а вы её можете просто скачать по ссылке.
Лекция содержит обзор тем: почему аналитика решает и так востребована, какая аналитика бывает, как она работает и как сделать так, чтоб у вас она получилась. Это вводная компиляция материалов из нашего интенсива про аналитику для менеджеров и предпринимателей. Мы решили, что будет здорово просто поделиться нашим трудом. Надеюсь вам материал понравится и будет для вас полезным.
Если вам тема интересна, вы хотите в неё системно на один день погрузиться в формате интенсива, пишите мне, у нас есть интересное для вас предложение.
10 заповедей IT-карьериста: от простого специалиста до высокооплачиваемого эк...SkillFactory
Сергей Кучеренко – инструктор онлайн-школы SkillFactory, CCIE Security – делится личным опытом и рекомендациями по продвижению к вершинам карьеры посредством программ сертификации специалистов Cisco.
В докладе попытка ответить на вопрос «Кто такой data scientist». На самом деле этим словом разные IT-компании называют принципиально разных специалистов, совместить работу которых сможет в себе лишь утопический data scientist. Рассматривается структура специальностей и академических инициатив в области анализа данных, которые есть в мире, обсудим их программы. На уровне компетенций объясняется, почему читаются именно такие курсы, соответствует ли их содержание ожиданиям индустрии.
Similar to Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г. (20)
Сети и системы телекоммуникаций. Интерфейс сокетовAndrey Sozykin
Презентация лекции "Интерфейс сокетов".
План лекции:
Место сокетов в моделях OSI и TCP/IP
Сокеты Беркли
Основные операции над сокетами
Работа сокетов
Пример на Python
Сети и системы телекоммуникаций. Управление потоком и перегрузкой в TCPAndrey Sozykin
Презентация лекции "Управление потоком и перегрузкой в TCP".
План лекции:
Скорость передачи данных с использованием протокола TCP
Управление потоком в TCP
Алгоритм Нагля
Управление перегрузкой в TCP
AIMD
Медленный старт
Сети и системы телекоммуникаций. Протокол TCPAndrey Sozykin
Презентация лекции. "Протокол TCP".
План лекции:
Место TCP в моделях OSI и TCP/IP
Основные понятия TCP
Скользящее окно
Установка соединения
Формат заголовка TСP
Сети и системы телекоммуникаций. Транспортный уровеньAndrey Sozykin
Презентация лекции "Транспортный уровень".
План лекции:
Место транспортного уровня в моделях OSI и TCP/IP
Назначение транспортного уровня
Адресация
Протоколы транспортного уровня TCP/IP
Сети и системы телекоммуникаций. Протокол IPv6Andrey Sozykin
Презентация лекции "Протокол IPv6".
План лекции:
Место протокола IPv6 в модели OSI и TCP/IP
Цели создания IPv6
Формат заголовка IPv6
Адреса IPv6
Внедрение IPv6
Сети и системы телекоммуникаций. Протоколы маршрутизацииAndrey Sozykin
Презентация лекции "Протоколы маршрутизации".
План лекции:
Место протоколов маршрутизации в моделях OSI и TCP/IP
Маршрутизация по вектору расстояний
Маршрутизация с учетом состояния канала
Протоколы внутренней маршрутизации (RIP, OSPF)
Структура Интернет
Протокол внешней маршрутизации BGP
Сети и системы телекоммуникаций. Управляющие протоколы сетевого уровняAndrey Sozykin
Презентация лекции. "Управляющие протоколы сетевого уровня".
План лекции:
Место управляющих протоколов в моделях OSI и TCP/IP
Internet Control Message Protocol (ICMP)
Address Resolution Protocol (ARP)
Dynamic Host Configuration Protocol (DHCP)
Сети и системы телекоммуникаций. МаршрутизацияAndrey Sozykin
Прещентация лекции "Маршрутизация".
План лекции:
Основы маршрутизации
Маршрутизаторы
Таблица маршрутизации
Поиск маршрута в таблице маршрутизации
Маршрут по умолчанию
Длина маски подсети
Сети и системы телекоммуникаций. IP-адресацияAndrey Sozykin
Презентация лекции "IP-адресация".
План лекции:
Глобальные и локальные адреса
Структура IP-адреса
Бесклассовая маршрутизация (Classless Inter-Domain Routing, CIDR) и классы IP-сетей
Специальные типы IP-адресов
Подсети
Сети и системы телекоммуникаций. Сетевой уровеньAndrey Sozykin
Презентация лекции "Сетевой уровень".
План лекции:
Место сетевого уровня в модели OSI
История создания
Назначение сетевого уровня
Задачи сетевого уровня
Маршрутизаторы
Сетевой уровень в стеке протоколов TCP/IP
Презентация лекции Wi-Fi.
План лекции:
Основы Wi-Fi
Место Wi-Fi в модели OSI
Wi-Fi и Ethernet
Физический уровень Wi-Fi
Уровень MAC в Wi-Fi
Метод доступа CSMA/CA
Сервисы Wi-Fi
Безопасность Wi-Fi
Сети и системы телекоммуникаций. Дополнительные функции коммутаторовAndrey Sozykin
Презентация лекции "Дополнительные функции коммутаторов".
План лекции:
Место в модели OSI
Виртуальные локальные сети (VLAN)
Связующее (остовное) дерево (Spaning Tree)
Агрегация каналов
Управление потоком
Сети и системы телекоммуникаций. Коммутируемый EthernetAndrey Sozykin
Презентация лекции "Коммутируемый Ethernet".
План лекции:
Классический и коммутируемый Ethernet
Концентратор и коммутатор
Основы коммутации
Скоростные версии Ethernet
Сети и системы телекоммуникаций. Технология EthernetAndrey Sozykin
Презентация к лекции "Технология Ethernet".
План лекции:
Место в модели OSI
История создания
Типы Ethernet
Классический Ethernet
Адресация
Формат кадра
Метод множественного доступа к каналу связи CSMA/CD
Сети и системы телекоммуникаций. Канальный уровеньAndrey Sozykin
Презентация к лекции "Канальный уровень".
План лекции:
Место канального уровня в модели OSI
Работа с кадрами
Обнаружение и коррекция ошибок
Множественный доступ к каналу
Технологии канального уровня
Сети и системы телекоммуникаций. Физический уровеньAndrey Sozykin
Презентация лекции "Физический уровень".
План лекции:
Место физического уровня в модели OSI
Модель канала связи
Среды передачи данных
Передача сигналов
Кодирование и модуляция
Сети и системы телекоммуникаций. Эталонные модели и стандартизация сетей
Презентация на семинаре Nvidia в ИТМО 16 мая 2017 г.
1. Глубокое обучение,
или как стать Data
Scientist'ом
Семинар компании NVIDIA
Университет ИТМО, 16 мая 2017 г.
Андрей Созыкин, www.asozykin.ru, sozykin@gmail.com
2. План
Кто такие Data Scientist'ы и как стать одним из них
Глубокое обучение – теория и применение
Демонстрация глубокого обучения нейронных
сетей:
• Распознавание объектов на изображениях
(Keras+Theano, MNIST и CIFAR-10)
• Сравнение фотографии паспорта и c Web-камеры
Глубокое обучение, или как стать Data Scientist'ом 2
3. Что такое Data Science?
Глубокое обучение, или как стать Data Scientist'ом 3
4. Data Science Process
Глубокое обучение, или как стать Data Scientist'ом 4
By Farcaster at English Wikipedia, CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=40129394
5. Где здесь глубокое обучение?
Глубокое обучение, или как стать Data Scientist'ом 5
Machine Learning
Neural Networks
Deep
Learning
7. Применение глубоких нейронных сетей
Глубокое обучение, или как стать Data Scientist'ом 7
Ода Сбербанку
С улыбкой нежной и всеми наравне,
Когда во мне счастья ликованье,
Скажу, преодолев страх признанья:
Сбербанк — светило на века в стране!
…
8. Применение глубоких нейронных сетей
Глубокое обучение, или как стать Data Scientist'ом 8
Skype Translator
Переводчик Google
9. Применение глубоких нейронных сетей
Глубокое обучение, или как стать Data Scientist'ом 9
Сингапур
Питсбург, США
Лондон
13. Анализ медицинских изображений
Глубокое обучение, или как стать Data Scientist'ом 13
По данные Word Economic Forum для подготовки врачей
необходимой квалификации в нужном количестве в
мире требуется 300 лет.
Health Systems Leapfrogging in Emerging Economies.
14. Что должен знать Data Scientist?
Глубокое обучение, или как стать Data Scientist'ом 14
1. Машинное обучение
2. Статистика
3. Математика
4. Компьютерные науки
5. Визуализация данных
6. Коммуникации
7. Предметная область
Cathy O’Neil and Rachel Schutt. Doing Data Science
Columbia University, Data Science Institute
15. Что необходимо Data Scientist’у?
Глубокое обучение, или как стать Data Scientist'ом 15
1. Теоретические знания
2. Практический опыт
3. Независимое подтверждение своей квалификации
16. Теоретические знания
Глубокое обучение, или как стать Data Scientist'ом 16
На русском языке:
• Курс “Введение в машинное обучение”. Coursera, Высшая
школа экономики, Константин Воронцов
https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie
• Специализация “Машинное обучение и анализ данных” на
Coursera, 6 курсов, МФТИ и Яндекс
https://www.coursera.org/specializations/machine-learning-data-
analysis
На английском языке:
• Курс “Machine Learning”, Andrew Ng
https://www.coursera.org/learn/machine-learning
• Курс “Neural Networks for Machine Learning”, Geoffrey Hinton
https://www.coursera.org/learn/neural-networks
17. Практический опыт
Глубокое обучение, или как стать Data Scientist'ом 17
Сайт kaggle.com:
• Соревнования по анализу данных
• Открытые наборы данных
• Примеры решений
Практически-ориентированные
курсы от udacity.com:
• Цель обучения – реализация проекта
• Теоретические курсы нацелены
помочь реализовать проект
Российские чемпионаты по анализу данных:
• boosters.pro
• mlbootcamp.ru
• dataring.ru
18. Независимое подтверждение квалификации
Глубокое обучение, или как стать Data Scientist'ом 18
Сайт kaggle.com
Открытые репозитории с программами на GitHub
Публикации на конференциях по анализу данных
Статьи на Хабре и других подобных ресурсах
Novice Contributor Expert Master Grandmaster
19. Школа анализа данных Яндекса
Школа анализа данных Яндекс:
• 2 года очного обучения
Филиалы:
• Санкт-Петербург
• Екатеринбург
• Новосибирск
• Минск
Совместная магистратура Уральского федерального
университета и ШАД:
• Начало обучения 1 сентября 2017 г.
• Два диплома: УрФУ и ШАД
Глубокое обучение, или как стать Data Scientist'ом 19
21. Глубокие нейронные сети и глубокое обучение
Глубокие нейронные сети:
• Один из методов машинного обучения
• Сеть из простых вычислительных элементов –
искусственных нейронов
Традиционное машинное обучение:
• Выбор важных признаков из множества доступных
данных (feature engineering)
Глубокие нейронные сети:
• Автоматическое определение важных признаков в
процессе обучения
• Высокие вычислительные требования
Глубокое обучение, или как стать Data Scientist'ом 21
22. Почему сейчас???
Основные идеи нейронных сетей придумали в
прошлом веке
Рост производительности компьютеров:
• Многоядерные процессоры
• Графические ускорители GPU
Резкое увеличение количества накопленных
данных
Большое количество готовых к использованию
программных систем глубокого обучения
Глубокое обучение, или как стать Data Scientist'ом 22
27. Искусственный нейрон
Глубокое обучение, или как стать Data Scientist'ом 27
𝑎 = 𝜑(
𝑖=1
𝑁
𝑤𝑖 𝑥𝑖)
Маккалок Дж., Питтс У. Логические исчисления идей, относящихся к нервной деятельности //
Автоматы. М.: ИЛ, 1956
28. Функции активации
Глубокое обучение, или как стать Data Scientist'ом 28
• Функция Хевисайда
– 𝜃 𝑥 = ቊ
0, 𝑥 < 0
1, 𝑥 > 0
• Сигмоидальные функции
– 𝜎 𝑥 =
1
1+𝑒−𝑥 (логистическая)
– 𝑡ℎ 𝑥 =
𝑒2𝑥−1
𝑒2𝑥+1
(гиперболический тангенс)
33. Обучение нейронной сети
Глубокое обучение, или как стать Data Scientist'ом 33
Обучение нейронной сети – подбор весов
таким образом, чтобы сеть решала поставленную
задачу
34. Задачи
Глубокое обучение, или как стать Data Scientist'ом 34
Классификация
Регрессия
https://www.kaggle.com/c/dogs-vs-cats
35. Типы обучения
Глубокое обучение, или как стать Data Scientist'ом 35
С учителем
• Данные с правильными ответами
Без учителя
• Данные без информации о правильных ответах
Обучение с подкреплением
• Агент получает сигналы от внешней среды
36. Первые варианты обучения, правила Хэбба
Глубокое обучение, или как стать Data Scientist'ом 36
Биологические предпосылки:
• Если нейроны срабатывают вместе, то их связи
укрепляются
Правила обучения Хэбба, 1949 г.:
• Нейрон выдает сигналы {0, 1}
• Начальные веса назначаются случайным образом
• Если сигнал нейрона неверен и равен нулю, то
необходимо увеличить веса тех входов, на которые
была подана единица
• Если сигнал нейрона неверен и равен единице, то
необходимо уменьшить веса тех входов, на которые
была подана единица
37. Метод обратного распространения ошибки
Глубокое обучение, или как стать Data Scientist'ом 37
Выходной сигнал сети:
• Вещественное число
Мера ошибки:
• Среднеквадратичная
Обучение:
• Минимизация ошибки методом градиентного спуска
38. Линейный нейрон
Глубокое обучение, или как стать Data Scientist'ом 38
Выходное значение:
Среднеквадратичная ошибка:
𝑎 =
𝑖=1
𝑁
𝑤𝑖 𝑥𝑖
𝜀 =
1
2
𝑗=1
𝑀
(𝑎𝑗 − 𝑦𝑗)2
40. Линейный нейрон
Глубокое обучение, или как стать Data Scientist'ом 40
𝑤𝑖 = 𝑤𝑖 − 𝜂
𝑗=1
𝑀
𝑥𝑗
𝑖
(𝑎𝑗 − 𝑦𝑗)
𝜂 – параметр скорости обучения
Изменение весов
(дельта-правило):
41. Варианты реализации
Глубокое обучение, или как стать Data Scientist'ом 41
Полное обучение:
• Изменяем веса после обработки всех элементов
обучающей выборки
Онлайн обучение:
• Изменяем веса после обработки каждого объекта
Мини-выборки:
• Изменяем веса после обработки 10-100 объектов
45. Набор данных MNIST
Глубокое обучение, или как стать Data Scientist'ом 45
Back-Propagation Applied to Handwritten Zip Code Recognition / Y. LeCun,
B. Boser, J. S. Denker et al. 1989
Mixed National Institute of Standards and Technology
database
46. Нейронная сеть для MNIST
Глубокое обучение, или как стать Data Scientist'ом 46
Входные значения сети
• Интенсивность пиксела в изображении
• Количество значений: 784 (28*28 пикселов)
Входной слой
• 800 нейронов
• Patrice Y. Simard; Dave Steinkraus; John C. Platt (2003).
«Best Practices for Convolutional Neural Networks Applied
to Visual Document Analysis»
• https://en.wikipedia.org/wiki/MNIST_database
Выходной слой
• 10 нейронов
• Вероятность того, что на изображении данная цифра
47. One Hot Encoding
Глубокое обучение, или как стать Data Scientist'ом 47
# 0 -> [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
# 2 -> [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
# 9 -> [0, 0, 0, 0, 0, 0, 0, 0, 0, 1]
48. Демонстрация MNIST
Глубокое обучение, или как стать Data Scientist'ом 48
Демонстрация распознавания рукописных цифр из
набора данных MNIST в Keras и Theano
49. Функции активации
Глубокое обучение, или как стать Data Scientist'ом 49
Rectified Linear Unit (ReLU)
SoftMax – нормализованная экспоненциальная
функция
• Используется для представления
вероятности
• Сумма всех выходных значений
нейронов равна 1
𝑓 𝑥 = max(0, 𝑥)
𝑓 𝑥 = ln(1 + 𝑒 𝑥)
51. Наборы данных для обучения
Глубокое обучение, или как стать Data Scientist'ом 51
Обучающая выборка (training set) – набор
данных, который используется для обучения сети
Проверочная выборка (validation set) – набор
данных, который используется в процессе
обучения для оценки качества обучения
Тестовая выборка (test set) – набор данных,
который используется для оценки качества работы
сети после завершения обучения
52. Сверточные нейронные сети
Глубокое обучение, или как стать Data Scientist'ом 52
Принципы сверточных нейронных сетей (convolutional
neural networks):
• Локальное восприятие
• Разделяемые веса
• Уменьшение размерности
54. Свертка изображений
Глубокое обучение, или как стать Data Scientist'ом 54
Размытие
1/9 1/9 1/9
1/9 1/9 1/9
1/9 1/9 1/9
Выделение границ
0 -1 0
-1 4 -1
0 -1 0
Повышение четкости
0 -1 0
-1 5 -1
0 -1 0
55. Свертка изображений
Глубокое обучение, или как стать Data Scientist'ом 55
Размытие
1/9 1/9 1/9
1/9 1/9 1/9
1/9 1/9 1/9
Выделение границ
0 -1 0
-1 4 -1
0 -1 0
Повышение четкости
0 -1 0
-1 5 -1
0 -1 0
В нейронных сетях ядра
свертки определяются
автоматически в процессе
обучения
57. Уменьшение размерности
Глубокое обучение, или как стать Data Scientist'ом 57
Распознавание объектов вне зависимости от
масштаба
Факт наличия признака важнее знания места его
точного положения на изображении
Слои подвыборки (subsampling):
• Усреднение
• Выбор максимального значения
59. Сверточная сеть LeNet-5
Глубокое обучение, или как стать Data Scientist'ом 59
Back-Propagation Applied to Handwritten Zip Code Recognition / Y. LeCun,
B. Boser, J. S. Denker et al. 1989
60. Распознавание лиц сверточными сетями
Глубокое обучение, или как стать Data Scientist'ом 60
Honglak Lee, Roger Grosse, Rajesh Ranganath, and Andrew Y. Ng.
Unsupervised Learning of Hierarchical Representations with
Convolutional Deep Belief Networks (2011)
61. Набор данных CIFAR-10
Глубокое обучение, или как стать Data Scientist'ом 61
Самолет
Автомобиль
Птица
Кот
Олень
Собака
Лягушка
Лошадь
Корабль
Грузовик
62. Набор данных CIFAR-10
Глубокое обучение, или как стать Data Scientist'ом 62
Открытый набор данных:
• https://www.cs.toronto.edu/~kriz/cifar.html
• Alex Krizhevsky, Learning Multiple Layers of Features from
Tiny Images, 2009.
Изображения в CIFAR-10:
• Размер 32х32
• Цветные изображения (коды интенсивности RGB)
• Набор данных для обучения – 50 000 (5 000 для каждого
класса)
• Набор данных для тестирования – 10 000
• На каждом изображении только один объект
• Нет пересечений
63. Сверточная сеть для распознавания CIFAR-10
Глубокое обучение, или как стать Data Scientist'ом 63
66. Transfer Learning
Глубокое обучение, или как стать Data Scientist'ом 66
Подход Transfer Learning:
• Использование предварительно обученной сети для
других задач
Соревнования ImageNet:
• Набор данных 14 млн. изображений
• 1000 классов объектов
67. Обученные нейронные сети на ImageNet
Глубокое обучение, или как стать Data Scientist'ом 67
AlexNet (2012):
• Разработчик Алекс Крижевский, 9 слоев
VGG16 (2014):
• Oxford Visual Geometry Group, 16 слоев
Inception (GoogLeNet, 2014):
• Google, 22 слоя
ResNet (2015):
• Microsoft, 152 слоя
68. Keras Applications
Глубокое обучение, или как стать Data Scientist'ом 68
Предварительно обученные модели:
• https://keras.io/applications/
Модели в Keras:
• Xception
• VGG16
• VGG19
• ResNet50
• InceptionV3
69. Архитектура VGG16
Глубокое обучение, или как стать Data Scientist'ом 69
Выделение признаков Классификация
Разные фото одного человека будут иметь похожие признаки
70. Сравнение фотографий
Глубокое обучение, или как стать Data Scientist'ом 70
Загружаем предварительно обученную сеть VGG16
«Отрезаем» последние три уровня
Для каждой фотографии получаем вектор признаков
Оцениваем расстояние между векторами признаков
72. Дополнительная информация
NVIDIA Deep Learning Institute:
• http://www.nvidia.ru/dli
Примеры кода из демонстраций:
• https://github.com/sozykin/dlpython_course
• Курс с видео и упражнениями -
https://www.asozykin.ru/courses/nnpython
Суперкомпьютерная академия МГУ:
• http://academy.hpc-russia.ru/
• Трек Уральского Федерального Университета
(Екатеринбург) по нейронным сетям –
http://youthscience.urfu.ru/scacademy/
Глубокое обучение, или как стать Data Scientist'ом 72