SlideShare a Scribd company logo
1 of 38
Download to read offline
Введение в машинное обучение
Дмитрий Сподарец
d.spodarets@flyelephant.net
Обо мне
• Основатель FlyElephant и
GeeksLab
• Преподаватель в ОНПУ
Содержание
• История искусственного интеллекта
• Машинное обучение: определение
• Инструменты для решения задач ML
• Классификация задач машинного обучения
• FlyElephant
История искусственного интеллекта
• Появление предпосылок AI (1943 – 1955)
• Теста Тьюринга (1950)
• Рождение AI (1956) / Дартмутский семинар (Термин AI и формулировки основных
задач) Его организовали Джон Маккарти (John McCarthy), Марвин Мински (Marvin
Minsky), Клод Шеннон (Claude Shennon) и Натаниэль Рочестер (Nathaniel Rochester).
• Нейронные сети - (1958)
• Превращение AI в индустрию (1980 – …)
• Превращение AI в науку (1987 – …)
• Доступность больших баз данных (2001 – …)
Машинное обучение: определение
• Машинное обучение — обширный подраздел искусственного
интеллекта, изучающий методы построения алгоритмов,
способных обучаться.
ru.wikipedia.org
Машинное обучение: определение
• Машинное обучение — процесс, в результате которого машина
(компьютер) способна показывать поведение, которое в нее не
было явно заложено (запрограммировано).
A.L. Samuel
Суть машинногообучения
Обучающаяся
программа
Примеры данных с
закономерностями
Модель
закономерности
Поиск закономерностей в
новых данных
Сферы приложения
• Компьютерное зрение (computer vision)
• Распознавание речи (speech recognition)
• Компьютерная лингвистика и обработка естественных языков (natural language processing)
• Медицинская диагностика
• Биоинформатика
• Техническая диагностика
• Финансовые приложения
• Информационный поиск
• …
Аппарат
• Линейная алгебра
• Теория вероятностей и математическая статистика
• Методы оптимизации
• Численные методы
• Математический анализ
• Дискретная математика
• и др.
Инструменты для решения задач ML
Классификация задач машинного обучения
• Дедуктивное обучение (экспертные системы)
• Индуктивное обучение (≈ статистическое обучение)
• Обучение с учителем
• Обучение без учителя
• Обучение с подкреплением (reinforcement learning)
• Активное обучение
• . . .
Дедуктивное или аналитическое обучение
(экспертные системы)
• Имеются знания, сформулированные экспертом и как-то
формализованные.
• Программа выводит из этих правил конкретные факты и новые
правила.
Примеры экспертных систем
• WolframAlpha
• IBM Watson
Индуктивное обучение
(≈ статистическое обучение)
• Обучение с учителем
• Обучение без учителя
Обучение с учителем
• Обучаем машину на примерах (данные + требуемое решение)
• Алгоритм сохраняет «значение» о примерах во внутренней
математической модели
• Предсказываем новые данные, используя обученную модель
Основная суть: обучая машину на исходных данных и зная ответ
для этих данных, получить ответ для новых данных.
Обучение без учителя
• Загружаем в машину какой-то набор данных
• Машина может самостоятельно проанализировать загруженные
данные и сгруппировать их или предложить вам набор инсайтов
Основная суть: не зная ответ совсем - получаем ответ.
Основные типы задач
• Обучение с учителем
• Классификация
• Регрессия
• Обучение без учителя
• Кластеризация
• Определение выбросов
• Гибридные
• Коллаборативная фильтрация (рекомендации)
Классификация
Примеры задач классификации
• Медицинская диагностика: по набору медицинских характеристик требуется
поставить диагноз
• Геологоразведка: по данным зондирования почв определить наличие
полезных ископаемых
• Оптическое распознавание текстов: по отсканированному изображению
текста определить цепочку символов, его формирующих
• Кредитный скоринг: по анкете заемщика принять решение о выдаче/отказе
кредита
• Синтез химических соединений: по параметрам химических элементов
спрогнозировать свойства получаемого соединения
Регрессия
Линейная регрессия
data <- read.csv('~/git/R-Linear-Regression/rosn.txt', sep='t')
fit <- lm(data$ROSN ~ data$BRN )
plot(data$ROSN~data$BRN, xlab="ROSN", ylab="BRN")
abline(fit)
summary(fit)
http://www.algorithmist.ru/2011/04/linear-regression-with-examples-in-r.html
Примеры задач регрессии
• Оценка стоимости недвижимости: по характеристике района, экологической
обстановке, транспортной связности оценить стоимость жилья
• Прогноз свойств соединений: по параметрам химических элементов
спрогнозировать температуру плавления, электропроводность, теплоемкость
получаемого соединения
• Медицина: по постоперационным показателям оценить время заживления
органа
• Кредитный скоринг: по анкете заемщика оценить величину кредитного лимита
• Инженерное дело: по техническим характеристикам автомобиля и режиму
езды спрогнозировать расход топлива
Кластеризация
Примеры задач кластерного анализа
• Экономическая география: по физико-географическим и экономическим
показателям разбить страны мира на группы схожих по экономическому положению
государств
• Финансовая сфера: по сводкам банковских операций выявить группы
«подозрительных», нетипичных банков, сгуппировать остальные по степени близости
проводимой стратегии
• Маркетинг: по результатам маркетинговых исследований среди множества
потребителей выделить характерные группы по степени интереса к продвигаемому
продукту
• Социология: по результатам социологических опросов выявить группы
общественных проблем, вызывающих схожую реакцию у общества, а также
характерные фокус-группы населения
Идентификация
Примеры задач идентификации
• Медицинская диагностика: по набору медицинских характеристик
требуется установить наличие/отсутствие конкретного заболевания
• Системы безопасности: по камерам наблюдения в подъезде
идентифицировать жильца дома
• Банковское дело: определить подлинность подписи на чеке
• Обработка изображений: выделить участки с изображениями лиц на
фотографии
• Искусствоведение: по характеристикам произведения (картины,
музыки, текста) определить, является ли его автором тот или иной автор
Прогнозирование
Примеры задач прогнозирования
• Биржевое дело: прогнозирование биржевых индексов и котировок
• Системы управления: прогноз показателей работы реактора по
данным телеметрии
• Экономика: прогноз цен на недвижимость
• Демография: прогноз изменения численности различных
социальных групп в конкретном ареале
• Гидрометеорология: прогноз геомагнитной активности
Извлечение знаний
Примеры задач извлечения знаний
• Медицина: поиск взаимосвязей (синдромов) между различными
показателями при фиксированной болезни
• Социология: определение факторов, влияющих на победу на выборах
• Генная инженерия: выявление связанных участков генома
• Научные исследования: получение новых знаний об исследуемом
процессе
• Биржевое дело: определение закономерностей между различными
биржевыми показателями
Онлайн курсы/лекции
• https://yandexdataschool.ru/edu-process/courses/machine-learning
• https://www.coursera.org/learn/introduction-machine-learning
• https://www.coursera.org/learn/machine-learning
• https://www.youtube.com/watch?v=qLBkB4sMztk
• https://www.udacity.com/course/machine-learning-engineer-
nanodegree--nd009
The Home of High Performance Computing
Compute / Manage data / Collaborate
http://www.flyelephant.net/
DEMO
Предстоящие вебинары и конференции
• Introduction to FlyElephant platform / January 22 at 16:00 (Kiev) /
Webinar language - Russian.
• Introduction to FlyElephant platform / January 26 at 11:00 am
( San Francisco) / Webinar language - English.
• AI&BigData Lab / June 4 - Odessa
www.flyelephant.net
100 $
127575063277
FlyElephant Beta Testing Program
http://flyelephant.net/beta/
Free access
Use new features first
To help make FlyElephant better
Вопросы???
Дмитрий Сподарец
d.spodarets@flyelephant.net

More Related Content

Similar to Вебинар: Введение в машинное обучение

Понятийные системы в цифровом мире: что может знать компьютер?
Понятийные системы в цифровом мире: что может знать компьютер?Понятийные системы в цифровом мире: что может знать компьютер?
Понятийные системы в цифровом мире: что может знать компьютер?
Dmitry Kudryavtsev
 
занятие 1
занятие 1занятие 1
занятие 1
dimour
 
Понятие информационной модели
Понятие информационной моделиПонятие информационной модели
Понятие информационной модели
irina8682
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
Lidia Pivovarova
 

Similar to Вебинар: Введение в машинное обучение (20)

19.урок информатики «информационные модели. система, структура системы»
19.урок информатики «информационные модели. система, структура системы»19.урок информатики «информационные модели. система, структура системы»
19.урок информатики «информационные модели. система, структура системы»
 
Системноинженерное мышление в непрерывном образовании
Системноинженерное мышление в непрерывном образованииСистемноинженерное мышление в непрерывном образовании
Системноинженерное мышление в непрерывном образовании
 
Введение в педагогический дизайн
Введение в педагогический дизайн Введение в педагогический дизайн
Введение в педагогический дизайн
 
Machine
MachineMachine
Machine
 
Понятийные системы в цифровом мире: что может знать компьютер?
Понятийные системы в цифровом мире: что может знать компьютер?Понятийные системы в цифровом мире: что может знать компьютер?
Понятийные системы в цифровом мире: что может знать компьютер?
 
Машинное обучение для интеллектуализации ваших приложений
Машинное обучение  для интеллектуализации ваших приложенийМашинное обучение  для интеллектуализации ваших приложений
Машинное обучение для интеллектуализации ваших приложений
 
занятие 1
занятие 1занятие 1
занятие 1
 
Взгляд на Data Science
Взгляд на Data ScienceВзгляд на Data Science
Взгляд на Data Science
 
Семь граблей краудсорсинга (7 crowdsourcing rakes)
Семь граблей краудсорсинга (7 crowdsourcing rakes)Семь граблей краудсорсинга (7 crowdsourcing rakes)
Семь граблей краудсорсинга (7 crowdsourcing rakes)
 
Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...
Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...
Блеск и нищета современного ИИ, из истории кибернетики в СССР, философия ИИ -...
 
Понятие информационной модели
Понятие информационной моделиПонятие информационной модели
Понятие информационной модели
 
древо компьютерных наукAygun
древо компьютерных наукAygunдрево компьютерных наукAygun
древо компьютерных наукAygun
 
древо компьютерных наукAygun
древо компьютерных наукAygunдрево компьютерных наукAygun
древо компьютерных наукAygun
 
икт в нач школе 2011
икт в нач школе 2011икт в нач школе 2011
икт в нач школе 2011
 
А.Левенчук -- инженерное образование: итоги 2014 и планы.
А.Левенчук -- инженерное образование: итоги 2014 и планы.А.Левенчук -- инженерное образование: итоги 2014 и планы.
А.Левенчук -- инженерное образование: итоги 2014 и планы.
 
Андрей Курьян Изобретательское творчество в инженерии требований
Андрей Курьян Изобретательское творчество в инженерии требованийАндрей Курьян Изобретательское творчество в инженерии требований
Андрей Курьян Изобретательское творчество в инженерии требований
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
 
Тема 1.Маркетинговое исследование: определение, процедура, планирование, типо...
Тема 1.Маркетинговое исследование: определение, процедура, планирование, типо...Тема 1.Маркетинговое исследование: определение, процедура, планирование, типо...
Тема 1.Маркетинговое исследование: определение, процедура, планирование, типо...
 
Моделеориентированность в инженерии
Моделеориентированность в инженерииМоделеориентированность в инженерии
Моделеориентированность в инженерии
 

Вебинар: Введение в машинное обучение

  • 1. Введение в машинное обучение Дмитрий Сподарец d.spodarets@flyelephant.net
  • 2. Обо мне • Основатель FlyElephant и GeeksLab • Преподаватель в ОНПУ
  • 3. Содержание • История искусственного интеллекта • Машинное обучение: определение • Инструменты для решения задач ML • Классификация задач машинного обучения • FlyElephant
  • 4. История искусственного интеллекта • Появление предпосылок AI (1943 – 1955) • Теста Тьюринга (1950) • Рождение AI (1956) / Дартмутский семинар (Термин AI и формулировки основных задач) Его организовали Джон Маккарти (John McCarthy), Марвин Мински (Marvin Minsky), Клод Шеннон (Claude Shennon) и Натаниэль Рочестер (Nathaniel Rochester). • Нейронные сети - (1958) • Превращение AI в индустрию (1980 – …) • Превращение AI в науку (1987 – …) • Доступность больших баз данных (2001 – …)
  • 5. Машинное обучение: определение • Машинное обучение — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. ru.wikipedia.org
  • 6. Машинное обучение: определение • Машинное обучение — процесс, в результате которого машина (компьютер) способна показывать поведение, которое в нее не было явно заложено (запрограммировано). A.L. Samuel
  • 7. Суть машинногообучения Обучающаяся программа Примеры данных с закономерностями Модель закономерности Поиск закономерностей в новых данных
  • 8. Сферы приложения • Компьютерное зрение (computer vision) • Распознавание речи (speech recognition) • Компьютерная лингвистика и обработка естественных языков (natural language processing) • Медицинская диагностика • Биоинформатика • Техническая диагностика • Финансовые приложения • Информационный поиск • …
  • 9. Аппарат • Линейная алгебра • Теория вероятностей и математическая статистика • Методы оптимизации • Численные методы • Математический анализ • Дискретная математика • и др.
  • 11. Классификация задач машинного обучения • Дедуктивное обучение (экспертные системы) • Индуктивное обучение (≈ статистическое обучение) • Обучение с учителем • Обучение без учителя • Обучение с подкреплением (reinforcement learning) • Активное обучение • . . .
  • 12. Дедуктивное или аналитическое обучение (экспертные системы) • Имеются знания, сформулированные экспертом и как-то формализованные. • Программа выводит из этих правил конкретные факты и новые правила.
  • 14. Индуктивное обучение (≈ статистическое обучение) • Обучение с учителем • Обучение без учителя
  • 15. Обучение с учителем • Обучаем машину на примерах (данные + требуемое решение) • Алгоритм сохраняет «значение» о примерах во внутренней математической модели • Предсказываем новые данные, используя обученную модель Основная суть: обучая машину на исходных данных и зная ответ для этих данных, получить ответ для новых данных.
  • 16. Обучение без учителя • Загружаем в машину какой-то набор данных • Машина может самостоятельно проанализировать загруженные данные и сгруппировать их или предложить вам набор инсайтов Основная суть: не зная ответ совсем - получаем ответ.
  • 17. Основные типы задач • Обучение с учителем • Классификация • Регрессия • Обучение без учителя • Кластеризация • Определение выбросов • Гибридные • Коллаборативная фильтрация (рекомендации)
  • 19. Примеры задач классификации • Медицинская диагностика: по набору медицинских характеристик требуется поставить диагноз • Геологоразведка: по данным зондирования почв определить наличие полезных ископаемых • Оптическое распознавание текстов: по отсканированному изображению текста определить цепочку символов, его формирующих • Кредитный скоринг: по анкете заемщика принять решение о выдаче/отказе кредита • Синтез химических соединений: по параметрам химических элементов спрогнозировать свойства получаемого соединения
  • 21. Линейная регрессия data <- read.csv('~/git/R-Linear-Regression/rosn.txt', sep='t') fit <- lm(data$ROSN ~ data$BRN ) plot(data$ROSN~data$BRN, xlab="ROSN", ylab="BRN") abline(fit) summary(fit) http://www.algorithmist.ru/2011/04/linear-regression-with-examples-in-r.html
  • 22.
  • 23. Примеры задач регрессии • Оценка стоимости недвижимости: по характеристике района, экологической обстановке, транспортной связности оценить стоимость жилья • Прогноз свойств соединений: по параметрам химических элементов спрогнозировать температуру плавления, электропроводность, теплоемкость получаемого соединения • Медицина: по постоперационным показателям оценить время заживления органа • Кредитный скоринг: по анкете заемщика оценить величину кредитного лимита • Инженерное дело: по техническим характеристикам автомобиля и режиму езды спрогнозировать расход топлива
  • 25. Примеры задач кластерного анализа • Экономическая география: по физико-географическим и экономическим показателям разбить страны мира на группы схожих по экономическому положению государств • Финансовая сфера: по сводкам банковских операций выявить группы «подозрительных», нетипичных банков, сгуппировать остальные по степени близости проводимой стратегии • Маркетинг: по результатам маркетинговых исследований среди множества потребителей выделить характерные группы по степени интереса к продвигаемому продукту • Социология: по результатам социологических опросов выявить группы общественных проблем, вызывающих схожую реакцию у общества, а также характерные фокус-группы населения
  • 27. Примеры задач идентификации • Медицинская диагностика: по набору медицинских характеристик требуется установить наличие/отсутствие конкретного заболевания • Системы безопасности: по камерам наблюдения в подъезде идентифицировать жильца дома • Банковское дело: определить подлинность подписи на чеке • Обработка изображений: выделить участки с изображениями лиц на фотографии • Искусствоведение: по характеристикам произведения (картины, музыки, текста) определить, является ли его автором тот или иной автор
  • 29. Примеры задач прогнозирования • Биржевое дело: прогнозирование биржевых индексов и котировок • Системы управления: прогноз показателей работы реактора по данным телеметрии • Экономика: прогноз цен на недвижимость • Демография: прогноз изменения численности различных социальных групп в конкретном ареале • Гидрометеорология: прогноз геомагнитной активности
  • 31. Примеры задач извлечения знаний • Медицина: поиск взаимосвязей (синдромов) между различными показателями при фиксированной болезни • Социология: определение факторов, влияющих на победу на выборах • Генная инженерия: выявление связанных участков генома • Научные исследования: получение новых знаний об исследуемом процессе • Биржевое дело: определение закономерностей между различными биржевыми показателями
  • 32. Онлайн курсы/лекции • https://yandexdataschool.ru/edu-process/courses/machine-learning • https://www.coursera.org/learn/introduction-machine-learning • https://www.coursera.org/learn/machine-learning • https://www.youtube.com/watch?v=qLBkB4sMztk • https://www.udacity.com/course/machine-learning-engineer- nanodegree--nd009
  • 33. The Home of High Performance Computing Compute / Manage data / Collaborate http://www.flyelephant.net/
  • 34. DEMO
  • 35. Предстоящие вебинары и конференции • Introduction to FlyElephant platform / January 22 at 16:00 (Kiev) / Webinar language - Russian. • Introduction to FlyElephant platform / January 26 at 11:00 am ( San Francisco) / Webinar language - English. • AI&BigData Lab / June 4 - Odessa
  • 37. FlyElephant Beta Testing Program http://flyelephant.net/beta/ Free access Use new features first To help make FlyElephant better