SlideShare a Scribd company logo
JULY 19, 2018
ALIAKSEI STATUT
Machine Learning with
Amazon SageMaker
2
• Алексей Статут
• Software Engineer
• Опыт работы более 3-х лет
• Стараюсь не зацикливаться на конкретных
технологиях
КТО Я?
3
О ЧЕМ ДОКЛАД?
Кратко о Machine Learning1
AWS SageMaker2
Личный опыт3
4
Машинное обучение (Machine Learning) — обширный подраздел искусственного
интеллекта, изучающий методы построения алгоритмов, способных обучаться, и их
применение.
5
ТИПЫ ЗАДАЧ
6
КЛАССИФИКАЦИЯ
7
ЗАДАЧА ВОССТАНОВЛЕНИЯ РЕГРЕССИИ
8
ЗАДАЧА КЛАСТЕРИЗАЦИИ (ОБУЧЕНИЯ БЕЗ
УЧИТЕЛЯ)
9
ЗАДАЧА ПРОГНОЗИРОВАНИЯ
10
ЭТАПЫ РАЗРАБОТКИ МОДЕЛИ
Сбор данных
Подготовка данных
Выбор модели и тренировка
Оценка и тонкая настройка
Использование
и улучшение
11
1. Малый объем обучающей выборки
2. Некорректность входных данных
3. Переобучение
ОСНОВНЫЕ ПРОБЛЕМЫ ML
12
AWS SageMaker - это управляемая платформа для быстрого и простого создания,
обучения и развертывания модели машинного обучения в любом масштабе.
13
1. Инструменты для сбора данных
2. Визуализация данных с Jupyter Notebook
3. Встроенные ML алгоритмы
4. Развертывание и A/B тестирование
5. Автомасштабирование
КАК AWS SAGEMAKER УПРОЩАЕТ ЖИЗНЬ?
14
ОСОБЕННОСТИ
End-to-end
платформа
машинного
обучения
Нулевая
настройка
Гибкая
тренировка
модели
Плата за время
15
Сбор данных
Подготовка данных
Выбор модели и тренировка
Оценка и тонкая настройка
Использование
и улучшение
- S3
- Redshift
- DynamoDB
- RDS
Jupyter Notebook
SageMaker
Training jobs
- Jupyter Notebook
- Hyperparameter tuning jobs
- Endpoints
- Cloudwatch
16
1. Notebook instances
2. Training jobs
3. Hyperparameter tuning jobs
4. Models
5. Endpoint configurations
6. Endpoints
КОМПОНЕНТЫ
17
ПОДГОТОВКА ДАННЫХ
18
ВИЗУАЛИЗАЦИЯ ДАННЫХ
19
1. С помощью SageMaker API
2. С помощью UI
– Выбрать алгоритм
– Определиться с размерами вычислительных мощностей
– Указать параметры алгоритма
– Задать источник данных (с Amazon S3)
– Запустить тренировку
СОЗДАНИЕ ТРЕНИРОВОЧНОГО ЗАДАНИЯ
20
1. Выбрать алгоритм
2. Выбрать диапазоны параметров
3. Выбрать метрику
4. Указать источник данных (Amazon S3)
5. Задать ограничение для вычислительных ресурсов
АВТОМАТИЧЕСКАЯ НАСТРОЙКА МОДЕЛИ
(HYPERPARAMETER TUNING)
21
1. Использование модели через HTTPS ресурс
2. Возможно сохранение пользовательских запросов для последующего улучшения
модели
3. Настройка A/B тестирования для ресурса
4. Автоматическое масштабирование
ИСПОЛЬЗОВАНИЕ МОДЕЛИ
22
1. Linear Learner
2. XGBoost Algorithm
3. Image Classification Algorithm
4. K-Means Algorithm
5. ...
6. + Возможность использовать свои
ВСТРОЕННЫЕ АЛГОРИТМЫ
23
1. AWS SageMaker SDK
2. Интеграция с Apache Spark
3. Гибкая настройка безопасности
4. Мониторинг
ДРУГИЕ ПОЛЕЗНЫЕ ВОЗМОЖНОСТИ
24
• Цена (https://aws.amazon.com/sagemaker/pricing)
НЕДОСТАТКИ
Кол-во часов в
месяц
Тип сервера
для
тренировки
Тип сервера
для хостинга
Стоимость часа Всего
4 ml.m4.xlarge $1.12 $4.48
24*31*3 = 2232 ml.t2.medium $0.065 $145.08
25
1. Задача: Предсказать CTR (Click through rate) для рекламных блока на странице
2. Параметры:
– Расположение блока
– Устройство пользователя
– Характеристики пользователя
– Характеристики рекламируемого товара
3. Результат: модель неудачная, ctr и параметры не имеют сильной зависимости
между собой
ЛИЧНЫЙ ОПЫТ
26
Вопросы?
27
Спасибо за внимание!

More Related Content

Similar to Machine Learning with Amazon SageMaker

TMPA-2013 Itsykson: Java Program Analysis
TMPA-2013 Itsykson: Java Program AnalysisTMPA-2013 Itsykson: Java Program Analysis
TMPA-2013 Itsykson: Java Program Analysis
Iosif Itkin
 
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...Positive Hack Days
 
Automation from the trenches
Automation from the trenchesAutomation from the trenches
Automation from the trenches
GlobalLogic Ukraine
 
Инструменты автоматизации процессов тестирования
Инструменты автоматизации процессов тестированияИнструменты автоматизации процессов тестирования
Инструменты автоматизации процессов тестирования
Paul Lesyuk
 
MySQL для высоконагруженных проектов
MySQL для высоконагруженных проектовMySQL для высоконагруженных проектов
MySQL для высоконагруженных проектовSoftline
 
Automation from the trenches
Automation from the trenchesAutomation from the trenches
Automation from the trenchesGleb Rybalko
 
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
Dmitry Andreev
 
Практическая верификация и командная работа
Практическая верификация и командная работаПрактическая верификация и командная работа
Практическая верификация и командная работа
MATLAB
 
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )Mobile Developer Day
 
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )Mobile Developer Day
 
20151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 201620151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 2016
Andrew Sovtsov
 
Warehouse Simulation
Warehouse SimulationWarehouse Simulation
Warehouse Simulation
Vardan Gasparyan
 
Jira as a test management tool
Jira as a test management toolJira as a test management tool
Jira as a test management tool
Return on Intelligence
 
Jira as a test management tool
Jira as a test management toolJira as a test management tool
Jira as a test management tool
Return on Intelligence
 
Защита центров обработки данных. Механизмы безопасности для классической фабр...
Защита центров обработки данных. Механизмы безопасности для классической фабр...Защита центров обработки данных. Механизмы безопасности для классической фабр...
Защита центров обработки данных. Механизмы безопасности для классической фабр...
Cisco Russia
 
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
QADay
 
Симуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологииСимуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологии
Sergey Gorshkov
 
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
Pavel Gorbunov
 
Один за всех, или как помочь тестированию многих компонентов одной системы
Один за всех, или как помочь тестированию многих компонентов одной системыОдин за всех, или как помочь тестированию многих компонентов одной системы
Один за всех, или как помочь тестированию многих компонентов одной системы
SQALab
 
Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...
Aliaksandr Ikhelis
 

Similar to Machine Learning with Amazon SageMaker (20)

TMPA-2013 Itsykson: Java Program Analysis
TMPA-2013 Itsykson: Java Program AnalysisTMPA-2013 Itsykson: Java Program Analysis
TMPA-2013 Itsykson: Java Program Analysis
 
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...
Техническая реализация интеграции систем класса IT-GRC и систем контроля защи...
 
Automation from the trenches
Automation from the trenchesAutomation from the trenches
Automation from the trenches
 
Инструменты автоматизации процессов тестирования
Инструменты автоматизации процессов тестированияИнструменты автоматизации процессов тестирования
Инструменты автоматизации процессов тестирования
 
MySQL для высоконагруженных проектов
MySQL для высоконагруженных проектовMySQL для высоконагруженных проектов
MySQL для высоконагруженных проектов
 
Automation from the trenches
Automation from the trenchesAutomation from the trenches
Automation from the trenches
 
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
Оптимизация производительности и нагрузочное тестирование в среде Visual Stud...
 
Практическая верификация и командная работа
Практическая верификация и командная работаПрактическая верификация и командная работа
Практическая верификация и командная работа
 
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
 
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
гибкий подход к тестированию ‘умных’ электронных систем.( а. вдовин, Auriga )
 
20151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 201620151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 2016
 
Warehouse Simulation
Warehouse SimulationWarehouse Simulation
Warehouse Simulation
 
Jira as a test management tool
Jira as a test management toolJira as a test management tool
Jira as a test management tool
 
Jira as a test management tool
Jira as a test management toolJira as a test management tool
Jira as a test management tool
 
Защита центров обработки данных. Механизмы безопасности для классической фабр...
Защита центров обработки данных. Механизмы безопасности для классической фабр...Защита центров обработки данных. Механизмы безопасности для классической фабр...
Защита центров обработки данных. Механизмы безопасности для классической фабр...
 
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
АНТОН СЕРПУТЬКО «Start performance testing from scratch» QADay 2019
 
Симуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологииСимуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологии
 
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
Программная среда «УЧИМСЯ ПРОГРАММИРОВАТЬ»
 
Один за всех, или как помочь тестированию многих компонентов одной системы
Один за всех, или как помочь тестированию многих компонентов одной системыОдин за всех, или как помочь тестированию многих компонентов одной системы
Один за всех, или как помочь тестированию многих компонентов одной системы
 
Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...Building Open Source Test Automation Frameworks. Watir based automation case ...
Building Open Source Test Automation Frameworks. Watir based automation case ...
 

More from Vitebsk Miniq

Runtime compilation and code execution in groovy
Runtime compilation and code execution in groovyRuntime compilation and code execution in groovy
Runtime compilation and code execution in groovy
Vitebsk Miniq
 
The 5 Laws of Software Estimates
The 5 Laws of Software EstimatesThe 5 Laws of Software Estimates
The 5 Laws of Software Estimates
Vitebsk Miniq
 
Latest & Greatest Observability Release 7.9
Latest & Greatest Observability Release 7.9Latest & Greatest Observability Release 7.9
Latest & Greatest Observability Release 7.9
Vitebsk Miniq
 
Тестирование Spring-based приложений
Тестирование Spring-based приложенийТестирование Spring-based приложений
Тестирование Spring-based приложений
Vitebsk Miniq
 
Семантический поиск - что это, как работает и чем отличается от просто поиска
Семантический поиск - что это, как работает и чем отличается от просто поискаСемантический поиск - что это, как работает и чем отличается от просто поиска
Семантический поиск - что это, как работает и чем отличается от просто поиска
Vitebsk Miniq
 
Локализационное тестирование - это не только перевод
Локализационное тестирование - это не только переводЛокализационное тестирование - это не только перевод
Локализационное тестирование - это не только перевод
Vitebsk Miniq
 
ISTQB Сертификация тестировщиков: быть или не быть?
ISTQB Сертификация тестировщиков: быть или не быть?ISTQB Сертификация тестировщиков: быть или не быть?
ISTQB Сертификация тестировщиков: быть или не быть?
Vitebsk Miniq
 
Apollo GraphQL Federation
Apollo GraphQL FederationApollo GraphQL Federation
Apollo GraphQL Federation
Vitebsk Miniq
 
Who is a functional tester
Who is a functional testerWho is a functional tester
Who is a functional tester
Vitebsk Miniq
 
Crawling healthy
Crawling healthyCrawling healthy
Crawling healthy
Vitebsk Miniq
 
Вперед в прошлое
Вперед в прошлоеВперед в прошлое
Вперед в прошлое
Vitebsk Miniq
 
CloudFormation experience
CloudFormation experienceCloudFormation experience
CloudFormation experience
Vitebsk Miniq
 
Learning Intelligence: the story of mine
Learning Intelligence: the story of mineLearning Intelligence: the story of mine
Learning Intelligence: the story of mine
Vitebsk Miniq
 
Как программисты могут спасти мир
Как программисты могут спасти мирКак программисты могут спасти мир
Как программисты могут спасти мир
Vitebsk Miniq
 
Использование AzureDevOps при разработке микросервисных приложений
Использование AzureDevOps при разработке микросервисных приложенийИспользование AzureDevOps при разработке микросервисных приложений
Использование AzureDevOps при разработке микросервисных приложений
Vitebsk Miniq
 
Distributed tracing system in action. Instana Tracing.
Distributed tracing system in action. Instana Tracing.Distributed tracing system in action. Instana Tracing.
Distributed tracing system in action. Instana Tracing.
Vitebsk Miniq
 
Насорил - убери!
Насорил - убери!Насорил - убери!
Насорил - убери!
Vitebsk Miniq
 
Styled-components. Что? Когда? И зачем?
Styled-components. Что? Когда? И зачем?Styled-components. Что? Когда? И зачем?
Styled-components. Что? Когда? И зачем?
Vitebsk Miniq
 
Красные флаги и розовые очки
Красные флаги и розовые очкиКрасные флаги и розовые очки
Красные флаги и розовые очки
Vitebsk Miniq
 
CSS. Практика
CSS. ПрактикаCSS. Практика
CSS. Практика
Vitebsk Miniq
 

More from Vitebsk Miniq (20)

Runtime compilation and code execution in groovy
Runtime compilation and code execution in groovyRuntime compilation and code execution in groovy
Runtime compilation and code execution in groovy
 
The 5 Laws of Software Estimates
The 5 Laws of Software EstimatesThe 5 Laws of Software Estimates
The 5 Laws of Software Estimates
 
Latest & Greatest Observability Release 7.9
Latest & Greatest Observability Release 7.9Latest & Greatest Observability Release 7.9
Latest & Greatest Observability Release 7.9
 
Тестирование Spring-based приложений
Тестирование Spring-based приложенийТестирование Spring-based приложений
Тестирование Spring-based приложений
 
Семантический поиск - что это, как работает и чем отличается от просто поиска
Семантический поиск - что это, как работает и чем отличается от просто поискаСемантический поиск - что это, как работает и чем отличается от просто поиска
Семантический поиск - что это, как работает и чем отличается от просто поиска
 
Локализационное тестирование - это не только перевод
Локализационное тестирование - это не только переводЛокализационное тестирование - это не только перевод
Локализационное тестирование - это не только перевод
 
ISTQB Сертификация тестировщиков: быть или не быть?
ISTQB Сертификация тестировщиков: быть или не быть?ISTQB Сертификация тестировщиков: быть или не быть?
ISTQB Сертификация тестировщиков: быть или не быть?
 
Apollo GraphQL Federation
Apollo GraphQL FederationApollo GraphQL Federation
Apollo GraphQL Federation
 
Who is a functional tester
Who is a functional testerWho is a functional tester
Who is a functional tester
 
Crawling healthy
Crawling healthyCrawling healthy
Crawling healthy
 
Вперед в прошлое
Вперед в прошлоеВперед в прошлое
Вперед в прошлое
 
CloudFormation experience
CloudFormation experienceCloudFormation experience
CloudFormation experience
 
Learning Intelligence: the story of mine
Learning Intelligence: the story of mineLearning Intelligence: the story of mine
Learning Intelligence: the story of mine
 
Как программисты могут спасти мир
Как программисты могут спасти мирКак программисты могут спасти мир
Как программисты могут спасти мир
 
Использование AzureDevOps при разработке микросервисных приложений
Использование AzureDevOps при разработке микросервисных приложенийИспользование AzureDevOps при разработке микросервисных приложений
Использование AzureDevOps при разработке микросервисных приложений
 
Distributed tracing system in action. Instana Tracing.
Distributed tracing system in action. Instana Tracing.Distributed tracing system in action. Instana Tracing.
Distributed tracing system in action. Instana Tracing.
 
Насорил - убери!
Насорил - убери!Насорил - убери!
Насорил - убери!
 
Styled-components. Что? Когда? И зачем?
Styled-components. Что? Когда? И зачем?Styled-components. Что? Когда? И зачем?
Styled-components. Что? Когда? И зачем?
 
Красные флаги и розовые очки
Красные флаги и розовые очкиКрасные флаги и розовые очки
Красные флаги и розовые очки
 
CSS. Практика
CSS. ПрактикаCSS. Практика
CSS. Практика
 

Machine Learning with Amazon SageMaker