SlideShare a Scribd company logo
1 of 15
Павел Галушко
Чтоделатьdevops'уеслиувас
захотелиmachinelearning
Pavlo Galushko
• Меня зовут Паша
• Программирую всю жизнь, за
деньги уже больше 25 лет
• Учу людей думать и
программировать
• Умею дышать огнем
• Tech lead Machine Learning dev
team at Namecheap
Кто я
спойлер: Кузнец
Pavlo Galushko
О чем не будет этот доклад
0111001101101111011100100111001001111001
• Этот доклад не будет про помощь ML в
жизни devops.
- Да, так можно
- Да, это работает
- Нет, вам это не нужно
• Если таки жизни больше нет:
- Поиск аномалий
- Особый упор на модели которые
работают с временным рядом.
- Доклад Antonio Pigna
Pavlo Galushko
А ещё не будет ( почти)
01101111011011110111000001110011
• Big Data
• ETL
• Скайнет
Pavlo Galushko
А что будет?
010000010110110001101100001000000111
001001101001011001110110100001110100
• Что такое ML
• Как выглядят процессы
• Что вас ждет (CD4ML)
• Что с этими счастьем делать?
Pavlo Galushko
Что такое машинное обучение
011100100110010101100001011001000110110101100101
• Это математические алгоритмы
• Код создает другой код
• Ему для этого нужно много
данных
• В результате получается
обычный api
Pavlo Galushko
Особенности
0111001101110100011100100110000101101110011001
1101100101
• Эти люди хотят странного
• Очень длинный и сложный
процесс
• Очень много данных
• Очень много вычислений
• Даже на проде
• Получается магия
Pavlo Galushko
Как это делается?
010101110101010001000110
• Сначала ищут данные
• Обучают модель выполнять
задачу
• Пишут сервис работающий с
моделью
• Пишут сервис переобучающий
модель
• Со всем этим счастьем, мы
попробуем взлететь
Pavlo Galushko
Рабочая среда для ресечеров
010011100111011001101001011001000110100101100001
• Железо с GPU
• Nvidia docker
• Jupyter Notebooks
• Каждому свой
• Много CUDA
Pavlo Galushko
Как выглядит готовый проект
0111001101101000011011110110001101101011
• Тренировка
- ETL (spark, Hadoop, много баз)
- Преобразование данных
- Обучение модели
• Prod
- Преобразование данных
- модель
• Дополнительные сервисы
Pavlo Galushko
Что вас ждет (CD4ML)
010011110100110101000111
• Эти люди хотят странного
• Docker,kubernetes с GPU
• Длинные пайплайны
• Передача моделей
• Облачные сервисы
• Spark, Hadoop и прочие ужасы
• Опять закончилось место
• CI/CD никуда не уходил
Pavlo Galushko
• Зовем дева
• Подготавливаемся к длинными
процессам
• Гоняем любителей делать сложные
пайплайны, которые причудливо
образом зависят друг от друга
• Помогаем им разбить на атомарные
пайпланы
• Подготовить место. Быть готовым к
тому, что террабайт забивают
примерно минут за 20
Что с этими счастьем делать?
01001001010011010100100001001111
Pavlo Galushko
• Разбираемся с предложениями
облаков
• Изучить особенности видеокарт
И работы с ними. CUDA и прочие
прелести жизни
• Гонять любителей всего нового
и свежего. TF2 еще не готов для
прода
Что с этими счастьем делать?
01001001010011010100100001001111
Pavlo Galushko
• Разбираемся с особенностями
работы кубика c GPU
• Изучаем стек Апач. Желательно
попробовать
Что с этими счастьем делать?
01001001010011010100100001001111
Pavlo Galushko
До новых встреч
https://www.linkedin.com/in/
galushkopavlo/
https://www.facebook.com/
paul.galushko
• OdessaJS’ 2020 / 29-30 августа
• PyCon Odessa 2020 /сентябрь
0110011001101111011011000110110001101111011101
1100100000011101000110100001100101

More Related Content

More from DevOps_Fest

DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...
DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...
DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...DevOps_Fest
 
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...DevOps_Fest
 
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and Challanges
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and ChallangesDevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and Challanges
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and ChallangesDevOps_Fest
 
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...DevOps_Fest
 
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...DevOps_Fest
 
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...DevOps_Fest
 
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...DevOps_Fest
 
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCD
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCDDevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCD
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCDDevOps_Fest
 
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в Kubernetes
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в KubernetesDevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в Kubernetes
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в KubernetesDevOps_Fest
 
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...DevOps_Fest
 
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...DevOps_Fest
 
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...DevOps_Fest
 
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...DevOps_Fest
 
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOps
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOpsDevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOps
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOpsDevOps_Fest
 
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing Events
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing EventsDevOps Fest 2020. Philipp Krenn. Scale Your Auditing Events
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing EventsDevOps_Fest
 
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...DevOps_Fest
 
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra Light
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra LightDevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra Light
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra LightDevOps_Fest
 
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...DevOps_Fest
 
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світі
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світіDevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світі
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світіDevOps_Fest
 
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDB
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDBDevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDB
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDBDevOps_Fest
 

More from DevOps_Fest (20)

DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...
DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...
DevOps Fest 2020. Барух Садогурский и Леонид Игольник. Устраиваем DevOps без ...
 
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...
DevOps Fest 2020. James Spiteri. Advanced Security Operations with Elastic Se...
 
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and Challanges
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and ChallangesDevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and Challanges
DevOps Fest 2020. Pavlo Repalo. Edge Computing: Appliance and Challanges
 
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...
DevOps Fest 2020. Максим Безуглый. DevOps - как архитектура в процессе. Две к...
 
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...
DevOps Fest 2020. Павел Жданов та Никора Никита. Построение процесса CI\CD дл...
 
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...
DevOps Fest 2020. Станислав Коленкин. How to connect non-connectible: tips, t...
 
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...
DevOps Fest 2020. Андрій Шабалін. Distributed Tracing for microservices with ...
 
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCD
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCDDevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCD
DevOps Fest 2020. Дмитрий Кудрявцев. Реализация GitOps на Kubernetes. ArgoCD
 
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в Kubernetes
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в KubernetesDevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в Kubernetes
DevOps Fest 2020. Роман Орлов. Инфраструктура тестирования в Kubernetes
 
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...
DevOps Fest 2020. Андрей Шишенко. CI/CD for AWS Lambdas with Serverless frame...
 
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...
DevOps Fest 2020. Александр Глущенко. Modern Enterprise Network Architecture ...
 
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...
DevOps Fest 2020. Виталий Складчиков. Сквозь монолитный enterprise к микросер...
 
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...
DevOps Fest 2020. Денис Медведенко. Управление сложными многокомпонентными ин...
 
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOps
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOpsDevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOps
DevOps Fest 2020. Сергей Абаничев. Modern CI\CD pipeline with Azure DevOps
 
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing Events
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing EventsDevOps Fest 2020. Philipp Krenn. Scale Your Auditing Events
DevOps Fest 2020. Philipp Krenn. Scale Your Auditing Events
 
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...
DevOps Fest 2020. Володимир Мельник. TuchaKube - перша українська DevOps/Host...
 
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra Light
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra LightDevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra Light
DevOps Fest 2020. Денис Васильев. Let's make it KUL! Kubernetes Ultra Light
 
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...
DevOps Fest 2020. Даніель Яворович. Data pipelines: building an efficient ins...
 
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світі
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світіDevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світі
DevOps Fest 2020. Богдан Матейко. Infrastructure as a Code в реальному світі
 
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDB
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDBDevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDB
DevOps Fest 2020. Николай Маржан. Consistent backups of multi-shard MongoDB
 

DevOps Fest 2020. Павел Галушко. Что делать devops'у если у вас захотели machine learning

  • 2. Pavlo Galushko • Меня зовут Паша • Программирую всю жизнь, за деньги уже больше 25 лет • Учу людей думать и программировать • Умею дышать огнем • Tech lead Machine Learning dev team at Namecheap Кто я спойлер: Кузнец
  • 3. Pavlo Galushko О чем не будет этот доклад 0111001101101111011100100111001001111001 • Этот доклад не будет про помощь ML в жизни devops. - Да, так можно - Да, это работает - Нет, вам это не нужно • Если таки жизни больше нет: - Поиск аномалий - Особый упор на модели которые работают с временным рядом. - Доклад Antonio Pigna
  • 4. Pavlo Galushko А ещё не будет ( почти) 01101111011011110111000001110011 • Big Data • ETL • Скайнет
  • 5. Pavlo Galushko А что будет? 010000010110110001101100001000000111 001001101001011001110110100001110100 • Что такое ML • Как выглядят процессы • Что вас ждет (CD4ML) • Что с этими счастьем делать?
  • 6. Pavlo Galushko Что такое машинное обучение 011100100110010101100001011001000110110101100101 • Это математические алгоритмы • Код создает другой код • Ему для этого нужно много данных • В результате получается обычный api
  • 7. Pavlo Galushko Особенности 0111001101110100011100100110000101101110011001 1101100101 • Эти люди хотят странного • Очень длинный и сложный процесс • Очень много данных • Очень много вычислений • Даже на проде • Получается магия
  • 8. Pavlo Galushko Как это делается? 010101110101010001000110 • Сначала ищут данные • Обучают модель выполнять задачу • Пишут сервис работающий с моделью • Пишут сервис переобучающий модель • Со всем этим счастьем, мы попробуем взлететь
  • 9. Pavlo Galushko Рабочая среда для ресечеров 010011100111011001101001011001000110100101100001 • Железо с GPU • Nvidia docker • Jupyter Notebooks • Каждому свой • Много CUDA
  • 10. Pavlo Galushko Как выглядит готовый проект 0111001101101000011011110110001101101011 • Тренировка - ETL (spark, Hadoop, много баз) - Преобразование данных - Обучение модели • Prod - Преобразование данных - модель • Дополнительные сервисы
  • 11. Pavlo Galushko Что вас ждет (CD4ML) 010011110100110101000111 • Эти люди хотят странного • Docker,kubernetes с GPU • Длинные пайплайны • Передача моделей • Облачные сервисы • Spark, Hadoop и прочие ужасы • Опять закончилось место • CI/CD никуда не уходил
  • 12. Pavlo Galushko • Зовем дева • Подготавливаемся к длинными процессам • Гоняем любителей делать сложные пайплайны, которые причудливо образом зависят друг от друга • Помогаем им разбить на атомарные пайпланы • Подготовить место. Быть готовым к тому, что террабайт забивают примерно минут за 20 Что с этими счастьем делать? 01001001010011010100100001001111
  • 13. Pavlo Galushko • Разбираемся с предложениями облаков • Изучить особенности видеокарт И работы с ними. CUDA и прочие прелести жизни • Гонять любителей всего нового и свежего. TF2 еще не готов для прода Что с этими счастьем делать? 01001001010011010100100001001111
  • 14. Pavlo Galushko • Разбираемся с особенностями работы кубика c GPU • Изучаем стек Апач. Желательно попробовать Что с этими счастьем делать? 01001001010011010100100001001111
  • 15. Pavlo Galushko До новых встреч https://www.linkedin.com/in/ galushkopavlo/ https://www.facebook.com/ paul.galushko • OdessaJS’ 2020 / 29-30 августа • PyCon Odessa 2020 /сентябрь 0110011001101111011011000110110001101111011101 1100100000011101000110100001100101