SlideShare a Scribd company logo
1 of 16
Download to read offline
Построение моделей
машинного обучения для
увеличения продаж
в сегменте СМБ
CRISP-DM: проверенная методология
для Data Scientist-ов
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Бизнес-анализ
•
•
•
•
•
•
Источники данных
•
•
•
•
•
•
Формирование перечня необходимой информации
Сбор данных из Data Research Platform
Параметры платформы
JupyterHub, или как управлять
сотнями пользователей Python
•
•
•
•
Инструментарий Python + Anaconda + Spark
•
•
•
Анализ основных свойств данных
Exploratory data analysis (EDA)
•
•
•
•
•
•
•
Exploratory data analysis (EDA)
•
•
•
Снижение размерности для визуализации (и kmeans++)
Feature selection / engineering
•
•
•
•
Анализ важности признаков
и построение новых
Моделирование
Бейзлайны моделей
Выбор метрики:
•
•
•
•
•
•
•
•
Бейзлайны моделей
Оценка Precision
Интерпретация моделей
SHAP*, LIME**
•
•
*
**
Результаты внедрения
Передача в пилот и сравнение реальных результатов
•
•
•
•
•
Постановка на регламент
Перенос с тестового стенда на прод
•
•
•
•
•
•
•
•
•
Сессия вопросов
и ответов

More Related Content

Similar to Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения продаж в сегменте СМБ

Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
HOWWEDOIT
 
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
OWASP Russia
 
Smart engineering presentation long range_rus_xor
Smart engineering presentation long range_rus_xorSmart engineering presentation long range_rus_xor
Smart engineering presentation long range_rus_xor
Dmitry Ivanov
 

Similar to Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения продаж в сегменте СМБ (20)

Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...
Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...
Конференция Cybermarketing 2015: Яндекс.Метрика или как «большой брат» следит...
 
Gpudigitallab experimental studio
Gpudigitallab experimental studioGpudigitallab experimental studio
Gpudigitallab experimental studio
 
Петрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.orgПетрова Ксения - Data mining на практике - dmlabs.org
Петрова Ксения - Data mining на практике - dmlabs.org
 
Развертывание алгоритмов на ПЛИС
Развертывание алгоритмов на ПЛИСРазвертывание алгоритмов на ПЛИС
Развертывание алгоритмов на ПЛИС
 
Принцип достаточности
Принцип достаточностиПринцип достаточности
Принцип достаточности
 
Особенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОКОсобенности ETL — инструмента pentaho data integrator. Опыт КРОК
Особенности ETL — инструмента pentaho data integrator. Опыт КРОК
 
Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
Построение и переход на новую аналитическую платформу. Цели, вызовы, решения....
 
20151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 201620151112 Что нового в DB PowerStudio 2016
20151112 Что нового в DB PowerStudio 2016
 
технологическая презентация Gpu digital lab
технологическая презентация Gpu digital labтехнологическая презентация Gpu digital lab
технологическая презентация Gpu digital lab
 
Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...
Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...
Яндекс.Метрика и факторы для SEO-специалиста (Cybermarketing-2015). Севальнев...
 
Особенности анализа в проектах по разработке сервисов
Особенности анализа в проектах по разработке сервисовОсобенности анализа в проектах по разработке сервисов
Особенности анализа в проектах по разработке сервисов
 
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
[1.3] Мониторинг событий ИБ — мастерим «дашборд» - Тарас Иващенко
 
Логистика производства. Имитационное моделирование
Логистика производства. Имитационное моделированиеЛогистика производства. Имитационное моделирование
Логистика производства. Имитационное моделирование
 
Автоматическая генерация C кода и тестирование на целевых вычислителях
Автоматическая генерация C кода и тестирование на целевых вычислителяхАвтоматическая генерация C кода и тестирование на целевых вычислителях
Автоматическая генерация C кода и тестирование на целевых вычислителях
 
Мониторинг веб приложений на PHP в режиме реального времени с помощью Pinba. ...
Мониторинг веб приложений на PHP в режиме реального времени с помощью Pinba. ...Мониторинг веб приложений на PHP в режиме реального времени с помощью Pinba. ...
Мониторинг веб приложений на PHP в режиме реального времени с помощью Pinba. ...
 
Smart engineering presentation long range_rus_xor
Smart engineering presentation long range_rus_xorSmart engineering presentation long range_rus_xor
Smart engineering presentation long range_rus_xor
 
Технический задел
Технический заделТехнический задел
Технический задел
 
Прогнозирование на SQL с помощью GBQ ML
Прогнозирование на SQL с помощью GBQ MLПрогнозирование на SQL с помощью GBQ ML
Прогнозирование на SQL с помощью GBQ ML
 
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниАлександр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
 
Owox rzykov
Owox rzykovOwox rzykov
Owox rzykov
 

More from Global Innovation Labs

Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Global Innovation Labs
 

More from Global Innovation Labs (20)

Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
Наталья Полковникова. Кардио ИИ. Построение системы распознавания коронарных ...
 
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоцийОльга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
Ольга Перепелкина. NeurodataLab. Особенности машинного распознавания эмоций
 
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
Павел Бахтин. ВШЭ. Использование state-of-the-art эмбеддинговых моделей для а...
 
Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на...
Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на...Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на...
Артем Артемов. Когнитивные системы. Учет неизвестных признаков нейромодели на...
 
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
Александр Ерофеев. Газпромнефть. Управление качеством данных, инструмент и пр...
 
Евгений Линник. БКС. GIGO — секреты очистки данных
Евгений Линник. БКС. GIGO — секреты очистки данныхЕвгений Линник. БКС. GIGO — секреты очистки данных
Евгений Линник. БКС. GIGO — секреты очистки данных
 
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
Егор Матешук. МаксимаТелеком. Не Spark’ом единым — полезные инструменты для с...
 
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerceПетр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce
 
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
Андрей Коняев. ArenaData. Построение аналитики на ClickHouse — преимущества и...
 
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
 
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
 
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
 
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
 
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщиныЕкатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
 
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
 
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
 
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
 
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
 
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рискамиЯна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
 

Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения продаж в сегменте СМБ