SlideShare a Scribd company logo
Пальто с 300 корманами
или как искать ошибки
Петр Ермаков

Lamoda / DataGym
О себе
Петр Ермаков https://ermakovpetr.ru

• Lamoda // Senior Data Scientist

• Юла MailRu Group // Руководитель отдела аналитики

• HeadHunter // Data Scientist

Веду телеграмм канал https://t.me/PowerOfData
Data Coach https://DataGym.ru
Agenda
• Задачи Lamoda

• Особенности и данные

• Задача: качество контента
Задачи
• Рекомендации, Каталог, Поиск

• Ценообразование

• Логистика

• Маркетинг

• Отток

• … другое
Рекомендации
• Похожие товары

• С этим товаром покупают

• Рекомендовано для вас

• Рекомендации на корзину

• Визуальные рекомендации
Поиск
• Саджесты

• Ранжирование

• Синонимы

• Фильтрация
Каталог
• Ранжирование

• Фильтрация
Поиск по фото
Дополненная реальность
Задачи
• Рекомендации, Каталог, Поиск

• Ценообразование

• Логистика

• Маркетинг

• Отток

• … другое
Метрики
• Клики

• Заказы

• Средний чек

• Выкупы

• Выручка

• Прибыль
Карточка товара
• Какие фото?

• Какое описание?
Размеры
• Унификация размеров

• Рекомендация размеров

• Большемерки/Маломерки
Закупки
• За несколько месяцев

• Медленное управление ассортиментом

• Время жизни товара
Свой склад
• Быстро распродается - плохо?

• А медленно?

• Сток в дороге
Особенность данных
• Отказы

• Возвраты

• Задержка до месяца

• Черная пятница
Сколько карманов?
Сколько карманов?
Сколько карманов?
Где больше карманов?
Карманы это важно!!!
Какие могут быть ошибки?
• Неверная категория

• Ошибки/опечатки в тексте

• Неверные числовые значения

• Неверные категориальные значения

• Ошибочные фото
Текст
Текст
Текст
Текст
Текст
Текст
Подход: Здравый смысл
Подход: Здравый смысл
Подход: Статистика
Подход: Статистика
Мультиклассификация на текстах
• TfidfVectorizer + XGBClassifier (multi:softprob)

• https://github.com/zveryansky/textvec/
… + признаки
• Word2Vec + CatBoostClassifier (MultiClass)
VGG16 + fine tuning
VGG16 + fine tuning
• https://github.com/zalandoresearch/fashion-mnist

• https://github.com/lmcinnes/umap

• https://flyyufelix.github.io/2016/10/03/fine-tuning-in-keras-part1.html
Почему качество - это важно?
• Поиск

• Рекомендации

• Пользователи ❤
Особая благодарность
• Александру Желубенкову

• Кристине Аветисян

• Дарье Шурыгиной

• Олегу Хомюку
Контакты
Петр Ермаков

• https://ermakovpetr.ru
Telegram Channel:
• https://t.me/PowerOfData

More Related Content

More from Global Innovation Labs

Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Global Innovation Labs
 

More from Global Innovation Labs (13)

Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
Илья Чухляев. OWOX. Как с помощью ML и BigQuery находить зоны роста в выполне...
 
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
Артемий Козырь. Сибур. Лучшие способы убить производительность аналитической ...
 
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниАлександр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камни
 
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
Ксения Александрова. Independent Media. Рекомендательные технологии в Digital...
 
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
Максим Годзи. Retentioneering. Искуственный интеллект помогает банку оптимзир...
 
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщиныЕкатерина Артюгина. ex MAIL.ru. Что выбирают женщины
Екатерина Артюгина. ex MAIL.ru. Что выбирают женщины
 
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
Александр Кузнецов. Lanit Digital. Что будет если маркетологи начнут вести се...
 
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
Андрей Анисимов. ВТБ. Построение моделей машинного обучения для увеличения пр...
 
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
Даниил Терентьев. Conventus. Как и зачем искусственный интеллект оценивает мы...
 
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
Илья Мунерман. Интрефакс Лаб. Вычисление исковой нагрузки российских компаний
 
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
Павел Соболев. BSH Group (BOSCH/Siemens) . Машинное обучение для прогнозирова...
 
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
Тарас Пустовой. Университет 2035. Как ИИ отвечает на вопрос «Чему пойти учить...
 
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рискамиЯна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
Яна Крухмалева. ПАО Газпром. Опыт внедрения системы управления рисками
 

Петр Ермаков. LAMODA. Автоматическая валидация контента в e-commerce