SlideShare a Scribd company logo
1 of 42
Download to read offline
Андрей Мурашев
Руководитель команды Машинного обучения
Рекомендательных систем
Обзор трендов
Рекомендательных
систем от Пульса
08.11.2019
Кто я?
Андрей Мурашев
Автор алгоритма рекомендаций myWidget
Руководил разработкой Пульса
Сейчас руковожу Командой Машинного обучения Рек.систем
Мы занимаемся построением рек.систем для различных продуктов
Mail.ru, включая Пульс, myWidget и еще пару “секретных” проектов
Что такое Пульс
Рекомендательная система собирающая персональную Ленту
пользователя.
Работает на главной Mail.ru c аудиторий 10 млн DAU (Дневная аудитория)
Что такое myWidget
Система персональных рекомендаций для сайта - более 1000 партнеров
и более 100 млн рекомендаций в сутки
Текущие тренды Рек.систем
1. Многорукие-бандиты
2. Объяснительные рекомендации
3. Приватность
4. “Честные” (fairness) рекомендации
5. Оптимизация нескольких задач одновременно
6. Работа со смещенными “боевыми” данными
7. Нейронные сети
Многорукие бандиты
Многорукие бандиты - Netflix
Топовые компании в рекомендациях Netflix, Spotify, Pandora -
одновременно начали использовать многорукие бандиты
Можно рекомендовать не только фильм, но и обложку для фильма.
Дата публикации: 01.2018
Многорукие бандиты - Spotify
Рекомендации “полок” на главном экране
Выбирается одновременно пара: плейлист+объяснение
Объяснение выбирают среди подходящих плейлисту,
но из фиксированного пула десятка объяснений
Дата публикации: 10.2018 (RecSys)
Epsilon-greedy стратегия
Контекстные многорукие бандиты
Многорукие бандиты - Online evaluation Netflix
Значительно улучшились продуктовые метрики - но числа не раскрывают
Для популярных фильмов - выбирают популярные обложки и
популярные актеры часто оказываются лучше остальных
Наиболее полезно оказалось в online для нишевых фильмов и тех,
которые изначально не рекомендовали человеку
Многорукие бандиты - Spotify
1. Random - случайный пара
объяснение+плейлист
2. Control - алгоритм без
бандитов
3. Logistic Regression -
линейная модель
4. Bart 2nd order - MF 2-order
5. Bart 3nd order - MF 3-order
features interactions
Многорукие бандиты - myWidget
Все статьи сайта
ML(GBOT) - ранки, топ
лучших
Контекстные
бандиты
GBOT - gradient boosting oblivious trees.
Наш внутренний framework для работы
с деревьями решений.
Многорукие бандиты - myWidget
Из нашего опыта контекст дает 10-15% улучшения в среднем на крупных
площадках
Особенности работы бандитов из практики:
● плохо работают при малом кол-ве статистики
● контекст зависит от объема трафика
● параметры бандитов зависят от размера и характеристик площадки
○ кол-во трафика
○ ограничения свежести
○ кол-во контента
○ CTR
Объяснительные
рекомендации
Объяснительные рекомендации
Объяснительные рекомендации
Обучаться на отзывах юзера и предсказывать их как “объяснение”
Multi-task learning - обучаем
одновременно рейтинг и текстовое
объяснение
Используются нейросети:
GAN, Autoencoder, seq2seq
Учитываем текстовый контент
Дата публикации: 10.2018 (RecSys)
Объяснительные рекомендации
Двустороннее объяснение рекомендаций
Сервисы знакомств, поиска работы
Дата публикации: 10.2018 (RecSys)
Приватность
Рекомендации в условиях GDPR
Первый доклад на основной сессии RecSys 2019 от профессора права о
том, как строить рекомендации и таргетировать рекламу в условиях GDPR
Идеи:
1. Человек должен давать согласие на использование и учет его данных
алгоритмами
2. Компании не могут использовать данные для дискриминации
пользователей и/или для поиска “слабых” мест человека
Дата публикации: 09.2019 (RecSys)
Другие статьи про приватность данных
Efficient Privacy-Preserving Recommendations based on Social
Graphs
Идея о том, что рекомендации на основании графа соц.сетей могут содержать приватную
информацию и надо зашумить данные, по которым они строятся
PrivateJobMatch: A Privacy-Oriented Deferred Multi-Match
Recommender System for Stable Employment
Рекомендательный сервис работы, который не раскрывает данные о пользователях и
требует меньше информации личной
Дата публикации: 09.2019 (RecSys)
Оптимизация
нескольких целей
одновременно
Recommending What Video to Watch Next: A
Multitask Ranking System - Google
Дата публикации: 09.2019 (RecSys)
Recommending What Video to Watch Next: A
Multitask Ranking System - Google
Дата публикации: 09.2019 (RecSys)
Multi-gate Mixture-of-Experts
Modeling task relationships in multi-task learning with multi-gate mixture-of experts. 2018
Recommending What Video to Watch Next: A
Multitask Ranking System - Google
Дата публикации: 09.2019 (RecSys)
Multi-gate Mixture-of-Experts
Работа со
“смещенными”
боевыми данными
Recommending What Video to Watch Next: A
Multitask Ranking System - Google
Учет position bias в модели
Перебалансировка данных
Criteo - RecSys 2018 best paper
Идея заключается в том, что лучший способ построения датасета - это
random uniform, но для бизнеса это слишком страшно и дорого.
95% это контроль и 5% это рандом
Оптимизируем матричное разложение исходя из условия, что веса на 5%
рандомной выборки не должны сильно отличаться от весов на 95%
контрольной.
Дата публикации: 10.2018 (RecSys)
Перебалансировка данных
Yt - таргет по случайной выборке
Pt - вектор объекта ответственный за случайную
выборку
Yc - таргет по контрольной выборке (боевым данным)
Pc - вектор объекта ответственный за контрольную
выборку
U - вектор юзера
“Честные” рекомендации
Calibrated Recs - Netflix
Распределение вкусов пользователя - не совпадает с распределением
рекомендуемых товаров
Дата публикации: 10.2018 (RecSys)
Calibrated Recs - Netflix
Разнообразие интересов пользователей Пульса
В Пульсе мы сталкиваемся с такой же проблемой - алгоритм старается
предсказать “основной” интересе пользователя.
Мы повторяем распределение документов в выдаче пропорционально
интересам пользователя. Это дает улучшение метрик восприятия
“персональности” Ленты пользователями на 20%
Нейронные сети
DeepFM - Huawei
Дата публикации: 04.2018
Hierarchical Temporal Convolutional Networks for
Dynamic Recommender Systems - Pinterest
Дата публикации: 04.2019
Выводы
1. Многорукие бандиты - позволяют получить еще улучшение поверх
имеющихся алгоритмов
2. Объяснительные рекомендации - генерация объяснений
3. “Честные” рекомендации - начинают получать применение
4. Приватность данных - не улучшает рекомендации, но важно
5. Работа со смещенными “боевыми” данными - всегда актуально
6. Оптимизация нескольких целей одновременно встречается все чаще
7. Нейронные сети - позволяют нам по-новому работать с историей
пользователя, сочетать разные типы данных и строить высокоуровневые
взаимодействия между фичами
Вопросы?
Андрей
Мурашев
Руководитель команды Машинного
обучения Рекомендательных систем
a.murashev@corp.mail.ru
Использованные статьи
[7] https://dl.acm.org/citation.cfm?id=3241729
[8] https://bit.ly/2Cu3aH5
[17] https://dl.acm.org/citation.cfm?id=3240365
[19] https://arxiv.org/pdf/1807.01227.pdf
[21] https://dl.acm.org/citation.cfm?id=3346980
[22] https://dl.acm.org/citation.cfm?id=3347013 , https://dl.acm.org/citation.cfm?id=3346983&dl=ACM&coll=DL
[24] https://dl.acm.org/citation.cfm?id=3346997
[29] https://arxiv.org/pdf/1706.07639.pdf
[32] https://dl.acm.org/citation.cfm?id=3240372
[36] https://arxiv.org/pdf/1804.04950.pdf
[37] https://arxiv.org/pdf/1904.04381.pdf

More Related Content

Similar to Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)

Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
 
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.Molinos
 
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг
Как перестать бояться и начать любить медийку. Алгоритмический маркетингКак перестать бояться и начать любить медийку. Алгоритмический маркетинг
Как перестать бояться и начать любить медийку. Алгоритмический маркетингSPECIA
 
C8 for uadigital2012
C8 for uadigital2012C8 for uadigital2012
C8 for uadigital2012Elena Peday
 
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию""Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"Oleg Mikhalevich
 
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"Комплето
 
Маркетинг мобильных приложений: чек-лист по запуску первой кампании
Маркетинг мобильных приложений: чек-лист по запуску первой кампанииМаркетинг мобильных приложений: чек-лист по запуску первой кампании
Маркетинг мобильных приложений: чек-лист по запуску первой кампанииNetpeak
 
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)PCampRussia
 
Лучшие практики мобильного маркетинга: как стать №1
Лучшие практики мобильного маркетинга: как стать №1Лучшие практики мобильного маркетинга: как стать №1
Лучшие практики мобильного маркетинга: как стать №1Eugene Lisovskiy
 
Performance-маркетинг мобильных приложений
Performance-маркетинг мобильных приложенийPerformance-маркетинг мобильных приложений
Performance-маркетинг мобильных приложенийNetpeak
 
Big Data & Big Image_Николай Киселев
Big Data & Big Image_Николай КиселевBig Data & Big Image_Николай Киселев
Big Data & Big Image_Николай Киселевiabrussiaprez
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымSergey Gorshkov
 
Perfomance-маркетинг мобильных приложений
Perfomance-маркетинг мобильных приложенийPerfomance-маркетинг мобильных приложений
Perfomance-маркетинг мобильных приложенийNetpeak
 
Практические рекомендации
Практические рекомендацииПрактические рекомендации
Практические рекомендацииDarya Karelina
 
Leonovich sape
Leonovich   sapeLeonovich   sape
Leonovich sapeAnna
 
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (..."Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...AvitoTech
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsCleverDATA
 
Аналитика для СМИ - на помощь приходят роботы!
Аналитика для СМИ - на помощь приходят роботы!Аналитика для СМИ - на помощь приходят роботы!
Аналитика для СМИ - на помощь приходят роботы!Relap.io
 

Similar to Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey) (20)

Semantic force newmedia b2b
Semantic force newmedia b2bSemantic force newmedia b2b
Semantic force newmedia b2b
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг.
 
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг
Как перестать бояться и начать любить медийку. Алгоритмический маркетингКак перестать бояться и начать любить медийку. Алгоритмический маркетинг
Как перестать бояться и начать любить медийку. Алгоритмический маркетинг
 
C8 for uadigital2012
C8 for uadigital2012C8 for uadigital2012
C8 for uadigital2012
 
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию""Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"
"Как взглянуть на ваш сайт по-новому и на практике повлиять на конверсию"
 
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"
#EMB2B Андрей Мерешкин: "Руководителю на заметку: секреты аналитической работы"
 
Маркетинг мобильных приложений: чек-лист по запуску первой кампании
Маркетинг мобильных приложений: чек-лист по запуску первой кампанииМаркетинг мобильных приложений: чек-лист по запуску первой кампании
Маркетинг мобильных приложений: чек-лист по запуску первой кампании
 
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)
Продукт в сфере онлайн-рекламы с нуля (Арсений Кравченко)
 
Лучшие практики мобильного маркетинга: как стать №1
Лучшие практики мобильного маркетинга: как стать №1Лучшие практики мобильного маркетинга: как стать №1
Лучшие практики мобильного маркетинга: как стать №1
 
Performance-маркетинг мобильных приложений
Performance-маркетинг мобильных приложенийPerformance-маркетинг мобильных приложений
Performance-маркетинг мобильных приложений
 
Big Data & Big Image_Николай Киселев
Big Data & Big Image_Николай КиселевBig Data & Big Image_Николай Киселев
Big Data & Big Image_Николай Киселев
 
Логическая витрина для доступа к большим данным
Логическая витрина для доступа к большим даннымЛогическая витрина для доступа к большим данным
Логическая витрина для доступа к большим данным
 
Perfomance-маркетинг мобильных приложений
Perfomance-маркетинг мобильных приложенийPerfomance-маркетинг мобильных приложений
Perfomance-маркетинг мобильных приложений
 
Практические рекомендации
Практические рекомендацииПрактические рекомендации
Практические рекомендации
 
Leonovich sape
Leonovich   sapeLeonovich   sape
Leonovich sape
 
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (..."Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
"Контекстная реклама в Avito: что под капотом?" Вадим Аюев и Андрей Остапец (...
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_fors
 
Сравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетовСравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетов
 
Аналитика для СМИ - на помощь приходят роботы!
Аналитика для СМИ - на помощь приходят роботы!Аналитика для СМИ - на помощь приходят роботы!
Аналитика для СМИ - на помощь приходят роботы!
 

More from Mail.ru Group

Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...
Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...
Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...Mail.ru Group
 
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...Mail.ru Group
 
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир ДубровинДругая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир ДубровинMail.ru Group
 
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...Mail.ru Group
 
Управление инцидентами в Почте Mail.ru, Антон Викторов
Управление инцидентами в Почте Mail.ru, Антон ВикторовУправление инцидентами в Почте Mail.ru, Антон Викторов
Управление инцидентами в Почте Mail.ru, Антон ВикторовMail.ru Group
 
DAST в CI/CD, Ольга Свиридова
DAST в CI/CD, Ольга СвиридоваDAST в CI/CD, Ольга Свиридова
DAST в CI/CD, Ольга СвиридоваMail.ru Group
 
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...Mail.ru Group
 
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...Mail.ru Group
 
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidiaRAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidiaMail.ru Group
 
WebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоWebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоMail.ru Group
 
AMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковAMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковMail.ru Group
 
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковКак мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковMail.ru Group
 
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Mail.ru Group
 
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиМетапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиMail.ru Group
 
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupКак не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupMail.ru Group
 
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Mail.ru Group
 
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Mail.ru Group
 
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Mail.ru Group
 
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()Mail.ru Group
 
Learning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинLearning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинMail.ru Group
 

More from Mail.ru Group (20)

Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...
Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...
Автоматизация без тест-инженеров по автоматизации, Мария Терехина и Владислав...
 
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...
BDD для фронтенда. Автоматизация тестирования с Cucumber, Cypress и Jenkins, ...
 
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир ДубровинДругая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин
Другая сторона баг-баунти-программ: как это выглядит изнутри, Владимир Дубровин
 
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...
Использование Fiddler и Charles при тестировании фронтенда проекта pulse.mail...
 
Управление инцидентами в Почте Mail.ru, Антон Викторов
Управление инцидентами в Почте Mail.ru, Антон ВикторовУправление инцидентами в Почте Mail.ru, Антон Викторов
Управление инцидентами в Почте Mail.ru, Антон Викторов
 
DAST в CI/CD, Ольга Свиридова
DAST в CI/CD, Ольга СвиридоваDAST в CI/CD, Ольга Свиридова
DAST в CI/CD, Ольга Свиридова
 
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...Почему вам стоит использовать свой велосипед и почему не стоит  Александр Бел...
Почему вам стоит использовать свой велосипед и почему не стоит Александр Бел...
 
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...CV в пайплайне распознавания ценников товаров: трюки и хитрости  Николай Масл...
CV в пайплайне распознавания ценников товаров: трюки и хитрости Николай Масл...
 
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidiaRAPIDS: ускоряем Pandas и scikit-learn на GPU  Павел Клеменков, NVidia
RAPIDS: ускоряем Pandas и scikit-learn на GPU Павел Клеменков, NVidia
 
WebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий ОстапенкоWebAuthn в реальной жизни, Анатолий Остапенко
WebAuthn в реальной жизни, Анатолий Остапенко
 
AMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей ПешковAMP для электронной почты, Сергей Пешков
AMP для электронной почты, Сергей Пешков
 
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила СтрелковКак мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
Как мы захотели TWA и сделали его без мобильных разработчиков, Данила Стрелков
 
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
Кейсы использования PWA для партнерских предложений в Delivery Club, Никита Б...
 
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.ТаксиМетапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
Метапрограммирование: строим конечный автомат, Сергей Федоров, Яндекс.Такси
 
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru GroupКак не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
Как не сделать врагами архитектуру и оптимизацию, Кирилл Березин, Mail.ru Group
 
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)Этика искусственного интеллекта, Александр Кармаев (AI Journey)
Этика искусственного интеллекта, Александр Кармаев (AI Journey)
 
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
Нейро-машинный перевод в вопросно-ответных системах, Федор Федоренко (AI Jour...
 
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...
 
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()
Мир глазами нейросетей, Данила Байгушев, Александр Сноркин ()
 
Learning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван СметанинLearning from Swift sources, Иван Сметанин
Learning from Swift sources, Иван Сметанин
 

Обзор трендов рекомендательных систем от Пульса, Андрей Мурашев (AI Journey)

  • 1. Андрей Мурашев Руководитель команды Машинного обучения Рекомендательных систем Обзор трендов Рекомендательных систем от Пульса 08.11.2019
  • 2. Кто я? Андрей Мурашев Автор алгоритма рекомендаций myWidget Руководил разработкой Пульса Сейчас руковожу Командой Машинного обучения Рек.систем Мы занимаемся построением рек.систем для различных продуктов Mail.ru, включая Пульс, myWidget и еще пару “секретных” проектов
  • 3. Что такое Пульс Рекомендательная система собирающая персональную Ленту пользователя. Работает на главной Mail.ru c аудиторий 10 млн DAU (Дневная аудитория)
  • 4. Что такое myWidget Система персональных рекомендаций для сайта - более 1000 партнеров и более 100 млн рекомендаций в сутки
  • 5. Текущие тренды Рек.систем 1. Многорукие-бандиты 2. Объяснительные рекомендации 3. Приватность 4. “Честные” (fairness) рекомендации 5. Оптимизация нескольких задач одновременно 6. Работа со смещенными “боевыми” данными 7. Нейронные сети
  • 7. Многорукие бандиты - Netflix Топовые компании в рекомендациях Netflix, Spotify, Pandora - одновременно начали использовать многорукие бандиты Можно рекомендовать не только фильм, но и обложку для фильма. Дата публикации: 01.2018
  • 8. Многорукие бандиты - Spotify Рекомендации “полок” на главном экране Выбирается одновременно пара: плейлист+объяснение Объяснение выбирают среди подходящих плейлисту, но из фиксированного пула десятка объяснений Дата публикации: 10.2018 (RecSys)
  • 11. Многорукие бандиты - Online evaluation Netflix Значительно улучшились продуктовые метрики - но числа не раскрывают Для популярных фильмов - выбирают популярные обложки и популярные актеры часто оказываются лучше остальных Наиболее полезно оказалось в online для нишевых фильмов и тех, которые изначально не рекомендовали человеку
  • 12. Многорукие бандиты - Spotify 1. Random - случайный пара объяснение+плейлист 2. Control - алгоритм без бандитов 3. Logistic Regression - линейная модель 4. Bart 2nd order - MF 2-order 5. Bart 3nd order - MF 3-order features interactions
  • 13. Многорукие бандиты - myWidget Все статьи сайта ML(GBOT) - ранки, топ лучших Контекстные бандиты GBOT - gradient boosting oblivious trees. Наш внутренний framework для работы с деревьями решений.
  • 14. Многорукие бандиты - myWidget Из нашего опыта контекст дает 10-15% улучшения в среднем на крупных площадках Особенности работы бандитов из практики: ● плохо работают при малом кол-ве статистики ● контекст зависит от объема трафика ● параметры бандитов зависят от размера и характеристик площадки ○ кол-во трафика ○ ограничения свежести ○ кол-во контента ○ CTR
  • 17. Объяснительные рекомендации Обучаться на отзывах юзера и предсказывать их как “объяснение” Multi-task learning - обучаем одновременно рейтинг и текстовое объяснение Используются нейросети: GAN, Autoencoder, seq2seq Учитываем текстовый контент Дата публикации: 10.2018 (RecSys)
  • 19. Двустороннее объяснение рекомендаций Сервисы знакомств, поиска работы Дата публикации: 10.2018 (RecSys)
  • 21. Рекомендации в условиях GDPR Первый доклад на основной сессии RecSys 2019 от профессора права о том, как строить рекомендации и таргетировать рекламу в условиях GDPR Идеи: 1. Человек должен давать согласие на использование и учет его данных алгоритмами 2. Компании не могут использовать данные для дискриминации пользователей и/или для поиска “слабых” мест человека Дата публикации: 09.2019 (RecSys)
  • 22. Другие статьи про приватность данных Efficient Privacy-Preserving Recommendations based on Social Graphs Идея о том, что рекомендации на основании графа соц.сетей могут содержать приватную информацию и надо зашумить данные, по которым они строятся PrivateJobMatch: A Privacy-Oriented Deferred Multi-Match Recommender System for Stable Employment Рекомендательный сервис работы, который не раскрывает данные о пользователях и требует меньше информации личной Дата публикации: 09.2019 (RecSys)
  • 24. Recommending What Video to Watch Next: A Multitask Ranking System - Google Дата публикации: 09.2019 (RecSys)
  • 25. Recommending What Video to Watch Next: A Multitask Ranking System - Google Дата публикации: 09.2019 (RecSys) Multi-gate Mixture-of-Experts Modeling task relationships in multi-task learning with multi-gate mixture-of experts. 2018
  • 26. Recommending What Video to Watch Next: A Multitask Ranking System - Google Дата публикации: 09.2019 (RecSys) Multi-gate Mixture-of-Experts
  • 28. Recommending What Video to Watch Next: A Multitask Ranking System - Google Учет position bias в модели
  • 29. Перебалансировка данных Criteo - RecSys 2018 best paper Идея заключается в том, что лучший способ построения датасета - это random uniform, но для бизнеса это слишком страшно и дорого. 95% это контроль и 5% это рандом Оптимизируем матричное разложение исходя из условия, что веса на 5% рандомной выборки не должны сильно отличаться от весов на 95% контрольной. Дата публикации: 10.2018 (RecSys)
  • 30. Перебалансировка данных Yt - таргет по случайной выборке Pt - вектор объекта ответственный за случайную выборку Yc - таргет по контрольной выборке (боевым данным) Pc - вектор объекта ответственный за контрольную выборку U - вектор юзера
  • 32. Calibrated Recs - Netflix Распределение вкусов пользователя - не совпадает с распределением рекомендуемых товаров Дата публикации: 10.2018 (RecSys)
  • 33. Calibrated Recs - Netflix
  • 34. Разнообразие интересов пользователей Пульса В Пульсе мы сталкиваемся с такой же проблемой - алгоритм старается предсказать “основной” интересе пользователя. Мы повторяем распределение документов в выдаче пропорционально интересам пользователя. Это дает улучшение метрик восприятия “персональности” Ленты пользователями на 20%
  • 36. DeepFM - Huawei Дата публикации: 04.2018
  • 37. Hierarchical Temporal Convolutional Networks for Dynamic Recommender Systems - Pinterest Дата публикации: 04.2019
  • 38. Выводы 1. Многорукие бандиты - позволяют получить еще улучшение поверх имеющихся алгоритмов 2. Объяснительные рекомендации - генерация объяснений 3. “Честные” рекомендации - начинают получать применение 4. Приватность данных - не улучшает рекомендации, но важно 5. Работа со смещенными “боевыми” данными - всегда актуально 6. Оптимизация нескольких целей одновременно встречается все чаще 7. Нейронные сети - позволяют нам по-новому работать с историей пользователя, сочетать разные типы данных и строить высокоуровневые взаимодействия между фичами
  • 40. Андрей Мурашев Руководитель команды Машинного обучения Рекомендательных систем a.murashev@corp.mail.ru
  • 41.
  • 42. Использованные статьи [7] https://dl.acm.org/citation.cfm?id=3241729 [8] https://bit.ly/2Cu3aH5 [17] https://dl.acm.org/citation.cfm?id=3240365 [19] https://arxiv.org/pdf/1807.01227.pdf [21] https://dl.acm.org/citation.cfm?id=3346980 [22] https://dl.acm.org/citation.cfm?id=3347013 , https://dl.acm.org/citation.cfm?id=3346983&dl=ACM&coll=DL [24] https://dl.acm.org/citation.cfm?id=3346997 [29] https://arxiv.org/pdf/1706.07639.pdf [32] https://dl.acm.org/citation.cfm?id=3240372 [36] https://arxiv.org/pdf/1804.04950.pdf [37] https://arxiv.org/pdf/1904.04381.pdf