2. Это волшебное слово – рекомендации
За много лет эксплуатации различных видео сервисов
мы пришли к выводу, что
не существует универсальной и идеальной системы
рекомендаций для всех случаев
Все подходы имеют свои преимущества и недостатки, и
нужно уметь выбирать наиболее подходящий в данный
момент, для конкретного пользователя.
ПОЭТОМУ…
5. Пандем – это:
• универсальный механизм управления выдачей
различных рекомендательных систем
• простая интеграция новых рекомендательных
систем
• оценка обратной связи и сбор статистики
рекомендаций
• а главное – самая высокая эффективность, которая
достигается выбором наиболее подходящей в
данном контексте рекомендации
6. Проблемы индивидуального восприятия
• пользователи имеют разные причины посещения
ресурса;
• пользователи покидают ресурс при наступлении
разных условий, которые не учитываются;
• на эффективность рекомендаций влияет не только
что рекомендуется, но также как и когда;
• самая распространенная ошибка — выбор той
системы, которая показалась наиболее близкой по
выдаче именно собственнику ресурса.
7. Множество базисов для систем
рекомендаций
Википедия делит все системы на два типа:
фильтрация содержимого и коллаборативная
фильтрация.
Все РС основываются на информации о контенте
(жанр, популярность, целевая аудитория),
пользователе (возраст, пол и т.п.) и информации о
поведении пользователя (что смотрел, когда
смотрел).
11. Проблемы
• Преобладает сериальный контент и нет ничего
логичнее, чем предложить смотреть следующую серию
• Ни одна из существующих СР не разделяет сериал на
отдельные серии и считает его единой сущностью
• При такой интерпретации для СР очень мало входной
информации для аналитики
12. Существующие на Видеоморе СР
- предложить из непросмотренных популярных
роликов (по просмотрам и рейтингу)
- предложить из новинок
- предложить из редакторской выборки
- предложить следующую серию
Согласно статистике, больше всего кликают на
следующую серию!
13. Система управления рекомендациями
Предлагаемый продукт Пандем включает в
себя комплекс мер и средств, позволяющих
построить правильную систему подбора
релевантного контента, как в существующем
проекте, так и в случае «холодного старта».
Особенностью комплекса является обратная
статистическая связь и чёткая предсказуемая
управляемость.
15. Элементы системы управления
рекомендациями
1. Маркеры
Специальные механизмы отслеживания поведения
пользователя, учитывающие максимальное
количество параметров, которые могут влиять на
выбор рекомендации: точка входа, время последнего
визита, просматриваемый контент в данный момент,
откуда пришел, как давно был последний раз,
лояльность к контенту, текущее время посещения,
какую часть видео смотрит и др.
16. Элементы системы управления
рекомендациями
2. Точки рекомендаций
Места страниц сайта или приложения, в которых пользователь
может получать рекомендации.
Примеры: блок справа от плеера; блок в плеере по окончанию
просмотра; блок в плеере в первую минуту просмотра
*разделение экрана+; блок в плеере в последнюю минуту
просмотра *разделение экрана+; блок, появляющийся при
большом количестве неудачных просмотров контента
*всплывающее окно+; блок, появляющийся на главной странице,
если пользователь уже известен; и др.
17. Элементы системы управления
рекомендациями
Главная новое и
авторизованный
Новый дизайн блоков с
тумбнейлами - чётко
выделены проект, новая
серия и цитаты.
18. Элементы системы управления
рекомендациями
Постпросмотр:
В плеер включена панель:
- С названием просмотренной
серии, кнопками like, поделиться
и повторить (при наведении
отображается название кнопки),
- вкладышем "Выбрано для Вас" с
возможностью обновления
предложенных видео (кнопка с
обратными стрелками)
- каждое видео помечено
плашкой с иконкой ("следующая
серия" и другие)
19. Элементы системы управления
рекомендациями
3. Системы рекомендаций
Набор интеллектуальных (коллаборативные
рекомендации, рекомендации на цепочках и т.д.) и
простых алгоритмов (следующая серия, первая серия,
последняя серия, ближайшая не просмотренная серия в
проекте пользователя и т.д.).
20. Элементы системы управления
рекомендациями
4. Фильтры
Набор условий, по которым очищается финальная
выдача СР для отображения пользователю. Это,
например, позволяет избежать нежелательного
попадания в рекомендации контента 16+ в выборке для
просмотра детьми, даже если когда-то кто-то из
родителей мог смотреть его, на этом же устройстве, под
тем же пользователем.
21. Элементы системы управления
рекомендациями
5. Система управления
Механизмы, которые позволяют задавать правила
отображения рекомендаций пользователям: с какими
маркерами, в какой точке рекомендаций, в каком
порядке и выдачу каких систем рекомендаций
показывать.
23. Элементы системы управления
рекомендациями
6. Статистика
Модуль, собирающий статистические данные по
всевозможным показателям (средняя глубина просмотра,
среднее количество возвратов и др.) и отображающий эти
данные.
Кроме того, этот модуль фиксирует все изменения в системе
и даёт возможность отмечать в статистике события,
способные повлиять на ключевые показатели (редизайн,
подлив трафика и др.).
Например, успешной рекомендацией мы считаем клик на
нее и факт просмотра более 20% видео.
27. 1. Ассоциативные рекомендации на
основе тегирования
• Редактор помечает контент заранее
утверждённым набором тегов
• Периодически обновляется граф связей
контента, связанных между собой общими
тегами
• В момент запроса из графа выбирается такой
контент, который имеет наибольшие размеры
множества общих тегов, полученных при
пересечении с текущим
29. 2. Рекомендации на основе цепочек
просмотров
• Считаем, что пользователю будут интересны лучшие ролики,
которые просмотрены другими пользователями после такой же
последовательности просмотров.
• Лучшие ролики — ролики с хорошими косвенными оценками и
хорошей надёжностью.
• Ролик имеет хорошую оценку, если хороших оценок больше, чем
плохих.
• Ролик имеет надёжную оценку, если количество оценок ролика
велико.
• Цепочки – основа функционирования РТЖАП.
30. 2. Рекомендации на основе цепочек
просмотров
1. При просмотре контента, для каждого пользователя фиксируется история просмотров.
2. На основе истории всех пользователей строится и периодически обновляется
расширенный граф переходов.
3. В момент запроса рекомендации:
• по этому графу осуществляется поиск наиболее точно совпадающих
последовательностей просмотров;
• извлекаются все возможные переходы из найденных последовательностей;
• каждый переход взвешивается на основе количества оценок и самой оценки (чтобы
избежать ошибок при малом количестве оценок),
• переходы сортируются;
• рекомендации контента, соответствующего переходам, отдаются пользователю.
31. 2’. Генератор РТЖАП
В основе работает СР на основе цепочек, с учетом
специфики РТЖАП:
• сверхкороткий хронометраж
• подбор контента по заданным критериям в
реальном времени
• реакция на выбор пользователей в реальном
времени
• особые правила чередования контента внутри
РТЖАП
33. 3-4. «Заразные» рекомендации и учёт
настроения (Moodometer)
1. Каждый ролик и пользователь имеют набор взвешенных
тегов (базовые значения тегов роликов задаются
редактором; базовый набор у пользователя пуст или
предопределён редактором);
2. При взаимодействии пользователей с контентом происходит
частичный обмен весами;
3. Передача весов к пользователю ведётся в рамках нескольких
временных интервалов. Это позволяет оценивать как его
текущее настроение, так и долгосрочное настроение
(интересы);
4. Подбор рекомендаций происходит аналогично подбору в
рекомендации по тегам.
34. 3-4. «Заразные» рекомендации и учёт
настроения (Moodometer)
Особенности:
1. Позволяет автоматически давать оценку
пользователям по тегам;
2. Позволяет автоматически давать оценку не
оценённым роликам на основе оценки
пользователей;
3. Позволяет пользователю корректировать свою
собственную оценку с целью корректировки выдачи
рекомендаций (Moodometer)
36. 5. Социальный граф
1. производится выборка основных сущностей
социальных сетей и их статистический анализ с целью
классификации взаимодействия с ними;
2. при авторизации пользователей через изученные соц.
сети производится построение личного графа
пользователя с целью выявления взаимодействия с
известными сущностями;
3. на основе взаимодействий уточняется портрет
пользователя (демография, интересы);
4. В соответствии с портретом пользователя
осуществляется социально-демографическая выдача
рекомендаций, а также интеграция с системой
Moodometer.
37. 6. Коллаборативные рекомендации
• Анализируется история просмотров различных
пользователей.
• Выделяются пользователи с «похожими»
вкусами: если они смотрели такие же ролики и
похожим образом их оценили.
• РС предлагает другие ролики из истории
просмотра похожего пользователя, которые
прямым или косвенным образом получили
положительную оценку и данный пользователь
еще не смотрел их.
38. Пример сравнительной оценки
эффективности рекомендаций
Система рекомендаций Количество переходов по Эффективность
рекомендации (успешные/неуспешные
переходы)
1. Существующие на Видеоморе системы 7 338 1,78
рекомендаций
2. Редакторские рекомендации, которые ещё не 3 456 0,99
попали в п.1.
3. Ролики проекта, 743 0,96
не вошедшие в п. 1 и п.2
4. Популярные ролики 2 510 0,81
5. Рекомендации на цепочках 4 824 2,97
6. Следующая серия 117 815 2,05
39. Оценка эффективности
Например, система, построенная на цепочках,
превосходит по качеству существующую систему
рекомендаций на 30%.
При переходе по старой системе рекомендаций на
один отказ было ~2 успешных просмотра.
При переходе по новой системе рекомендаций на
один отказ было ~3 успешных просмотра.
40. Эффективные рекомендации –
выполненный бизнес-план 2013 года!
Персональные рекомендации
Больше удовольствия от просмотра
Больше возращений на сайт
Больше просмотров - больше рекламного времени
41. Спасибо за внимание!
Генеральный директор
ЗАО «Инвентос»
Волобуев О.А.
Завораживающие рекомендации, бьющие точно в цель
Editor's Notes
Они не обязательно являются статическими.
Они не обязательно являются статическими.
Они не обязательно являются статическими.
Это довольно тяжелый процесс и может выполняться во время низкой нагрузки системы.Для реализации используется высокопроизводительная NoSql СУБД
Это довольно тяжелый процесс и может выполняться во время низкой нагрузки системы.Для реализации используется высокопроизводительная NoSql СУБД
Это довольно тяжелый процесс и может выполняться во время низкой нагрузки системы.Для реализации используется высокопроизводительная NoSql СУБД