Выступление Александра Петрова (Data-Centric Alliance) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
2. Задача сегментации пользователей
1
.Реклама и маркетинг требуют персонификации общения с клиентом
( ,Для этого нужно уметь определять характеристики пользователя его пол
, , , ).возраст интересы намерения особенности характера
2 .Разные рекламодатели требуют разных аудиторных сегментов
, .Много быстро и эффективно
Нужен способ быстро создавать
.качественные аудиторные сегменты
3. Способы определения паттернов
поведения
Экспертный
• “ ” URLэксперт определяет на какие должен сходить пользователь чтобы
.попасть в сегмент
Семантический анализ
• Робот классифицирует страницы на принадлежность к той или иной
,тематике в дальнейшем размечаем пользователя на основе
.определенных тематик страниц
• http://habrahabr.ru/company/dca/blog/261677/
Look-a-like
• Имея выборку пользователей которые точно принадлежат целевому
классу пытаемся при помощи машинного определить принадлежность к
.данному классу
• http://habrahabr.ru/company/dca/blog/263729/
Автоматическое выявление паттернов поведения
4. Граф аффинитивностей сайтов
На сайты схожей тематики и направления
.часто заходят вместе
Аффинитивность аудиторий двух
–сайтов мера близости множеств
.посетителей этих сайтов Показывает во
сколько раз повышается вероятность того
Bчто человек посетит сайт если мы
A.знаем что он посетил сайт
Интернет можно представить в виде
, –полного графа сайтов где вес ребра
.аффинитивность аудиторий сайтов
5. Кластеризация графа аффинитивностей
Кластиризовав граф аффинитивностей
,получим группы сайтов на которые часто
.заходят вместе
:Алгоритмы кластеризации
• K-medoids
• Марковская кластеризация
• Louvain
6. Результаты
Создание сегментов
.без участия эксперта
+30%
.к качеству прогноза охвата аудитории
, ,Сегменты основанные на автоматически выявленных паттернах
.оказались хорошими фичами для машинного обучения
1,5х
раза
увеличилось количество кликов при
.сохранении цены
На примере одной из рекламных кампаний для автомобильного
.бренда
!