9. Точные и вероятностные
таргетинги
Соцдем портрет
(в т. ч. образование, занятость, семейный статус и доход)
Таргетинг по интересам
Кастомные запросы,
«Look-alike»
Работа с данными
12. С использованием Machine Learning
Наличие образования TNS
• Есть высшее
• Нет высшего
Занятость TNS
• Работает
• Не работает
Семейное положение TNS
• В браке
• Холост
Индивидуальный доход
• A – ниже среднего
• B – средний
• C – выше среднего
• D – высокий
• E – премиум
TNS - совместимы с данными WebIndex
Телесмотрение TNS
• LTV – мало смотрят ТВ
• MTV – среднее телесмотрение
• HTV – много смотрят ТВ
Средний семейный доход TNS
• A – ниже среднего
• B – средний
• C – выше среднего
Наличие детей разного возраста
• Новорожденных до 1 года
• Малышей от 1 до 3 лет
• Дошкольников от 3 до 7 лет
• Школьников начальных классов
• Школьников средних и старших классов
Профессиональные области hh.ru
13. С использованием Machine Learning
Наличие детей до 16 лет TNS
• Есть дети
• Нет детей
B2B или B2C
• B2B - работаете не на конечного потребителя, а на компании
(юридические лица)
• B2C - работаете на конечного потребителя (частные, физические
лица)
Род занятий TNS
• Руководители
• Специалисты
• Рабочие
• Учащиеся
• Домохозяйки
• Другие неработающие
Новые таргетинги – ожидаются во втором полугодии 2015
14. Таргетинг по уровню доходов
Как делается?
Размер выборки – более полутора миллионов человек,
зарегистрированных на Headhunter.ru, с учетом их зарплатных ожиданий
(редакции анкет соискателей не ранее 2012 года и не находящихся в активном поиске работы
в настоящий момент).
Для сопоставления с реальными доходами используется коэффициент 0.85
от зарплатных ожиданий.
Выборка строится пропорционально количеству пользователей интернета
по регионам с учетом данных Web Index.
Выборка является базовой для построения математической модели с
помощью алгоритмов машинного обучения. Выделяются паттерны
поведения в сети, относящиеся к определенной категории пользователей.
Получаемый таргетинг увеличивает вероятность попадания в аудиторию с
тем или иным уровнем дохода.
15. Таргетинг по уровню доходов
Что получается?
Группы индивидуальных доходов:
• A – Доход ниже среднего
20 000 рублей и менее*
• B – Средний доход
Более 20 000 до 40 000 рублей
• C – Доход выше среднего
Более 40 000 до 60 000 рублей
• D – Высокий доход
Более 60 000 до 100 000 рублей
• E – Премиум
Более 100 000 рублей
* - Данные о доходах не позднее сентября 2014 год
16. Расширенный соцдем таргетинг
Как делается?
Организация опросов аудитории в интернете.
Проведенная волна охватила порядка 250 тысяч пользователей из России,
Украины, Беларуси и Казахстана.
Содержание анкеты с вопросами, в зависимости от разновидности таргетинга:
Образование – Начальное / Среднее / Среднее специальное / Незаконченное высшее /
Высшее
Занятость – Работает / Работает на дому / Не работает
Семейный статус – В браке / Холост
Выборка является базовой для построения математической модели с помощью
алгоритмов машинного обучения. Выделяются паттерны поведения в сети,
относящиеся к определенной категории пользователей. Получаемый таргетинг
увеличивает вероятность попадания в аудиторию с той или иной соцдем
характеристикой.
18. Регулярное проведение опросов аудитории на проектах Mail.ru Group.
Последняя проведенная волна охватила порядка 200 тысяч пользователей из России, Украины, Беларуси и Казахстана
Выборка является базовой для построения математической модели с помощью
алгоритмов машинного обучения. Выделяются паттерны поведения в сети, относящиеся
к определенной категории пользователей. Получаемый таргетинг увеличивает
вероятность попадания в аудиторию с тем или иным уровнем телесмотрения.
Таргетинг по уровню телесмотрения
Как делается
# Ответ
1 Каждый день, почти все время
2 Более 3 часов в день, почти каждый день
3 От 1 до 3 часов в день, почти каждый день
4 Почти каждый день около 1 часа
5 3 – 5 раз в неделю
6 1 – 2 раза в неделю
7 Несколько раз в месяц
8 Раз в месяц и реже
9 За последние полгода ни разу
Содержание анкеты с вопросом
«Как часто вы смотрите телевизор?»
19. Выборка является базовой для построения математической модели с помощью алгоритмов
машинного обучения. Выделяются паттерны поведения в сети, относящиеся к
определенной категории пользователей. Получаемый таргетинг увеличивает вероятность
попадания в аудиторию с тем или иным уровнем телесмотрения
Таргетинг по уровню телесмотрения
Что получается
Группы по уровню телесмотрения,
в зависимости от выбранных ответов в анкете:
LTV
мало смотрят
(ответы 7, 6, 9)
MTV
средняя
продолжительность
(ответы 4, 5, 6)
HTV
много смотрят
телевизор
(ответы 1, 2, 3)
20. Период: осень 2013 г.
Место размещения: Главная страница,
Мой Мир – раздел Видео;
Задача: увеличение ТВ-охвата
за счет аудитории, потребление
телевидения которой
не так активно;
Площадка Доля LTV
Mail.ru
Главная страница
26%
Mail.ru
Главная страница / LTV
48%
Мой Мир
Видео
20%
Мой Мир
Видео / LTV 56%
Билайн на Главной + Мой Мир
Дополнение ТВ рекламы размещением в Интернет на LTV-аудиторию
21. Lookalike таргетинг
“Обычная” классификация
(доход, LTV, и т.д.)
“Lookalike” классификация
Пользователи с известной категорией
(обучающая выборка)
Пользователи с неизвестной категорией
(которую нужно предсказать)
?
+ — + —
• Дана небольшая выборка из “положительных” пользователей, то есть таких, которые достигли
определенной цели на сайте. Необходимо найти похожих.
• Для того, чтобы воспользоваться обычным подходом, то есть построить статистическую модель для
предсказания, необходимо иметь выборку как из “положительных”, так и “отрицательных”
пользователей.
• Задача: разработать алгоритм, умеющий достоверно определять“отрицательных”
пользователей на основании имеющихся данных.
22. 22
Lookalike таргетинг
?
Для нахождения достоверно “отрицательных” пользователей применяется подход,
основанный на машинном обучении
Обучающая выборка из “положительных” и “отрицательных” пользователей используется
для обучения модели
С помощью полученной модели определяем категорию “неизвестных”
пользователей. Таргетируем только “положительных”
target
23. Lookalike таргетинг:
исходные выборки
• Установка счетчика Рейтинг@Мэйл.Ру позволит собрать информацию о
пользователях, посетивших "важные" страницы (например кредитный
калькулятор, запись на тест драйв)
• Также есть возможность сконфигурировать и использовать уже
настроенные цели (такие как посещение определенной страницы или
действие пользователя)
• Установка пикселя конверсии
• Использование данных предыдущих кампаний (но они должны быть
"большими")
• Использование данных вашей CRM (лучше подходит для сегментации,
но годится и для lookalike)
24. Использование данных CRM
Данные, необходимые для точной привязки:
• Мобильный телефон / почтовый адрес / аккаунт
• Пол
• День рождения
Дополнительные данные:
• Имя
• Фамилия
• Город или регион
Действие в offline:
• Достижение конверсии / действие / последний контакт / опрос
• Время достижения конверсии / свершения действия / контакта
Результат:
• Таргетинг на выбранный сегмент / Look-alike
• Тригер / рекомендация / score
25. СПАСИБО ЗА ВНИМАНИЕ
Михаил Фирулик
Руководитель отдела анализа данных
m.firulik@corp.mail.ru
Николай Анохин
Руководитель группы машинного обучения
n.anokhin@corp.mail.ru