Математика таргетинга. #izso2011. Лев Глейзер

4,649 views
4,591 views

Published on

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,649
On SlideShare
0
From Embeds
0
Number of Embeds
2,616
Actions
Shares
0
Downloads
30
Comments
0
Likes
4
Embeds 0
No embeds

No notes for slide

Математика таргетинга. #izso2011. Лев Глейзер

  1. 1. κρυπτήМатематика таргетинга
  2. 2. Таргетинги в интернете  способ ограничить коммуникацию  интерактивность позволяет принимать решение по каждому контакту  география, сайт, формат и технология баннера, слова на странице, слова из поиска, броузер, провайдер  параметры контакта c ID(регистрация, частота)  знание о пользователе Самоцензура рекламы в Интернете ;)κρυπτή
  3. 3. Аффинити  каждый человек ведет себя по разному в разное время  при анализе статистики- данные объединяются и усредняются  у рекламодателя нет точного знания как говорить с каждым потребителем, только со статистической группой Большая часть из нас еще не определилась с соц.демом ;)κρυπτή
  4. 4. Идея проекта  собрать статистику в разрезе пользователя/ID  проанализировать выборку, про которую что- либо точно известно  найти закономерности отличающие одну целевую группу от другой  анализируем статистику каждого ID и приводим к вероятности попадания в группу Применяем дедуктивный метод ;)κρυπτή
  5. 5. Источник знания (data)  privacy и сбор данных  уникальный ID и время его жизни  контекстность, как идеал  майнинг информации  данные о любых действиях пользователя и их взаимосвязях Логи и Размышления. Т. 2-128κρυπτή
  6. 6. Вероятностный подход противоречивость и неполнота данных степень достоверности возможность перевзвешивания под внешние факторы 100% аудитории выбираем лучшиххарактерных при использовании Оптимизируем монетку ;)
  7. 7. Выделение факторов  анализируем зависимости между целевой группой и поведением  вычисляем метрики из любой известной информации  отбираем сильные факторы для конкретной классификации  несколько наборов факторов для разных аудиторий для соц.дема используется 300 факторов никто их не знает)κρυπτή
  8. 8. Машинное обучение  обучающая выборка  алгоритм ищет закономерности между признаком и логами  применяем формулу ко всем пользователейκρυπτή
  9. 9. Классификацияберем внешние категориисмотрим похожее «поведение»предполагаем, что этому пользователю это свойственнооцениваем достоверность предположения Можно вычислить людей, которые живут в нечетных квартирах ;)
  10. 10. Цифры и факты объем технологииo 35 дней o Map&Reduceo 3 млрд. событийo 3,4 Tb в день o Machine learningo 235 млн. ID o Matrixneto 730 тыс. обучающая выборка o SVD (cингуля́ рноеo 490 тыс. проверочная разложение)o 7,5Tb данные
  11. 11. Результат и применение проверяем TNS Корреляция с группой (пол- 78%) выбираем лучших повышаем аффинитивность соц.дем таргетинг на страницах Яндекса математический подход- как это объяснить рынку? У нас есть такие приборы ;)κρυπτή
  12. 12. Планы мультипрофили audience extension долгосрочные интересы тематический таргетинг модели потребительского поведения API для внешнего использования Автоматически отделять копытных от хищников ;)κρυπτή
  13. 13. Почему это революция? не на базе регистраций все пользователи каждый пользователь- уникален классификаторы могут быть по чему угодно регенерация информации, которой никогда не было данные собираются и пересчитываются постоянно Почта не работает, телеграф отменен, но вот мосты?κρυπτή
  14. 14. Снятся ли андроидам электрические овцы? распределение пола среди роботов: 60% роботы мальчики 40% роботы девочкиκρυπτή
  15. 15. Спасибоlev@yandex-team.ru

×