Математика таргетинга. #izso2011. Лев Глейзер
Upcoming SlideShare
Loading in...5
×
 

Математика таргетинга. #izso2011. Лев Глейзер

on

  • 4,421 views

 

Statistics

Views

Total Views
4,421
Views on SlideShare
1,946
Embed Views
2,475

Actions

Likes
4
Downloads
28
Comments
0

16 Embeds 2,475

http://cossa.ru 1802
http://www.cossa.ru 636
url_unknown 9
http://46.137.176.109 5
http://hghltd.yandex.net 4
http://www1.cossa.ru 3
http://trends.futurebit.ru 3
http://futurebit.tumblr.com 3
http://webcache.googleusercontent.com 2
http://www.slideshare.net 2
http://98.139.168.220 1
http://cossa.2px.ru 1
https://twitter.com 1
http://twitter.com 1
http://us-w1.rockmelt.com 1
http://translate.googleusercontent.com 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Математика таргетинга. #izso2011. Лев Глейзер Математика таргетинга. #izso2011. Лев Глейзер Presentation Transcript

  • κρυπτήМатематика таргетинга
  • Таргетинги в интернете  способ ограничить коммуникацию  интерактивность позволяет принимать решение по каждому контакту  география, сайт, формат и технология баннера, слова на странице, слова из поиска, броузер, провайдер  параметры контакта c ID(регистрация, частота)  знание о пользователе Самоцензура рекламы в Интернете ;)κρυπτή
  • Аффинити  каждый человек ведет себя по разному в разное время  при анализе статистики- данные объединяются и усредняются  у рекламодателя нет точного знания как говорить с каждым потребителем, только со статистической группой Большая часть из нас еще не определилась с соц.демом ;)κρυπτή
  • Идея проекта  собрать статистику в разрезе пользователя/ID  проанализировать выборку, про которую что- либо точно известно  найти закономерности отличающие одну целевую группу от другой  анализируем статистику каждого ID и приводим к вероятности попадания в группу Применяем дедуктивный метод ;)κρυπτή
  • Источник знания (data)  privacy и сбор данных  уникальный ID и время его жизни  контекстность, как идеал  майнинг информации  данные о любых действиях пользователя и их взаимосвязях Логи и Размышления. Т. 2-128κρυπτή
  • Вероятностный подход противоречивость и неполнота данных степень достоверности возможность перевзвешивания под внешние факторы 100% аудитории выбираем лучшиххарактерных при использовании Оптимизируем монетку ;)
  • Выделение факторов  анализируем зависимости между целевой группой и поведением  вычисляем метрики из любой известной информации  отбираем сильные факторы для конкретной классификации  несколько наборов факторов для разных аудиторий для соц.дема используется 300 факторов никто их не знает)κρυπτή
  • Машинное обучение  обучающая выборка  алгоритм ищет закономерности между признаком и логами  применяем формулу ко всем пользователейκρυπτή
  • Классификацияберем внешние категориисмотрим похожее «поведение»предполагаем, что этому пользователю это свойственнооцениваем достоверность предположения Можно вычислить людей, которые живут в нечетных квартирах ;)
  • Цифры и факты объем технологииo 35 дней o Map&Reduceo 3 млрд. событийo 3,4 Tb в день o Machine learningo 235 млн. ID o Matrixneto 730 тыс. обучающая выборка o SVD (cингуля́ рноеo 490 тыс. проверочная разложение)o 7,5Tb данные
  • Результат и применение проверяем TNS Корреляция с группой (пол- 78%) выбираем лучших повышаем аффинитивность соц.дем таргетинг на страницах Яндекса математический подход- как это объяснить рынку? У нас есть такие приборы ;)κρυπτή
  • Планы мультипрофили audience extension долгосрочные интересы тематический таргетинг модели потребительского поведения API для внешнего использования Автоматически отделять копытных от хищников ;)κρυπτή
  • Почему это революция? не на базе регистраций все пользователи каждый пользователь- уникален классификаторы могут быть по чему угодно регенерация информации, которой никогда не было данные собираются и пересчитываются постоянно Почта не работает, телеграф отменен, но вот мосты?κρυπτή
  • Снятся ли андроидам электрические овцы? распределение пола среди роботов: 60% роботы мальчики 40% роботы девочкиκρυπτή
  • Спасибоlev@yandex-team.ru