SlideShare a Scribd company logo
1 of 8
datacentric.ru
Технологии
кластеризация сайтов
при сборе и анализе
пользовательских
данных
Александр Петров
Head of R&D
Задача сегментации пользователей
1
.Реклама и маркетинг требуют персонификации общения с клиентом
( ,Для этого нужно уметь определять характеристики пользователя его пол
, , , ).возраст интересы намерения особенности характера
2 .Разные рекламодатели требуют разных аудиторных сегментов
, .Много быстро и эффективно
Нужен способ быстро создавать
.качественные аудиторные сегменты
Способы определения паттернов
поведения
Экспертный
• “ ” URLэксперт определяет на какие должен сходить пользователь чтобы
.попасть в сегмент
Семантический анализ
• Робот классифицирует страницы на принадлежность к той или иной
,тематике в дальнейшем размечаем пользователя на основе
.определенных тематик страниц
• http://habrahabr.ru/company/dca/blog/261677/
Look-a-like
• Имея выборку пользователей которые точно принадлежат целевому
классу пытаемся при помощи машинного определить принадлежность к
.данному классу
• http://habrahabr.ru/company/dca/blog/263729/
Автоматическое выявление паттернов поведения
Граф аффинитивностей сайтов
На сайты схожей тематики и направления
.часто заходят вместе
Аффинитивность аудиторий двух
–сайтов мера близости множеств
.посетителей этих сайтов Показывает во
сколько раз повышается вероятность того
Bчто человек посетит сайт если мы
A.знаем что он посетил сайт
Интернет можно представить в виде
, –полного графа сайтов где вес ребра
.аффинитивность аудиторий сайтов
Кластеризация графа аффинитивностей
Кластиризовав граф аффинитивностей
,получим группы сайтов на которые часто
.заходят вместе
:Алгоритмы кластеризации
• K-medoids
• Марковская кластеризация
• Louvain
Результаты
Создание сегментов
.без участия эксперта
+30%
.к качеству прогноза охвата аудитории
, ,Сегменты основанные на автоматически выявленных паттернах
.оказались хорошими фичами для машинного обучения
1,5х
раза
увеличилось количество кликов при
.сохранении цены
На примере одной из рекламных кампаний для автомобильного
.бренда
!
Читайте нас
Habrahabrна
habrahabr.ru/company/dca/
БОЛЬШИЕ ДАННЫЕ
ДЛЯ БОЛЬШОГО ДЕЛА
Спасибо
a.petrov@datacentric.ru

More Related Content

Viewers also liked

Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015rusbase
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015rusbase
 
Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015rusbase
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015rusbase
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015rusbase
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015rusbase
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015rusbase
 
Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015rusbase
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015rusbase
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015rusbase
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015rusbase
 
Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015rusbase
 
Google Adwords Bid Simulator Reference Guide
Google Adwords Bid Simulator Reference GuideGoogle Adwords Bid Simulator Reference Guide
Google Adwords Bid Simulator Reference Guideisa-media GmbH
 
Вадим Игонин. Диджитал платформа онлайн коммуникаций
Вадим Игонин. Диджитал платформа онлайн коммуникацийВадим Игонин. Диджитал платформа онлайн коммуникаций
Вадим Игонин. Диджитал платформа онлайн коммуникацийweb2win
 
Scorista on Big Data Russia
Scorista on Big Data RussiaScorista on Big Data Russia
Scorista on Big Data Russiarusbase.vc
 
Валерий Кашин: "Почему вы разочаровались в программатике"
Валерий Кашин: "Почему вы разочаровались в программатике"Валерий Кашин: "Почему вы разочаровались в программатике"
Валерий Кашин: "Почему вы разочаровались в программатике"Auditorius
 
Чем programmatic отличается от обычного стирального порошка. Планирование
Чем programmatic отличается от обычного стирального порошка. ПланированиеЧем programmatic отличается от обычного стирального порошка. Планирование
Чем programmatic отличается от обычного стирального порошка. ПланированиеMoscow Digital
 
RTB. Несколько слов и цифр (Iplace)
RTB. Несколько слов и цифр (Iplace)RTB. Несколько слов и цифр (Iplace)
RTB. Несколько слов и цифр (Iplace)Dmytro Lysiuk
 

Viewers also liked (18)

Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015
 
Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015Михаил Кечинов — REES46 — ICBDA 2015
Михаил Кечинов — REES46 — ICBDA 2015
 
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
Кирилл Чистов — Data-Centric Alliance — ICBDA 2015
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
 
Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015Сергей Кашпоров — Frank Research Group — ICBDA 2015
Сергей Кашпоров — Frank Research Group — ICBDA 2015
 
Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015Тимур Кузеев — Meta System — ICBDA 2015
Тимур Кузеев — Meta System — ICBDA 2015
 
Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015Александр Емешев — Tinkoff — ICBDA 2015
Александр Емешев — Tinkoff — ICBDA 2015
 
Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015Николай Птицын — Synesis — ICBDA 2015
Николай Птицын — Synesis — ICBDA 2015
 
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
Александр Мигаловский — ГНИВЦ ФНС России — ICBDA 2015
 
Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015Роман Постников — «Мегафон» — ICBDA 2015
Роман Постников — «Мегафон» — ICBDA 2015
 
Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015Сергей Чернов — Yandex Data Factory — ICBDA 2015
Сергей Чернов — Yandex Data Factory — ICBDA 2015
 
Google Adwords Bid Simulator Reference Guide
Google Adwords Bid Simulator Reference GuideGoogle Adwords Bid Simulator Reference Guide
Google Adwords Bid Simulator Reference Guide
 
Вадим Игонин. Диджитал платформа онлайн коммуникаций
Вадим Игонин. Диджитал платформа онлайн коммуникацийВадим Игонин. Диджитал платформа онлайн коммуникаций
Вадим Игонин. Диджитал платформа онлайн коммуникаций
 
Scorista on Big Data Russia
Scorista on Big Data RussiaScorista on Big Data Russia
Scorista on Big Data Russia
 
Валерий Кашин: "Почему вы разочаровались в программатике"
Валерий Кашин: "Почему вы разочаровались в программатике"Валерий Кашин: "Почему вы разочаровались в программатике"
Валерий Кашин: "Почему вы разочаровались в программатике"
 
Чем programmatic отличается от обычного стирального порошка. Планирование
Чем programmatic отличается от обычного стирального порошка. ПланированиеЧем programmatic отличается от обычного стирального порошка. Планирование
Чем programmatic отличается от обычного стирального порошка. Планирование
 
RTB. Несколько слов и цифр (Iplace)
RTB. Несколько слов и цифр (Iplace)RTB. Несколько слов и цифр (Iplace)
RTB. Несколько слов и цифр (Iplace)
 

More from rusbase

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзингrusbase
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание rusbase
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере rusbase
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг rusbase
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеrusbase
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство rusbase
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russiarusbase
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russiarusbase
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russiarusbase
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russiarusbase
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russiarusbase
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russiarusbase
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russiarusbase
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russiarusbase
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017rusbase
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017rusbase
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016rusbase
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016rusbase
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016rusbase
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016rusbase
 

More from rusbase (20)

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016Владислав Лисицкий — Rubbles — ICBDA2016
Владислав Лисицкий — Rubbles — ICBDA2016
 
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016Андрей Созыкин — ИММ УрО РАН — ICDBA2016
Андрей Созыкин — ИММ УрО РАН — ICDBA2016
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016
 
Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016
 

Александр Петров — Data-Centric Alliance — ICBDA 2015

  • 1. datacentric.ru Технологии кластеризация сайтов при сборе и анализе пользовательских данных Александр Петров Head of R&D
  • 2. Задача сегментации пользователей 1 .Реклама и маркетинг требуют персонификации общения с клиентом ( ,Для этого нужно уметь определять характеристики пользователя его пол , , , ).возраст интересы намерения особенности характера 2 .Разные рекламодатели требуют разных аудиторных сегментов , .Много быстро и эффективно Нужен способ быстро создавать .качественные аудиторные сегменты
  • 3. Способы определения паттернов поведения Экспертный • “ ” URLэксперт определяет на какие должен сходить пользователь чтобы .попасть в сегмент Семантический анализ • Робот классифицирует страницы на принадлежность к той или иной ,тематике в дальнейшем размечаем пользователя на основе .определенных тематик страниц • http://habrahabr.ru/company/dca/blog/261677/ Look-a-like • Имея выборку пользователей которые точно принадлежат целевому классу пытаемся при помощи машинного определить принадлежность к .данному классу • http://habrahabr.ru/company/dca/blog/263729/ Автоматическое выявление паттернов поведения
  • 4. Граф аффинитивностей сайтов На сайты схожей тематики и направления .часто заходят вместе Аффинитивность аудиторий двух –сайтов мера близости множеств .посетителей этих сайтов Показывает во сколько раз повышается вероятность того Bчто человек посетит сайт если мы A.знаем что он посетил сайт Интернет можно представить в виде , –полного графа сайтов где вес ребра .аффинитивность аудиторий сайтов
  • 5. Кластеризация графа аффинитивностей Кластиризовав граф аффинитивностей ,получим группы сайтов на которые часто .заходят вместе :Алгоритмы кластеризации • K-medoids • Марковская кластеризация • Louvain
  • 6. Результаты Создание сегментов .без участия эксперта +30% .к качеству прогноза охвата аудитории , ,Сегменты основанные на автоматически выявленных паттернах .оказались хорошими фичами для машинного обучения 1,5х раза увеличилось количество кликов при .сохранении цены На примере одной из рекламных кампаний для автомобильного .бренда !
  • 8. БОЛЬШИЕ ДАННЫЕ ДЛЯ БОЛЬШОГО ДЕЛА Спасибо a.petrov@datacentric.ru