Стереотип о Big Data 
- Вig Data работают только у больших магазинов 
- собирая данные о миллионах посетителей, 
магазины способны удовлетворить любой 
запрос
Big Data: чем больше тем лучше 
важен сам объем данных: 
- в ширину (немного данных о миллионе 
пользователей) 
- в глубину (много данных о нескольких 
тысячах пользователей) 
количество пользователей 
количество переменных
Собирайте больше данных 
- имя 
- email 
- история 
заказов 
- клики 
- переходы 
- просмотры 
- open rate & 
CTR в 
письмах 
- история 
поиска 
- etc.
Извлекайте больше из данных 
- обработка 
заказов 
- спрос по 
бестселлерам 
- промо email или 
sms рассылка 
- прогноз спроса 
- сезонные пики 
- оптимальное 
размещение 
пунктов 
самовывоза 
- товарная 
сегментация 
- персонализация 
- показатель оттока
Индивидуальность важнее всего
Отличия определяют сегменты
Как увидеть и описать отличия
Портрет клиента
Портрет клиента
Аудитория для рекламы на fb 
Возраст 
Город 
Бренды
Контент для рекламы на fb 
- бестселлеры для этой возрастной группы 
- популярные бренды для этой возрастной группы
Расчет похожих пользователей 
- загрузка базы email на fb 
- расчет похожей аудитории 
- таргетинг объявлений с бестселлерами или 
самыми популярными товарами для этого 
сегмента
Открывать ли пункт самовывоза? 
- Объем заказов в регионе 
- Отмена заказа в регионе 
- Показатель отказов на странице доставки 
- Популярные отделения служб доставки в регионе 
- Стоимость аренды 
- Расстояние до местоположения пользователя (ip, gps)
Оценка востребованности
Оценка востребованности
Где открыть пункт самовывоза? 
- популярные 
отделения служб 
доставки 
- объем заказов в 
регионе 
- местоположение 
пользователя 
- транспортная 
развязка 
- стоимость аренды
Снижение возвратов одежды 
40% заказов в Украине возвращается из-за того, 
что не подошел размер. 
48% пользователей не покупают обувь и одежду в 
онлайне из-за неудачного опыта с размерами
Снижение возвратов одежды 
- сопоставить размеры брендов между собой 
- сопоставить размеры, одинаковые фактически, 
но отличающиеся маркировкой 
- предупреждать пользователя, что размер не 
подойдет
Кому дать бесплатную доставку 
Групповые и семейные заказы – аудитория, 
которая хотела бы экономить на доставке.
Пример группового заказа 
Разные размеры и бренды в заказе
Пример семейного заказа 
Разные пол, возраст, размеры и бренды в заказе
Где взять данные 
- в магазине 
- из истории заказов 
- из информации о пользователе 
- спросить у пользователя
О пользователе 
- имя 
- контакт 
- дата рождения, etc. (если зарегистрирован) 
- из браузера 
- география (по айпи) 
- устройство 
- браузер
О товаре 
- бренд 
- цвет 
- размер 
- цена 
- материал 
- технические характеристики
О заказах 
- время 
- место 
- средний чек 
- размер 
- товарные предпочтения
О магазине 
- маржа 
- конверсия 
- популярные категории 
- условия доставки 
- склады (где хранится товар) 
- промо-акции
О пользователе 
- имя 
- email 
- история 
заказов 
- клики 
- переходы 
- просмотры 
- open rate & 
CTR в 
письмах 
- история 
поиска 
- etc.
Популярные проблемы 
1. Слабая архитектура базы данных усложняет 
работу с ними 
2. Не собираются данные, которые производятся 
3. Недостаточно четкая формализация полей в 
базе данных 
4. Строятся недостоверные сегменты
Данные – нефть нового времени 
Вы сидите на фонтане денег
Спасибо за внимание! 
roman.zakharov@softcube.com 
softcube.com
Достоверные сегменты 
- тщательно подбирать количество сегментов 
- внутренняя оценка качества сегментации: 
- “сплоченность” точек вокруг центра 
- расстояние между сегментами 
- внешняя оценка качества сегментации: 
- обучение на известных примерах 
- экспертная оценка
Метод ближайших соседей
Метод ближайших соседей
Иерархическая сегментация
Метод главных компонент 
исходное пространство пространство “компонент”

Lviv iCamp 2014. Роман Захаров “big data як інструмент маркетингу”

  • 1.
    Стереотип о BigData - Вig Data работают только у больших магазинов - собирая данные о миллионах посетителей, магазины способны удовлетворить любой запрос
  • 2.
    Big Data: чембольше тем лучше важен сам объем данных: - в ширину (немного данных о миллионе пользователей) - в глубину (много данных о нескольких тысячах пользователей) количество пользователей количество переменных
  • 3.
    Собирайте больше данных - имя - email - история заказов - клики - переходы - просмотры - open rate & CTR в письмах - история поиска - etc.
  • 4.
    Извлекайте больше изданных - обработка заказов - спрос по бестселлерам - промо email или sms рассылка - прогноз спроса - сезонные пики - оптимальное размещение пунктов самовывоза - товарная сегментация - персонализация - показатель оттока
  • 5.
  • 6.
  • 7.
    Как увидеть иописать отличия
  • 8.
  • 9.
  • 10.
    Аудитория для рекламына fb Возраст Город Бренды
  • 11.
    Контент для рекламына fb - бестселлеры для этой возрастной группы - популярные бренды для этой возрастной группы
  • 12.
    Расчет похожих пользователей - загрузка базы email на fb - расчет похожей аудитории - таргетинг объявлений с бестселлерами или самыми популярными товарами для этого сегмента
  • 13.
    Открывать ли пунктсамовывоза? - Объем заказов в регионе - Отмена заказа в регионе - Показатель отказов на странице доставки - Популярные отделения служб доставки в регионе - Стоимость аренды - Расстояние до местоположения пользователя (ip, gps)
  • 14.
  • 15.
  • 16.
    Где открыть пунктсамовывоза? - популярные отделения служб доставки - объем заказов в регионе - местоположение пользователя - транспортная развязка - стоимость аренды
  • 17.
    Снижение возвратов одежды 40% заказов в Украине возвращается из-за того, что не подошел размер. 48% пользователей не покупают обувь и одежду в онлайне из-за неудачного опыта с размерами
  • 18.
    Снижение возвратов одежды - сопоставить размеры брендов между собой - сопоставить размеры, одинаковые фактически, но отличающиеся маркировкой - предупреждать пользователя, что размер не подойдет
  • 19.
    Кому дать бесплатнуюдоставку Групповые и семейные заказы – аудитория, которая хотела бы экономить на доставке.
  • 20.
    Пример группового заказа Разные размеры и бренды в заказе
  • 21.
    Пример семейного заказа Разные пол, возраст, размеры и бренды в заказе
  • 22.
    Где взять данные - в магазине - из истории заказов - из информации о пользователе - спросить у пользователя
  • 23.
    О пользователе -имя - контакт - дата рождения, etc. (если зарегистрирован) - из браузера - география (по айпи) - устройство - браузер
  • 24.
    О товаре -бренд - цвет - размер - цена - материал - технические характеристики
  • 25.
    О заказах -время - место - средний чек - размер - товарные предпочтения
  • 26.
    О магазине -маржа - конверсия - популярные категории - условия доставки - склады (где хранится товар) - промо-акции
  • 27.
    О пользователе -имя - email - история заказов - клики - переходы - просмотры - open rate & CTR в письмах - история поиска - etc.
  • 28.
    Популярные проблемы 1.Слабая архитектура базы данных усложняет работу с ними 2. Не собираются данные, которые производятся 3. Недостаточно четкая формализация полей в базе данных 4. Строятся недостоверные сегменты
  • 29.
    Данные – нефтьнового времени Вы сидите на фонтане денег
  • 30.
    Спасибо за внимание! roman.zakharov@softcube.com softcube.com
  • 31.
    Достоверные сегменты -тщательно подбирать количество сегментов - внутренняя оценка качества сегментации: - “сплоченность” точек вокруг центра - расстояние между сегментами - внешняя оценка качества сегментации: - обучение на известных примерах - экспертная оценка
  • 32.
  • 33.
  • 34.
  • 35.
    Метод главных компонент исходное пространство пространство “компонент”