2. Происхождение.
• Алгоритмы машинного обучения 60-х годов
встретились с огромным объемом данных
• 2008 год – рождение термина «Большие
Данные» (Big Data) [Клиффорд Линч.
Журнал Nature. 2008. V. 455. N. 7209]
• Первый IPHONE (2007 год)
• Генератор данных – человек.
3. Что это
• Интернет — первая индустрия, столкнувшаяся с Big Data, отметил в своем
выступлении Аркадий Волож
• Умение обрабатывать данные дает нам не только новые знания
о человеке, но и возможность изменить к лучшему нашу жизнь.
Фактически это вторая технологическая революция — когда-то мы
научились автоматизировать механические процессы, теперь
учимся автоматизировать обработку «больших данных»
4. Что это
• Почти все сервисы, которыми сейчас
пользуются люди в интернете, основаны на
анализе «больших данных»
• Через два-три года мы не будем
обсуждать примеры применения больших
данных, потому что они будут везде
9. Сенсоры
• Микрофон
• Камера
• Датчик приближения (управление жестами)
• Акселерометр (подсчет шагов)
• Датчик освещенности
• Гироскоп
• Магнитный компас
• Барометр
• Датчик температуры/влажности
• 3D-сенсор
• Безопасность
• По мнению специалистов из IBM, к 2017 году смартфоны получат
обоняние.
10. Сбор данных (Google)
• https://www.google.com/intl/en-us/policies/terms/
«Наши системы автоматически анализируют ваш контент (включая почту),
чтобы предлагать персонализированный сервис, включая результаты поиска,
объявления и улучшенную защиту от спама и вредоносных ссылок», —
говорится в новом абзаце правил.
В июле 2005 года корпорация Google купила компанию Android Inc
14. 3. Технологические процессы
• GPS треки, построение пробок, перекрытие
дорог
• Датчики самолета. Изменение поведения
детали.
15. 4. Государство
- Прогнозирование экономического кризиса
(Япония, SERP+чеки)
- Предсказывание климата (датчики
температур, инфоматериалы)
16. Использование в Sape
• В Sape, как и любой сервис – огромное
количество функций. Определение
тематики площадок – на аутсорсе.
• Вывод: создание простых сервисов как
способ заработка.
17. Проблемы
• Сложности в передаче данных между
компаниями
• Взаимная закрытость данных (в
коммерческих целях)
• Есть мозги, но нет мощностей (и наоборот)
• Объем рынка BD зависит от других
отраслей
• Маленьким быть сложно
19. Применение
Новая профессия Data Scientist
Математика
Информатика
Экономика
набор утилит, библиотек и программный каркас
для разработки и выполнения распределённых программ,
работающих на кластерах из сотен и тысяч узлов.
20. Что это такое?
Retargeting (перенацеливание) – показ рекламы
посетителям, которые уже интересовались
товаром на Вашем сайте, но не решились сделать
заказ или покупку.
Аудиторные закупки – показ рекламы посетителям,
аналогичных по параметрам тем, кого мы
догоняем по ретаргетингу
- В Яндексе таргетинг происходит по ~400 000 параметров
21. Что это такое?
Сервис погоды http://pogoda.mail.ru
СМИ http://ridus.ru
Магазин одежды http://lamoda.ru
Интернет
Соц. сеть http://vk.com
22. Что это дает?
При использовании для интернет магазина:
* данные по трафику за сутки
23. Что это дает?
Для других сайтов:
* данные по трафику за сутки
Целевым действием может быть: подписка, проведение N времени на опреде-ленной
странице, скачивание программы, тестовый замер, заказ, звонок и т.д.
25. Как настроить?
• Если настроить «слабо» – то результат будет никакой.
• Слабо – это один сегмент, один креатив, одна сеть.
• Тройка с минусом: 2-3 сегмента, 2-3 креатива, одна сеть.
• Пятерка с плюсом: десятки и сотни аудиторий, кросс-
креативы (регламентированные связи между ЦА банковских
продуктов), все возможные сети для ретаргетинга с
исключением неэффективных отношений.
26. Кейс Pr.sape
Кейс: реклама через 5 каналаов + ретаргетинг
– стоимость создания проекта в системе по традиционным рекламным каналам:
более 100 р.
– В течение февраля 2014 года потратили на ретаргетинг 12500 р.
– стоимость проекта, созданного с помощью ретаргетинга, составила 45 р.!
С помощью ретаргетинга мы увеличили эффективность
других рекламных каналов.
27. Товарные рекомендации
1. Сервис собирает всю информацию о пользователях и их поведении на сайте
магазина.
2. Мощный аналитический аппарат превращает огромное количество данных в
рекомендации.
3. Рекомендации размещаются на сайте магазина через API и демонстрируются
посетителям.
Система постоянно самообучается и увеличивает свою эффективность.