SlideShare a Scribd company logo
1 of 24
Как выйти из плоскости
(How to escape from Flatland)
Павел Айткулов (ajtkulov@gmail.com)
http://www.convert-conf.ru/
M. C. Escher, Reptiles, 1943
(c)opyrights
(Big?) Data engineer
Обо мне
Маленькие девочки любят картинки
Бизнес любит картинки
Alice was beginning to get very tired of sitting by her sister on the bank and of having nothing to do: once
or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it,
"and what is the use of a book," thought Alice, "without pictures or conversations?'
Больше чем 2D: размер, температура, география, ...
И так, инфографика?
В основном, 2D
Сегодня
- (NY) Привет Роман, нам нужен отчет для
клиента.
- (BRA) Хорошо, к утру сделаю.
- +1 день
- (Bra) Готово, посмотри пожалуйста.
- (NY) Классно, сейчас взгляну.
- +1 день
- (NY) Есть вопрос. Почему по строке….
- (Bra) Мда,
- (Bra) Переделал, обнови.
- (NY) Вроде все нормально. Так, вот это все надо
для другого клиента.
- +1 день
Клиент -> наш бизнес -> наш аналитик
C B -> C A -> O B -> O A -> O P
B Бизнес, O наш, A аналитик,
C клиент, P программист
+ на каждом слое по менеджеру
Отдача результата:
<- <- <- <-
Идеальный мир:
Бизнес <-> поиграться с данными
Почти идеальный мир
Бизнес аналитик <-> поиграться с данными
Проблема
Характеристики прототипа
Входные данные: 100+Гб, 400 млн строк (pageviews)
Время реакции: < 3 c
Количество входных измерений: десятки, < 100 (да и зачем вам больше?)
Количество измерений в запросах: < 12-15 (финальные данные должны влезть в
память)
Следите за руками (обман!), предобрабатываем входные (100+Гб) в разумные
данные.
Демо
Мифы:
Apple более щедрые чем android
Доля Mac не более 10% рынка
Глубже?
Группировки по:
Пользователю (уже сделано)
Url
Стране
Разделу (tag,
спорт/политика/новости)
Автору
Url: расширить данными (переходы с соцСетей)
Наиболее ценные страницы(платники), оценка соцЗаказа (покупка
заказных статей блогеров).
SEO. На какие же страницы приходят с поиска?
Страна:
А уж не блокирует ли кто нас? “Национальная кухня”
Раздел:
Наиболее ценные разделы(платники)
Автор:
Топ-10 лучших авторов. Топ-10 худших авторов. Система оплаты
авторов. Наиболее ценные авторы (платники)
Как насчет?
Что если вы работаете в:
Банк
Служба такси
Ритейлер
Нефтяная компания
Железные дороги
Данные:
Клиент, менеджер, офис, тип операции
Клиент, водитель, машина, география,
Покупатель, продавец, товар, поставщик, склад, магазин
Всегда: деньги, время, размер очереди обслуживания
Группировать: обсудить с аудиторией
Задачи:
Удержание клиента, системы лояльности
Поиск аномалий, защита от мошенничества
За границами веб-аналитики
Сравнение
Product + - =
GA/YM Простота Не глубоко
GA/YM
платный
$$$, доп знания
Excel Распространенность Не большие данные, по
большей части 2D, знания
Иметь данные
Tableau Визуализация,
многомерность
$$$, доп знания Иметь данные
OLAP Многомерность $$$, доп знания Иметь данные
Revolve
(этот)
Простота, глубина, скорость Пока не продукт Иметь данные
+
Быстро. (100+Гб/300млн строк за 1-3 с)
Глубоко. > 2D
Интуитивно, не требует знаний программирования (SQL, R, Excel). Бизнес
может с этим поиграться.
-
Нужен доступ до данных (GA/YM собирает, но не предоставляет)
Все равно нужно уметь “готовить” данные
Преимущества/недостатки
=
Является инструментом для выборки/запроса данных, не является
средством для расчета. (Скрестить с excel/google sheet?)
Визуализация побочна/вторична.
Никак не является системой сбора данных
Для целей аналитики, нельзя навесить действие на выделенный сегмент
- Что мне делать, если я средний … (банкир, веб-аналитик)?
- Не быть средним
(с) Богатый папа, бедный папа, Роберт Кийосаки
Совет
Что делать, если у меня нет доступа до данных?
==
Что делать, если у меня нет денег?
==
Что делать, если ничего нет, а хочется?
Ничего, см. выше
Андрей Овсянников (Picom, anr.andrew@gmail.com)
Picom (http://picom.ru)
Благодарности
Мои цели на эту конференцию
Понять есть ли у кого схожие задачи (и за пределами веб-аналитики, возможные связи).
Обратная связь. Куда двигаться? Нужно ли вообще двигаться? (куда можно еще съездить?)
Спасибо.
А мы все ставим каверзный ответ, и не
находим нужного вопроса (с) Высоцкий В. С.
Мой Гамлет
ajtkulov@gmail.com
Page
view
Grouped
by user
Projection
1) Room. Man and woman. W: “Which dress? Red or blue?”
2) Man: “Does it matter?”
3) The house, the street, the city, the country...
4) Aliens on orbit: “If she picks the blue one, explode the planet!”
Getting the vision of its audience
Otherwise, you can print reports.
There is no difference whether the user visits site 204 or 217 times.
We do not need total accuracy, just the general vision.
If your traffic went up by 15%, it’s just fluctuation.
If your traffic has been going up by 15% for the last 6 months, then it’s
probably a trend.
Business wants reports.
Business wants to get the vision of its audience.
Select specific part of the audience.
Perform some actions.
Get feedback.
Repeat. ^^^
Why do we need analytics?
Why business needs analytics?
Translation from Business language to Technical language (!?)
actually, money
This is all about happiness.
"Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск
"Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

More Related Content

Viewers also liked

TCP Profile - November 2016
TCP Profile - November 2016TCP Profile - November 2016
TCP Profile - November 2016THE CREW
 
Safaratos coffee
Safaratos coffeeSafaratos coffee
Safaratos coffeeAlfian Noor
 
Introducción investigación comercial simplificada
Introducción investigación comercial simplificadaIntroducción investigación comercial simplificada
Introducción investigación comercial simplificadaManuel Pérez Millares
 
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангелit-people
 
Launch of the Housing First Guide Europe
Launch of the Housing First Guide EuropeLaunch of the Housing First Guide Europe
Launch of the Housing First Guide EuropeFEANTSA
 
Aplicacion de los sistemas multimedia en la educacion
Aplicacion de los sistemas multimedia en la educacionAplicacion de los sistemas multimedia en la educacion
Aplicacion de los sistemas multimedia en la educacionartilescorniel
 
Tema 1 mglpc Investigación Comercial
Tema 1 mglpc Investigación ComercialTema 1 mglpc Investigación Comercial
Tema 1 mglpc Investigación ComercialJaime Manera
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...it-people
 

Viewers also liked (12)

Interests
InterestsInterests
Interests
 
TCP Profile - November 2016
TCP Profile - November 2016TCP Profile - November 2016
TCP Profile - November 2016
 
Ciclo cero
Ciclo ceroCiclo cero
Ciclo cero
 
Safaratos coffee
Safaratos coffeeSafaratos coffee
Safaratos coffee
 
Introducción investigación comercial simplificada
Introducción investigación comercial simplificadaIntroducción investigación comercial simplificada
Introducción investigación comercial simplificada
 
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел
"Ошибки венчурного инвестора" Леонид Волков, Бизнес-ангел
 
Ventanas
Ventanas Ventanas
Ventanas
 
Launch of the Housing First Guide Europe
Launch of the Housing First Guide EuropeLaunch of the Housing First Guide Europe
Launch of the Housing First Guide Europe
 
Aplicacion de los sistemas multimedia en la educacion
Aplicacion de los sistemas multimedia en la educacionAplicacion de los sistemas multimedia en la educacion
Aplicacion de los sistemas multimedia en la educacion
 
Tema 1 mglpc Investigación Comercial
Tema 1 mglpc Investigación ComercialTema 1 mglpc Investigación Comercial
Tema 1 mglpc Investigación Comercial
 
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
«Строим собственную BI в Excel на данных из Яндекс.Метрики и Google Analytics...
 
Cynthia berrios
Cynthia berriosCynthia berrios
Cynthia berrios
 

Similar to "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Ilja Zverev
 
Маркетинг в эпоху черных ящиков
Маркетинг в эпоху черных ящиковМаркетинг в эпоху черных ящиков
Маркетинг в эпоху черных ящиковAndrey Sebrant
 
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...Tech Talks @NSU
 

Similar to "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск (8)

Akavita Tutejshyja
Akavita TutejshyjaAkavita Tutejshyja
Akavita Tutejshyja
 
Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)Открытые геоданные (Citycamp 2012)
Открытые геоданные (Citycamp 2012)
 
Science games
Science gamesScience games
Science games
 
AdDay2012. Как это было
AdDay2012. Как это былоAdDay2012. Как это было
AdDay2012. Как это было
 
Маркетинг в эпоху черных ящиков
Маркетинг в эпоху черных ящиковМаркетинг в эпоху черных ящиков
Маркетинг в эпоху черных ящиков
 
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...
Data Science и Cognitive Science, алгоритмы и психология: четвертая промышлен...
 
Smi internet bsu_5_05_10
Smi internet bsu_5_05_10Smi internet bsu_5_05_10
Smi internet bsu_5_05_10
 
"Обзор Tarantool DB"
"Обзор Tarantool DB""Обзор Tarantool DB"
"Обзор Tarantool DB"
 

More from it-people

«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co
«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co
«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Coit-people
 
«Scrapy internals» Александр Сибиряков, Scrapinghub
«Scrapy internals» Александр Сибиряков, Scrapinghub«Scrapy internals» Александр Сибиряков, Scrapinghub
«Scrapy internals» Александр Сибиряков, Scrapinghubit-people
 
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrainsit-people
 
«Gevent — быть или не быть?» Александр Мокров, Positive Technologies
«Gevent — быть или не быть?» Александр Мокров, Positive Technologies«Gevent — быть или не быть?» Александр Мокров, Positive Technologies
«Gevent — быть или не быть?» Александр Мокров, Positive Technologiesit-people
 
«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс
«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс
«Ещё один Поиск Яндекса» Александр Кошелев, Яндексit-people
 
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...it-people
 
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalrit-people
 
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...it-people
 
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАНit-people
 
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банкit-people
 
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Coit-people
 
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНСit-people
 
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...it-people
 
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologiesit-people
 
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn Systemit-people
 
«(Без)опасный Python», Иван Цыганов, Positive Technologies
«(Без)опасный Python», Иван Цыганов, Positive Technologies«(Без)опасный Python», Иван Цыганов, Positive Technologies
«(Без)опасный Python», Иван Цыганов, Positive Technologiesit-people
 
«Python of Things», Кирилл Борисов, Яндекс
«Python of Things», Кирилл Борисов, Яндекс«Python of Things», Кирилл Борисов, Яндекс
«Python of Things», Кирилл Борисов, Яндексit-people
 
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...it-people
 
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognicianit-people
 
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...it-people
 

More from it-people (20)

«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co
«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co
«Про аналитику и серебряные пули» Александр Подсобляев, Rambler&Co
 
«Scrapy internals» Александр Сибиряков, Scrapinghub
«Scrapy internals» Александр Сибиряков, Scrapinghub«Scrapy internals» Александр Сибиряков, Scrapinghub
«Scrapy internals» Александр Сибиряков, Scrapinghub
 
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains
«Отладка в Python 3.6: Быстрее, Выше, Сильнее» Елизавета Шашкова, JetBrains
 
«Gevent — быть или не быть?» Александр Мокров, Positive Technologies
«Gevent — быть или не быть?» Александр Мокров, Positive Technologies«Gevent — быть или не быть?» Александр Мокров, Positive Technologies
«Gevent — быть или не быть?» Александр Мокров, Positive Technologies
 
«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс
«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс
«Ещё один Поиск Яндекса» Александр Кошелев, Яндекс
 
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...
«How I Learned to Stop Worrying and Love the BFG: нагрузочное тестирование со...
 
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr
«Write once run anywhere — почём опиум для народа?» Игорь Новиков, Scalr
 
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...
«Gensim — тематическое моделирование для людей» Иван Меньших, Лев Константино...
 
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН«Тотальный контроль производительности» Михаил Юматов, ЦИАН
«Тотальный контроль производительности» Михаил Юматов, ЦИАН
 
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк
«Детские болезни live-чата» Ольга Сентемова, Тинькофф Банк
 
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
«Микросервисы наносят ответный удар!» Олег Чуркин, Rambler&Co
 
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС
«Память и Python. Что надо знать для счастья?» Алексей Кузьмин, ЦНС
 
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...
«Что такое serverless-архитектура и как с ней жить?» Николай Марков, Aligned ...
 
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies
«Python на острие бритвы: PyPy project» Александр Кошкин, Positive Technologies
 
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System
«PyWat. А хорошо ли вы знаете Python?» Александр Швец, Marilyn System
 
«(Без)опасный Python», Иван Цыганов, Positive Technologies
«(Без)опасный Python», Иван Цыганов, Positive Technologies«(Без)опасный Python», Иван Цыганов, Positive Technologies
«(Без)опасный Python», Иван Цыганов, Positive Technologies
 
«Python of Things», Кирилл Борисов, Яндекс
«Python of Things», Кирилл Борисов, Яндекс«Python of Things», Кирилл Борисов, Яндекс
«Python of Things», Кирилл Борисов, Яндекс
 
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...
«Как сделать так, чтобы тесты на Swift не причиняли боль» Сычев Александр, Ra...
 
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician
«Клиенту и серверу нужно поговорить» Прокопов Никита, Cognician
 
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...
«Кошелек или деньги: сложный выбор между памятью и процессором» Алексеенко Иг...
 

"Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

  • 1. Как выйти из плоскости (How to escape from Flatland) Павел Айткулов (ajtkulov@gmail.com) http://www.convert-conf.ru/
  • 2. M. C. Escher, Reptiles, 1943
  • 4. Маленькие девочки любят картинки Бизнес любит картинки Alice was beginning to get very tired of sitting by her sister on the bank and of having nothing to do: once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, "and what is the use of a book," thought Alice, "without pictures or conversations?'
  • 5. Больше чем 2D: размер, температура, география, ... И так, инфографика?
  • 7. - (NY) Привет Роман, нам нужен отчет для клиента. - (BRA) Хорошо, к утру сделаю. - +1 день - (Bra) Готово, посмотри пожалуйста. - (NY) Классно, сейчас взгляну. - +1 день - (NY) Есть вопрос. Почему по строке…. - (Bra) Мда, - (Bra) Переделал, обнови. - (NY) Вроде все нормально. Так, вот это все надо для другого клиента. - +1 день Клиент -> наш бизнес -> наш аналитик C B -> C A -> O B -> O A -> O P B Бизнес, O наш, A аналитик, C клиент, P программист + на каждом слое по менеджеру Отдача результата: <- <- <- <- Идеальный мир: Бизнес <-> поиграться с данными Почти идеальный мир Бизнес аналитик <-> поиграться с данными Проблема
  • 8. Характеристики прототипа Входные данные: 100+Гб, 400 млн строк (pageviews) Время реакции: < 3 c Количество входных измерений: десятки, < 100 (да и зачем вам больше?) Количество измерений в запросах: < 12-15 (финальные данные должны влезть в память) Следите за руками (обман!), предобрабатываем входные (100+Гб) в разумные данные.
  • 9. Демо Мифы: Apple более щедрые чем android Доля Mac не более 10% рынка Глубже?
  • 10.
  • 11. Группировки по: Пользователю (уже сделано) Url Стране Разделу (tag, спорт/политика/новости) Автору Url: расширить данными (переходы с соцСетей) Наиболее ценные страницы(платники), оценка соцЗаказа (покупка заказных статей блогеров). SEO. На какие же страницы приходят с поиска? Страна: А уж не блокирует ли кто нас? “Национальная кухня” Раздел: Наиболее ценные разделы(платники) Автор: Топ-10 лучших авторов. Топ-10 худших авторов. Система оплаты авторов. Наиболее ценные авторы (платники) Как насчет?
  • 12. Что если вы работаете в: Банк Служба такси Ритейлер Нефтяная компания Железные дороги Данные: Клиент, менеджер, офис, тип операции Клиент, водитель, машина, география, Покупатель, продавец, товар, поставщик, склад, магазин Всегда: деньги, время, размер очереди обслуживания Группировать: обсудить с аудиторией Задачи: Удержание клиента, системы лояльности Поиск аномалий, защита от мошенничества За границами веб-аналитики
  • 13. Сравнение Product + - = GA/YM Простота Не глубоко GA/YM платный $$$, доп знания Excel Распространенность Не большие данные, по большей части 2D, знания Иметь данные Tableau Визуализация, многомерность $$$, доп знания Иметь данные OLAP Многомерность $$$, доп знания Иметь данные Revolve (этот) Простота, глубина, скорость Пока не продукт Иметь данные
  • 14. + Быстро. (100+Гб/300млн строк за 1-3 с) Глубоко. > 2D Интуитивно, не требует знаний программирования (SQL, R, Excel). Бизнес может с этим поиграться. - Нужен доступ до данных (GA/YM собирает, но не предоставляет) Все равно нужно уметь “готовить” данные Преимущества/недостатки = Является инструментом для выборки/запроса данных, не является средством для расчета. (Скрестить с excel/google sheet?) Визуализация побочна/вторична. Никак не является системой сбора данных Для целей аналитики, нельзя навесить действие на выделенный сегмент
  • 15. - Что мне делать, если я средний … (банкир, веб-аналитик)? - Не быть средним (с) Богатый папа, бедный папа, Роберт Кийосаки Совет Что делать, если у меня нет доступа до данных? == Что делать, если у меня нет денег? == Что делать, если ничего нет, а хочется? Ничего, см. выше
  • 16. Андрей Овсянников (Picom, anr.andrew@gmail.com) Picom (http://picom.ru) Благодарности
  • 17. Мои цели на эту конференцию Понять есть ли у кого схожие задачи (и за пределами веб-аналитики, возможные связи). Обратная связь. Куда двигаться? Нужно ли вообще двигаться? (куда можно еще съездить?)
  • 18. Спасибо. А мы все ставим каверзный ответ, и не находим нужного вопроса (с) Высоцкий В. С. Мой Гамлет ajtkulov@gmail.com
  • 20. 1) Room. Man and woman. W: “Which dress? Red or blue?” 2) Man: “Does it matter?” 3) The house, the street, the city, the country... 4) Aliens on orbit: “If she picks the blue one, explode the planet!” Getting the vision of its audience Otherwise, you can print reports. There is no difference whether the user visits site 204 or 217 times. We do not need total accuracy, just the general vision. If your traffic went up by 15%, it’s just fluctuation. If your traffic has been going up by 15% for the last 6 months, then it’s probably a trend.
  • 21. Business wants reports. Business wants to get the vision of its audience. Select specific part of the audience. Perform some actions. Get feedback. Repeat. ^^^
  • 22. Why do we need analytics? Why business needs analytics? Translation from Business language to Technical language (!?) actually, money This is all about happiness.