SlideShare a Scribd company logo
1 of 9
Download to read offline
Данные от точки возникновения до
точки использования
Почему вы наверняка всё запорите
Autodoc GmbH Josef-Orlopp-Straße 55 10365
Berlin
General overview: me
Kirill Sidorov
38 years
Hobbies:
Go - Chinese strategic board game,
micro-controllers, inline skating,
snowboarding
Patent:
An electromechanic landscape
programmable interactive display (2011)
17 years

Project management
urban ecology
public events
construction
software development
agritech
11 years

IT Project mngr.
Business analyst
USA digital marketing
RTB
analytical interfaces
bigdata
highload
7 years

System / data
analysis & development
automated marketing researches

semi-automated competitor analysis
data collection / preparation / storage
user behaviour analysis
It’s my 4th big project in Data filed
Для начала простой пример
как это обычно начинается
-
Простой пример
Прикрутим GA
+ +
=
Пример становится чуть сложнее…
Что нужно знать про GA
А может сразу
enterprise edition?
or
+
+
А хранить где?
or
еще раз

or
Ну может вы


уже лютый
enterprise?
Пример становится чуть сложнее…
Что нужно знать про GA
А может сразу
enterprise edition?
or
+
+
А хранить где?
or
еще раз

or
Ну может вы


уже лютый
enterprise?
А что там с
семплированием?
А связанность
данных между
сессиями?
А как
обеспечить
транзитивную
аналитику?
А custom
dimensions сколько
можно будет всунуть?
Это ж
поведенческие
данные - как
валидировать?
А стоить то по
итогу сколько будет?

Куда писать select * …
Итак, что нам в целом нужно сделать?
Очень упрощённая схема
!
! → "
→ #
→ → →
"
#
"
#
"
#
!
#
!
#
!
#
"
→ →
Data origin
Application processing
1st OLAP DWH ETL
2nd OLAP DWH ETL
OLTP Database
OLTP


Online Transaction
Processing
OLAP


Processing service
OLAP


online analytical
processing
Data Lake
Data marts
BI reports
А что ещё будем собирать?
"# "
May the data
be with you

More Related Content

Similar to Data: from point of origin to point of use. Why you’re sure to screw things up

Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях
Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях
Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях Альбина Минуллина
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBranchMarketing
 
Машинное обучение в кибербезопасности
Машинное обучение в кибербезопасностиМашинное обучение в кибербезопасности
Машинное обучение в кибербезопасностиAleksey Lukatskiy
 
ALMADA 2013 (computer science school by Yandex and Microsoft Research)
ALMADA 2013 (computer science school by Yandex and Microsoft Research)ALMADA 2013 (computer science school by Yandex and Microsoft Research)
ALMADA 2013 (computer science school by Yandex and Microsoft Research)Alexey Zinoviev
 
Ключевые тренды в ИТ и их причины
Ключевые тренды в ИТ и их причиныКлючевые тренды в ИТ и их причины
Ключевые тренды в ИТ и их причиныMikhail Andronov
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013Gleb K
 
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...Yauheni Akhotnikau
 
Cовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнесаCовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнеса1C-KPD
 
Зачем в Avito Аналитика?
Зачем в Avito Аналитика?Зачем в Avito Аналитика?
Зачем в Avito Аналитика?AvitoTech
 
Про IoT Gartner i2017
Про IoT Gartner i2017Про IoT Gartner i2017
Про IoT Gartner i2017Victor Gridnev
 
Презентация 8bitМechanic
Презентация 8bitМechanicПрезентация 8bitМechanic
Презентация 8bitМechanicDaniel Abelski
 
Маркетинг времен IV промышленной революции (Russian)
Маркетинг времен IV  промышленной революции (Russian)Маркетинг времен IV  промышленной революции (Russian)
Маркетинг времен IV промышленной революции (Russian)Andrey Sebrant
 
F+ presentation public
F+ presentation publicF+ presentation public
F+ presentation publicSergiy Gladkyy
 
Сложность – норма жизни
Сложность – норма жизниСложность – норма жизни
Сложность – норма жизниStanislav Makarov
 
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...Фонд СПО 2.0
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015rusbase
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovIlya Gershanov
 
лекция типовые ошибки
лекция типовые ошибкилекция типовые ошибки
лекция типовые ошибкиYury Zelensky
 
От продуктов к услугам - Open Source и SaaS
От продуктов к услугам  - Open Source и SaaSОт продуктов к услугам  - Open Source и SaaS
От продуктов к услугам - Open Source и SaaSDmitry Altukhov
 

Similar to Data: from point of origin to point of use. Why you’re sure to screw things up (20)

Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях
Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях
Мониторинг инцидентов ИБ, SIEM-системы в промышленных сетях
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Машинное обучение в кибербезопасности
Машинное обучение в кибербезопасностиМашинное обучение в кибербезопасности
Машинное обучение в кибербезопасности
 
ALMADA 2013 (computer science school by Yandex and Microsoft Research)
ALMADA 2013 (computer science school by Yandex and Microsoft Research)ALMADA 2013 (computer science school by Yandex and Microsoft Research)
ALMADA 2013 (computer science school by Yandex and Microsoft Research)
 
Ключевые тренды в ИТ и их причины
Ключевые тренды в ИТ и их причиныКлючевые тренды в ИТ и их причины
Ключевые тренды в ИТ и их причины
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013
 
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...
Акторы в C++: взгляд старого практикующего актородела (St. Petersburg C++ Use...
 
Cовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнесаCовременные тенденции против устаревших стереотипов бизнеса
Cовременные тенденции против устаревших стереотипов бизнеса
 
Зачем в Avito Аналитика?
Зачем в Avito Аналитика?Зачем в Avito Аналитика?
Зачем в Avito Аналитика?
 
Про IoT Gartner i2017
Про IoT Gartner i2017Про IoT Gartner i2017
Про IoT Gartner i2017
 
Презентация 8bitМechanic
Презентация 8bitМechanicПрезентация 8bitМechanic
Презентация 8bitМechanic
 
Маркетинг времен IV промышленной революции (Russian)
Маркетинг времен IV  промышленной революции (Russian)Маркетинг времен IV  промышленной революции (Russian)
Маркетинг времен IV промышленной революции (Russian)
 
F+ presentation public
F+ presentation publicF+ presentation public
F+ presentation public
 
Сложность – норма жизни
Сложность – норма жизниСложность – норма жизни
Сложность – норма жизни
 
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...
Открытые технологии и стандарты в РФ: импортозамещение, безопасность, экономи...
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 
Про DLP (Баку) 2014 11
Про DLP (Баку) 2014 11Про DLP (Баку) 2014 11
Про DLP (Баку) 2014 11
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
 
лекция типовые ошибки
лекция типовые ошибкилекция типовые ошибки
лекция типовые ошибки
 
От продуктов к услугам - Open Source и SaaS
От продуктов к услугам  - Open Source и SaaSОт продуктов к услугам  - Open Source и SaaS
От продуктов к услугам - Open Source и SaaS
 

Data: from point of origin to point of use. Why you’re sure to screw things up

  • 1. Данные от точки возникновения до точки использования Почему вы наверняка всё запорите Autodoc GmbH Josef-Orlopp-Straße 55 10365 Berlin
  • 2. General overview: me Kirill Sidorov 38 years Hobbies: Go - Chinese strategic board game, micro-controllers, inline skating, snowboarding Patent: An electromechanic landscape programmable interactive display (2011) 17 years
 Project management urban ecology public events construction software development agritech 11 years
 IT Project mngr. Business analyst USA digital marketing RTB analytical interfaces bigdata highload 7 years
 System / data analysis & development automated marketing researches
 semi-automated competitor analysis data collection / preparation / storage user behaviour analysis It’s my 4th big project in Data filed
  • 3. Для начала простой пример как это обычно начинается -
  • 5. Пример становится чуть сложнее… Что нужно знать про GA А может сразу enterprise edition? or + + А хранить где? or еще раз
 or Ну может вы 
 уже лютый enterprise?
  • 6. Пример становится чуть сложнее… Что нужно знать про GA А может сразу enterprise edition? or + + А хранить где? or еще раз
 or Ну может вы 
 уже лютый enterprise? А что там с семплированием? А связанность данных между сессиями? А как обеспечить транзитивную аналитику? А custom dimensions сколько можно будет всунуть? Это ж поведенческие данные - как валидировать? А стоить то по итогу сколько будет?
 Куда писать select * …
  • 7. Итак, что нам в целом нужно сделать? Очень упрощённая схема ! ! → " → # → → → " # " # " # ! # ! # ! # " → → Data origin Application processing 1st OLAP DWH ETL 2nd OLAP DWH ETL OLTP Database OLTP 
 Online Transaction Processing OLAP 
 Processing service OLAP 
 online analytical processing Data Lake Data marts BI reports
  • 8. А что ещё будем собирать? "# "
  • 9. May the data be with you