SlideShare a Scribd company logo
1 of 14
Download to read offline
Данные: от любви до ненависти и обратно.
Кто такие дата-инженеры и как им стать
Кто такой дата инженер?
set up infrastructure,
collect data
analysis, DS,
ML, DL
explore/transform,
validation
move/store
Data infrastructure
engineer, Backend
Analysts,
Data Scientists
Data engineer
Доставка Обработка
Актуальность
Сбор
Корректность
Хранение
Доступность
Что делает?
За что отвечает?
Как становятся дата инженерами?
Data Engineer
Backend
engineers
Analysts
Data Scientists
Architectors
Как становятся дата инженерами?
Data Engineer
Как становятся дата инженерами?
Backend
engineer
Data Engineer
- Принципы работы схожи
- Безболезненный переход
- Данные как ресурс
- Сложности с бизнес-требованиями
Как становятся дата инженерами?
Backend
engineer
Data Engineer
Data analyst
- Принципы работы схожи
- Безболезненный переход
- Данные как ресурс
- Сложности с бизнес-требованиями
- Умение работать с данными и понимать их
- Нехватка данных
- Недостаток документации
- Невозможность проверить источники
- Умение находить проблемы в данных
- Невозможность эти проблемы пофиксить
- Сложности обучения
Что должен знать и уметь дата инженер?
Что должен знать и уметь дата инженер?
SQL
01
Programming
language
02
Data
pipelines
03
Database
basics &
concepts
04
Cloud
05
Distributed
systems
06
Data
processing
07
MLOps
08
- Python
- Scala
- ETL/ELT
- Airflow
- SQL/No SQL
- Data Warehouse
- Data Lake
- Delta Lake
- GCP
- AWS
- Azure
- MySQL
- PostgreSQL
- PySpark
- Kafka
- DVC
- MLFlow / KubeFlow
3 базовых навыка для старта
3 базовых навыка для старта
Analytical mindset
Programming
SQL
Спасибо за внимание!
Вопросы?
Diana Dmytrashko
Team Lead of Data Engineering
Contacts:
Linkedin: https://www.linkedin.com/in/diana-dmytrashko-aa98a419b/
Gmail: diana.dmytrashko@gmail.com

More Related Content

Similar to Data: from love to hate and back again. Who data engineers are and how to become one.

Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...Andrew Sovtsov
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovIlya Gershanov
 
Практические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPПрактические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPDialogueScience
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...it-network
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlDmitry Guzenko
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данныеSQALab
 
Top big data architecture patterns by Igor Chub
Top big data architecture patterns  by Igor ChubTop big data architecture patterns  by Igor Chub
Top big data architecture patterns by Igor Chub.NET User Group Dnipro
 
Device lock: построение эффективной системы от утечек данных
Device lock: построение эффективной системы от утечек данныхDevice lock: построение эффективной системы от утечек данных
Device lock: построение эффективной системы от утечек данныхExpolink
 
BI-проекты глазами аналитика
BI-проекты глазами аналитикаBI-проекты глазами аналитика
BI-проекты глазами аналитикаSQALab
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biМаксим Войцеховский
 
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Vlad Linnik
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхDenodo
 
Практические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPПрактические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPDialogueScience
 
Device lock codeib - екатеринбург 2014
Device lock   codeib - екатеринбург 2014Device lock   codeib - екатеринбург 2014
Device lock codeib - екатеринбург 2014Expolink
 
Device Lock - Построение эффективной системы защиты от утечек данных
Device Lock - Построение эффективной системы защиты от утечек данныхDevice Lock - Построение эффективной системы защиты от утечек данных
Device Lock - Построение эффективной системы защиты от утечек данныхExpolink
 
Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI TransformationEduard Tyantov
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхDenodo
 

Similar to Data: from love to hate and back again. Who data engineers are and how to become one. (20)

Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
Бизнес-контекст, совместная работа и согласованность для интеллектуального уп...
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
 
Практические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPПрактические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLP
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsml
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данные
 
Top big data architecture patterns by Igor Chub
Top big data architecture patterns  by Igor ChubTop big data architecture patterns  by Igor Chub
Top big data architecture patterns by Igor Chub
 
Device lock: построение эффективной системы от утечек данных
Device lock: построение эффективной системы от утечек данныхDevice lock: построение эффективной системы от утечек данных
Device lock: построение эффективной системы от утечек данных
 
BI-проекты глазами аналитика
BI-проекты глазами аналитикаBI-проекты глазами аналитика
BI-проекты глазами аналитика
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft bi
 
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Практические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLPПрактические особенности внедрения систем класса DLP
Практические особенности внедрения систем класса DLP
 
Sap Crystal Solutions
Sap Crystal Solutions Sap Crystal Solutions
Sap Crystal Solutions
 
Device lock codeib - екатеринбург 2014
Device lock   codeib - екатеринбург 2014Device lock   codeib - екатеринбург 2014
Device lock codeib - екатеринбург 2014
 
Device Lock - Построение эффективной системы защиты от утечек данных
Device Lock - Построение эффективной системы защиты от утечек данныхDevice Lock - Построение эффективной системы защиты от утечек данных
Device Lock - Построение эффективной системы защиты от утечек данных
 
Project Management 2.0: AI Transformation
Project Management 2.0: AI TransformationProject Management 2.0: AI Transformation
Project Management 2.0: AI Transformation
 
Продвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данныхПродвинутый анализ и машинное обучение с помощью виртуализации данных
Продвинутый анализ и машинное обучение с помощью виртуализации данных
 
Big Data
Big DataBig Data
Big Data
 
Big data
Big dataBig data
Big data
 

Data: from love to hate and back again. Who data engineers are and how to become one.