Bacon.2018.it pro network.ba for dsml

BA for Data Science
& Machine Learning

Гузенко Дмитрий
 Инструктор IT Education Academy
 Аналитик Luxoft
 Специалист по проектированию, разработке и
внедрению IT проектов
 24 года в ИТ
 15 лет БA
КОНТАКТНЫЕ ДАННЫЕ
fb.com/dmitry.guzenko
d.guzenko@outlook.com

(не)Новые технологии
Machine Learning
Data Science

(не)Новые роли
Data Scientist
Data Analyst

Specialized knowledge
 Understanding theoretical concepts of statistics/probability, data mining, machine learning
 Understanding how these theoretical concepts could be applied to real world problems
 Ability to understand the nature of business problems and see the place of analytical models in the
solution
 Knowledge and hands-on experience with one or more of the following: Matlab/Octave, R, Python
 Familiarity with the concept of HPC, parallel computing
 Knowledge and hands-on experience with one or more of the following for data analytics:
Spark/Theano/TensorFlow/Caffee

Skills and abilities
 Strong English verbal and written communication
skills
 Deep analytical skills
 Self-organization, self-management
 Ability to work independently with limited
supervision
 Ability to handle multi-tasking activities
 Ability to learn quickly
 Following academic research and trends as a
habit
 Initiative and pro-active skills and flexibility
Experience
•Track record in data analysis, data science,
artificial intelligence
Personal characteristics
•Passion for learning and education
•Business orientation
•Result orientation
Job Context
•Customer facing role
•Sole responsibility over the analytical project
•High level of responsibility
•Simultaneous handling and fast processing of
multiple tasks
•Lots of educational and self-educational
activities
•Culture of knowledge sharing

Вывод
Сегодня суббота !!!

Вывод
BA knowledge as a base
BA + DS = новые возможности

(не)Новые инновации

1924 - Present 2001 - Present 2015 - Present

Data-Driven Approach
Сбор всех данных

Data-Driven Approach
Объединение
данных
различного типа

The Evolution of Data-Driven Company

(не)Новые возможности
Вопросы
Предсказания

Data Science — это наука о
методах анализа данных и
извлечения из них ценной
информации, знаний.

Data Science Process
Business
Analysis
Development
Evaluation
Deployment Data
Business
Understanding
Data
Understanding
Data
Preparation
Modeling

Data Science Process
https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining
Cross-Industry
Standard Process for
Data Mining
Brussels, 1999
CRISP-DM

Вывод
Больше половины нам и так знакомо
Пока все понятно.

Принцип машинного обучения

Варианты использования
Очевидные и невероятные

На какие вопросы отвечает Data Science?
Это A или B?
Является ли это странным?
Сколько?
Как это организовано?
Что делать дальше?
Classification
Anomaly Detection
Regression
Clustering
Recommendation
1
2
3
4
5

Сколько? Regression
Пример 2-х мерного пространства
Характеристик много, реальное
пространство многомерное

•Какой доход принесет клиент?
•Какой возраст у клиента?
•Сколько стоит этот объект (недвижимости)?

•Какой объем продаж будет в следующем месяце?
•Сколько сотрудников уволится в следующем
месяце?
•Прогноз прибыли или убытков по
филиалам/направлениями/продуктам/менеджерам?

Как это организовано? Clustering

Bank & Finances
Николай Щербина
Попасть в девяточку: как с
помощью сегментации увеличить
конверсию на 473%
Персонализация коммуникаций:
как достучаться до каждого
Поток: CRM & Лояльность

Это A или B? Classification
•Какой категории этот клиент?
•Сотрудник уволится в следующем месяце?
•Вернет ли этот клиент кредит банку: Да или Нет?
1
•Какой пол клиента?

Является ли это странным? Anomaly Detection2
Нормально ли это сообщение внутри интернет трафика?
Могли ли вы рассчитаться кредитной картой одновременно
из двух разных мест?
Нормально ли то, что клиент летит в Египет но заказал
экскурсию в Турции?

Рекомендательная система Collaborative Filtering

Что добавить еще? Recommendation
•Какой товар можно еще докупить
•Какой контент можно просмотреть еще?
•Каким клиентам еще можно предложить эту услугу?
•Рекомендация друзей, специалистов (FB, LinkedIn)?

Демократизация технологий

Challenges
Фокус не на алгоритм а на результат
Эксперты не хотят терять монополию на
экспертизу
Размерность спринта иногда большая
Отсутствие данных

Bacon.2018.it pro network.ba for dsml

Recommended

Recommended

More Related Content

Similar to Bacon.2018.it pro network.ba for dsml

Similar to Bacon.2018.it pro network.ba for dsml (20)

Bacon.2018.it pro network.ba for dsml