SlideShare a Scribd company logo
BA for Data Science
& Machine Learning
Гузенко Дмитрий
 Инструктор IT Education Academy
 Аналитик Luxoft
 Специалист по проектированию, разработке и
внедрению IT проектов
 24 года в ИТ
 15 лет БA
КОНТАКТНЫЕ ДАННЫЕ
fb.com/dmitry.guzenko
d.guzenko@outlook.com
What we deliver? Free Time
What we can
deliver now…
(не)Новые технологии
Machine Learning
Data Science
(не)Новые роли
Data Scientist
Data Analyst
Who Is mr. Data Scientist
Specialized knowledge
 Understanding theoretical concepts of statistics/probability, data mining, machine learning
 Understanding how these theoretical concepts could be applied to real world problems
 Ability to understand the nature of business problems and see the place of analytical models in the
solution
 Knowledge and hands-on experience with one or more of the following: Matlab/Octave, R, Python
 Familiarity with the concept of HPC, parallel computing
 Knowledge and hands-on experience with one or more of the following for data analytics:
Spark/Theano/TensorFlow/Caffee
Skills and abilities
 Strong English verbal and written communication
skills
 Deep analytical skills
 Self-organization, self-management
 Ability to work independently with limited
supervision
 Ability to handle multi-tasking activities
 Ability to learn quickly
 Following academic research and trends as a
habit
 Initiative and pro-active skills and flexibility
Experience
•Track record in data analysis, data science,
artificial intelligence
Personal characteristics
•Passion for learning and education
•Business orientation
•Result orientation
Job Context
•Customer facing role
•Sole responsibility over the analytical project
•High level of responsibility
•Simultaneous handling and fast processing of
multiple tasks
•Lots of educational and self-educational
activities
•Culture of knowledge sharing
Вывод
Сегодня суббота !!!
Вывод
BA knowledge as a base
BA + DS = новые возможности
(не)Новые инновации
Что происходит
1924 - Present 2001 - Present 2015 - Present
Data-Driven Approach
Сбор всех данных
Data-Driven Approach
Объединение
данных
различного типа
The Evolution of Data-Driven Company
(не)Новые возможности
Вопросы
Предсказания
Data Science — это наука о
методах анализа данных и
извлечения из них ценной
информации, знаний.
Data Science Process
Business
Analysis
Development
Evaluation
Deployment Data
Business
Understanding
Data
Understanding
Data
Preparation
Modeling
Data Science Process
https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining
Cross-Industry
Standard Process for
Data Mining
Brussels, 1999
CRISP-DM
Вывод
Вывод
Больше половины нам и так знакомо
Пока все понятно.
Принцип машинного обучения
Варианты использования
Очевидные и невероятные
Предсказания
На какие вопросы отвечает Data Science?
Это A или B?
Является ли это странным?
Сколько?
Как это организовано?
Что делать дальше?
Classification
Anomaly Detection
Regression
Clustering
Recommendation
1
2
3
4
5
На какие вопросы отвечает Data Science?
Сколько? Regression
Пример 2-х мерного пространства
Характеристик много, реальное
пространство многомерное
На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой доход принесет клиент?
•Какой возраст у клиента?
•Сколько стоит этот объект (недвижимости)?
На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой объем продаж будет в следующем месяце?
•Сколько сотрудников уволится в следующем
месяце?
•Прогноз прибыли или убытков по
филиалам/направлениями/продуктам/менеджерам?
Как это организовано? Clustering
На какие вопросы отвечает Data Science?
Как это организовано? Clustering
Bank & Finances
Николай Щербина
Попасть в девяточку: как с
помощью сегментации увеличить
конверсию на 473%
Персонализация коммуникаций:
как достучаться до каждого
Поток: CRM & Лояльность
На какие вопросы отвечает Data Science?
Это A или B? Classification
•Какой категории этот клиент?
•Сотрудник уволится в следующем месяце?
•Вернет ли этот клиент кредит банку: Да или Нет?
1
•Какой пол клиента?
На какие вопросы отвечает Data Science?
Является ли это странным? Anomaly Detection2
Нормально ли это сообщение внутри интернет трафика?
Могли ли вы рассчитаться кредитной картой одновременно
из двух разных мест?
Нормально ли то, что клиент летит в Египет но заказал
экскурсию в Турции?
Рекомендательная система Collaborative Filtering
Рекомендательная система Collaborative Filtering
На какие вопросы отвечает Data Science?
Что добавить еще? Recommendation
•Какой товар можно еще докупить
•Какой контент можно просмотреть еще?
•Каким клиентам еще можно предложить эту услугу?
•Рекомендация друзей, специалистов (FB, LinkedIn)?
Демократизация технологий
Tools for quick starting
Tools for Machine Learning
Frameworks
Challenges
Фокус не на алгоритм а на результат
Эксперты не хотят терять монополию на
экспертизу
Размерность спринта иногда большая
Отсутствие данных
Вопросы

More Related Content

Similar to Bacon.2018.it pro network.ba for dsml

Продюссирование, проект-менеджмент
Продюссирование, проект-менеджментПродюссирование, проект-менеджмент
Продюссирование, проект-менеджмент
Nimax
 
Дайджест вакансий июнь 2013
Дайджест вакансий июнь 2013Дайджест вакансий июнь 2013
Дайджест вакансий июнь 2013it-park
 
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажатьКак прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
Netpeak
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
Evgeniy Pavlovskiy
 
Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...
Ontico
 
Оправданы ли вложения в технологическое образование? (YEES 2010)
Оправданы ли вложения в технологическое образование? (YEES 2010)Оправданы ли вложения в технологическое образование? (YEES 2010)
Оправданы ли вложения в технологическое образование? (YEES 2010)YEES-2011
 
Как попасть на следующий уровень карьеры и зарплаты в C#
Как попасть на следующий уровень карьеры и зарплаты в C#Как попасть на следующий уровень карьеры и зарплаты в C#
Как попасть на следующий уровень карьеры и зарплаты в C#
geekfamilyrussia
 
А.Левенчук -- Образование по машинному обучению
А.Левенчук -- Образование по машинному обучениюА.Левенчук -- Образование по машинному обучению
А.Левенчук -- Образование по машинному обучению
Anatoly Levenchuk
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
Elizaveta Alekseeva
 
BI-проекты глазами аналитика
BI-проекты глазами аналитикаBI-проекты глазами аналитика
BI-проекты глазами аналитика
SQALab
 
Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...
Nik Spirin
 
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Vlad Linnik
 
48 Успех ( Больше про личный и командный)
48 Успех ( Больше про личный и командный)48 Успех ( Больше про личный и командный)
48 Успех ( Больше про личный и командный)
Dmitry Bezuglyy
 
Готовность предприятий к Индустрии 4-0 - результаты опроса
Готовность предприятий к Индустрии 4-0 - результаты опросаГотовность предприятий к Индустрии 4-0 - результаты опроса
Готовность предприятий к Индустрии 4-0 - результаты опроса
APPAU_Ukraine
 
Real Projects And Ahe June 2007 Ru
Real Projects And Ahe June 2007 RuReal Projects And Ahe June 2007 Ru
Real Projects And Ahe June 2007 Ru
Sergey Dmitriev
 
School IT recruiting
School IT recruiting School IT recruiting
School IT recruiting
Olga Kotova
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
Ilya Gershanov
 
ReqLabs2011_юрий_веденин_система_квалификации_аналитиков
ReqLabs2011_юрий_веденин_система_квалификации_аналитиковReqLabs2011_юрий_веденин_система_квалификации_аналитиков
ReqLabs2011_юрий_веденин_система_квалификации_аналитиков
Yuri Vedenin
 
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
ContextCombiner
 

Similar to Bacon.2018.it pro network.ba for dsml (20)

Продюссирование, проект-менеджмент
Продюссирование, проект-менеджментПродюссирование, проект-менеджмент
Продюссирование, проект-менеджмент
 
Дайджест вакансий июнь 2013
Дайджест вакансий июнь 2013Дайджест вакансий июнь 2013
Дайджест вакансий июнь 2013
 
go to us
go to usgo to us
go to us
 
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажатьКак прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
Как прийти в сферу SEO без опыта: расти, зарабатывать больше и не лажать
 
Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии Одна лекция из мира Big Data: тренды, кейсы и технологии
Одна лекция из мира Big Data: тренды, кейсы и технологии
 
Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...
 
Оправданы ли вложения в технологическое образование? (YEES 2010)
Оправданы ли вложения в технологическое образование? (YEES 2010)Оправданы ли вложения в технологическое образование? (YEES 2010)
Оправданы ли вложения в технологическое образование? (YEES 2010)
 
Как попасть на следующий уровень карьеры и зарплаты в C#
Как попасть на следующий уровень карьеры и зарплаты в C#Как попасть на следующий уровень карьеры и зарплаты в C#
Как попасть на следующий уровень карьеры и зарплаты в C#
 
А.Левенчук -- Образование по машинному обучению
А.Левенчук -- Образование по машинному обучениюА.Левенчук -- Образование по машинному обучению
А.Левенчук -- Образование по машинному обучению
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
BI-проекты глазами аналитика
BI-проекты глазами аналитикаBI-проекты глазами аналитика
BI-проекты глазами аналитика
 
Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...Применение машинного обучения для генерации структурированных сниппетов в пои...
Применение машинного обучения для генерации структурированных сниппетов в пои...
 
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
Большие данные от гуманитария: как успешно реализовать проект на Big Data, не...
 
48 Успех ( Больше про личный и командный)
48 Успех ( Больше про личный и командный)48 Успех ( Больше про личный и командный)
48 Успех ( Больше про личный и командный)
 
Готовность предприятий к Индустрии 4-0 - результаты опроса
Готовность предприятий к Индустрии 4-0 - результаты опросаГотовность предприятий к Индустрии 4-0 - результаты опроса
Готовность предприятий к Индустрии 4-0 - результаты опроса
 
Real Projects And Ahe June 2007 Ru
Real Projects And Ahe June 2007 RuReal Projects And Ahe June 2007 Ru
Real Projects And Ahe June 2007 Ru
 
School IT recruiting
School IT recruiting School IT recruiting
School IT recruiting
 
OSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya GershanovOSPconf Big Data Forum 2014 Ilya Gershanov
OSPconf Big Data Forum 2014 Ilya Gershanov
 
ReqLabs2011_юрий_веденин_система_квалификации_аналитиков
ReqLabs2011_юрий_веденин_система_квалификации_аналитиковReqLabs2011_юрий_веденин_система_квалификации_аналитиков
ReqLabs2011_юрий_веденин_система_квалификации_аналитиков
 
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
Презентация Вебинар 1LEADGEN "Excel для Директолога" (04.03.2017)
 

Bacon.2018.it pro network.ba for dsml