SlideShare a Scribd company logo
Analytics Institute
Организация исследований и
проектов анализа данных
Основная ценность анализа больших данных - повышение эффективности
принятия решений, а не технологический стек хранения данных.
эффективность
принятия
решений
объем
данных
Данные
Информация
Знания
Решения

формирование действительности




Анализ данных

существует вне действительности





Данные

отражение действительности
Методы анализа данных предоставляют собой технологический мост,
обеспечивающий принимаемым решениям поддержку актуальной
информацией, отражающей объективную действительность.
Выбор критериев
успешности
Определение
возможных решений
Слежение за
результатами
Выбор и исполнение
лучшего решения
Оценка возможных
решений
Постановка задачи
Рациональный подход к принятию решений представляет собой
повторяющийся цикл оценки и выбора альтернатив.
В решении задач анализа данных существует разработанная методология -
CRoss Industry Standard Process for Data Mining (CRISP DM).
CRISP DM согласуется с рациональным подходом к принятию решений и
описывает стандартный жизненный цикл решений.
Выбор критериев
успешности
Определение
возможных решений
Слежение за
результатами
Выбор и исполнение
лучшего решения
Оценка возможных
решений
Постановка задачи
В процессе решения важно следовать нескольким простым принципам:
Порядок

следовать плану -
не перескакивать
между пунктами
Скорость

проходить полный
круг по циклу как
можно быстрее(чаще)
Фокусировка

держать в
приоритете решение
а не методы
Воспроизводимость

сохранять результаты
каждого цикла
решения
1. Сбор данных, подготовка
инфраструктуры
2. Разведочный анализ
данных
3. Жизненный цикл решений
анализа данных
4. Улучшение решений,
сопряженные задачи
5. Презентация решения
• Данные удалось считать,

удалось построить первые графики
• Есть план по созданию первого решения в
следующие несколько часов
• Есть одно готовое решение, команда
следует плану и знает что улучшить
• Есть несколько решений, дальнейшая
работа взвешена и спланирована
• Решение готово, удовлетворяет всем
требованиям
Шпаргалки, которые могут помочь в решении хакатона:
‣Данные считываются
верно?

‣В данных нет ошибок?
‣Данных достаточно?
‣Данные актуальны?
‣Можно улучшить
результат?
‣Тестирование
корректно?
‣Учтены все решения?
‣Тип модели/решения
адекватен?
‣Корректен ли выбор
(гипер)параметров?
‣Нет ли избыточной
сложности?
‣Есть технические
трудности?
‣Данные удобны для
работы?
‣Что еще можно
вытащить из данных?
‣Как задачу обычно
решают?
‣На что в данных
смотрят?
‣Что именно найти, что
оптимизировать?
Этап: Должно быть готово к концу этапа:
Алексей Натекин
anatekin@deloitte.ru
Спасибо!

More Related Content

Viewers also liked

Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)
Edutainme
 
Григорий Сапунов (eclass)
Григорий Сапунов (eclass)Григорий Сапунов (eclass)
Григорий Сапунов (eclass)
Edutainme
 
Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)
Edutainme
 
Presentation introduction to six sigma
Presentation   introduction to six sigmaPresentation   introduction to six sigma
Presentation introduction to six sigmajpanchpor
 
six sigma ppt
six sigma pptsix sigma ppt
six sigma ppt
Sanjiv Yadav
 
Basic Six Sigma Presentation
Basic Six Sigma PresentationBasic Six Sigma Presentation
Basic Six Sigma Presentationvivekissar
 
Six Sigma the best ppt
Six Sigma the best pptSix Sigma the best ppt
Six Sigma the best ppt
Rabia Sgh S
 

Viewers also liked (7)

Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)
 
Григорий Сапунов (eclass)
Григорий Сапунов (eclass)Григорий Сапунов (eclass)
Григорий Сапунов (eclass)
 
Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)
 
Presentation introduction to six sigma
Presentation   introduction to six sigmaPresentation   introduction to six sigma
Presentation introduction to six sigma
 
six sigma ppt
six sigma pptsix sigma ppt
six sigma ppt
 
Basic Six Sigma Presentation
Basic Six Sigma PresentationBasic Six Sigma Presentation
Basic Six Sigma Presentation
 
Six Sigma the best ppt
Six Sigma the best pptSix Sigma the best ppt
Six Sigma the best ppt
 

Similar to Алексей Натекин (Deloitte)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
DEVTYPE
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
Yuri Yashkin
 
Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2
Changellenge >> Capital
 
Подход КРОК к построению MDM
Подход КРОК к построению MDMПодход КРОК к построению MDM
Подход КРОК к построению MDM
КРОК
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
Elizaveta Alekseeva
 
A/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибокA/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибок
Николай Захаров
 
Visualization of information - Talat Numonov
Visualization of information - Talat NumonovVisualization of information - Talat Numonov
Visualization of information - Talat NumonovE-Journal ICT4D
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
Alexander Barakov
 
Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»
Gregory Baev
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
Elizaveta Alekseeva
 
Байдалина472(2)
Байдалина472(2)Байдалина472(2)
Байдалина472(2)
Liubov Baydalina
 
Управление процессами разработки ПО
Управление процессами разработки ПОУправление процессами разработки ПО
Управление процессами разработки ПО
Peoplemind
 
Clt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-codeClt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-code
Changellenge >> Capital
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
Yuri Yashkin
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных
Elizaveta Alekseeva
 
3. 10 shagov k pci compliance
3. 10 shagov k pci compliance3. 10 shagov k pci compliance
3. 10 shagov k pci complianceInformzaschita
 
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Edward Babushkin
 
сппр
сппрсппр
Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)
PCampRussia
 

Similar to Алексей Натекин (Deloitte) (20)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
SPSS Modeler
SPSS ModelerSPSS Modeler
SPSS Modeler
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2
 
Подход КРОК к построению MDM
Подход КРОК к построению MDMПодход КРОК к построению MDM
Подход КРОК к построению MDM
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
A/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибокA/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибок
 
Visualization of information - Talat Numonov
Visualization of information - Talat NumonovVisualization of information - Talat Numonov
Visualization of information - Talat Numonov
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
 
Байдалина472(2)
Байдалина472(2)Байдалина472(2)
Байдалина472(2)
 
Управление процессами разработки ПО
Управление процессами разработки ПОУправление процессами разработки ПО
Управление процессами разработки ПО
 
Clt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-codeClt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-code
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных
 
3. 10 shagov k pci compliance
3. 10 shagov k pci compliance3. 10 shagov k pci compliance
3. 10 shagov k pci compliance
 
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
 
сппр
сппрсппр
сппр
 
Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)
 

More from Edutainme

Светлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУСветлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУ
Edutainme
 
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУКирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
Edutainme
 
Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017
Edutainme
 
Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017
Edutainme
 
Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017
Edutainme
 
Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017
Edutainme
 
Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017
Edutainme
 
Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017
Edutainme
 
Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017
Edutainme
 
Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017
Edutainme
 
Открытое образование для университетов
Открытое образование для университетовОткрытое образование для университетов
Открытое образование для университетов
Edutainme
 
Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016
Edutainme
 
Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016
Edutainme
 
Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016
Edutainme
 
Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016
Edutainme
 
Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016
Edutainme
 
Мета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостностиМета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостности
Edutainme
 
Дизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУДизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУ
Edutainme
 
Дизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИДизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИ
Edutainme
 
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
Edutainme
 

More from Edutainme (20)

Светлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУСветлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУ
 
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУКирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
 
Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017
 
Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017
 
Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017
 
Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017
 
Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017
 
Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017
 
Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017
 
Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017
 
Открытое образование для университетов
Открытое образование для университетовОткрытое образование для университетов
Открытое образование для университетов
 
Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016
 
Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016
 
Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016
 
Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016
 
Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016
 
Мета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостностиМета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостности
 
Дизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУДизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУ
 
Дизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИДизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИ
 
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
 

Алексей Натекин (Deloitte)

  • 1. Analytics Institute Организация исследований и проектов анализа данных
  • 2. Основная ценность анализа больших данных - повышение эффективности принятия решений, а не технологический стек хранения данных. эффективность принятия решений объем данных
  • 3. Данные Информация Знания Решения
 формирование действительности 
 
 Анализ данных
 существует вне действительности
 
 
 Данные
 отражение действительности Методы анализа данных предоставляют собой технологический мост, обеспечивающий принимаемым решениям поддержку актуальной информацией, отражающей объективную действительность.
  • 4. Выбор критериев успешности Определение возможных решений Слежение за результатами Выбор и исполнение лучшего решения Оценка возможных решений Постановка задачи Рациональный подход к принятию решений представляет собой повторяющийся цикл оценки и выбора альтернатив.
  • 5. В решении задач анализа данных существует разработанная методология - CRoss Industry Standard Process for Data Mining (CRISP DM).
  • 6. CRISP DM согласуется с рациональным подходом к принятию решений и описывает стандартный жизненный цикл решений. Выбор критериев успешности Определение возможных решений Слежение за результатами Выбор и исполнение лучшего решения Оценка возможных решений Постановка задачи
  • 7. В процессе решения важно следовать нескольким простым принципам: Порядок
 следовать плану - не перескакивать между пунктами Скорость
 проходить полный круг по циклу как можно быстрее(чаще) Фокусировка
 держать в приоритете решение а не методы Воспроизводимость
 сохранять результаты каждого цикла решения
  • 8. 1. Сбор данных, подготовка инфраструктуры 2. Разведочный анализ данных 3. Жизненный цикл решений анализа данных 4. Улучшение решений, сопряженные задачи 5. Презентация решения • Данные удалось считать,
 удалось построить первые графики • Есть план по созданию первого решения в следующие несколько часов • Есть одно готовое решение, команда следует плану и знает что улучшить • Есть несколько решений, дальнейшая работа взвешена и спланирована • Решение готово, удовлетворяет всем требованиям Шпаргалки, которые могут помочь в решении хакатона: ‣Данные считываются верно?
 ‣В данных нет ошибок? ‣Данных достаточно? ‣Данные актуальны? ‣Можно улучшить результат? ‣Тестирование корректно? ‣Учтены все решения? ‣Тип модели/решения адекватен? ‣Корректен ли выбор (гипер)параметров? ‣Нет ли избыточной сложности? ‣Есть технические трудности? ‣Данные удобны для работы? ‣Что еще можно вытащить из данных? ‣Как задачу обычно решают? ‣На что в данных смотрят? ‣Что именно найти, что оптимизировать? Этап: Должно быть готово к концу этапа: