Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Использование практик бизнес-анализа в проектах big data и data science

1,099 views

Published on

Доклад Сергея Кадомского на конференции Analyst Days-4,
17-18 апреля 2015 г., Минск
www.analystdays.com

Published in: Education
  • Be the first to comment

Использование практик бизнес-анализа в проектах big data и data science

  1. 1. Использование практик бизнес-анализа в проектах big data и data science Сергей Кадомский Director of Research and Data Science Wargaming.net
  2. 2. 2 Давайте познакомимся
  3. 3. 3 Немного о нашей команде Player Research and Data Science в WG  Wargaming.net сейчас оперирует несколько free2Play игр: World of Tanks, World of Warplanes, World of Tanks Blitz, на подходе ещё ряд проектов  Некоторые задачи, которые нами решаются либо не решались в индустрии, либо информация об их решении отсутствует  Наша команда представляет собой сервисное подразделение, работающее с внутренними заказчиками, сейчас нас 12 человек  Офисы WG расположены в 14 локациях по всему миру
  4. 4. 4 История из жизни
  5. 5. 5 О чем мой рассказ  Big Data, Data Science, Machine Learning это новые области не только для игровой индустрии, но и для большинства индустрий на постсоветском пространстве  Специалисты, решающие задачи data science – в подавляющем большинстве приходят из технических специальностей, а не из бизнеса, маркетинга или продуктового управления
  6. 6. 6 О чем мой рассказ  Непонимание подходов Big Data и Data Science заказчиками  Завышенные ожидания и естественный scope creep  Непредсказуемость результатов моделирования  Конфликт результатов с мнением экспертов
  7. 7. 7 Практика #1: глоссарий бизнес-определений  Первый этап, с которого необходимо начинать работу  Базис, без которого невозможна эффективная коммуникация
  8. 8. 8 Практика #2: словари данных  Описание структур используемых БД  Описание значений данных в используемых БД  Описание Business Intelligence систем, с которыми нужно будет интегрироваться Решает проблему качества данных и упрощает поиск ошибок
  9. 9. 9 Проблема: завышенные ожидания и scope creep
  10. 10. 10 Решение проблемы завышенных ожиданий  Фиксация vision&scope перед стартом проекта  Формализация бизнес-целей  Фиксация гипотез с вовлечением экспертов
  11. 11. 11 Решение проблемы завышенных ожиданий – в работе с нефункциональными требованиями  Скорость работы моделей  Качество моделирования  Reusability: это ad-hoc или будем внедрять?
  12. 12. 12 Проблема: непредсказуемость результатов  Моделирование это приблизительное описание реального мира – 100% точных моделей не бывает, т.к. все данные собрать невозможно  Результата может не быть – вообще!  Полученные результаты иногда сложно, а при выборе некоторых методов невозможно объяснить
  13. 13. 13 Решение - непредсказуемость результатов  Итеративное решение задачи возможно только тогда, когда исполнителю понятны бизнес-цели (а не «посчитайте мне это») и метрики успешности проекта  Повышение точности достигается в результате оптимизации моделей: через усложнение алгоритмов, поиск и добавление новых данных – для выбора направления оптимизации нужно понимать ожидания и бизнес-задачи
  14. 14. 14 Проблема: конфликт результатов с мнением экспертов  Для моей команды успешный проект это не тот, который подтвердил ожидания, а тот, который принёс новые и неожиданные знания  Зачастую такие результаты сильно отличаются от ожиданий заказчиков и экспертов и вызывают недоверие
  15. 15. 15 Решение - конфликт результатов с мнением экспертов  Выявление на старте проекта не только стейкхолдеров и SME, но и неформальных лидеров мнений  План коммуникаций должен вовлекать заказчиков и экспертов не только на этапе постановки, но и при выполнении проекта – так создаётся доверие к результатам
  16. 16. 16 Решение - конфликта результатов с мнением экспертов  Сбор гипотез и информации по проблеме у SME  Погружение в предметную область аналитика  В идеальном мире – с физическим перемещением его в команду SME  Выявление того, как задача решается сейчас или решалась ранее?
  17. 17. 17 Успешная аналитика  Любые технические задачи можно решить  Успех аналитического проекта лежит в плоскости коммуникаций  Учите ваших data scientist’ов эффективной коммуникации и оказывайте им достаточную аналитическую поддержку  Управляйте ожиданиями и чётко определяйте бизнес-цели проекта
  18. 18. 18 Рекомендуемая литература How to Measure Anything: Finding the Value of Intangibles in Business by Douglas W. Hubbard http://amzn.to/1DMTyxf Secrets of Analytical Leaders: Insights from Information Insiders by Wayne Eckerson http://amzn.to/1EcGR4L
  19. 19. Спасибо за внимание Ваши вопросы? Email: sergey@kadomsky.com Skype: sergey.kadomsky DataTalks: http://linkd.in/1EVdkLT

×