Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Игорь Иванов, Playrix — Статистические предсказания игровой активности

94 views

Published on

Конференция Dev Party (http://devparty.ru).
Вологда, 25.03.2017

Published in: Science
  • Be the first to comment

  • Be the first to like this

Игорь Иванов, Playrix — Статистические предсказания игровой активности

  1. 1. Пятая конференция разработчиков ПО «DevParty» 25 марта 2017 года, Вологда Иванов Игорь Статистические предсказания игровой активности Playrix
  2. 2. Аналитика • Апостериорный анализ: • Эксперимент • Оценка результата • Априорный анализ: • Моделирование эксперимента • Прогнозирование результата
  3. 3. Какую информацию “из будущего” по игрокам хотелось бы получить?
  4. 4. • Увлечёт ли игра? • Что понравится больше, а что меньше? • Можно ли ожидать конверсию? • С какой скоростью игрок будет проходить игру? • Когда игрок перестанет играть? • Хватит ли терпения на прохождение сложных уровней? • … (тысячи их)
  5. 5. Где найти хрустальный шар?
  6. 6. Статистические модели предсказаний - на известных данных определяем зависимости (обучение) и применяем их к неизвестным данным (предсказание)
  7. 7. • Выявим паттерны поведения • Определим критерии “похожести” игроков • Определим критерии разделения полезной информации и шума • По полезной информации учимся строить прогнозы • … • Profit!
  8. 8. Фундамент для предсказательных моделей
  9. 9. • Теория вероятностей (изучаем случайное явление само по себе) • Математическая статистика (изучаем предыдущие эксперименты в которых наблюдалось случайное явление) • Факторный анализ (изучаем влияние других явлений на случайное явление, чтобы объяснить предыдущие эксперименты)
  10. 10. • Регрессия - предсказываем количественный признак • Классификация - предсказываем качественный признак • Кластеризация - определяем принадлежность ко множеству
  11. 11. Интерпретируемые модели • Определяем что можно изменить чтобы достичь нужного результата • Отсекаем значимое от второстепенного • Уменьшаем вычислительные затраты • Увеличиваем устойчивость
  12. 12. Менее интерпретируемые модели • Повышаем точность предсказания • Упрощаем отбор значимых данных • Повышаем универсальность решения • Увеличиваем размерность данных
  13. 13. Как измерить точность предсказания?
  14. 14. • Метод минимизации эмпирического риска (“хорошо - это когда мало ошибок”) • Метод максимального правдоподобия (“хорошо - это когда наиболее часто встречается наиболее вероятное значение”) • Минимизация ошибок определённого рода
  15. 15. А какая точность нас устроит?
  16. 16. Предсказание: все присутствующие согласятся с тем, что нельзя предсказывать со 100% точностью :)
  17. 17. • Интуиции доверять не стоит • Как бы много мы не знали про игрока, остаются неизвестные факторы • Глубокое знание предметной области помогает выбрать правильные критерии оценки
  18. 18. Почему нельзя предсказывать всё подряд?
  19. 19. Принцип Бонферрони • Вычислить количество рассматриваемых событий при предположении их полной случайности • Если полученное количество намного превосходит количество реальных искомых событий, то найденные события фиктивные
  20. 20. • Нет смысла в информации, которую мы не знаем как использовать • Нет смысла в предсказании, которое мы не сможем воспроизвести • Нет смысла в очевидном предсказании
  21. 21. Примеры • Предсказание “неконверсии” • Предсказание отвалов игроков с большим количеством покупок • Предсказание отвалов на paywall
  22. 22. Спасибо!

×