Выступление Артема Плешакова (Intency DSP) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
Как не упустить момент и не дать погибнуть Банку в эпоху цифровой трансформации. Как управлять данными клиентов и научиться извлекать из них знания для выстраивания эффективных целевых коммуникаций
Выступление Артема Плешакова (Intency DSP) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
Как не упустить момент и не дать погибнуть Банку в эпоху цифровой трансформации. Как управлять данными клиентов и научиться извлекать из них знания для выстраивания эффективных целевых коммуникаций
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...Newprolab
Андрей Уваров, Руководитель по аналитическим сервисам, МегаФон. Если вы хотите получить доступ к видео выступления, заполните форму здесь: http://dswknd2017.datascienceweek.com/
Data Science Weekend 2017. МегаФон. Аналитика больших данных в телекоме. Опыт...Newprolab
Андрей Уваров, Руководитель по аналитическим сервисам, МегаФон. Если вы хотите получить доступ к видео выступления, заполните форму здесь: http://dswknd2017.datascienceweek.com/
2. Гузенко Дмитрий
Инструктор IT Education Academy
Аналитик Luxoft
Специалист по проектированию, разработке и
внедрению IT проектов
24 года в ИТ
15 лет БA
КОНТАКТНЫЕ ДАННЫЕ
fb.com/dmitry.guzenko
d.guzenko@outlook.com
3. ERP Ирбис
предприятие
75 / 300
implementations
ERP SiReD
5000 users
Brunei Telecom
Solution
25 Systems
АПУ, МОН,
КМДА, Антонов
Luxoft
Bank Domain
Medical
Statistic System
1992 201820122008
13. Specialized knowledge
Understanding theoretical concepts of statistics/probability, data mining, machine learning
Understanding how these theoretical concepts could be applied to real world problems
Ability to understand the nature of business problems and see the place of analytical models in the
solution
Knowledge and hands-on experience with one or more of the following: Matlab/Octave, R, Python
Familiarity with the concept of HPC, parallel computing
Knowledge and hands-on experience with one or more of the following for data analytics:
Spark/Theano/TensorFlow/Caffee
14. Skills and abilities
Strong English verbal and written communication
skills
Deep analytical skills
Self-organization, self-management
Ability to work independently with limited
supervision
Ability to handle multi-tasking activities
Ability to learn quickly
Following academic research and trends as a
habit
Initiative and pro-active skills and flexibility
Experience
•Track record in data analysis, data science,
artificial intelligence
Personal characteristics
•Passion for learning and education
•Business orientation
•Result orientation
Job Context
•Customer facing role
•Sole responsibility over the analytical project
•High level of responsibility
•Simultaneous handling and fast processing of
multiple tasks
•Lots of educational and self-educational
activities
•Culture of knowledge sharing
45. На какие вопросы отвечает Data Science?
Это A или B?
Является ли это странным?
Сколько?
Как это организовано?
Что делать дальше?
Classification
Anomaly Detection
Regression
Clustering
Recommendation
1
2
3
4
5
46. На какие вопросы отвечает Data Science?
Сколько? Regression
Пример 2-х мерного пространства
Характеристик много, реальное
пространство многомерное
47. На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой доход принесет клиент?
•Какой возраст у клиента?
•Сколько стоит этот объект (недвижимости)?
•Какая оптимальная стоимость услуги?
48. На какие вопросы отвечает Data Science?
Сколько? Regression
•Какой объем продаж будет в следующем месяце?
•Сколько сотрудников уволится в следующем
месяце?
•Прогноз прибыли или убытков по
филиалам/направлениями/продуктам/менеджерам?
51. На какие вопросы отвечает Data Science?
Это A или B? Classification
•Какой категории этот клиент?
•Сотрудник уволится в следующем месяце?
•Вернет ли этот клиент кредит банку: Да или Нет?
1
•Какой пол клиента?
52. На какие вопросы отвечает Data Science?
Является ли это странным? Anomaly Detection2
Нормально ли это сообщение внутри интернет трафика?
Могли ли вы рассчитаться кредитной картой одновременно
из двух разных мест?
Нормально ли то, что клиент летит в Египет но заказал
экскурсию в Турции?
55. На какие вопросы отвечает Data Science?
Что добавить еще? Recommendation
•Какой товар можно еще докупить
•Какой контент можно просмотреть еще?
•Каким клиентам еще можно предложить эту услугу?
•Рекомендация друзей, специалистов (FB, LinkedIn)?
56. Case: Такси Uklon
Задачи:
• Сократить время ожидания
• Повысить кол-во заказов
Бизнес модель: Клиент имеет возможность сам назначить цену поездки
Проблема: Низкий % вывоза из определенных точек города
Решение: сервис прогноза оптимальной стоимости поездки
Целевые переменные:
• Ожидаемое время прибытия
• Процент выполнения заказа, план
57. Case: Такси Uklon
Features:
цена, конечная точка маршрута, марка машины, место прибытия, время суток, время года
Dataset:
Size = 20 Gb;
Count = 20 000 000 поездок;
Features = 20 характеристик;
63. Bank & Finances
Николай Щербина
Попасть в девяточку: как с
помощью сегментации увеличить
конверсию на 473%
Персонализация коммуникаций:
как достучаться до каждого
Поток: CRM & Лояльность
64. На какие вопросы отвечает Data Science?
Как это организовано? Clustering
71. Challenges
Фокус не на алгоритм а на результат
Эксперты не хотят терять монополию на
экспертизу
Размерность спринта иногда большая
Отсутствие данных
72. Challenges
Данные собираются для отчетности а не для анализа
Нет чистых данных
Требования объяснить результат
Попытка повлиять на полученные предсказания
Ответственность аналитика не за инсайт а за результат
Заказчик считает что данных предостаточно
Иногда нужна не аналитика а отчетность (30 вагонов продукции)
73. Советы
Использовать «пилоты»
Кол-во данных может быть небольшим
• 100% данных дают 100% результат
• 20% дают 80% результат
• 4% дают 60-70% результата (проверка гипотезы)
Работаем через гипотезы
Решать задачу бизнеса
• Например, остаток кеша в банкоматах не полезен для бизнеса.
Необходимо понимать изменение стоимости пролеживания
денег, штрафы за банкомат без денег, стоимость логистики
инкассации. Т.е. термины и показатели бизнеса
75. На какие вопросы отвечает Data Science?
Что делать дальше? Recommendation5
•Для робота-пылесоса: продолжить уборку или вернуться к зарядной станции?
•Для автомобиля с автономным управлением: при желтом сигнале светофора
затормозить или ускориться?
•Для боевого дрона: внизу это колонна боевиков или это дети из школы идут?
76. AI in Marketing
Meet Albert™
the First Artificial Intelligence Marketing
Platform for the Enterprise
77. Save Time More Accurate
Desigions
Increase
Revenue
Smart
Storage
Delight
Customers
High Value
Problem
Solving