СИСТЕМА ОЦЕНКИ УЯЗВИМОСТЕЙ CVSS 4.0 / CVSS v4.0 [RU].pdf
Предиктивная аналитика и Big Data: методы, инструменты, решения
1. Предиктивная аналитика и Big Data:
методы, инструменты, решения
Марина Онищенко, Исполнительный директор StatSoft Russia
Милков Максим, Технический директор StatSoft Russia
1
2. О Dell Statistica
26/10/20152
Многолетний опыт
в аналитике
с 1984
Более 16,000
аналитических
процедур и методов
Более 1 млн
пользователей Dell Statistica
Мониторинг
процессов и
контроль качества
в масштабах
предприятия
Расширяемая
и настраиваемая
под задачи
пользователей
Обширная
сфера
применения
3. Области применения
26/10/20153
• Анализ
выживаемости
• Оценка
эффективности
лекарственных
препаратов
• Планирование
медицинских
исследований
• Анализ результатов
клинических
исследований
• Оценка рисков
заболеваний
и многое другое…
• Прогнозирование
нагрузок сети
• Классификация
пользователей
• Оценка мощности
необходимого
оборудования
• Распределение
трафика
• Анализ контента
интернет-ресурсов
• Планирование
промо-акций
и многое другое…
• Контроль качества
• Мониторинг
процессов
• Анализ надежности
• Планирование
промышленных
экспериментов
• Анализ причин
потери качества
• Обеспечение
стабильности
процессов
и многое другое…
• Оценка рисков
• Кредитный скоринг
• Прогнозирование
оттока клиентов
• Выявление
мошенничества
• Прогноз остатков
на счетах
• Мониторинг
финансовых
показателей
и многое другое…
• Сегментация рынка
• Прогнозирование
спроса, продаж
• Выбор
оптимального
поставщика
• Сравнительный
анализ и прогноз
цен на товары
• Оценка
эффективности
рекламы
и многое другое…
Бизнес/
Маркетинг
Медицина/
Фармакология
Производство
Телеком/
Интернет
Банковское
дело/Финансы
4. Аналитические инструменты серии Statistica
26/10/20154
Универсальны
Просты в использовании
Расширяемые, гибкие,
настраиваемые
Легко интегрируемые
3M
Инструменты Statistica Enterprise создают
наглядную систему управления
производственным процессом, облегчают
непрерывный процесс улучшения качества,
уменьшают время, затрачиваемое на доступ
к данным.
ВСМПО
• Statistica является мощной
аналитической системой для
профессионального анализа, что
позволяет решать широкий круг задач
любой сложностиe.
• Statistica обеспечивает надежную
реализацию статистических методов
анализа. Большой выбор графических
инструментов.
• Программа полностью переведена на
русский язык, включая интерфейс,
документацию и справочное руководство.
Центральный банк РФ
Statistica является действительно
гибким, мощным, легким в
использовании инструментом,
позволяющим решать широкий
спектр исследовательских задач.
Pepsi
Сбор данных и автоматизация
предоставляют широкие
возможности для правильного
анализа результатов и улучшения
производственного процесса.
Казцинк
Основное свойство продуктов
линейки Statistica: мощность,
простота в использовании,
наглядность и эффективность и при
этом невысокая стоимость.
6. Специальные программы для вузов
Statistica Ultimate Academic Bundle:
• Statistica Advanced
• Statistica Automated Neural Networks
• Statistica Data Miner, Text Miner
• Statistica Data Visualization
• Statistica Extract, Transform, and Load (ETL)
• Statistica Process Optimization
• Statistica Quality Control (QC)
• Statistica Reporting Tables
• Statistica Sequence, Association and Link Analysis …
26/10/20156
8. Консалтинг
Отраслевые решения:
• Sales-Forecast
Система автоматизации прогнозирования продаж
большого ассортимента товаров
• Energy-Forecast
Система автоматизации прогнозирования потребления
электроэнергии промышленными предприятиями, отдельными
объектами, регионами
• Map Analytical Tool
система визуализации результатов статистической обработки
на географических картах
• и другие решения
26/10/20158
12. Программа
• STATISTICA Big Data Analytics:
новые возможности
• Big Data в электронной коммерции:
взгляд практика
• Data Mining/Text Mining:
предиктивная аналитика
• Big Data в real-time рекламе:
задачи, методы, подходы, решения
• StatSoft Solutions:
автоматизация прогнозирования для retail, энергетики и др.
Обязательна предварительная регистрация на сайте www.statsoft.ru.
26/10/201512
14. Данные
• Управление ресурсами
• Поставщики
• Проектирование
• Контроль качества
• Мониторинг
• Испытания
• Маркетинг/Сбытовики
• Логистика
• База клиентов
• Служба поддержки
• Заявки
• Гарантийные ремонты
• IT-инфраструктура
• Парк оборудования
• Служба безопасности
• Бухгалтерия
• …
Данные в том или ином виде собирают
все
15. Источников все больше
Развитие технологий по сбору и хранению данных предоставляет
качественно новые возможности
• Сбор информации по отрасли
• Конкуренты
• Отслеживание реакции потребителей (массовый рынок)
• Социальные сети
17. Business intelligence
• Business intelligence (узк.) - это методы и инструменты для
построения информативных отчётов о текущей ситуации.
– Цель BI — предоставить нужную информацию тому человеку,
которому она необходима в нужное время.
18. Следующий этап BI
• Business Analytics (Бизнес-аналитика) – это инструменты,
используемые для преобразования, хранения, анализа, моделирования,
доставки и трассировки информации в ходе работы над задачами,
связанными с принятием решений на основе фактических данных.
– Получение знаний о бизнесе, добытых путем углубленного
анализа детальных данных и консолидированной
информации
19. BI или BA
BI BA
текущий уровень продаж прогноз продаж на неделю/месяц/год
количество клиентов по каналам профили клиентов по поведению/отклику
количество должников/ушедших клиентов предсказание кредитоспособности/ оттока/
мошенничества
число бракованных изделий предотвращение разладки процесса
затраты на маркетинговые акции прогнозирование эффекта маркетинговых
кампаний
количество товаров в заказе анализ корзины, подсказки для кросс-продаж
Описательная аналитика Предсказательная аналитика
20. Описательная аналитика
Отвечает на вопросы:
– Что случилось?
– Почему случилось?
Инструменты:
– Отчѐтность
– OLAP
– KPI
– Dashboards
– Прикладная
статистика
21. Предсказательная аналитика
Отвечает на вопросы:
– Что случится?
– Когда случится?
Инструменты:
– Прикладная
статистика
– Data mining
– Машинное обучение
– Моделирование
23. Все что нужно для анализа
!
Огромное количество
процедур и методов
24. Statistica Big Data Analytics
• SBDA - это Suite, т.е. набор/комплект инструментов
– Набор технологий серии Hadoop из коробки
• Быстро устанавливается и почти не требует конфигурирования
– Набор коннекторов для сбора данных из внешних источников
– Поиск по хранимому контенту
– Встроенные средства аналитики
• Визуализация
• Машинное обучение
– Тесная взаимосвязь со Statistica
24
25. Что умеет SBDA?
• Crawling – «робот» для сбора данных из различных источников
– Локальные документы
• Файловая система
• HDFS
• RDBMS
– Сайты
– Twitter
– Facebook
• Extracting – «парсинг» (обнаружение)
– Люди
– Места
– Организации
– Даты
– Ссылки на другие документы
– Биологические термины
– …
26. Что еще умеет SBDA?
• Преобразования
– фильтрация
• простая (линейная)
• случайная
• стратифицированная
• regexp
– группировка
– обработка текста, NLP
• частотный анализ
• выделение сущностей
– конвертация
– …
• Анализ
– визуализация
– построение сети социальных отношений
– анализ эмоциональной окраски высказываний
– глубокая аналитика на основе Mahout
• Без навыков программирования
29. Графический интерфейс
• Большинство операций, как и в обычной Statistica делается с помощью
мышки
• Аналогично Statistica Data Miner создаются проекты обработки данных –
Analytics Workflows
– Узлы (Processing Elements)
– Связи
31. Итак
Dell обладает всесторонним, модульным портфолио, от
инфраструктуры до управления информацией и
предиктивной аналитики.
Statistica позволяет Dell конкурировать в технологии
Больших Данных и предлагает решения, позволяющие
стать предприятию «data driven».
Statistica полная, легкая, масштабируемая и
доступная платформа для предиктивной аналитики,
приносящая выгоды в любой отрасли.