При массовой выдаче кредитов возникают множество рисков: мошенничество, неверная оценка финансовых возможностей, недостоверные данные и прочее. Для управления этими рисками необходимо применение методов глубокого анализа данных, позволяющих найти оптимальный компромисс между доходностью, рисками, охватом рынка и временем обработки заявки.
Deductor нацелен на формализацию логики принятия решений, повышение скорости прохождения заявок, управление кредитными рисками и снижению требований к линейному персоналу.
Очевидно, что огромные массивы данных, накопленные в организациях, содержат много полезной информации, которую можно и нужно использовать для оптимизации работы.
Для этого требуется обобщить прошлый опыт, найти закономерности, извлечь правила и использовать эти знания в процессе управления.
В презентации рассмотрены этапы процесса анализа данных, определение и классы задач Data Mining, их бизнес-применение.
Deductor data quality – очистка персональных данныхLoginom
Плохое качество данных является одной из самых больших проблем при построении аналитических решений, т.к. на основе некорректной информации делаются неверные выводы. Даже самые совершенные методы анализа не помогают, необходимо использовать специальные механизмы очистки.
Решение Deductor Data Quality позволяет автоматически распознавать, проверять, стандартизировать и очищать любые контактные данные; выявлять дубликаты и взаимосвязи между данными; создавать эталонные «золотые» записи. Решение представляет собой не одноразовую процедуру обработки данных, а полноценный комплекс проверки информации каждый день.
Выступление по презентации - https://www.youtube.com/watch?v=1vP90X3SwPc
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
This document discusses predictive analytics in telecommunications and describes Nokia's Network Data Intelligence (NDI) project. The presentation covers the requirements and use cases for predictive analytics in telecom, including predicting network outages, hardware failures, and service issues. It then describes the NDI architecture, which uses tools like Pandas, SciKit, and RapidMiner for data ingestion, aggregation, analytics and visualization. The presentation notes challenges like dealing with big data's high volume, velocity, variety and veracity and discusses NDI's real-time distributed processing approach.
При массовой выдаче кредитов возникают множество рисков: мошенничество, неверная оценка финансовых возможностей, недостоверные данные и прочее. Для управления этими рисками необходимо применение методов глубокого анализа данных, позволяющих найти оптимальный компромисс между доходностью, рисками, охватом рынка и временем обработки заявки.
Deductor нацелен на формализацию логики принятия решений, повышение скорости прохождения заявок, управление кредитными рисками и снижению требований к линейному персоналу.
Очевидно, что огромные массивы данных, накопленные в организациях, содержат много полезной информации, которую можно и нужно использовать для оптимизации работы.
Для этого требуется обобщить прошлый опыт, найти закономерности, извлечь правила и использовать эти знания в процессе управления.
В презентации рассмотрены этапы процесса анализа данных, определение и классы задач Data Mining, их бизнес-применение.
Deductor data quality – очистка персональных данныхLoginom
Плохое качество данных является одной из самых больших проблем при построении аналитических решений, т.к. на основе некорректной информации делаются неверные выводы. Даже самые совершенные методы анализа не помогают, необходимо использовать специальные механизмы очистки.
Решение Deductor Data Quality позволяет автоматически распознавать, проверять, стандартизировать и очищать любые контактные данные; выявлять дубликаты и взаимосвязи между данными; создавать эталонные «золотые» записи. Решение представляет собой не одноразовую процедуру обработки данных, а полноценный комплекс проверки информации каждый день.
Выступление по презентации - https://www.youtube.com/watch?v=1vP90X3SwPc
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
This document discusses predictive analytics in telecommunications and describes Nokia's Network Data Intelligence (NDI) project. The presentation covers the requirements and use cases for predictive analytics in telecom, including predicting network outages, hardware failures, and service issues. It then describes the NDI architecture, which uses tools like Pandas, SciKit, and RapidMiner for data ingestion, aggregation, analytics and visualization. The presentation notes challenges like dealing with big data's high volume, velocity, variety and veracity and discusses NDI's real-time distributed processing approach.
TIBCO Spotfire - Аналитическая платформа бизнес анализа (Business Intelligence, BI), которая позволяет бизнес пользователю анализировать большие данные (Big Data) и большой контент, выявить скрытые возможности и скрытые риски бизнеса, на основе которых можно принимать обоснованные решения.
Вы узнаете о том, как создать собственную DMP c помощью платформы 1DMP, проблемах использования офлайн-данных в онлайн-каналах, а также о бирже данных как необходимом элементе экосистемы рынка данных.
CleverDATA. Как же на самом деле заработать на данныхHybridRussia
Мало кто может показать на реальных кейсах, как же начать превращать данные в деньги и еще меньше людей и компаний могут показать реальные цифры и достижения. В своём докладе Денис расскажет о проблемах, которые препятствуют развитию рынка данных и о новом функционале продукта 1DMC.io, который предназначен для их решения.
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
Как извлечь пользу из больших данных.
Инструменты бизнес-аналитики для анализа и исследования больших данных
Мероприятие:
День Науки НИУ ВШЭ 2015
Фото: http://vk.com/album-66011151_214023156
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниGlobal Innovation Labs
1. Потребности бизнеса, клиентов и рынка в массовом скоринге
2. Первый технологический стек, первый прототип
3. Полезные новейшие возможности облаков для скоринга и других применений ML
4. Выбор фич
5. Несбалансированные данные - как не сойти с ума
6. Оптимизация моделей скоринга
7. Внедрение скоринга в продукт
Презентация о платформе управления данными 1DMP.io (разработка компании CleverDATA) во время бизнес-завтрака для партнеров 15/09/2015 совместно с Oracle и ФОРС Дистрибуция.
Описание аспектов портирования и тестирования выполнения задачи построения клиентских профилей платформой управления данными 1DMP на программно-аппаратном комплексе Oracle Big Data Appliance. Топология развертывания. Hardware. Software. Результаты тестирования.
Консолидация информации при кооперации и франчайзингеMaxim Andreyev
Презентация с конференции DIY & Household & Garden Retail 2013. Сессия с моим докладом была посвящена вопросам кооперации в индустрии - глобальные игроки растут быстрее рынка и есть все шансы, что большая тройка не оставит места для других игроков рынка DIY
TIBCO Spotfire - Аналитическая платформа бизнес анализа (Business Intelligence, BI), которая позволяет бизнес пользователю анализировать большие данные (Big Data) и большой контент, выявить скрытые возможности и скрытые риски бизнеса, на основе которых можно принимать обоснованные решения.
Вы узнаете о том, как создать собственную DMP c помощью платформы 1DMP, проблемах использования офлайн-данных в онлайн-каналах, а также о бирже данных как необходимом элементе экосистемы рынка данных.
CleverDATA. Как же на самом деле заработать на данныхHybridRussia
Мало кто может показать на реальных кейсах, как же начать превращать данные в деньги и еще меньше людей и компаний могут показать реальные цифры и достижения. В своём докладе Денис расскажет о проблемах, которые препятствуют развитию рынка данных и о новом функционале продукта 1DMC.io, который предназначен для их решения.
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
Как извлечь пользу из больших данных.
Инструменты бизнес-аналитики для анализа и исследования больших данных
Мероприятие:
День Науки НИУ ВШЭ 2015
Фото: http://vk.com/album-66011151_214023156
Александр Сербул. 1С Битрикс. Массовый скоринг в CRM — секреты и подводные камниGlobal Innovation Labs
1. Потребности бизнеса, клиентов и рынка в массовом скоринге
2. Первый технологический стек, первый прототип
3. Полезные новейшие возможности облаков для скоринга и других применений ML
4. Выбор фич
5. Несбалансированные данные - как не сойти с ума
6. Оптимизация моделей скоринга
7. Внедрение скоринга в продукт
Презентация о платформе управления данными 1DMP.io (разработка компании CleverDATA) во время бизнес-завтрака для партнеров 15/09/2015 совместно с Oracle и ФОРС Дистрибуция.
Описание аспектов портирования и тестирования выполнения задачи построения клиентских профилей платформой управления данными 1DMP на программно-аппаратном комплексе Oracle Big Data Appliance. Топология развертывания. Hardware. Software. Результаты тестирования.
Консолидация информации при кооперации и франчайзингеMaxim Andreyev
Презентация с конференции DIY & Household & Garden Retail 2013. Сессия с моим докладом была посвящена вопросам кооперации в индустрии - глобальные игроки растут быстрее рынка и есть все шансы, что большая тройка не оставит места для других игроков рынка DIY
6. billing.ru
Определение Big Data
Много V
Volume объѐм
Velocity скорость in/out
Variety многообразие типов и
источников
Value доход
Validity (Veracity,
Verification)
правдивость (достоверность,
проверяемость)
Volatility изменчивость, непостоянство
6
8. billing.ru
Технологии: NoSQL DB
Тип DB Примеры
Key/Value store Dinamo, Redis, Tarantool
Column store Cassandra, HBase
Document store (Key/Document) MongoDB
Graph DB (Key/Node + Key/ Relationship ) neo4j
8
В ПЕТЕР-СЕРВИСЕ:
Реестр разрешенных технологий
Критерии выбора NoSQL решения (PROD 41807)
Все документы на узле ДРПО, раздел
“Архитектура и технологии ПО”:
https://intra.billing.ru/sites/DRSE/DocLib5/Forms/AllItems.aspx?RootFolder=%2Fsites%2FDRSE%2FDocLib5%2F%D0%A2%D0%B5%D1%85%D0%
BD%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D0%B8&FolderCTID=0x0120009DEE72E6BD641C4A95BF9A3F8FF0F934&View=%7B75D346BE-
8299-4055-A7FC-A21FAC919DCF%7D
9. billing.ru
TM Forum "Big Data Analytics Guidebook"
Стандарт октябрь 2013:
34 Use-Case
21 Big Data Analytics Building Blocks (ABB)
Big Data Analytics Reference Model
Big Data Analytics Business Value Roadmap -
отвечает на вопрос как использовать Big
Data Analytics для генерации выручки
9
12. billing.ru
Cписок Use-Case (34)
12
ID Use-Case ID Use-Case
S-MOM-T1 Real-time Personalized Offers while
Browsing
O-CRM-
PC1
Proactive Care
S-MOM-T2 Real-time Personalized Offers during
Checkout
O-CRM-
PC2
Right Proactive Care Channel and Time
S-MOM-T3 Real-time Personalized Offers during Life
Interaction
O-CRM-
PC3
Proactive Care based on Poor Care
Experience
S-MOM-T4 Real-time Personalized Offers Based on
Location
O-CRM-
PC4
Proactive Care During or After Network
Fault
S-MOM-T5 Real-time Personalized Offers Based on
Usage
O-CRM-
PC5
Proactive Care based on Absence of Usage
S-MOM-T6 Real-time Personalized Offers Based on
Device
O-CRM-
CR1
Churn Risk Prediction for Customer
Retention
S-MOM-T7 Intelligent Advertising Based on
Browsing History
O-CRM-
CR2
Churn Motivation Prediction for Customer
Retention
S-MOM-O1 Product Definition and development O-CRM-
CR3
Personalized Offers for Customer
Retention
S-MOM-O2 Product Introduction Analytics O-CRM-
CR4
Retention Offer Acceptance Propensity
Analytics
S-MOM-O3 Product Performance Optimization O-RMO1 Network Fault Location and Recovery
S-MOM-O4 Purchase Propensity Analytics for
Enhanced Targeting
O-RMO2 Real-time Value-based Congestion
Management
S-SDM1 CSP Data Monetization O-RMO3 Real-time Customer Offload Management
S-RDM1 Value-based Network Planning O-SPRM1 Partner Value Optimization
S-RDM2 New Enterprise Order Impact Analysis O-BRM1 Revenue Assurance
S-RDM3 Policy-based Capacity Management E-SEP1 Market Watch
O-CRM-CC1 Personalization of Real-Time Interaction
in Assisted Care
E-EEM1 Business Process Optimization
O-CRM-CC2 Increase Effectiveness of Customer Self
Care
E-FAM1 Fraud Management
13. billing.ru
Cписок BDA Building Blocks (21)
ID BDA Building Block ID BDA Building Block
VT1 Voice Transcription OR1 Popularity Based Offer
Recommendation
VT2 Text Classification OR2 Hot Offer Recommendation
VT3 Text Clustering OR3 Profile Based Offer Recommendation
VT4 Concept Mining OR4 Community Based Offer
Recommendation
C1 Customer Influence Scoring CC-ID1 Care Issue Anomaly Detection
C2 Customer Social Influence
Scoring
CC-ID2 Care Issue Root Cause Analysis
CV1 Customer Value Scoring CC-ID1 Care Call Motivation Prediction
CV2 Customer Lifetime Value
Scoring and Prediction
CC-SR1 Policy Based Care Solution
Recommendation
CL1 Geocoding CC-SR2 Success Based Care Solution
Recommendation
CL2 Customer Location Detection
CL3 Customer Location Prediction
CL4 Key Location Profiling 13
15. billing.ru
BDA Business Value Roadmap
1. Выбрать Use-Case
2. Выбрать Building Blocks для Use-Case
3. Выбрать из Building Blocks все источники
информации и технологии.
4. Для понимания наложить их на BDA
Reference Model
5. Собрать все вместе и еще раз проверить
Use-Case
6. На этом завершен первый шаг в BDA
Business Value Roadmap
15
16. billing.ru
Пример Use-Case
S-MOM-T4 Real-time Personalized Offers Based on Location
Horizontal Marketing and Offer Management
Actors Customer
Business Drivers Увеличение вероятности релевантности рекламных
сообщений
Business Metrics • Увеличение выручки
• Увеличение числа принятия предложений
Story Система управления маркетинговыми компаниями
посылает предложения только абонентам находящимся
в определенной географической зоне
Data Sources • Offer Catalogue
• Правила посылки сообщений
• Location Information
Optional Data
Sources
• Call Detailed Records
• Social Media Records
• Web Browsing History
BDA Building Blocks • CL3 Customer Location Prediction
• CL4 Key Location Profiling 16
17. billing.ru
Пример BDA Building Blocks
CL3 Customer Location Prediction
Description Предсказывать где окажется абонент в определенное
время или следующее местоположение
Type Automatically Learned
Underlying Data Набор местоположений абонента
Input Data Текущее местоположение и время
Output Data Следующее местоположение
Related Use Cases • S-MOM-T4
• Сообщения о происшествиях
• Сообщения о пробках
Implementation
Guide
Data Source…
Data Ingestion …
Data Management…
Data Analysis:
• моделирование
• Предсказание
17
18. billing.ru
Пример BDA Building Blocks
CL4 Key Location Profiling
Description Получить ключевые местоположения
Type Automatically Learned
Underlying Data Набор местоположений абонента с историей
Input Data Текущее местоположение и время
Output Data Метка местоположения
Related Use Cases • S-MOM-T4
• Контроль фрода по местоположению
• Информация для приложений соц сетей
Implementation
Guide
Data Source…
Data Ingestion …
Data Management…
Data Analysis:
• Кластеризация
18
19. billing.ru
Пример Business Value Roadmap
S-MOM-T4 Real-time Personalized Offers Based on Location
Технологии • Алгоритм машинного обучения для анализа
местоположения
• Алгоритмы кластеризации
Источники
информации
• Текущее и историческое местоположение абонента
• Обогащение информации из социальных сетей
19
20. billing.ru
Схема Big Data + Scrum
20
BigData Actionable
Insights
Планирование
спринта
Ретроспектива
Показ
заказчику
Выполнение
21. billing.ru
Big Data Manifesto
1. Сохранение всех данных важнее их структурирования;
2. Скорость сохранения важнее полноты данных;
3. Скорость реакции системы должна зависеть от реальных
задач а не формальных цифр;
4. Сотрудничество по циклу с обратной связью с заказчиком
важнее формальных сроков;
5. Сотрудничество с теми кто будет использовать результат
обработки данных важнее чем с аналитиками и
программистами
6. Предсказание событий важнее их описания;
7. Гибкая визуализация данных важнее исчерпывающих схем
данных
8. Надо верить в то, что в данных скрыта прибыль;
9. Готовность к изменениям важнее следования
первоначальному плану;
21