CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
Как не упустить момент и не дать погибнуть Банку в эпоху цифровой трансформации. Как управлять данными клиентов и научиться извлекать из них знания для выстраивания эффективных целевых коммуникаций
Презентация Дениса Афанасьева для конференции HybridConf'16. Заходите на 1DMC.io и станьте клиентом Биржи данных, первой в России облачной независимой платформы для монетизации ваших данных об аудитории!
Технологии Больших Данных для банков и страховых компаний. Какие задачи решают? Как монетизировать Большие Данные? Бизнес-кейсы и конкретные примеры. Концепция 3D профиля клиента. Точная сегментация и персонифицированный маркетинг. Управление данными на Oracle Big Data Appliance
CNEWS FORUM 2014 / Секция ИТ в Банках / "Big Data: О чем думают ваши клиенты?"
Текст презентации доступен доступен по ссылке http://denrey.me/r1u9tnP
http://denreymer.com
CleverDATA (Denis Reymer) presentation for CNews Forum 2015 (Banking Section)CleverDATA
Как не упустить момент и не дать погибнуть Банку в эпоху цифровой трансформации. Как управлять данными клиентов и научиться извлекать из них знания для выстраивания эффективных целевых коммуникаций
Презентация Дениса Афанасьева для конференции HybridConf'16. Заходите на 1DMC.io и станьте клиентом Биржи данных, первой в России облачной независимой платформы для монетизации ваших данных об аудитории!
Технологии Больших Данных для банков и страховых компаний. Какие задачи решают? Как монетизировать Большие Данные? Бизнес-кейсы и конкретные примеры. Концепция 3D профиля клиента. Точная сегментация и персонифицированный маркетинг. Управление данными на Oracle Big Data Appliance
CNEWS FORUM 2014 / Секция ИТ в Банках / "Big Data: О чем думают ваши клиенты?"
Текст презентации доступен доступен по ссылке http://denrey.me/r1u9tnP
http://denreymer.com
Как использовать внешние данные при найме сотрудников на работу? Какие источники данных могут быть полезны? Как строится аналитическая предиктивная модель для HR скоринга? Опыт реализации проекта от компании CleverDATA
Презентация о платформе управления данными 1DMP.io (разработка компании CleverDATA) во время бизнес-завтрака для партнеров 15/09/2015 совместно с Oracle и ФОРС Дистрибуция.
Выступление Артема Плешакова (Intency DSP) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Презентация с конференции Resilience 2014.
Опыт и решения CleverDATA.
Какие задачи стоят перед Бизнесом и как подходить к решению задач обогащения данных для извлечения знаний.
Биржа Данных 1DMP.RU и Private DMP.
Роль Научного сообщества и Data Science в развитии Big Data
Сергей Чернов — Yandex Data Factory — ICBDA 2015rusbase
Выступление Сергея Чернова (Yandex Data Factory) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Описание бизнес-кейса проведения сегментации клиентской базы для выявления наиболее склонной к покупке страховых продуктов аудитории и последующей целевой коммуникации
Д.Афанасьев_ CleverDATA_Охота за даннымиCleverDATA
Эффективность использования внешних источников для пополнения знаний о вашей аудитории и таргетированного маркетинга/управления рисками/поведением клиентов
Управление качеством клиентского портфеля “по- умному”. iECARUS
Практические рекомендации для управления качеством клиентского портфеля “по- умному” .Биг Дата в маркетинге,продажах, клиентинге, CRM, 360 градусов клиентa.
Видео по данным слайдам можете найти по ссылке внизу
https://www.youtube.com/watch?v=7rDQrQK1Mvc&list=PLHTVj-msOEIB6uCBd6PcGTBmhvGGZrARI&index=13
Содержание:
1. Исторические формы производственно-технологического процесса
2. BIG DATA и цифровые технологии в жизни
3. Этапы работы над проектом “BIG DATA в моем бизнесе“
4. Примеры иконографики и журналистики больших данных
5. Трудности в работе с большими данными
6. Инструментарий для работы с большими данными (краткий обзор)
7.Кто владеет информацией – владеет миром
8.Заключение и ссылки на полезные источники
Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Описание аспектов портирования и тестирования выполнения задачи построения клиентских профилей платформой управления данными 1DMP на программно-аппаратном комплексе Oracle Big Data Appliance. Топология развертывания. Hardware. Software. Результаты тестирования.
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
My presentation at OSPconf. Big Data Forum 2015 in Moscow on Informatica products and solutions in Big Data space: datawarehouse offload, managed data lake, big data Customer MDM, streaming analytics platform.
Как использовать внешние данные при найме сотрудников на работу? Какие источники данных могут быть полезны? Как строится аналитическая предиктивная модель для HR скоринга? Опыт реализации проекта от компании CleverDATA
Презентация о платформе управления данными 1DMP.io (разработка компании CleverDATA) во время бизнес-завтрака для партнеров 15/09/2015 совместно с Oracle и ФОРС Дистрибуция.
Выступление Артема Плешакова (Intency DSP) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Презентация с конференции Resilience 2014.
Опыт и решения CleverDATA.
Какие задачи стоят перед Бизнесом и как подходить к решению задач обогащения данных для извлечения знаний.
Биржа Данных 1DMP.RU и Private DMP.
Роль Научного сообщества и Data Science в развитии Big Data
Сергей Чернов — Yandex Data Factory — ICBDA 2015rusbase
Выступление Сергея Чернова (Yandex Data Factory) на International Conference on Big Data and its Applications (ICBDA).
ICBDA — конференция для предпринимателей и разработчиков о том, как эффективно решать бизнес-задачи с помощью анализа больших данных.
http://icbda2015.org/
Описание бизнес-кейса проведения сегментации клиентской базы для выявления наиболее склонной к покупке страховых продуктов аудитории и последующей целевой коммуникации
Д.Афанасьев_ CleverDATA_Охота за даннымиCleverDATA
Эффективность использования внешних источников для пополнения знаний о вашей аудитории и таргетированного маркетинга/управления рисками/поведением клиентов
Управление качеством клиентского портфеля “по- умному”. iECARUS
Практические рекомендации для управления качеством клиентского портфеля “по- умному” .Биг Дата в маркетинге,продажах, клиентинге, CRM, 360 градусов клиентa.
Видео по данным слайдам можете найти по ссылке внизу
https://www.youtube.com/watch?v=7rDQrQK1Mvc&list=PLHTVj-msOEIB6uCBd6PcGTBmhvGGZrARI&index=13
Содержание:
1. Исторические формы производственно-технологического процесса
2. BIG DATA и цифровые технологии в жизни
3. Этапы работы над проектом “BIG DATA в моем бизнесе“
4. Примеры иконографики и журналистики больших данных
5. Трудности в работе с большими данными
6. Инструментарий для работы с большими данными (краткий обзор)
7.Кто владеет информацией – владеет миром
8.Заключение и ссылки на полезные источники
Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Описание аспектов портирования и тестирования выполнения задачи построения клиентских профилей платформой управления данными 1DMP на программно-аппаратном комплексе Oracle Big Data Appliance. Топология развертывания. Hardware. Software. Результаты тестирования.
Splunk - универсальная платформа для работы с любыми даннымиCleverDATA
Презентация Константина Ткачева, архитектора решений CleverDATA по платформе Splunk (функционал, источники данных, возможности масштабируемости, примеры панелей управления, возможности интеграции, аналитика данных и предиктивные возможности).
My presentation at OSPconf. Big Data Forum 2015 in Moscow on Informatica products and solutions in Big Data space: datawarehouse offload, managed data lake, big data Customer MDM, streaming analytics platform.
TopRater.com Машинное понимание миллионов отзывов / Павел Велихов (TopRater)Ontico
Мы строим сервис TopRater.com, который должен агрегировать в себе все мнения из Интернета относительно массы объектов e-commerce. Для этого мы "прочитали" миллионы отзывов и научились выделять из них сущности, аспекты, тональности и факты. При этом, хотя объемы данных кажутся маленькими для специалистов Big Data (всего несколько терабайт) — почти во всех задачах нам пришлось использовать технологии Big Data — сотни серверов на Google Cloud, Apache Spark, MPP Базы данных.
В докладе в форме "галопом по Европам" будет рассказано о гибридных подходах к NLP и машинному обучению, будут всякие интересные простые решения (некоторые широко известные, но, как показывает практика, часто забытые), ну и, конечно, немного про Deep Learning, а также про наш кластер и как там все организовано.
CleverDATA CEO Denis Afanasev presentation for Oracle Big Data partner forum. 3D client view, client data enrichment and business cases, customer centric architecture,
Как управлять клиентским опытом? Что такое Customer Experience Management? Переход к парадигме Customer Centric. Построение единого профиля клиента. Использование внешних данных о клиентах. Ключевой инструмент - платформа 1DMP.RU для управления данными. Кейсы по использованию данных из различных источников.
Вы узнаете о том, как создать собственную DMP c помощью платформы 1DMP, проблемах использования офлайн-данных в онлайн-каналах, а также о бирже данных как необходимом элементе экосистемы рынка данных.
Презентация "Big Data: Как принести пользу бизнесу" вице-президента ЛАНИТ Дениса Реймера на Международной конференции "Стойкость сложных социо-технических систем - Resilience2014"
Большие данные и бизнес-аналитика: как найти пользу?Marina Payvina
Как извлечь пользу из больших данных.
Инструменты бизнес-аналитики для анализа и исследования больших данных
Мероприятие:
День Науки НИУ ВШЭ 2015
Фото: http://vk.com/album-66011151_214023156
Андрей Новиков RKM-2016 - Socialnaya analitika & Big Datavalveindustryhub
Работа с сообществом: от операций - к стратегии
• Шаг 1. Сообщество – инструмент продаж
– Представительство в основных соцсетях и предметных форумах
– Мониторинг релевантных сообщений в соцсетях и реагирование
– Организация взаимодействия между клиентами (c2c-поддержка)
• Шаг 2. Сообщество помогает наращивать KPI
– Привязка активностей в соцсетях к основным КПЭ работы с клиентами: time-to-
market, CSAT, response times...
– Качественное понимание картины: типовые проблемы продукта/сервиса, идеи по совершенствованию, что говорят и как думают клиенты
• Шаг 3. Сообщество – стратегический партнер бизнеса
– Что будет нужно нашей ЦА через одно или два поколения наших продуктов
Конвергенция технологий как тренд развития искусственного интеллекта, Владими...Mail.ru Group
AI Journey — двухдневная конференция с ведущими международными и российскими спикерами — экспертами в области искусственного интеллекта и анализа данных, а также представителями компаний — лидеров по развитию и применению технологий ИИ в бизнес-процессах.
Поймать Цифровую Волну. CleverDATA на Cnews Forum 2015Den Reymer
1. Как работать с данными
2. Как построить Цифровой Профиль Клиента
3. Зачем нужно обогащение данных
4. Что можно получить на Бирже Данных (DMC.1DMP.IO)
5. Какие кейсы наиболее востребованы в Big Data для Банков
Big Data for Customer centric organisation - CleverDATA for Oracle CIO Club M...CleverDATA
- how to know your customer for not to loose him
- how to use customer centric approach
- how to get 3D customer view
- data sources review
- customer profile on every stage of customer life cycle
- use cases
- how to build a solution architecture to use all your data
- 1DMP.RU for Enterprise components to work with big data
- Oracle Big Data appliance to deploy a solution
- 1DMP.RU solution's benefits
Инженерный подход к управлению интернет-маркетингом. Дмитрий Сизов, руководит...SPECIA
В непростых рыночных условиях требуется точно понимать, как работают любые вложения. Часто различные маркетинговые активности в интернете ведутся независимо друг от друга и оцениваются отдельно или не оцениваются вовсе.
1. Как количественно оценить интегральный результат?
2. Какие существуют сложности и какие возможности открываются при построении агрегированной отчётности.
3. Перенимаем методики у NASA.
Similar to Konstantin Obukhov - Customer Experience Technologies (20)
Alexey Mikhaylichenko - Automatic Detection of Bone Contours in X-Ray ImagesAIST
This document summarizes an algorithm for automatically segmenting and detecting joints in x-ray images. The algorithm involves several steps: (1) computing an edge map of the image, (2) determining binarization thresholds, (3) thinning edges, (4) binarizing the image, and (5) chaining edges together. The algorithm is compared to the Canny edge detector and is shown to achieve a 74% success rate on joint images. Processing time is improved by implementing a multi-threaded version. Challenges include false edge detection and discontinuities between edge fragments.
Евгений Цымбалов, Webgames - Методы машинного обучения для задач игровой анал...AIST
ML is helping a large Russian game developer and publisher called WebGames analyze data from their free-to-play games. They collect over 80 million records daily from their 400k daily players across various platforms. They use ML for tasks like churn prediction, revenue prediction, user classification, A/B testing, balance, and recommendations. Specifically, they build 30 different models to predict LTV for users based on their behavior in the first 30 days. They also use kNN and cohort-based approaches for user classification and Bayesian A/B testing to dynamically adjust testing over time. Rule-based modeling and midgame support based on classification help balance games. Content recommendations are done through static and dynamic clustering.
Александр Москвичев, EveResearch - Алгоритмы анализа данных в маркетинговых и...AIST
The document discusses various economic models related to utility and consumer choice. It introduces concepts like cardinal and ordinal utility and discusses modeling utility as a probability of success. It also discusses simple models of consumer choice that involve choosing a product based on type and brand or type and price. Additionally, it discusses models where neighbors' choices or prices can influence individual choices and mentions discounts and bundles. Graphs are shown comparing product turnover before and after implementing a neighbors effect model.
1) Exactpro is a specialist QA firm focused on testing financial systems that was acquired by the London Stock Exchange Group in 2015.
2) The London Stock Exchange Group is a leading international exchange group that traces its history back to 1698 and has over 5,500 employees.
3) Exactpro uses automated testing tools like Sailfish and ClearTH to test systems, as well as techniques like formal verification, crowd-sourced testing, and machine learning.
Nikolay Karpov - Evolvable Semantic Platform for Facilitating Knowledge ExchangeAIST
This document describes an evolvable semantic platform called EXPERTIZE that was developed to facilitate knowledge exchange between experts at a university. EXPERTIZE analyzes unstructured text from news and matches it to the skills of university experts, as defined in their personal ontologies, in order to recommend relevant experts. It uses a latent Dirichlet allocation algorithm to perform the semantic matching. The system was implemented and evaluated, showing its ability to successfully recommend experts and categories for news items.
George Moiseev - Classification of E-commerce Websites by Product CategoriesAIST
This document describes a study that classified e-commerce websites by the products they sell. It discusses preprocessing web pages, extracting features using TF-IDF with additional weighting for tags, and classifying pages using a support vector machine. The results show that considering information from other pages in addition to the main page improved classification accuracy, with an average F-score of 0.81 for product type classification when using all page information with the tag weighting.
Elena Bruches - The Hybrid Approach to Part-of-Speech DisambiguationAIST
The document describes a hybrid approach to part-of-speech disambiguation that combines neural networks and manually crafted rules. The algorithm uses neural networks to generate a set of possible part-of-speech tags for each word, and rule-based tagging to generate another set. The final set of tags is the intersection of these two sets, or their union if the intersection is empty. The approach achieved 96.11% precision on one corpus and 86.39% precision on another larger corpus.
Marina Danshina - The methodology of automated decryption of znamenny chantsAIST
1. The researchers created an automated system called "Computer Semiography" to decode Znamenny chants. The system consists of 5 modules: inputting chants into a database, reviewing manuscripts, forming linguistic and translation models, decoding chants, and a music editor.
2. The system can decode chants using either linear or Znamenny notation by applying rules from dictionaries and books. Researchers first build dictionaries from sources then use them to transform manuscripts into a linear notation.
3. The methodology allows producing three main components for decoding chants: a dictionary with translation rules, a translated manuscript version, and language and translation models. The work developed software to input, edit, and view chants in the database
Edward Klyshinsky - The Corpus of Syntactic Co-occurences: the First GlanceAIST
The document discusses the Corpus of Syntactic Co-occurrences, which aims to provide a corpus for students learning Russian that contains correct word combinations. It notes existing corpora like the Russian National Corpus are too large and technical for beginners. The CoSyCo extracts unambiguous syntactic phrases from Russian texts that could help learners. It uses various news and technical texts totaling over 15 billion words. Examples of extracted phrases are provided. The CoSyCo site is mentioned and future plans outlined, such as enlarging the phrase list, filtering repeats and strange combinations, improving the design, and making the co-occurrence database clearer.
Galina Lavrentyeva - Anti-spoofing Methods for Automatic Speaker Verification...AIST
This document discusses anti-spoofing methods for automatic speaker verification systems. It summarizes various spoofing methods like replay attacks, voice conversion, and text-to-speech synthesis that attempt to manipulate biometric systems. The document then outlines the ASVspoof 2015 challenge on spoofing detection and the system submitted by the authors that achieved 2nd place. It details the authors' system including front-end preprocessing, feature extraction using magnitude, phase and high-level features, and back-end classifiers like SVM and neural networks. The system fused multiple feature types to achieve robust spoofing detection.
Oleksandr Frei and Murat Apishev - Parallel Non-blocking Deterministic Algori...AIST
This document describes parallel algorithms for topic modeling, including synchronous, asynchronous, and deterministic asynchronous algorithms. The synchronous offline algorithm splits the document collection into batches and has each thread process one batch at a time. The asynchronous online algorithm has processor threads process batches concurrently while a merger thread accumulates and merges results to recalculate model parameters. To make the algorithm deterministic, the deterministic asynchronous approach has each thread process batches and write results directly without a merger thread.
Kaytoue Mehdi - Finding duplicate labels in behavioral data: an application f...AIST
The document discusses identifying duplicate labels, or aliases, in behavioral data from e-sports games. It presents a method to analyze confusion matrices from predictive models to identify pairs of labels that concentrate confusion, indicating they may belong to the same player using different aliases. The method extracts fuzzy concepts from the confusion matrix and scores candidate pairs based on their cosine similarity to rank and filter the most likely alias pairs. Experimental settings on real e-sports datasets are also discussed.
Valeri Labunets - The bichromatic excitable Schrodinger metamediumAIST
This document describes research into modeling wave phenomena like particle motion and interference using a cellular automata approach called an excitable metamedium. It can simulate the Schrodinger equation by representing diffusion as complex numbers across cells. The researchers extended this to use triplet "color" numbers for diffusion coefficients, allowing visualization of properties like hue, saturation and lightness. Experiments demonstrated particle motion, interference and blending effects using different color diffusion values. Unusual geometries were also explored by changing the definition of the imaginary unit, affecting the behavior of color wave propagation in interesting ways.
Valeri Labunets - Fast multiparametric wavelet transforms and packets for ima...AIST
This document discusses multiparametric wavelet transforms (WDT). It describes the structure of WDT, which is characterized by two sets of coefficients (h-coefficients and g-coefficients) related by a matrix equation. It also discusses arbitrary cyclic wavelet transforms (AWT) and their representation using Jacobi-Givens rotations and stairs-like structures. An example of an 8-level AWT is presented using these concepts.
Alexander Karkishchenko - Threefold Symmetry Detection in Hexagonal Images Ba...AIST
This document discusses a method for detecting threefold symmetry in hexagonal images using finite Eisenstein fields. It begins with an introduction to symmetry detection and issues that arise when applying existing continuous techniques to digital images. It then describes finite Eisenstein fields, which are constructed as finite fields analogous to the complex integers. Elements of these fields correspond naturally to hexagons, allowing hexagonal images to be represented as functions over the fields. Polar coordinate transformations are introduced to represent field elements in exponential form, enabling the transfer of continuous symmetry detection methods to digital hexagonal images. In summary, the document proposes a novel approach for symmetry detection in hexagonal images based on the algebraic structure of finite Eisenstein fields.
Artyom Makovetskii - An Efficient Algorithm for Total Variation DenoisingAIST
This document summarizes a research paper that analyzes the total variation denoising algorithm. It presents the following key points:
1. The total variation denoising model aims to minimize the sum of a fidelity term measuring noise and a regularization term measuring total variation.
2. The solution space can be reduced from bounded variation functions to piecewise constant functions on a given partition.
3. Explicit solutions are described for small values of the regularization parameter λ using Strong-Chan formulas, and these solutions are used to iteratively reduce the problem size and λ value.
4. The properties of extremal functions are proved, including uniqueness and behavior at discontinuity points depending on the sign of neighboring
2. cleverdata.ru | info@cleverdata.ru
Make your data clever
Развитие бизнеса
на международном
рынке
Входит в тройку
лидеров российских ИТ компаний
43 подразделения в России и за рубежом
Более 7000 сотрудников
100 тыс.проектов для 10 тыс.заказчиков
Облачная платформа
управления данными
«Биржа» данных
Прикладные сервисы и приложения
Big Data интегратор
Опыт работы более 3-х лет
Собственные центры разработки
Партнерство с мировыми лидерами и
научными институтами
Центр экспертизы по технологиям Big
Data и Digital Marketing
1DMP
3. cleverdata.ru | info@cleverdata.ru
Мы знаем все о больших данных и их обработке
ВЫСОКАЯ СКОРОСТЬ
БОЛЬШОЙ ОБЪЕМ
ЗНАЧИТЕЛЬНАЯ ВАРИАТИВНОСТЬ
Web логи
Финансовые транзакции
Социальные сети
Web контент
Машинные данные
Открытые данные
Hadoop
MPP (Vertica, Exadata, Greenplum,
Teradata)
NoSQL (Key-Value, Document-oriented,
Column-based, Graph-oriented)
In-memory Data Grids, Calculation
Grids
Data Mining
Machine Learning / Statistics / Natural
Language Processing
Event-Stream Processing
Ценность данных в том, как вы их
анализируете и применяете для развития
своего бизнеса
Понимание клиента и его поведения
Информационная безопасность
Управление рисками
Повышение операционной эффективности
“Потенциал Big Data раскрывается в полной мере при взаимодействии с
другими данными корпорации.” Билл Фрэнкс.
4. cleverdata.ru | info@cleverdata.ru
Ценность клиентов
Огромное количество коммуникаций, атакующих
клиента по разным каналам, делают задачу привлечь
внимание клиента и при этом сохранить его
лояльность все более сложно выполнимыми.
Нерелевантные предложения клиенту приносят
больше вреда, чем пользы.
Digital маркетинг
показывать только те предложения, которые релевантны интересам посетителя сайта
Маркетинговые кампании
прогноз отклика на продукт, канал, предложение
Управление оттоком
оценка вероятности отказа от продукта или ухода клиента из компании
Удержание
Каждая информация о клиенте несет в себе ценность
Привлечение
Продажи
5. cleverdata.ru | info@cleverdata.ru
Customer Experience Profile
Вероятность
оттока
35%
Лояльность
87%
Надежность
20% Кредитная
нагрузка
Низкая
Семья
2 чел
Доход семьи
Средний
Инвестиции,
экономика 66%
Автомобили
5%
Недвижимость
10%
Накопления
18%
Технологии
63%
Действующих
продуктов
5
Последняя
покупка
36 дн
Активность
28%
CLTV
Средний
В клиентской
базе
35.2 мес
Удовлетворенность 75%
Уровень
коммуникации
20%
Уровень отклика
18%
Централизованный сбор десятков заранее определенных
метрик
Глубокая аналитическая витрина объединяет внутренние и
внешние данные о клиенте
Расчет метрик в реальном времени;
Ориентир на единичного клиента или микро-сегмент;
Отражает эволюцию клиентского профайла – тренды и
прогнозы;
Адаптация под конечного пользователя;
Обеспечивает «живые» рабочие данные для маркетинговых
приложений.
7. cleverdata.ru | info@cleverdata.ru
Отличие от традиционных систем
Big Data
Real Time
Analytics
Традиционные
аналитические
системы
«Что уже случилось и почему?»
«Что произойдет?
Что стоит предпринять?»
Большие объемы данных
разной структуры
Real-time системы
Структурированные
sampled-данные
Офф-лайн системы
Традиционные BI системы покажут
завтра то, что было позавчера
CIO Fortune 50 Banks
v
v
8. cleverdata.ru | info@cleverdata.ru
Управление оттоком клиентов
• Необходимо выявить клиентов, которые с большой вероятностью прекратят взаимодействие с компанией
• Каждому клиенту сопоставляется вероятность уйти в отток через какой-то промежуток времени
• Действия по удержанию (скидки, предложения) формируются для клиентов с высокой вероятностью
оттока
10. cleverdata.ru | info@cleverdata.ru
Кейс – вторичные продажи в банке
• Социально-демографические данные (регион, образование,
возраст…)
• История коммуникаций (звонки в колл-центр, отправленные
предложения)
• История контрактов (типы и параметры первых кредитов,
кредитная история)
Предоставлены внутренние данные обучающей выборки
Текущая модель банка обладает следующими особенностями
• Текущая модель показывает результат 47% базы – 78% отклика
• AUC 0,74
• Модель в 1.5 раза лучше случайного выбора
Откликом является факт приобретения
конкретного продукта
11. cleverdata.ru | info@cleverdata.ru
Подход к решению
Data
Preprocessing
Feature
Engineering
Feature
Selection
Machine Learning
• Очистка выбросов one-class SVM, boxplot. Выделение unbiased
выборки KS test
• Генерация агрегатов из предыдущих коммуникаций, паттерна
кредитной истории, дискретизация woe, MDLP, Entropy Measure
• Отбор признаков по AUC, Random Forest FS, RFE Decision Trees
• Построение модели Logistic Regression, LASSO Regularization
• Cross Validation, Leave-out tests на ретро данныхBack Testing
13. cleverdata.ru | info@cleverdata.ru
Результаты
Увеличение GINI на 15%
На 38% базы достигается 82% отклика
Модель на 30% лучше текущей модели у банка
• Выявлены клиенты, склонные к отклику из большой массы спящих клиентов
• Расходы на коммуникацию снижены за счет перераспределения клиентов по каналам
• Применена стратегия оптимизации расходов на коммуникации с целью максимизации прибыли