SlideShare a Scribd company logo
1 of 19
Download to read offline
Моделирование поведения клиентов
банка с помощью Hadoop и Spark
Реализовано более 20 проектов с
12 крупнейшими банками
Более
20
≈70миллионов
2/5
Модели платформы работают на
~70 млн реальных профилей
Работает в 2 из топ-5
европейских банков
Платформа используется ведущими банками в нескольких странах
проектов
Rubbles
Customer Insight™
Данные как отражение реальной жизни клиента Rubbles
SBDA Group
Типы моделей
Детектирующие инсайты
Активность клиента
Предсказывающие инсайты
Rubbles
SBDA Group
Детектирующие инсайты
Ручной поиск
событий
Обобщение знания в
виде модели*
Набор вероятностных
моделей
* (gradient boosted decision trees, factorization machines и другие)
Rubbles
SBDA Group
Предсказывающие инсайты
Формирование выборки на
базе детектирующих инсайтов
Обучение* на
исторических данных
Набор вероятностных
моделей
?
* (gradient boosted decision trees, factorization machines и другие)
Rubbles
SBDA Group
Транзакционные данные
op_date sttl_date op_curr conamt_1e4 acct_curr summa_rur_1e2 strana city mcc tochka …
2015-05-31	22:42:01 2015-06-03	06:59:41 810 2920000 810 29200 RUS PENZA 5499 BRISTOL	1314 …
2015-05-31	22:44:04 2015-06-03	06:59:43 810 6900000 810 69000 RUS MOSKVA 5261 LERUA	MERLEN …
2015-05-31	22:46:43 2015-06-04	05:38:32 810 34760000 810 347600 RUS MOSKVA 5261 OBI …
2015-05-31	22:48:05 2015-06-03	06:59:41 810 141800 840 75113 RUS MOSKVA							 5812 STARLIGHT	DINER							 …
2015-05-31	22:48:09 2015-06-03	06:59:43 810 9000000 810 90000 RUS MOSCOW 4812 ROSTELEKOM …
2015-05-31	22:48:10 2015-06-02	06:29:04 810 15351000 810 153510 RUS MOSCOW 5814 YAKITORIYA …
2015-05-31	22:48:25 2015-06-03	06:59:42 810 16000000 810 160000 RUS MOSCOW 5734 PSCB*ALLSOFT.RU …
2015-05-31	22:48:56 2015-06-03	06:59:45 810 1000000 810 10000 RUS MOSKVA 4814 NTV+	INTERNET-EKVAYRIN …
2015-05-31	22:49:10 2015-06-03	06:59:43 810 775000 810 7750 RUS MOSCOW 5499 UNIVERSAM	ABK …
2015-05-31	22:53:15 2015-06-03	06:59:42 810 2830000 810 28300 RUS MOSKVA							 5814 MCDONALDS	24447							 …
2015-05-31	22:56:07 2015-06-03	06:59:41 810 9770000 810 97700 RUS MOSCOW 5411 PEREKRESTOK	SM	SKOBE …
2015-05-31	23:02:45 2015-06-03	06:59:45 810 61000000 810 610000 RUS MOSCOW 6538 Tinkoff	Bank	Card2Card …
2015-05-31	23:04:30 2015-06-02	06:29:03 810 22500000 810 225000 RUS MOSCOW 5812 OOO	SHON	LON …
2015-05-31	23:05:53 2015-06-03	06:59:43 810 146500000 810 1465000 RUS MOSCOW 6536 0QIWI …
2015-05-31	23:12:05 2015-06-03	06:59:43 810 14900000 810 149000 RUS MOSCOW 5734 PSCB*ALLSOFT.RU …
2015-05-31	23:21:56 2015-06-03	06:59:44 810 8150000 810 81500 RUS MOSKVA 5411 VIKTORIJA-2	KKM1 …
2015-05-31	23:25:05 2015-06-03	06:59:42 810 19699700 810 196997 RUS MOSCOW 5411 POLIARNAIA	ZVEZDA …
2015-05-31	23:26:32 2015-06-02	06:29:03 810 16550000 810 165500 RUS MOSCOW 5814 STARLITE	DINER …
2015-05-31	23:27:48 2015-06-02	06:29:02 810 40360000 810 403600 RUS MOSCOW 5814 YAKITORIYA …
2015-05-31	23:28:57 2015-06-03	06:59:41 810 19834000 810 198340 RUS MOSKVA 5411 BILLA-TAGANKA …
2015-05-31	23:29:52 2015-06-03	06:59:42 810 16153200 810 161532 RUS MOSCOW 5300 METRO	STORE	1049 …
2015-05-31	23:31:39 2015-06-03	06:59:43 810 1475000 810 14750 RUS MOSCOW 5411 MAGNOLIYA …
2015-05-31	23:32:28 2015-06-03	06:59:46 810 5500000 810 55000 RUS MOSKVA							 4816 STARLINK														 …
2015-05-31	23:41:25 2015-06-02	06:29:04 810 68408000 810 684080 RUS MOSKVA 6538 LR*www.homecredit.ru …
2015-05-31	23:43:39 2015-06-03	06:59:45 810 2300000 810 23000 RUS MOSCOW 5812 COFFEEMANIA	TVERSKAYA …
2015-05-31	23:45:23 2015-06-02	06:29:01 810 2090000 810 20900 RUS MOSKVA 5812 Kafe	ToDaSjo …
2015-05-31	23:48:37 2015-06-02	06:29:01 810 9152000 810 91520 RUS Moskva 5912 Apteka	N516 …
2015-05-31	23:49:20 2015-06-03	06:59:43 810 39205000 810 392050 RUS MOSCOW 5411 AZBUKA	VKUSA …
2015-05-31	23:49:55 2015-06-03	06:59:46 810 5730000 810 57300 RUS MOSCOW 5411 NG	Presnenskaya	zastav …
2015-05-31	23:50:29 2015-06-03	06:59:45 810 10000000 810 100000 RUS MOSCOW 4814 WWW.MEGAFON.RU …
2015-05-31	23:56:57 2015-06-03	06:59:43 810 2390000 810 23900 RUS MOSCOW 5499 STANEM	DRUZYAMI …
2015-05-31	23:58:45 2015-06-03	06:59:44 810 30000000 810 300000 RUS MOSCOW 7922 TICKET.MXAT.RU …
2015-05-31	23:59:14 2015-06-03	06:59:42 810 3900000 810 39000 RUS MOSKVA							 5814 MCDONALDS	24454							 …
Rubbles
SBDA Group
Rubbles
SBDA Group
Очистка и подготовка
данных
Очистка и подготовка данных
Примеры проблем, исправляемых в данных:
• Различные MCC для нескольких одинаковых объектов. Например, два ресторана
McDonalds могут иметь два разных MCC кода («фастфуд» или «ресторан» или «магазин
продуктов»).
• Имена мерчантов различны для одинаковых объектов. Например, «McDonalds» или
«Makdonalds» или «MCDONALDS 24447».
• Различные названия городов. Например, «MOSCOW» и «MOSKVA»
• Неоднозначность трактовки MCC в зависимости от объема транзакции — например,
транзакция размером 10 рублей на заправке не означает, что человек там заправлялся.
Rubbles
SBDA Group
Rubbles
SBDA Group
Особенности обновления
данных в HDFS
Особенности обновления данных в HDFS
Как работает оплата по карте:
1. В момент осуществления транзакции платёжная система резервирует деньги на карте
(транзакция со статусом «HOLD»).
2. Банк-эквайер отправляет через платежную систему в банк-эмитент так называемые
клиринговые файлы.
3. Средства списываются со счёта клиента (или транзакция просто пропадает —
например, в случае её отмены).
Rubbles
SBDA Group
В итоге:
• Данные по транзакциям до и после списания хранятся в разных системах и в разных
форматах
• Подавляющее число транзакций фактически списывается со счёта в течение 3-9 дней
• Встроиться в процесс фактического списания транзакций достаточно сложно, для
выгрузки исторических данных чаще всего используются ежедневные дампы
• Списание происходит не последовательно, то есть “вставка” записей в исторические
данные — обычное дело
Особенности обновления данных в HDFS Rubbles
SBDA Group
С точки зрения хранения в HDFS получается неудобно
Решение:
• В HDFS ежедневно выгружаются данные по транзакциям после их списания со счёта за
последние 10 дней
• В HDFS ежедневно выгружаются все данные по транзакциям в статусе «HOLD»
• В ZooKeeper записываются флаги, гарантирующие бесшовное «переключение»
запускаемых Job на новые файлы
• По расписанию происходит удаление старых файлов
Особенности обновления данных в HDFS Rubbles
SBDA Group
Rubbles
SBDA Group
Построение признаков в
Spark
Построение признаков в Spark Rubbles
SBDA Group
Вводные:
• Большая часть признаков представляет собой статистики по историческим данным —
расчёт по всем клиентам достаточно трудоёмок
• Всегда существует “дельта” из свежих данных, которая не была загружена в HDFS
• Необходимо уметь быстро рассчитывать признаки для одного клиента, чтобы
отобразить персонализированный интерфейс/набор коммуникаций
• Для проактивных коммуникаций необходимо регулярно рассчитывать признаки для
всех клиентов
• Обычно не сразу, но рано или поздно банки реализовывают возможность поставки
данных в реальном времени
Исторические данные Свежие данные
Агрегаты
Признаковое
описание
Построение признаков в Spark Rubbles
SBDA Group
• Хорошо ложится в парадигму Resilient Distributed Dataset (RDD)
• Поддерживает Spark Streaming “из коробки”
• Позволяет без существенных доработок разворачивать
решение на отличных от HDFS источниках данных
Rubbles
SBDA Group
Обучение и исполнение моделей
(Spark MLlib)
Обучение и исполнение моделей (Spark MLlib) Rubbles
SBDA Group
{
"appName": "trans_test",
"type": "spending_prediction",
"master": "yarn-client",
"input": {
"type": "trans_dump",
"path": "hdfs:///user/root/transactions_filtered.txt"
},
"outputPath": "hdfs:///user/root/out1",
"task": {
"type": "train_save",
"path": "hdfs:///user/root/spending_model",
"model": {
"type": "spending",
"now": "2016-04-10",
"monthWindow": 6,
"featureFormat": {
"type": "default"
},
"regressor": {
"type": "rf"
},
"label": {
"type": "simple"
}
}
}
}
Пример конфига:
• Модели и признаки изначально разрабатываются на
Python
• Разработали обвязку для Spark MLlib, чтобы запускать
джобы на базе конфига
• Конфиг для обучения моделей содержит набор
параметров моделей и ссылки на признаки
• Конфиг для исполнения моделей содержит ссылки на
файлы моделей и признаки
www.rubbles.ru
info@rubbles.ru
Спасибо!

More Related Content

Viewers also liked

Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016rusbase
 
Александр Белоцерковский — Microsoft — ICBDA2016
Александр Белоцерковский — Microsoft — ICBDA2016Александр Белоцерковский — Microsoft — ICBDA2016
Александр Белоцерковский — Microsoft — ICBDA2016rusbase
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016rusbase
 
Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016rusbase
 
Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016rusbase
 
Искусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеИскусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеExpasoft
 
Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016rusbase
 
Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016rusbase
 
Blockchain Investment Potential
Blockchain Investment PotentialBlockchain Investment Potential
Blockchain Investment PotentialDima Starodubcev
 
Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016rusbase
 
Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015rusbase
 
Презентация компании Trade Help
Презентация компании Trade HelpПрезентация компании Trade Help
Презентация компании Trade HelpTrade Help
 
Евгений Смирнов — Numbuster — ICBDA 2015
Евгений Смирнов — Numbuster — ICBDA 2015Евгений Смирнов — Numbuster — ICBDA 2015
Евгений Смирнов — Numbuster — ICBDA 2015rusbase
 
Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015rusbase
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015rusbase
 
Василий Суханов — SAP — ICBDA 2015
Василий Суханов — SAP — ICBDA 2015Василий Суханов — SAP — ICBDA 2015
Василий Суханов — SAP — ICBDA 2015rusbase
 
Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015rusbase
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015rusbase
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015rusbase
 
Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016rusbase
 

Viewers also liked (20)

Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016Евгений Быков – Телум – ICBDA2016
Евгений Быков – Телум – ICBDA2016
 
Александр Белоцерковский — Microsoft — ICBDA2016
Александр Белоцерковский — Microsoft — ICBDA2016Александр Белоцерковский — Microsoft — ICBDA2016
Александр Белоцерковский — Microsoft — ICBDA2016
 
Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016Александр Яшкин – FANUC Russia – ICBDA2016
Александр Яшкин – FANUC Russia – ICBDA2016
 
Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016Александр Хайтин — Yandex Data Factory — ICBDA2016
Александр Хайтин — Yandex Data Factory — ICBDA2016
 
Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016Роман Чеботарев — КРОК — ICBDA2016
Роман Чеботарев — КРОК — ICBDA2016
 
Искусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесеИскусственный интеллект и Big Data в бизнесе
Искусственный интеллект и Big Data в бизнесе
 
Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016Максим Кулиш — OWOX-Russia — ICBDA2016
Максим Кулиш — OWOX-Russia — ICBDA2016
 
Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016Иван Красников — K☆50 — ICBDA2016
Иван Красников — K☆50 — ICBDA2016
 
Blockchain Investment Potential
Blockchain Investment PotentialBlockchain Investment Potential
Blockchain Investment Potential
 
Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016Александр Куликов — Segmento — ICBDA2016
Александр Куликов — Segmento — ICBDA2016
 
Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015Владислав Флакс — OWOX — IСBDA 2015
Владислав Флакс — OWOX — IСBDA 2015
 
Презентация компании Trade Help
Презентация компании Trade HelpПрезентация компании Trade Help
Презентация компании Trade Help
 
Евгений Смирнов — Numbuster — ICBDA 2015
Евгений Смирнов — Numbuster — ICBDA 2015Евгений Смирнов — Numbuster — ICBDA 2015
Евгений Смирнов — Numbuster — ICBDA 2015
 
Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015Евгений Власов — CallTouch — ICBDA 2015
Евгений Власов — CallTouch — ICBDA 2015
 
Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015Артем Плешаков — Intency DSP — ICBDA 2015
Артем Плешаков — Intency DSP — ICBDA 2015
 
Василий Суханов — SAP — ICBDA 2015
Василий Суханов — SAP — ICBDA 2015Василий Суханов — SAP — ICBDA 2015
Василий Суханов — SAP — ICBDA 2015
 
Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015Ксения Ачкасова — TNS Россия — ICBDA 2015
Ксения Ачкасова — TNS Россия — ICBDA 2015
 
Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015Антон Бут — Auditorius — ICBDA 2015
Антон Бут — Auditorius — ICBDA 2015
 
Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015Александр Фонарев — Rubbles — ICBDA 2015
Александр Фонарев — Rubbles — ICBDA 2015
 
Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016Алексей Смирнов – Актион – ICBDA 2016
Алексей Смирнов – Актион – ICBDA 2016
 

Similar to Владислав Лисицкий — Rubbles — ICBDA2016

QlikView в Лудинг: Единый центр принятия решений
QlikView в Лудинг: Единый центр принятия решенийQlikView в Лудинг: Единый центр принятия решений
QlikView в Лудинг: Единый центр принятия решенийMarina Payvina
 
Опыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингОпыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингMarina Payvina
 
Инфраструктура под аналитику и большие данные
Инфраструктура под аналитику  и большие данныеИнфраструктура под аналитику  и большие данные
Инфраструктура под аналитику и большие данныеCisco Russia
 
Архитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfАрхитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfSerge Dobridnjuk
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореIT Group
 
Cовременные инструменты для Business Intelligence
Cовременные инструменты для Business IntelligenceCовременные инструменты для Business Intelligence
Cовременные инструменты для Business IntelligenceAndrey Korshikov
 
Варианты развертывания СЭД - ограничения и выгоды
Варианты развертывания СЭД - ограничения и выгодыВарианты развертывания СЭД - ограничения и выгоды
Варианты развертывания СЭД - ограничения и выгодыExpolink
 
владивосток форум Deep_see
владивосток форум Deep_seeвладивосток форум Deep_see
владивосток форум Deep_seeElena Ometova
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияDell_Russia
 
Business intelligence в Ozon.ru
Business intelligence в Ozon.ruBusiness intelligence в Ozon.ru
Business intelligence в Ozon.ruRoman Zykov
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biМаксим Войцеховский
 
Облачные вычисления - игры кончились, началась работа
Облачные вычисления - игры кончились, началась работаОблачные вычисления - игры кончились, началась работа
Облачные вычисления - игры кончились, началась работаКРОК
 
Черкашин, Экспобанк. ИТ бюджет 2016
Черкашин, Экспобанк. ИТ бюджет 2016Черкашин, Экспобанк. ИТ бюджет 2016
Черкашин, Экспобанк. ИТ бюджет 2016Bankir_Ru
 
DOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВDOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВIvan Stoyev
 
DOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВDOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВIvan Stoyev
 
Защищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровЗащищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровAndrew Fadeev
 
венчурам презентация Calligraph
венчурам презентация Calligraphвенчурам презентация Calligraph
венчурам презентация CalligraphВладимир Лосев
 
Разработка и внедрение PHP SDK myTarget
Разработка и внедрение PHP SDK myTargetРазработка и внедрение PHP SDK myTarget
Разработка и внедрение PHP SDK myTargetSocialKey Ads
 

Similar to Владислав Лисицкий — Rubbles — ICBDA2016 (20)

QlikView в Лудинг: Единый центр принятия решений
QlikView в Лудинг: Единый центр принятия решенийQlikView в Лудинг: Единый центр принятия решений
QlikView в Лудинг: Единый центр принятия решений
 
Опыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК ЛудингОпыт работы с Qlik в компании ГК Лудинг
Опыт работы с Qlik в компании ГК Лудинг
 
Инфраструктура под аналитику и большие данные
Инфраструктура под аналитику  и большие данныеИнфраструктура под аналитику  и большие данные
Инфраструктура под аналитику и большие данные
 
Архитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdfАрхитектура_расчетных_систем_500_лет.pdf
Архитектура_расчетных_систем_500_лет.pdf
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом секторе
 
Cовременные инструменты для Business Intelligence
Cовременные инструменты для Business IntelligenceCовременные инструменты для Business Intelligence
Cовременные инструменты для Business Intelligence
 
Варианты развертывания СЭД - ограничения и выгоды
Варианты развертывания СЭД - ограничения и выгодыВарианты развертывания СЭД - ограничения и выгоды
Варианты развертывания СЭД - ограничения и выгоды
 
владивосток форум Deep_see
владивосток форум Deep_seeвладивосток форум Deep_see
владивосток форум Deep_see
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решения
 
Business intelligence в Ozon.ru
Business intelligence в Ozon.ruBusiness intelligence в Ozon.ru
Business intelligence в Ozon.ru
 
Анализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft biАнализ и визуализация данных на базе платформы Microsoft bi
Анализ и визуализация данных на базе платформы Microsoft bi
 
Облачные вычисления - игры кончились, началась работа
Облачные вычисления - игры кончились, началась работаОблачные вычисления - игры кончились, началась работа
Облачные вычисления - игры кончились, началась работа
 
Черкашин, Экспобанк. ИТ бюджет 2016
Черкашин, Экспобанк. ИТ бюджет 2016Черкашин, Экспобанк. ИТ бюджет 2016
Черкашин, Экспобанк. ИТ бюджет 2016
 
RISK MANAGEMENT U2
RISK MANAGEMENT U2RISK MANAGEMENT U2
RISK MANAGEMENT U2
 
DOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВDOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И В
 
DOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И ВDOCFLOW 2014 Презентация Стоева И В
DOCFLOW 2014 Презентация Стоева И В
 
Защищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центровЗащищенная веб-аналитика для банков, телекомов, медицинских центров
Защищенная веб-аналитика для банков, телекомов, медицинских центров
 
венчурам презентация Calligraph
венчурам презентация Calligraphвенчурам презентация Calligraph
венчурам презентация Calligraph
 
Принцип достаточности
Принцип достаточностиПринцип достаточности
Принцип достаточности
 
Разработка и внедрение PHP SDK myTarget
Разработка и внедрение PHP SDK myTargetРазработка и внедрение PHP SDK myTarget
Разработка и внедрение PHP SDK myTarget
 

More from rusbase

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзингrusbase
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание rusbase
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере rusbase
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг rusbase
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеrusbase
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство rusbase
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russiarusbase
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russiarusbase
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russiarusbase
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russiarusbase
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russiarusbase
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russiarusbase
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russiarusbase
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russiarusbase
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017rusbase
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017rusbase
 
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016rusbase
 
Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016rusbase
 
Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016rusbase
 
Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016rusbase
 

More from rusbase (20)

Робоэдвайзинг
РобоэдвайзингРобоэдвайзинг
Робоэдвайзинг
 
Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание Как чат-боты меняют банковское обслуживание
Как чат-боты меняют банковское обслуживание
 
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
Как удаленная идентификация повлияет на бизнес модели в финансовой сфере
 
Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг Как социальные сети влияют на скоринг
Как социальные сети влияют на скоринг
 
Искусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скорингеИскусственный интеллект в кредитном скоринге
Искусственный интеллект в кредитном скоринге
 
P2P кредитование и народное поручительство
P2P кредитование и народное поручительство P2P кредитование и народное поручительство
P2P кредитование и народное поручительство
 
Francis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech RussiaFrancis Bakos, Vitality - FinTech Russia
Francis Bakos, Vitality - FinTech Russia
 
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech RussiaРуслан Юсуфов, Страхование от кибер-атак - FinTech Russia
Руслан Юсуфов, Страхование от кибер-атак - FinTech Russia
 
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech RussiaАлексей Краснопольский, Онлайн-кассы - FinTech Russia
Алексей Краснопольский, Онлайн-кассы - FinTech Russia
 
Иван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech RussiaИван Беров, Digital Identity - FinTech Russia
Иван Беров, Digital Identity - FinTech Russia
 
Алексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech RussiaАлексей Катрич, IoT в InsurTech - FinTech Russia
Алексей Катрич, IoT в InsurTech - FinTech Russia
 
Алексей Архипов, Мастерчейн - FinTech Russia
Алексей Архипов, Мастерчейн  - FinTech RussiaАлексей Архипов, Мастерчейн  - FinTech Russia
Алексей Архипов, Мастерчейн - FinTech Russia
 
Максим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech RussiaМаксим Григорьев, Удаленная идентификация - FinTech Russia
Максим Григорьев, Удаленная идентификация - FinTech Russia
 
Александр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech RussiaАлександр Кузьмин, PSD2 - FinTech Russia
Александр Кузьмин, PSD2 - FinTech Russia
 
Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017Алексей Благирев, "Открытие" — FinTech Russia 2017
Алексей Благирев, "Открытие" — FinTech Russia 2017
 
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
Ханнес Чопра (Hannes Chopra) - FinTech Russia 2017
 
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
Антон Бут и Екатерина Огнева – Билайн – ICBDA 2016
 
Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016Анатолий Климчук – ARTOX Media International – ICBDA 2016
Анатолий Климчук – ARTOX Media International – ICBDA 2016
 
Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016Александр Воронов – BURDA – ICBDA 2016
Александр Воронов – BURDA – ICBDA 2016
 
Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016Евгений Никульчев — МТИ — ICBDA2016
Евгений Никульчев — МТИ — ICBDA2016
 

Владислав Лисицкий — Rubbles — ICBDA2016

  • 2. Реализовано более 20 проектов с 12 крупнейшими банками Более 20 ≈70миллионов 2/5 Модели платформы работают на ~70 млн реальных профилей Работает в 2 из топ-5 европейских банков Платформа используется ведущими банками в нескольких странах проектов Rubbles Customer Insight™
  • 3. Данные как отражение реальной жизни клиента Rubbles SBDA Group
  • 4. Типы моделей Детектирующие инсайты Активность клиента Предсказывающие инсайты Rubbles SBDA Group
  • 5. Детектирующие инсайты Ручной поиск событий Обобщение знания в виде модели* Набор вероятностных моделей * (gradient boosted decision trees, factorization machines и другие) Rubbles SBDA Group
  • 6. Предсказывающие инсайты Формирование выборки на базе детектирующих инсайтов Обучение* на исторических данных Набор вероятностных моделей ? * (gradient boosted decision trees, factorization machines и другие) Rubbles SBDA Group
  • 7. Транзакционные данные op_date sttl_date op_curr conamt_1e4 acct_curr summa_rur_1e2 strana city mcc tochka … 2015-05-31 22:42:01 2015-06-03 06:59:41 810 2920000 810 29200 RUS PENZA 5499 BRISTOL 1314 … 2015-05-31 22:44:04 2015-06-03 06:59:43 810 6900000 810 69000 RUS MOSKVA 5261 LERUA MERLEN … 2015-05-31 22:46:43 2015-06-04 05:38:32 810 34760000 810 347600 RUS MOSKVA 5261 OBI … 2015-05-31 22:48:05 2015-06-03 06:59:41 810 141800 840 75113 RUS MOSKVA 5812 STARLIGHT DINER … 2015-05-31 22:48:09 2015-06-03 06:59:43 810 9000000 810 90000 RUS MOSCOW 4812 ROSTELEKOM … 2015-05-31 22:48:10 2015-06-02 06:29:04 810 15351000 810 153510 RUS MOSCOW 5814 YAKITORIYA … 2015-05-31 22:48:25 2015-06-03 06:59:42 810 16000000 810 160000 RUS MOSCOW 5734 PSCB*ALLSOFT.RU … 2015-05-31 22:48:56 2015-06-03 06:59:45 810 1000000 810 10000 RUS MOSKVA 4814 NTV+ INTERNET-EKVAYRIN … 2015-05-31 22:49:10 2015-06-03 06:59:43 810 775000 810 7750 RUS MOSCOW 5499 UNIVERSAM ABK … 2015-05-31 22:53:15 2015-06-03 06:59:42 810 2830000 810 28300 RUS MOSKVA 5814 MCDONALDS 24447 … 2015-05-31 22:56:07 2015-06-03 06:59:41 810 9770000 810 97700 RUS MOSCOW 5411 PEREKRESTOK SM SKOBE … 2015-05-31 23:02:45 2015-06-03 06:59:45 810 61000000 810 610000 RUS MOSCOW 6538 Tinkoff Bank Card2Card … 2015-05-31 23:04:30 2015-06-02 06:29:03 810 22500000 810 225000 RUS MOSCOW 5812 OOO SHON LON … 2015-05-31 23:05:53 2015-06-03 06:59:43 810 146500000 810 1465000 RUS MOSCOW 6536 0QIWI … 2015-05-31 23:12:05 2015-06-03 06:59:43 810 14900000 810 149000 RUS MOSCOW 5734 PSCB*ALLSOFT.RU … 2015-05-31 23:21:56 2015-06-03 06:59:44 810 8150000 810 81500 RUS MOSKVA 5411 VIKTORIJA-2 KKM1 … 2015-05-31 23:25:05 2015-06-03 06:59:42 810 19699700 810 196997 RUS MOSCOW 5411 POLIARNAIA ZVEZDA … 2015-05-31 23:26:32 2015-06-02 06:29:03 810 16550000 810 165500 RUS MOSCOW 5814 STARLITE DINER … 2015-05-31 23:27:48 2015-06-02 06:29:02 810 40360000 810 403600 RUS MOSCOW 5814 YAKITORIYA … 2015-05-31 23:28:57 2015-06-03 06:59:41 810 19834000 810 198340 RUS MOSKVA 5411 BILLA-TAGANKA … 2015-05-31 23:29:52 2015-06-03 06:59:42 810 16153200 810 161532 RUS MOSCOW 5300 METRO STORE 1049 … 2015-05-31 23:31:39 2015-06-03 06:59:43 810 1475000 810 14750 RUS MOSCOW 5411 MAGNOLIYA … 2015-05-31 23:32:28 2015-06-03 06:59:46 810 5500000 810 55000 RUS MOSKVA 4816 STARLINK … 2015-05-31 23:41:25 2015-06-02 06:29:04 810 68408000 810 684080 RUS MOSKVA 6538 LR*www.homecredit.ru … 2015-05-31 23:43:39 2015-06-03 06:59:45 810 2300000 810 23000 RUS MOSCOW 5812 COFFEEMANIA TVERSKAYA … 2015-05-31 23:45:23 2015-06-02 06:29:01 810 2090000 810 20900 RUS MOSKVA 5812 Kafe ToDaSjo … 2015-05-31 23:48:37 2015-06-02 06:29:01 810 9152000 810 91520 RUS Moskva 5912 Apteka N516 … 2015-05-31 23:49:20 2015-06-03 06:59:43 810 39205000 810 392050 RUS MOSCOW 5411 AZBUKA VKUSA … 2015-05-31 23:49:55 2015-06-03 06:59:46 810 5730000 810 57300 RUS MOSCOW 5411 NG Presnenskaya zastav … 2015-05-31 23:50:29 2015-06-03 06:59:45 810 10000000 810 100000 RUS MOSCOW 4814 WWW.MEGAFON.RU … 2015-05-31 23:56:57 2015-06-03 06:59:43 810 2390000 810 23900 RUS MOSCOW 5499 STANEM DRUZYAMI … 2015-05-31 23:58:45 2015-06-03 06:59:44 810 30000000 810 300000 RUS MOSCOW 7922 TICKET.MXAT.RU … 2015-05-31 23:59:14 2015-06-03 06:59:42 810 3900000 810 39000 RUS MOSKVA 5814 MCDONALDS 24454 … Rubbles SBDA Group
  • 8. Rubbles SBDA Group Очистка и подготовка данных
  • 9. Очистка и подготовка данных Примеры проблем, исправляемых в данных: • Различные MCC для нескольких одинаковых объектов. Например, два ресторана McDonalds могут иметь два разных MCC кода («фастфуд» или «ресторан» или «магазин продуктов»). • Имена мерчантов различны для одинаковых объектов. Например, «McDonalds» или «Makdonalds» или «MCDONALDS 24447». • Различные названия городов. Например, «MOSCOW» и «MOSKVA» • Неоднозначность трактовки MCC в зависимости от объема транзакции — например, транзакция размером 10 рублей на заправке не означает, что человек там заправлялся. Rubbles SBDA Group
  • 11. Особенности обновления данных в HDFS Как работает оплата по карте: 1. В момент осуществления транзакции платёжная система резервирует деньги на карте (транзакция со статусом «HOLD»). 2. Банк-эквайер отправляет через платежную систему в банк-эмитент так называемые клиринговые файлы. 3. Средства списываются со счёта клиента (или транзакция просто пропадает — например, в случае её отмены). Rubbles SBDA Group
  • 12. В итоге: • Данные по транзакциям до и после списания хранятся в разных системах и в разных форматах • Подавляющее число транзакций фактически списывается со счёта в течение 3-9 дней • Встроиться в процесс фактического списания транзакций достаточно сложно, для выгрузки исторических данных чаще всего используются ежедневные дампы • Списание происходит не последовательно, то есть “вставка” записей в исторические данные — обычное дело Особенности обновления данных в HDFS Rubbles SBDA Group С точки зрения хранения в HDFS получается неудобно
  • 13. Решение: • В HDFS ежедневно выгружаются данные по транзакциям после их списания со счёта за последние 10 дней • В HDFS ежедневно выгружаются все данные по транзакциям в статусе «HOLD» • В ZooKeeper записываются флаги, гарантирующие бесшовное «переключение» запускаемых Job на новые файлы • По расписанию происходит удаление старых файлов Особенности обновления данных в HDFS Rubbles SBDA Group
  • 15. Построение признаков в Spark Rubbles SBDA Group Вводные: • Большая часть признаков представляет собой статистики по историческим данным — расчёт по всем клиентам достаточно трудоёмок • Всегда существует “дельта” из свежих данных, которая не была загружена в HDFS • Необходимо уметь быстро рассчитывать признаки для одного клиента, чтобы отобразить персонализированный интерфейс/набор коммуникаций • Для проактивных коммуникаций необходимо регулярно рассчитывать признаки для всех клиентов • Обычно не сразу, но рано или поздно банки реализовывают возможность поставки данных в реальном времени
  • 16. Исторические данные Свежие данные Агрегаты Признаковое описание Построение признаков в Spark Rubbles SBDA Group • Хорошо ложится в парадигму Resilient Distributed Dataset (RDD) • Поддерживает Spark Streaming “из коробки” • Позволяет без существенных доработок разворачивать решение на отличных от HDFS источниках данных
  • 17. Rubbles SBDA Group Обучение и исполнение моделей (Spark MLlib)
  • 18. Обучение и исполнение моделей (Spark MLlib) Rubbles SBDA Group { "appName": "trans_test", "type": "spending_prediction", "master": "yarn-client", "input": { "type": "trans_dump", "path": "hdfs:///user/root/transactions_filtered.txt" }, "outputPath": "hdfs:///user/root/out1", "task": { "type": "train_save", "path": "hdfs:///user/root/spending_model", "model": { "type": "spending", "now": "2016-04-10", "monthWindow": 6, "featureFormat": { "type": "default" }, "regressor": { "type": "rf" }, "label": { "type": "simple" } } } } Пример конфига: • Модели и признаки изначально разрабатываются на Python • Разработали обвязку для Spark MLlib, чтобы запускать джобы на базе конфига • Конфиг для обучения моделей содержит набор параметров моделей и ссылки на признаки • Конфиг для исполнения моделей содержит ссылки на файлы моделей и признаки