SlideShare a Scribd company logo
На шаг впереди
Data science и машинное обучение
как будущее антифрод-систем
Конференция «AntiFraud Russia 2015», 3 декабря 2015
Владимир Михнович, фрод-аналитик компании «Яндекс.Деньги»
«AntiFraud Russia 2015», 3 декабря 2015
Финансовые транзакции в цифровом мире
Российские банки потеряли в 2015
году из-за карточного мошенничества
C начала 2015 года по картам Visa и
MasterCard в мире проведено
операций
рублей
«AntiFraud Russia 2015», 3 декабря 2015
Эквайринг в оффлайновых магазинах
покупатель магазин
МПС
банк-эмитент банк-эквайер
Запрос авторизации
Ответ эмитента
выпуск карт
«AntiFraud Russia 2015», 3 декабря 2015
Интернет-эквайринг
МПС банк-эквайер
Запрос авторизации
Ответ эмитента
покупатель онлайн-магазин платёжный
агрегатор
антифрод-
система
банк-эмитент
выпуск карт
«AntiFraud Russia 2015», 3 декабря 2015
Data Science: классы задач
«AntiFraud Russia 2015», 3 декабря 2015
Data Science: практика применения
• Математические и статистические методы и
алгоритмы машинного обучения
• Экспертиза в предметной области
• Конечная цель – не аналитика ради аналитики, а
извлечение прибыли из данных
«AntiFraud Russia 2015», 3 декабря 2015
Data Science и антифрод-системы
Data Science в области антифрода – применение
математических моделей и алгоритмов
машинного обучения для анализа и обнаружения
мошеннических транзакций и фрода (на основе
уже известных данных) и аномалий платёжного
поведения пользователей.
«AntiFraud Russia 2015», 3 декабря 2015
Промышленные антифрод-решения
«AntiFraud Russia 2015», 3 декабря 2015
Наши инструменты
Code Effects
business rules engine
(BRE)
«AntiFraud Russia 2015», 3 декабря 2015
Экосистема RapidMiner Studio + Server
RapidMiner Studio:
аналитика и моделирование
RapidMiner Server:
деплоймент и веб-сервисы
«AntiFraud Russia 2015», 3 декабря 2015
Повернёмся лицом к бизнесу
Merchant oriented antifraud: парадигма использования бизнес-специфических
данных и создание моделей под конкретный бизнес / мерчанта / категорию.
• Дата и время
платежа
• Сумма платежа
• Банк-эмитент
• Страна эмитента
• География
пользователя
• Число дней до
рейса
• Наличие детей в
билете
• Наличие страховки
• Наличие
регистрации
• Возраст игрового
аккаунта
• История его покупок
• Величина «среднего
чека» игры
• …
«AntiFraud Russia 2015», 3 декабря 2015
Классифицируй это
Основные используемые алгоритмы
машинного обучения (supervised):
• Логистическая регрессия
• Байесовские классификаторы
• Деревья и леса решений (random forest)
• Нейронные сети
• Выбор и генерация атрибутов: 15-20 основных атрибутов, включая
созданные (например, на основе направления платежа, географии
пользователя и эмитента, платёжной истории и т.д.)
«AntiFraud Russia 2015», 3 декабря 2015
Зачем придумывать что-то новое?
Машинное обучение не отменяет антифрода
на основе правил (rule-based system), а
дополняет его
Компромисс между подходами: что быстрее
и эффективнее?
• время на обучение модели
на новых данных
или
• время на создание / адаптацию
правил под новые паттерны
«AntiFraud Russia 2015», 3 декабря 2015
Архитектурное решение
Система
правил
Модели машинного
обучения
Скоринг транзакции
Резолюция по
транзакции
Платёжная
история
Важный показатель SLA: время ответа антифрод-системы в целом
• Получаем резолюцию по транзакции от системы правил + модели
• Сохраняем ответ модели для аналитики будущих транзакций
• Уведомление мёрчанта (передаём скоринг транзакции)
«AntiFraud Russia 2015», 3 декабря 2015
Проблема интерпретации
• Иногда (но не всегда!) модель это «чёрный ящик» и интерпретировать её
решение может только аналитик, но не пользователь
• Модели машинного обучения выдают не только ответ, но и вероятность
(confidence)
89% 93% 99%
«AntiFraud Russia 2015», 3 декабря 2015
Цену ошибки диктует бизнес
Пропустить
все хорошие
платежи
Заблокировать
весь фрод
Компромисс между «заблокировать весь
фрод» и «пропустить все хорошие платежи»
= цена ошибки. Она диктуется бизнес-
моделью и всегда различна.
Использование threshold (порога
срабатывания) в зависимости от типа
модели позволяет минимизировать те
ошибки, которые обходятся дороже.
threshold
«AntiFraud Russia 2015», 3 декабря 2015
Иллюстрация порога срабатывания
Threshold = 0,7Threshold = 0,97 Threshold = 0,1
«AntiFraud Russia 2015», 3 декабря 2015
Измеряем эффективность
Десятки метрик, что выбрать?..
«AntiFraud Russia 2015», 3 декабря 2015
Измеряем эффективность
Метрики эффективности моделей выбраны с учётом тех параметров,
которые важно оптимизировать с точки зрения бизнес-модели.
• False positive rate ~ 4%
ложноположительное срабатывание:
посчитали легитимную транзакцию фродом
• False negative rate ~ 8%
ложноотрицательное срабатывание:
пропустили фродовую транзакцию
«AntiFraud Russia 2015», 3 декабря 2015
Что ждёт в будущем?
• Автоматический выбор атрибутов транзакций для моделирования
• Автоматическая генерация правил на основе классификационных моделей
• Чем больше данных – тем более «самостоятельны» алгоритмы машинного
обучения: сдвиг в сторону unsupervised learning
• Дальнейшее проникновение парадигмы Digital Identity во все онлайновые
действия пользователей
«AntiFraud Russia 2015», 3 декабря 2015
Резюмируя
• Data Science: аналитика данных не ради
аналитики, а извлечение прибыли из данных
• Мы используем простые модели, но хорошо
адаптированные под специфику конкретной
категории или мёрчанта
• Машинное обучение не заменяет правила и не
отменяет мозга аналитиков
• Цену ошибок классификации всегда диктует
бизнес
«Фрод не пройдёт»
Спасибо!
Конференция «AntiFraud Russia 2015», 3 декабря 2015
Владимир Михнович, фрод-аналитик компании «Яндекс.Деньги»
mikhnovich@yamoney.ru kypexin

More Related Content

Viewers also liked

Татьяня Алексеева Yandex.Money
Татьяня Алексеева Yandex.MoneyТатьяня Алексеева Yandex.Money
Татьяня Алексеева Yandex.Money
Aleksandrs Baranovs
 
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
E-Money News
 
Кросс-маркетинг для финансовой организации
Кросс-маркетинг для финансовой организацииКросс-маркетинг для финансовой организации
Кросс-маркетинг для финансовой организации
FIN people group
 
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
InSales
 
Презентация с семинара «Формула сайта» от Яндекс, Александра Золотова
Презентация с семинара «Формула сайта» от Яндекс, Александра ЗолотоваПрезентация с семинара «Формула сайта» от Яндекс, Александра Золотова
Презентация с семинара «Формула сайта» от Яндекс, Александра Золотова
remark72.ru
 
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги. Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
Ольга Федина
 
Возвраты платежей в Яндекс.Кассе
Возвраты платежей в Яндекс.КассеВозвраты платежей в Яндекс.Кассе
Возвраты платежей в Яндекс.Кассе
Яндекс.Деньги
 
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
elenae00
 
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
elenae00
 
Безопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
Безопасность платежей в интернете — Мария Грачёва, Яндекс.ДеньгиБезопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
Безопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
Яндекс.Деньги
 
Платежные решения для краудфандинга
Платежные решения для краудфандингаПлатежные решения для краудфандинга
Платежные решения для краудфандингаЯндекс.Деньги
 
Системы электронных платежей в России (исследование TNS)
Системы электронных платежей в России (исследование TNS)Системы электронных платежей в России (исследование TNS)
Системы электронных платежей в России (исследование TNS)Яндекс.Деньги
 
Сервисы электронных платежей в России (март-апрель 2014)
Сервисы электронных платежей в России (март-апрель 2014)Сервисы электронных платежей в России (март-апрель 2014)
Сервисы электронных платежей в России (март-апрель 2014)
Яндекс.Деньги
 
Умный платеж в Яндекс.Кассе
Умный платеж в Яндекс.КассеУмный платеж в Яндекс.Кассе
Умный платеж в Яндекс.Кассе
Яндекс.Деньги
 
Как эффективно принимать платежи в интернете
Как эффективно принимать платежи в интернетеКак эффективно принимать платежи в интернете
Как эффективно принимать платежи в интернете
Яндекс.Деньги
 
Как принимать Яндекс.Деньги — в том числе с банковских карт
Как принимать Яндекс.Деньги — в том числе с банковских картКак принимать Яндекс.Деньги — в том числе с банковских карт
Как принимать Яндекс.Деньги — в том числе с банковских карт
Яндекс.Деньги
 

Viewers also liked (16)

Татьяня Алексеева Yandex.Money
Татьяня Алексеева Yandex.MoneyТатьяня Алексеева Yandex.Money
Татьяня Алексеева Yandex.Money
 
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
СПИК 2009: С кем конкурируют электронные деньги (Яндекс.Деньги)
 
Кросс-маркетинг для финансовой организации
Кросс-маркетинг для финансовой организацииКросс-маркетинг для финансовой организации
Кросс-маркетинг для финансовой организации
 
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
05_Сивакова В._Яндекс.Деньги_Онлайн платежи. Что? Где? и Как?
 
Презентация с семинара «Формула сайта» от Яндекс, Александра Золотова
Презентация с семинара «Формула сайта» от Яндекс, Александра ЗолотоваПрезентация с семинара «Формула сайта» от Яндекс, Александра Золотова
Презентация с семинара «Формула сайта» от Яндекс, Александра Золотова
 
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги. Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
Умный банк в кармане. Евгений Малеев, Яндекс.Деньги.
 
Возвраты платежей в Яндекс.Кассе
Возвраты платежей в Яндекс.КассеВозвраты платежей в Яндекс.Кассе
Возвраты платежей в Яндекс.Кассе
 
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
Лидеры и аутсайдеры платежного рынка России. Данные исследования за 2 и 3 ква...
 
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
Эволюция клиентского опыта в fashion e-commerce: чего хотят потребители Инара...
 
Безопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
Безопасность платежей в интернете — Мария Грачёва, Яндекс.ДеньгиБезопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
Безопасность платежей в интернете — Мария Грачёва, Яндекс.Деньги
 
Платежные решения для краудфандинга
Платежные решения для краудфандингаПлатежные решения для краудфандинга
Платежные решения для краудфандинга
 
Системы электронных платежей в России (исследование TNS)
Системы электронных платежей в России (исследование TNS)Системы электронных платежей в России (исследование TNS)
Системы электронных платежей в России (исследование TNS)
 
Сервисы электронных платежей в России (март-апрель 2014)
Сервисы электронных платежей в России (март-апрель 2014)Сервисы электронных платежей в России (март-апрель 2014)
Сервисы электронных платежей в России (март-апрель 2014)
 
Умный платеж в Яндекс.Кассе
Умный платеж в Яндекс.КассеУмный платеж в Яндекс.Кассе
Умный платеж в Яндекс.Кассе
 
Как эффективно принимать платежи в интернете
Как эффективно принимать платежи в интернетеКак эффективно принимать платежи в интернете
Как эффективно принимать платежи в интернете
 
Как принимать Яндекс.Деньги — в том числе с банковских карт
Как принимать Яндекс.Деньги — в том числе с банковских картКак принимать Яндекс.Деньги — в том числе с банковских карт
Как принимать Яндекс.Деньги — в том числе с банковских карт
 

Similar to AntiFraudRussia2015.YM

AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
Alina Sobolevskaya
 
Использование Big Data, скоринговые модели и телематические концепции
Использование Big Data, скоринговые модели и телематические концепцииИспользование Big Data, скоринговые модели и телематические концепции
Использование Big Data, скоринговые модели и телематические концепции
Institute of development of the Internet
 
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
elenae00
 
Презентация Tibco spotfire
Презентация Tibco spotfireПрезентация Tibco spotfire
Презентация Tibco spotfire
Компания Ксема
 
Анализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентовАнализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентов
yaevents
 
Data analysis for customer profitability
Data analysis for customer profitabilityData analysis for customer profitability
Data analysis for customer profitabilityyaevents
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
CleverDATA
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platform
CleverDATA
 
Life cloud чарухин
Life cloud чарухинLife cloud чарухин
Life cloud чарухинstartuppoint
 
Life cloud
Life cloud Life cloud
Life cloud
startuptour
 
Printstatoverview 140505052848-phpapp01
Printstatoverview 140505052848-phpapp01Printstatoverview 140505052848-phpapp01
Printstatoverview 140505052848-phpapp01
nchetverikov
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решения
Dell_Russia
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_fors
CleverDATA
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentation
AlgoMost
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
Alina Sobolevskaya
 
Технологии для ивенторов, или Как снять головную боль при продаже билетов
Технологии для ивенторов, или Как снять головную боль при продаже билетовТехнологии для ивенторов, или Как снять головную боль при продаже билетов
Технологии для ивенторов, или Как снять головную боль при продаже билетов
TicketForEvent
 
Bezopasnost platejnyh terminalov
Bezopasnost platejnyh terminalovBezopasnost platejnyh terminalov
Bezopasnost platejnyh terminalov
E-Money News
 
Возможности интернет эквайринга Uniteller
Возможности интернет эквайринга Uniteller Возможности интернет эквайринга Uniteller
Возможности интернет эквайринга Uniteller
it-park
 
Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014
RTB-media RU
 
Бизнес-модель современной киберпреступности
Бизнес-модель современной киберпреступностиБизнес-модель современной киберпреступности
Бизнес-модель современной киберпреступности
Aleksey Lukatskiy
 

Similar to AntiFraudRussia2015.YM (20)

AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
Использование Big Data, скоринговые модели и телематические концепции
Использование Big Data, скоринговые модели и телематические концепцииИспользование Big Data, скоринговые модели и телематические концепции
Использование Big Data, скоринговые модели и телематические концепции
 
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
Предотвращение финансовых потерь от мошенничества в сфере электронных платеже...
 
Презентация Tibco spotfire
Презентация Tibco spotfireПрезентация Tibco spotfire
Презентация Tibco spotfire
 
Анализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентовАнализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентов
 
Data analysis for customer profitability
Data analysis for customer profitabilityData analysis for customer profitability
Data analysis for customer profitability
 
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
Customer experience profile&PredictiveMarketing_R.Styatugin_31032015
 
Digital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platformDigital Marketing Analytics on Splunk platform
Digital Marketing Analytics on Splunk platform
 
Life cloud чарухин
Life cloud чарухинLife cloud чарухин
Life cloud чарухин
 
Life cloud
Life cloud Life cloud
Life cloud
 
Printstatoverview 140505052848-phpapp01
Printstatoverview 140505052848-phpapp01Printstatoverview 140505052848-phpapp01
Printstatoverview 140505052848-phpapp01
 
Предиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решенияПредиктивная аналитика и Big Data: методы, инструменты, решения
Предиктивная аналитика и Big Data: методы, инструменты, решения
 
Clever data 1dmp_oracle_fors
Clever data 1dmp_oracle_forsClever data 1dmp_oracle_fors
Clever data 1dmp_oracle_fors
 
AlgoMost presentation
AlgoMost presentationAlgoMost presentation
AlgoMost presentation
 
AlgoMost: about
AlgoMost: aboutAlgoMost: about
AlgoMost: about
 
Технологии для ивенторов, или Как снять головную боль при продаже билетов
Технологии для ивенторов, или Как снять головную боль при продаже билетовТехнологии для ивенторов, или Как снять головную боль при продаже билетов
Технологии для ивенторов, или Как снять головную боль при продаже билетов
 
Bezopasnost platejnyh terminalov
Bezopasnost platejnyh terminalovBezopasnost platejnyh terminalov
Bezopasnost platejnyh terminalov
 
Возможности интернет эквайринга Uniteller
Возможности интернет эквайринга Uniteller Возможности интернет эквайринга Uniteller
Возможности интернет эквайринга Uniteller
 
Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014Перезентация с доклада на конференции MarketingOne2014
Перезентация с доклада на конференции MarketingOne2014
 
Бизнес-модель современной киберпреступности
Бизнес-модель современной киберпреступностиБизнес-модель современной киберпреступности
Бизнес-модель современной киберпреступности
 

AntiFraudRussia2015.YM

  • 1.
  • 2. На шаг впереди Data science и машинное обучение как будущее антифрод-систем Конференция «AntiFraud Russia 2015», 3 декабря 2015 Владимир Михнович, фрод-аналитик компании «Яндекс.Деньги»
  • 3. «AntiFraud Russia 2015», 3 декабря 2015 Финансовые транзакции в цифровом мире Российские банки потеряли в 2015 году из-за карточного мошенничества C начала 2015 года по картам Visa и MasterCard в мире проведено операций рублей
  • 4. «AntiFraud Russia 2015», 3 декабря 2015 Эквайринг в оффлайновых магазинах покупатель магазин МПС банк-эмитент банк-эквайер Запрос авторизации Ответ эмитента выпуск карт
  • 5. «AntiFraud Russia 2015», 3 декабря 2015 Интернет-эквайринг МПС банк-эквайер Запрос авторизации Ответ эмитента покупатель онлайн-магазин платёжный агрегатор антифрод- система банк-эмитент выпуск карт
  • 6. «AntiFraud Russia 2015», 3 декабря 2015 Data Science: классы задач
  • 7. «AntiFraud Russia 2015», 3 декабря 2015 Data Science: практика применения • Математические и статистические методы и алгоритмы машинного обучения • Экспертиза в предметной области • Конечная цель – не аналитика ради аналитики, а извлечение прибыли из данных
  • 8. «AntiFraud Russia 2015», 3 декабря 2015 Data Science и антифрод-системы Data Science в области антифрода – применение математических моделей и алгоритмов машинного обучения для анализа и обнаружения мошеннических транзакций и фрода (на основе уже известных данных) и аномалий платёжного поведения пользователей.
  • 9. «AntiFraud Russia 2015», 3 декабря 2015 Промышленные антифрод-решения
  • 10. «AntiFraud Russia 2015», 3 декабря 2015 Наши инструменты Code Effects business rules engine (BRE)
  • 11. «AntiFraud Russia 2015», 3 декабря 2015 Экосистема RapidMiner Studio + Server RapidMiner Studio: аналитика и моделирование RapidMiner Server: деплоймент и веб-сервисы
  • 12. «AntiFraud Russia 2015», 3 декабря 2015 Повернёмся лицом к бизнесу Merchant oriented antifraud: парадигма использования бизнес-специфических данных и создание моделей под конкретный бизнес / мерчанта / категорию. • Дата и время платежа • Сумма платежа • Банк-эмитент • Страна эмитента • География пользователя • Число дней до рейса • Наличие детей в билете • Наличие страховки • Наличие регистрации • Возраст игрового аккаунта • История его покупок • Величина «среднего чека» игры • …
  • 13. «AntiFraud Russia 2015», 3 декабря 2015 Классифицируй это Основные используемые алгоритмы машинного обучения (supervised): • Логистическая регрессия • Байесовские классификаторы • Деревья и леса решений (random forest) • Нейронные сети • Выбор и генерация атрибутов: 15-20 основных атрибутов, включая созданные (например, на основе направления платежа, географии пользователя и эмитента, платёжной истории и т.д.)
  • 14. «AntiFraud Russia 2015», 3 декабря 2015 Зачем придумывать что-то новое? Машинное обучение не отменяет антифрода на основе правил (rule-based system), а дополняет его Компромисс между подходами: что быстрее и эффективнее? • время на обучение модели на новых данных или • время на создание / адаптацию правил под новые паттерны
  • 15. «AntiFraud Russia 2015», 3 декабря 2015 Архитектурное решение Система правил Модели машинного обучения Скоринг транзакции Резолюция по транзакции Платёжная история Важный показатель SLA: время ответа антифрод-системы в целом • Получаем резолюцию по транзакции от системы правил + модели • Сохраняем ответ модели для аналитики будущих транзакций • Уведомление мёрчанта (передаём скоринг транзакции)
  • 16. «AntiFraud Russia 2015», 3 декабря 2015 Проблема интерпретации • Иногда (но не всегда!) модель это «чёрный ящик» и интерпретировать её решение может только аналитик, но не пользователь • Модели машинного обучения выдают не только ответ, но и вероятность (confidence) 89% 93% 99%
  • 17. «AntiFraud Russia 2015», 3 декабря 2015 Цену ошибки диктует бизнес Пропустить все хорошие платежи Заблокировать весь фрод Компромисс между «заблокировать весь фрод» и «пропустить все хорошие платежи» = цена ошибки. Она диктуется бизнес- моделью и всегда различна. Использование threshold (порога срабатывания) в зависимости от типа модели позволяет минимизировать те ошибки, которые обходятся дороже. threshold
  • 18. «AntiFraud Russia 2015», 3 декабря 2015 Иллюстрация порога срабатывания Threshold = 0,7Threshold = 0,97 Threshold = 0,1
  • 19. «AntiFraud Russia 2015», 3 декабря 2015 Измеряем эффективность Десятки метрик, что выбрать?..
  • 20. «AntiFraud Russia 2015», 3 декабря 2015 Измеряем эффективность Метрики эффективности моделей выбраны с учётом тех параметров, которые важно оптимизировать с точки зрения бизнес-модели. • False positive rate ~ 4% ложноположительное срабатывание: посчитали легитимную транзакцию фродом • False negative rate ~ 8% ложноотрицательное срабатывание: пропустили фродовую транзакцию
  • 21. «AntiFraud Russia 2015», 3 декабря 2015 Что ждёт в будущем? • Автоматический выбор атрибутов транзакций для моделирования • Автоматическая генерация правил на основе классификационных моделей • Чем больше данных – тем более «самостоятельны» алгоритмы машинного обучения: сдвиг в сторону unsupervised learning • Дальнейшее проникновение парадигмы Digital Identity во все онлайновые действия пользователей
  • 22. «AntiFraud Russia 2015», 3 декабря 2015 Резюмируя • Data Science: аналитика данных не ради аналитики, а извлечение прибыли из данных • Мы используем простые модели, но хорошо адаптированные под специфику конкретной категории или мёрчанта • Машинное обучение не заменяет правила и не отменяет мозга аналитиков • Цену ошибок классификации всегда диктует бизнес «Фрод не пройдёт»
  • 23. Спасибо! Конференция «AntiFraud Russia 2015», 3 декабря 2015 Владимир Михнович, фрод-аналитик компании «Яндекс.Деньги» mikhnovich@yamoney.ru kypexin