SlideShare a Scribd company logo
1 of 28
Deductor Credit
Scorecard Modeler
Построение скоринговой системы делится на две
подзадачи:
Deductor Credit Scorecard Modeler решает задачу
построения карт.
Задачи скоринга
Построение
скоринговых карт
Встраивание карты в
бизнес-процесс
Подготовка скоринговой
выборки
Анализ жизненных
циклов счетов
Сэмплинг
Двумерный анализ –
конечные классы
(одобренные)
Моделирование
(предварительная карта)
Добавление в выборку
отказов (Reject Inference)
Перестройка карт с
учетом отказов
(окончательная карта)
Сравнение качества карт,
выбор оптимальной,
назначение балла
отсечения
Тестовая эксплуатация и
мониторинг
Разработка скоринговой карты
 Предочищенные
выборки
 Просрочки
 Флаги счетов
Подготовка скоринговой выборки
Настроенная
структура
витрины данных
Анализ счетов: винтажи
Винтажный анализ –
расчет накопительной
суммы потерь поколений
счетов
Анализ счетов: матрица миграции
55% счетов, попавших в
1-й год в 60+, не
улучшат свой статус
Undersampling:
балансировка
плохих/хороших
счетов
Разбиение на
множества
Исходная выборка
Все данные –
100%
Рабочее –
70%
Плохие –
100%
Хорошие –
40%
Тестовое –
30%
Без изменений
Сэмплинг
Скоринговая карта строится на категориальных
атрибутах –необходимо квантование.
Конечные классы – механизм поиска
компромисса между:
 Точностью
 Интерпретируемостью
 Значимостью
Конечные классы
Конечные классы: настройка
Выбор лучшего
варианта
квантования
Конечные классы: WoE
Weight of Evidence –
оценка
предсказательной
силы атрибута
Конечные классы: IV
Information Value –
выбор значимых
атрибутов для
построения
скоринговой карты
Моделирование: карта
Баллы
скоринговой
карты
Калибровка – преобразование модели
логистической регрессии в скоринговую
карту:
 Масштабирование – перевод коэффициентов в
баллы (по умолчанию в стандарт FICO);
 Сдвиг и внесение поправки на априорные
вероятности.
Моделирование: калибровка
Reject Inference (анализ отклоненных заявок) –
процедура включения в данные для построения
скоринговой модели отклоненных заявок с целью
смещения результата.
Опциональный этап, в некоторых случаях может
улучшить качество скоринговой карты.
Рекомендуется при большом числе отказов в
истории заявок.
Reject Inference
Скоринговый балл для отказанных заявок с
использованием предварительной карты
Определение статуса счета методами Reject
Inference: Hard Cut-Off, Random Parceling
Пополнение скоринговой выборки отказами
Повторное моделирование
Перекалибровка скоринговой карты
Reject Inference: моделирование
Оценка качества карты
Gini = B / (A + B)
Индекс Джини –
интегральная
характеристика,
позволяющая судить
о прогностической
силе скоринговой
карты
Качество карты: индекс GINI
Портфель, упорядоченный по баллу карты
Плохие Хорошие
Доляотвсех
плохих
Плохие Хорошие
Случайное
угадывание
B - скоринговая
карта
A – идеальная
модель
0
10
20
30
40
50
60
70
80
90
100
300 350 400 450 500 550 600 650 700 750 800 850 900
Плохие %, кумулятивный Хорошие %, кумулятивный
Качество карты: Статистика K-S
Статистика Колмогорова-
Смирнова – максимальное
расстояние между
функциями распределения
хороших и плохих
Выбор порогового балла
3 базовых
способа расчета
порогового
балла
Перед внедрением скоринговой карты нужно
убедиться, что текущий поток клиентов
соответствует клиентам, на которых производилось
моделирование.
Отсутствие сдвига в совокупностях нужно
проверять на регулярной основе и после внедрения
скоринговой карты в процессы принятия решений.
Тестирование и мониторинг
Тестирование и мониторинг
Индекс сдвига
популяции – PSI Index
Выдача
кредитов
Скоринг
Заявки
Мониторинг,
перекалибровка и
возможность «горячей»
замены карт.
Интеграция в кредитный
конвейер не входит в
состав данного решения.
Тестирование и мониторинг
Учебники, руководства
Базовое дистанционное
обучение, 1-2 месяца
Очный тренинг –
теория и практика
скоринга, 4 дня
Обучение риск-аналитиков
Deductor Credit Scorecard Modeler
позволяет:
 в 5-6 раз сократить трудозатраты
аналитиков
 обосновать корректность каждого этапа
построения карты
 адаптировать без программирования, в
том числе методами Data Mining
Ключевые преимущества
Базель II предоставляет банкам возможность
использовать внутренние рейтинги при расчете
достаточности капитала для покрытия кредитных
рисков.
Кредитный скоринг позволяет рассчитать:
 вероятность дефолта контрагента (PD)
 Ожидаемые (EL) и неожидаемые (UL) потери
 Количественное выражение рисков
Подготовка к Базелю II
Решение позволяет выполнить минимальные
требования Базель II в части кредитных
рисков:
 Скоринговый балл – количественная оценка
риска заемщика и транзакции
 Обоснование рейтинговых критериев на базе
статистики кредитов
 Регулярный пересмотр и корректировка
рейтингов
Требования Базель II
 Потребительский кредит
 Кредитные карты
 Ипотека
 Автокредит
 Микрозаймы
Deductor в банках
basegroup.ru

More Related Content

What's hot

Вводный курс по онлайн-платежам от PayOnline
Вводный курс по онлайн-платежам от PayOnline Вводный курс по онлайн-платежам от PayOnline
Вводный курс по онлайн-платежам от PayOnline PayOnline
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореIT Group
 
Deductor 5 - аналитическая платформа
Deductor 5 - аналитическая платформаDeductor 5 - аналитическая платформа
Deductor 5 - аналитическая платформаLoginom
 
IBA: Кредитный скоринг
IBA: Кредитный скорингIBA: Кредитный скоринг
IBA: Кредитный скорингExpolink
 
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...Ontico
 
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...Ontico
 
Простой способ описать сложный мир: моделирование предметной области в UX
Простой способ описать сложный мир: моделирование предметной области в UXПростой способ описать сложный мир: моделирование предметной области в UX
Простой способ описать сложный мир: моделирование предметной области в UXPavel Manakhov
 
Информация для роста: особенности проверок контрагентов из КНР
Информация для роста: особенности проверок контрагентов из КНРИнформация для роста: особенности проверок контрагентов из КНР
Информация для роста: особенности проверок контрагентов из КНРOlga Rink
 

What's hot (11)

Вводный курс по онлайн-платежам от PayOnline
Вводный курс по онлайн-платежам от PayOnline Вводный курс по онлайн-платежам от PayOnline
Вводный курс по онлайн-платежам от PayOnline
 
M&a
M&aM&a
M&a
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом секторе
 
#Corpriskforum2016 - Pavel Tikhomirov
#Corpriskforum2016 - Pavel Tikhomirov#Corpriskforum2016 - Pavel Tikhomirov
#Corpriskforum2016 - Pavel Tikhomirov
 
Deductor 5 - аналитическая платформа
Deductor 5 - аналитическая платформаDeductor 5 - аналитическая платформа
Deductor 5 - аналитическая платформа
 
Презентация Павла Гурина, Почта Банк
Презентация Павла Гурина, Почта БанкПрезентация Павла Гурина, Почта Банк
Презентация Павла Гурина, Почта Банк
 
IBA: Кредитный скоринг
IBA: Кредитный скорингIBA: Кредитный скоринг
IBA: Кредитный скоринг
 
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...
Поиск признаков мошенничества в убытках по медицинскому страхованию / Василий...
 
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...
Cкоринговые модели нового типа: анализируем действия клиента / Максим Савченк...
 
Простой способ описать сложный мир: моделирование предметной области в UX
Простой способ описать сложный мир: моделирование предметной области в UXПростой способ описать сложный мир: моделирование предметной области в UX
Простой способ описать сложный мир: моделирование предметной области в UX
 
Информация для роста: особенности проверок контрагентов из КНР
Информация для роста: особенности проверок контрагентов из КНРИнформация для роста: особенности проверок контрагентов из КНР
Информация для роста: особенности проверок контрагентов из КНР
 

Viewers also liked

PrimoKnowledge #1\2013
PrimoKnowledge #1\2013PrimoKnowledge #1\2013
PrimoKnowledge #1\2013PrimoCollect
 
u2 Gerey IFRS reporting systems CS 2013 experience
u2 Gerey IFRS reporting systems CS 2013 experienceu2 Gerey IFRS reporting systems CS 2013 experience
u2 Gerey IFRS reporting systems CS 2013 experienceYuriy Yurchenko
 
Первый шаг аналитики - Cбор данных о клиентах
Первый шаг аналитики - Cбор данных о клиентахПервый шаг аналитики - Cбор данных о клиентах
Первый шаг аналитики - Cбор данных о клиентахLoginom
 
Маркетинг банковских продуктов и услуг
Маркетинг банковских продуктов и услугМаркетинг банковских продуктов и услуг
Маркетинг банковских продуктов и услугLoginom
 
Deductor Demand Planning
Deductor Demand PlanningDeductor Demand Planning
Deductor Demand PlanningLoginom
 
Повышение лояльности клиентов
Повышение лояльности клиентовПовышение лояльности клиентов
Повышение лояльности клиентовLoginom
 
Бизнес-ценность клиентской аналитики
Бизнес-ценность клиентской аналитикиБизнес-ценность клиентской аналитики
Бизнес-ценность клиентской аналитикиLoginom
 
Deductor 5.3 - новые возможности
Deductor 5.3 - новые возможностиDeductor 5.3 - новые возможности
Deductor 5.3 - новые возможностиLoginom
 
Клиентская аналитика - методы принятия решений
Клиентская аналитика  - методы принятия решенийКлиентская аналитика  - методы принятия решений
Клиентская аналитика - методы принятия решенийLoginom
 
Antivirus software
Antivirus softwareAntivirus software
Antivirus softwarekhalid umer
 

Viewers also liked (11)

PrimoKnowledge #1\2013
PrimoKnowledge #1\2013PrimoKnowledge #1\2013
PrimoKnowledge #1\2013
 
RISK MANAGEMENT U2
RISK MANAGEMENT U2RISK MANAGEMENT U2
RISK MANAGEMENT U2
 
u2 Gerey IFRS reporting systems CS 2013 experience
u2 Gerey IFRS reporting systems CS 2013 experienceu2 Gerey IFRS reporting systems CS 2013 experience
u2 Gerey IFRS reporting systems CS 2013 experience
 
Первый шаг аналитики - Cбор данных о клиентах
Первый шаг аналитики - Cбор данных о клиентахПервый шаг аналитики - Cбор данных о клиентах
Первый шаг аналитики - Cбор данных о клиентах
 
Маркетинг банковских продуктов и услуг
Маркетинг банковских продуктов и услугМаркетинг банковских продуктов и услуг
Маркетинг банковских продуктов и услуг
 
Deductor Demand Planning
Deductor Demand PlanningDeductor Demand Planning
Deductor Demand Planning
 
Повышение лояльности клиентов
Повышение лояльности клиентовПовышение лояльности клиентов
Повышение лояльности клиентов
 
Бизнес-ценность клиентской аналитики
Бизнес-ценность клиентской аналитикиБизнес-ценность клиентской аналитики
Бизнес-ценность клиентской аналитики
 
Deductor 5.3 - новые возможности
Deductor 5.3 - новые возможностиDeductor 5.3 - новые возможности
Deductor 5.3 - новые возможности
 
Клиентская аналитика - методы принятия решений
Клиентская аналитика  - методы принятия решенийКлиентская аналитика  - методы принятия решений
Клиентская аналитика - методы принятия решений
 
Antivirus software
Antivirus softwareAntivirus software
Antivirus software
 

Similar to Deductor Credit Scorecard Modeler

Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентам
Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентамВладимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентам
Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентамБанковское обозрение
 
2013 Разработка программно-математического комплекса поддержки скоринга востр...
2013 Разработка программно-математического комплекса поддержки скоринга востр...2013 Разработка программно-математического комплекса поддержки скоринга востр...
2013 Разработка программно-математического комплекса поддержки скоринга востр...RF-Lab
 
Маркетинг на основе данных НБКИ
Маркетинг на основе данных НБКИМаркетинг на основе данных НБКИ
Маркетинг на основе данных НБКИFIN people group
 
Анализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентовАнализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентовyaevents
 
Data analysis for customer profitability
Data analysis for customer profitabilityData analysis for customer profitability
Data analysis for customer profitabilityyaevents
 
2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базыBankir_Ru
 
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...Банковское обозрение
 

Similar to Deductor Credit Scorecard Modeler (7)

Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентам
Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентамВладимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентам
Владимир Шикин, НБКИ: Эволюция систем таргетированного предложения клиентам
 
2013 Разработка программно-математического комплекса поддержки скоринга востр...
2013 Разработка программно-математического комплекса поддержки скоринга востр...2013 Разработка программно-математического комплекса поддержки скоринга востр...
2013 Разработка программно-математического комплекса поддержки скоринга востр...
 
Маркетинг на основе данных НБКИ
Маркетинг на основе данных НБКИМаркетинг на основе данных НБКИ
Маркетинг на основе данных НБКИ
 
Анализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентовАнализ данных для повышения доходности и лояльности клиентов
Анализ данных для повышения доходности и лояльности клиентов
 
Data analysis for customer profitability
Data analysis for customer profitabilityData analysis for customer profitability
Data analysis for customer profitability
 
2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы
 
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
Презентация Владимира Шикина с конференции «BIG DATA: банки, финансовые компа...
 

Deductor Credit Scorecard Modeler

  • 2. Построение скоринговой системы делится на две подзадачи: Deductor Credit Scorecard Modeler решает задачу построения карт. Задачи скоринга Построение скоринговых карт Встраивание карты в бизнес-процесс
  • 3. Подготовка скоринговой выборки Анализ жизненных циклов счетов Сэмплинг Двумерный анализ – конечные классы (одобренные) Моделирование (предварительная карта) Добавление в выборку отказов (Reject Inference) Перестройка карт с учетом отказов (окончательная карта) Сравнение качества карт, выбор оптимальной, назначение балла отсечения Тестовая эксплуатация и мониторинг Разработка скоринговой карты
  • 4.  Предочищенные выборки  Просрочки  Флаги счетов Подготовка скоринговой выборки Настроенная структура витрины данных
  • 5. Анализ счетов: винтажи Винтажный анализ – расчет накопительной суммы потерь поколений счетов
  • 6. Анализ счетов: матрица миграции 55% счетов, попавших в 1-й год в 60+, не улучшат свой статус
  • 7. Undersampling: балансировка плохих/хороших счетов Разбиение на множества Исходная выборка Все данные – 100% Рабочее – 70% Плохие – 100% Хорошие – 40% Тестовое – 30% Без изменений Сэмплинг
  • 8. Скоринговая карта строится на категориальных атрибутах –необходимо квантование. Конечные классы – механизм поиска компромисса между:  Точностью  Интерпретируемостью  Значимостью Конечные классы
  • 9. Конечные классы: настройка Выбор лучшего варианта квантования
  • 10. Конечные классы: WoE Weight of Evidence – оценка предсказательной силы атрибута
  • 11. Конечные классы: IV Information Value – выбор значимых атрибутов для построения скоринговой карты
  • 13. Калибровка – преобразование модели логистической регрессии в скоринговую карту:  Масштабирование – перевод коэффициентов в баллы (по умолчанию в стандарт FICO);  Сдвиг и внесение поправки на априорные вероятности. Моделирование: калибровка
  • 14. Reject Inference (анализ отклоненных заявок) – процедура включения в данные для построения скоринговой модели отклоненных заявок с целью смещения результата. Опциональный этап, в некоторых случаях может улучшить качество скоринговой карты. Рекомендуется при большом числе отказов в истории заявок. Reject Inference
  • 15. Скоринговый балл для отказанных заявок с использованием предварительной карты Определение статуса счета методами Reject Inference: Hard Cut-Off, Random Parceling Пополнение скоринговой выборки отказами Повторное моделирование Перекалибровка скоринговой карты Reject Inference: моделирование
  • 17. Gini = B / (A + B) Индекс Джини – интегральная характеристика, позволяющая судить о прогностической силе скоринговой карты Качество карты: индекс GINI Портфель, упорядоченный по баллу карты Плохие Хорошие Доляотвсех плохих Плохие Хорошие Случайное угадывание B - скоринговая карта A – идеальная модель
  • 18. 0 10 20 30 40 50 60 70 80 90 100 300 350 400 450 500 550 600 650 700 750 800 850 900 Плохие %, кумулятивный Хорошие %, кумулятивный Качество карты: Статистика K-S Статистика Колмогорова- Смирнова – максимальное расстояние между функциями распределения хороших и плохих
  • 19. Выбор порогового балла 3 базовых способа расчета порогового балла
  • 20. Перед внедрением скоринговой карты нужно убедиться, что текущий поток клиентов соответствует клиентам, на которых производилось моделирование. Отсутствие сдвига в совокупностях нужно проверять на регулярной основе и после внедрения скоринговой карты в процессы принятия решений. Тестирование и мониторинг
  • 21. Тестирование и мониторинг Индекс сдвига популяции – PSI Index
  • 22. Выдача кредитов Скоринг Заявки Мониторинг, перекалибровка и возможность «горячей» замены карт. Интеграция в кредитный конвейер не входит в состав данного решения. Тестирование и мониторинг
  • 23. Учебники, руководства Базовое дистанционное обучение, 1-2 месяца Очный тренинг – теория и практика скоринга, 4 дня Обучение риск-аналитиков
  • 24. Deductor Credit Scorecard Modeler позволяет:  в 5-6 раз сократить трудозатраты аналитиков  обосновать корректность каждого этапа построения карты  адаптировать без программирования, в том числе методами Data Mining Ключевые преимущества
  • 25. Базель II предоставляет банкам возможность использовать внутренние рейтинги при расчете достаточности капитала для покрытия кредитных рисков. Кредитный скоринг позволяет рассчитать:  вероятность дефолта контрагента (PD)  Ожидаемые (EL) и неожидаемые (UL) потери  Количественное выражение рисков Подготовка к Базелю II
  • 26. Решение позволяет выполнить минимальные требования Базель II в части кредитных рисков:  Скоринговый балл – количественная оценка риска заемщика и транзакции  Обоснование рейтинговых критериев на базе статистики кредитов  Регулярный пересмотр и корректировка рейтингов Требования Базель II
  • 27.  Потребительский кредит  Кредитные карты  Ипотека  Автокредит  Микрозаймы Deductor в банках

Editor's Notes

  1. Потребность в скоринге на финансовых рынках вызвана двумя важными факторами: Конкуренция среди банков требует повышения скорости принятия решений о выдаче кредита при сохранении приемлемого уровня рисков. Для удовлетворения требований регуляторов необходима формализованная система управления банковскими рисками. Разработка и поддержка скоринговых карт – трудоемкая задача, требующая применения специализированных инструментов, позволяющих автоматизировать рутинные процедуры риск-аналитика: от анализа портфеля до мониторинга скоринговых карт. Применение подручных средств для разработки скоринговых карт приводит к появлению «зоопарка» IT-систем. Недостатки подобного подхода очевидны: Отсутствие единого источника данных Кодирование формул в разных системах Разрозненная отчетность Ручной ввод данных Отсутствие версионности моделей
  2. Специализированное хранилище данных предназначено для автоматизации всего цикла построения скоринговой карты и не заменяет централизованное банковское хранилище, а служит дополнением аналитику для решения конкретной задачи. Кроме того, загрузка данных в нужной форме позволит с минимальными затратами времени пройти весь цикл разработки карты с использованием уже преднастроенных сценариев. Портфель кредитов - группа счетов за определенный временной период, чаще по какому-либо кредитному продукту. В хранилища данных на первом шаге загружаются данные в процесс Выборки и Качество обслуживания долга. Все дальнейшие процессы будут заполняться в ходе движения по циклу разработки скоринговой карты.
  3. Винтажный анализ (Vintage analysis) – исследование счетов по поколениям: кредитный портфель разбивается по дате выдачи на поколения кредитов, а затем рассчитывается накопительная сумма потерь отдельных поколений счетов. Строится винтажная матрица. Таким образом, получается иллюстрация поведения рисков по кредитам нескольких поколений в один и тот же период жизненного цикла. В скоринге винтажный анализ применяется с целью определения периода, после которого состояние задолженности не улучшается (размер «окна наблюдения», perfomance window). В нашем случае это 1 год. Для разных кредитных продуктов размер окна различный. Например, в ипотеке размер окна как правило 3 года. Винтажный анализ проводится для конкретного определения дефолтного счета (в примере взят 60+, т.е. наличие просрочки свыше 60 дней).
  4. Метод миграции просрочек заключается в том, что все кредиты портфеля делятся на несколько корзин в зависимости от длительности просрочки по кредиту. Так, в первую корзину могут быть включены кредиты, не имевшие просрочки; во вторую — кредиты с просрочкой от 1 до 30 дней; в третью — от 31 до 60 и т.д. Последней является корзина дефолтных кредитов. Процедура разбиения портфеля на корзины выполняется регулярно, с периодичностью, зависящей от шага разбиения; в нашем примере периодичность составляет 1 год. Уже по результатам двух разбиений можно оценить вероятность перехода кредитов между двумя смежными корзинами. Кредиты заданной корзины в течение месяца либо переходят в смежную корзину (например, из «31–60» в «61–90»), либо остаются в исходной корзине.
  5. На этапе разбиения как правило, от 50% до 80% счетов попадают в рабочее множество – именно на этих счетах будет строиться (т.е. формироваться баллы) скоринговая карта. На остальном множестве – тестовом – будет впоследствии оцениваться качество скоринговой карты. Уравновешивание классов плохих и хороших необходимо для лучшей работы алгоритма расчета весов для будущей скоринговой модели. Если распределение классов сильно несбалансированное (например, доля плохих 5-7%), то высока вероятность получить статистически не значимую скоринговую карту. Это обходится путем отбором со смещением: случайно удаляется часть хороших счетов. Чаще всего соотношение плохих к хорошим делают от 1:1 до 1:4. Однако на тестовом множестве уравновешивание плохих и хороших счетов не проводится. Их соотношение должно быть максимально приближено к реальному уровню просрочки кредитного портфеля, так как именно в таких условиях будет применяться скоринговая карта на новых аппликантах.
  6. Значения WoE близкое к 0 говорит о том, что ничего определенного о величине риска в отношении данного атрибута сказать нельзя.
  7. Любой стандарт скоринговой карты определяется 3-мя показателями: PDO – сколько баллов удваивают шансы стать хорошим заемщиком, и в какой точке достигается заданное отношение шансов хороших к плохим. Для FICO параметр PDO равен 40, а в точке 660 баллов отношение шансов должно быть 72:1. Данные показатели всегда приводятся в документации к скоринговой карте, если она приобретается у третьей стороны. Таким образом, можно всегда отмасштабировать свою карту так, чтобы ее можно было сравнивать с другой, внешней. Поправка на априорные вероятности нужна, потому что на рабочем множестве мы делали уравновешивание классов (undersampling), а применяться карта будет в среде с другим распределением плохих и хороших. Доказано, что для внесения поправки достаточно изменить смещение скоринговой карты (это константа, с которой «стартует» любой аппликант при скоринге), а сами баллы атрибутов остаются без изменений. В приведенном примере скорректированная константа равна 127.
  8. KGB – Known Good Bad – выборка, состоящая из зрелых кредитов на основе одобренных заявок. AGB – All Good Bad – вся выборка, дополненная отклоненными заявками, статус которых проставлен с помощью какого-либо метода Reject Inference. В методе Random Parceling все отклоненные счета квантуются по полю «Скоринговый балл». Далее в каждом квантиле N% счетов помечаются как «плохие», остальные – «хорошие». N – это доля плохих счетов в тестовой выборке. В методе Hard Cutt-Off делается тоже самое, но без квантования. Как бы этот метод более «грубый».
  9. Это стандартные методики, для работы которых важен только порядок, в котором модель выстроила счета, и знание метки плохой/хороший для каждого из них. Принципы расчета Gini и K-S схожи: очередь заемщиков перебирается, начиная от самых плохих до самых хороших, при этом на каждом шаге вычисляются: Доля Ag хороших заемщиков, оказавшихся в очереди хуже данного, среди всех хороших; Доля Ab плохих заемщиков, оказавшихся в очереди хуже данного, среди всех плохих. Статистика K-S является максимальной разницей Ab-Ag по всем точкам очереди. Gini = 2*AUC-1, где AUC – площадь под ROC-кривой. Чем больше Gini и KS, тем лучше прогностическая сила скоринговой карты.
  10. Это отраслевая метрика, для работы которой важен только порядок, в котором модель выстроила счета, и знание метки плохой/хороший для каждого из них. Очередь заемщиков перебирается, начиная от самых плохих до самых хороших, при этом на каждом шаге вычисляются: Доля Ag хороших заемщиков, оказавшихся в очереди хуже данного, среди всех хороших; Доля Ab плохих заемщиков, оказавшихся в очереди хуже данного, среди всех плохих. Gini = B / (A + B) = 2*AUC-1, где AUC – площадь под ROC-кривой. Чем больше Gini, тем лучше прогностическая сила скоринговой карты. Для анкетного скоринга Gini < 25% считается неудовлетворительным показателем. Считается, что без привлечения информации из БКИ трудно построить скоринговые карты с Gini > 45%.
  11. Статистика Колмогорова-Смирнова является локальной мерой, в отличие от интегрального показателя Gini. Статистика K-S является максимальной разницей Ab-Ag по всем точкам очереди. Чем больше KS, тем лучше прогностическая сила скоринговой карты. Скоринговую карту можно считать хорошей при K-S > 30-40%.
  12. Расчет порогового балла – задача, не имеющая прямого отношения к построению скоринговой карте. Она делается, когда необходимо принимать решения по заявкам на базе скоринговых карт. Ее решение зависит от многих факторов, как то: стратегия, которую преследует банк, маржинальные показатели розничного кредитного бизнеса и так далее. В конфигурацию по умолчанию включены три базовых способа расчета пороговых баллов. Только один из них – «Требуемое соотношение хороших и плохих счетов» не требует моделирования отказов.
  13. Таким образом, после построения карты нужно сделать предмониторинг – провести оценку сдвига совокупности на самых последних заявках, включая отказы, и неважно, что по ним нет или еще мало платежей – нас интересует, чтобы поток существенным образом не отличался по распределению своих характеристик (возраст, пол и т.д.). Корректно оценить сдвиги в совокупностях выборок позволяет специальный набор отчетов. Важно: для проведения мониторинга требуется доступ к базе данных с заявками.
  14. Рассчитывается Индекс сдвига популяции – PSI Index. Дополнительно, анализируются причины сдвигов – какие характеристики и атрибуты скоринговой карты внесли наибольший вклад в сдвиг.