SlideShare a Scribd company logo
1 of 20
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ПРИБОРОСТРОЕНИЯ И ИНФОРМАТИКИ
Кафедра ИТ6 «Управление и моделирование систем»
ДИПЛОМНЫЙ ПРОЕКТ
на тему

«Разработка программно-математического комплекса
поддержки скоринга востребования»

Выполнил:
Руководитель:

Царьков Юрий Александрович
Мельников Алексей Олегович

Москва, 2013
Скоринг
(от англ.
score - счет)
Кредитный

система оценки заемщика, основанная на
численных статистических методах
оценка кредитоспособности заемщика при
выдаче кредита

Мошенничеств
а

оценка вероятности мошеннических действий
со стороны потенциального заемщика

Поведенческий

анализ кредитной истории с целью изменения
стратегии взаимодействия с заемщиком

Востребования

анализ информации о заемщике с целью
возврата просроченного платежа
Прекратить
взыскание
Продолжить
прежним методом

Установка
контакта с
должником

Анализ
результатов

Принятие
стратегическог
о решения

Изменить метод
взыскания
Списать
задолженность

2
Разработка программно-математического комплекса,
выполняющего кластеризацию новых
задолженностей,
основываясь на статистической
информации о ранее
осуществленных контактах с
должниками

Задачи:
1

• изучение существующих программных средств и математических
методов скоринга

2

• выбор математического метода для использования в дипломном
проекте

3

• разработка алгоритмов для реализации выбранного метода

4

• описание структуры программного комплекса и написание
программного кода, реализующего разработанные алгоритмы

5

• анализ опасных для пользователя ПЭВМ факторов и разработка
комплекса мероприятий по обеспечению безопасности эксплуатации
ПЭВМ

6

• расчет экономической эффективности от реализации проекта

3
Разработать эффективный механизм
кластеризации вновь поступивших задолженностей,
основывающийся на информации, полученной в ходе
работы по возврату других задолженностей, в
результате работы которого, каждый долг можно было
отнести к одной из двух групп – «плохие» или
Критерий качества
«хорошие»
задолженностей
«плохие»
задолженности работа по
взысканию признана
неуспешной

«хорошие»
задолженности работа по
взысканию признана
успешной

Да

«Хороший»

Нет

«Плохой»

4
линейная регрессия
логистическая регрессия
метод ближайших соседей
линейное
программирование
генетические алгоритмы

Математические
методы скоринга

нейронные сети
деревья решений

байесовский подход

Таблица 1 – Сравнение точности классификации различных методов*, %
Линейная
регрессия

Логистическ
ая регрессия

Метод
ближайш
их
соседей

[43,4 – 87,5]
68,66

[43,3 – 89,3]
66,63

[43,8 –
93,2]
68,32

Линейное
программ
ирование

Нейронны
е сети

[74,7 –
86,1]
80,4

[62 - 64]
63

Генетическ
ий
алгоритм

Деревья
решений

64,5

[78,5 –
92,1]
83,88

* Значения точности классификации для всех методов получены путем вычисления среднего
арифметического результатов тестов, приведенных в таблице 1 пояснительной записки
дипломного проекта.

5
IBM SPSS, пакет
Clementine

Scorto Ample
Collection, пакет
Loan Decision

SAS, пакет
Enterprise Miner

Ksema TERN Group,
пакет KXEN Analytic
Framework

Таблица 2 – Сравнительная характеристика программных продуктов в области ско

Продукт

Scorto
IBM SPSS

SAS

KSEN

Возможность
Построен
интеграции
ие
со
стратеги
сторонними
й
АС
есть
нет

нет

есть

есть
нет

нет

есть

Наличие
АРМ

Используемые
алгоритмы обработки
данных

Стоимость
(минималь
ная
стоимость
пакета,
руб.)

есть

лог. регрессия, деревья
решений

65 000

есть

лог. регрессия, деревья
решений, нейронные
сети

82 000

нет

лог. регрессия, деревья
решений, нейронные
сети

600 000

нет

лог. регрессия, деревья
решений, нейронные
сети, сети Байеса

2 700 000

6
I >> 1

Коллектор

Коллектор
Контакт I

Результат
контакта
(наблюдение)

Результат
контакта
(наблюдение)

БД

Контакт 1

Должник

Должник

t

I>1

Должник

t

7
Скрытая марковская модель:

8
Таблица 4 – Возможные причины выхода на
Состояние в
просрочку
Номер
Значение

Таблица 3 – Исходы, регистрируемые по результату контакта с
Состояние в
заемщиком
Номер
Значение
1 Автоответчик
2 Должник не берет трубку
3 Должник не дождался ответа оператора
4 Информация передана
5 Клиента знают, но связи не имеют
6 Клиента не знают
7 Нарушение обязательств
8 Не берут трубку
9 Необходимо перезвонить
10 Номер не существует
11 Обещание оплаты
12 Отказ от верификации
13 Отказ от оплаты
14 Отправлен факс
15 Подозрение на мошенничество (КЛИЕНТ)
16 Подтверждение оплаты
17 Полное погашение
18 Признак мошенничества (НЕ КЛИЕНТ)
19 Сброс со стороны абонента
20 Связаться с заемщиком невозможно
21 Связь прервалась
22 Сложный (в армии, в тюрьме, алкоголик, наркоман)

СММ
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S2, S3
S2, S3
S1, S2, S3
S1, S2, S3
S2
S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3
S1, S2, S3

23 Сообщение прослушано не полностью (Автоинформатор)

S1, S2, S3

24 Сообщение прослушано полностью (Автоинформатор)

S1, S2, S3

25 Телефон занят

S1, S2, S3

26 Третье лицо не знает о кредите/Отказ в передаче информации

S1, S3

27 Тяжело болен/Инвалид
28 Умер/Пропал без вести
29 Частичное погашение

S1, S2, S3
S1, S2, S3
S1, S2, S3

1 Нет данных в БД
2 Болезнь
3 Забыл
4 Кредит оформлял не для себя
5 Мошенничество
6 Находился в командировкеотпуске
7 Не разъяснены условия договора
8 Причина не установлена
9 Проблемы с досрочным погашением
10 Рекламация
11 Тяжелое материальное положение
12 Утеряны платежи (контроль по квитанциям)

СММ
S1
S2, S3
S1
S1, S3
S3
S1, S2
S1
S1, S2, S3
S2, S3
S2, S3
S2, S3
S2, S3

Таблица 5 – Правила изменения состояний
СММ
Переход
Номер наблюдения (таблица 3)
1, 2, 3, 4, 8, 9, 10, 14, 20, 21, 23, 25
11, 16, 17, 23, 24, 29
5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28
1, 2, 3, 4, 8, 9, 10, 11, 14, 16, 17, 20, 21, 23, 24, 25, 29

5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28
11, 16, 17, 23, 24, 29
2, 3, 4, 5, 6, 7, 8, 9,
Таблица1,6 24, Правила 10, 12, 13, 14, 15, 18, 19, 20, 21, 22,
23, – 25, 26, 27, 28 определения
начальных 3, 4, 8, 9, 10, 14, 20, 21, 23, 25
состояний СММ
1, 2,

Причина выхода
Номер наблюдения
на просрочку
Состояние
(таблица 3)
11, 16, 17, 23, 24, 29
(таблица 4)
5, 6, 7, 10, 11, 12, 13, 15, 16,
S1
1 5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28
17, 18, 20, 22, 26, 28
S2
2 – 12
11, 16, 17
5, 6, 7, 10, 12, 13, 15, 18, 20,
S3
2 – 12
22, 26, 28

9
Задолженность

Клиентский
модуль

Работа по
возврату
задолженности
Информаци
я
о
исследуемо
м
долге не
учитываетс
я
при
подготовке
параметров
модели
История
контактов

Выбор по
максимуму

Индекс
кластера

Обучение
моделей

Сбор
статистики

Подготовка
параметров
моделей

Серверный
модуль

10
Алгоритм прямого хода
(1)
Инициализация:
N – число состояний
Вычисление:
(2)

(3)

11
Алгоритм обратного хода
(4)
Инициализация:
N – число состояний
Вычисление:
(5)

(6)

12
TScore.StartScore()

quScoreDe
bt.Eof

InitHMMValues

Да

TScore.quScor
eDebt.First

P1 := 0
P2 := 0

P1 :=
HMM_Good.Get
ForwardProbabil
ity
P2 :=
HMM_Bad.GetF
orwardProbabilit
y

Нет
Вычисление и сравнение
вероятностей для каждого долга
исследуемого множества

P1 > P2
quScoreDebt_S
coreResult := 0
quScoreDebt_S
coreResult := 1
quScoreDebt.Po
st

Конец

quScoreDebt.Ne
xt

13
Начало (Execute
gain_stat)

Подготовка
вспомогательных
таблиц
Вычисление
значений вектора
вероятностей
начальных
состояний
Вычисление
значений
матрицы
вероятностей
наблюдений
Вычисление
значений
матрицы
вероятностей
переходов

Конец

14
15
Выбираются случайным
образом из всех долгов, по
которым уже завершена
работа

Отобрать 1000
задолженностей
из БД

По некоторым долгам Банки
присылают обновленную
информацию о погашении
до начала работ по
взысканию

Подготовка данных

Отфильтровать непригодные для
использования данные

Отобрать 15% в
тестовую группу

Выполнить сбор
статистики и расчет
параметров моделей по
обучающей группе
1000 долгов

Выполнить моделирование с
использованием полученных
входных параметров на
тестовой группе
Для того, чтобы в тестовой
группе присутствовали как
116
«плохие», так и «хорошие»
«хороших»
задолженности, отдельно
отбираются по 15% долгов с
хорошими и плохими
17 для
признаками
тестирования

57 непригодных

943

831 «плохих»

99 для
расчета
параметров

108 для
тестирования

723 для
расчета
параметров

16
Таблица 7 – Вероятности начальных состояний 10 – Вероятности начальных состояний
Таблица
для модели «хороших» задолженностей для модели «плохих» задолженностей
π

π1

π2

π3

π

1 0,262626 0,232323 0,505051

π1

π2

π3

1 0,876902 0,001383 0,121715

Таблица
Таблица 8 – Вероятности изменения состояний 11 – Вероятности изменения состояний
для модели «хороших» задолженностей для модели «плохих» задолженностей
Таблица
S
S1
S2
S3
S
S1
S2
S3
1 0,764151 0,018868 0,216981
2
0 0,889885 0,110115
3
0 0,191123 0,808877

13 – Результат работы ПО на тестовых

«хороши
е»

«плохи
е»

17

1 0,947418 0,003756 0,048826
2
0 0,792564 0,207436
3
0 0,018688 0,981312

108

Таблица 9 – Вероятности получения наблюдений 12 – Вероятности получения наблюдений
Таблица
Тестовое
для модели «хороших» задолженностей для модели «плохих» задолженностей
O

S1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

0,009434
0,103774
0
0
0,009434
0,018868
0
0
0
0,528302
0
0
0
0
0
0
0
0
0,188679
0
0,009434
0
0,009434
0,018868
0,103774
0
0
0
0

S2
0,008323
0,067862
0,011524
0,020487
0,001921
0,011524
0
0,005122
0,016645
0,069782
0,028169
0
0,007042
0,00128
0
0,084507
0,021767
0
0,086428
0,072343
0,048015
0,00064
0,161332
0,224712
0,046095
0,002561
0
0
0,001921

S3
0,015399
0,070652
0,009964
0,008152
0,01087
0,014493
0,003623
0,007246
0,009964
0,224638
0,009058
0
0,006341
0,000906
0
0,011775
0,000906
0
0,347826
0,012681
0,029891
0
0,01721
0,152174
0,03442
0,001812
0
0
0

O

S1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

0,001995
0,313967
0,00223
0,000469
0,001526
0,003873
0
0,006221
0,003052
0,524883
0
0
0,000117
0
0
0
0
0
0,043192
0,000469
0,006103
0
0,000587
0,003756
0,087441
0,000117
0
0
0

S2
0,019569
0,066536
0,013699
0,003914
0,020548
0,108611
0
0,007828
0,017613
0,093933
0,000978
0
0,001957
0,005871
0
0
0
0
0,07045
0,031311
0,053816
0
0,219178
0,216243
0,042074
0
0
0,005871
0

S3
0,0052327
0,2239768
0,0185947
0,0100916
0,0135489
0,0315829
0,0001869
0,0121473
0,0205569
0,2646234
0,0001869
9,34E-05
0,0001869
0,0020557
9,34E-05
9,34E-05
0
0,0001869
0,2883573
0,0067277
0,033732
0
0,0024295
0,0159783
0,0409269
0,0028967
0
0,005513
0

множество

Правильно
кластеризованно
15
СММ Правильно кластеризованно в СММ

92

Тестовое множество

"хорошие"

15
17

92

"плохие"

108

Точность кластеризации

17
Таблица 14– Смета затрат на разработку и внедрение ПО
Наименование
Обозначение
статей
Основная
Сосн
заработная плата
Дополнительная
Сдоп
заработная плата
Отчисления
на
Ссоц
социальные нужды
Материалы
Смат

Сумма, руб.

210000

В % к итогу

45,15

21000

4,6

78540

16,89

2750

0,59

Стоимость
С
машинного времени маш.вр

26850

5,77

Накладные расходы Сн

126000

27

Итого:

465140

100

Спр

Ленточный график разработки ПО

Таблица 15– Основные технико-экономические показатели
Наименован
ие
показателя

Способ
обработки
информации

Ед.
измерения

-

Базовый
вариант

Проектный
вариант

Проектный
вариант в %
к базовому

В ручную

С
применением
ЭВМ и
программных
средств

-

Используемо
Пишущие
ПЭВМ,
е
машинки
принтер
оборудование
Годовые
затраты на
Чел. ч.
1798
7192
обработку
Маш. ч.
1259
информации
Количество
Чел
4
1
работников
Потребность
в
производстве
м2
12
6
нных
площадях
Капитальные
Руб.
180000
238217,22
вложения
Годовые
текущие
затраты на
Руб.
4511508
1132384,75
обработку
информации
Годовые
приведенные
затраты на
Руб.
4538508
1158117,33
обработку
информации
Расчетные результаты внедрения:
Годовой
• экономически
годовой экономический эффект в размере 3380390,67
Руб.
3380390,67
рубля
й эффект
• снижение следующих экономических показателей:
 годовые приведенные затраты труда на 75%
 количество работников на 75%
 годовые текущие затраты на 75%

-

25

25

50

132

25

25

-

18
 В рамках дипломного проекта разработан программно-математический
комплекс, использующий аппарат скрытых марковских моделей для
кластеризации задолженностей, не требующий обучения по алгоритму
Баума-Велча
 В ходе тестирования установлено, что разработанный комплекс
выполняет кластеризацию с высокой точностью, позволяющей повысить
эффективность работы специалистов за счет выявления перспективных
задолженностей на ранних стадиях работы по взысканию
 Созданное ПО может быть использовано как в качестве
самостоятельного средства анализа данных, так и в комплексе с
системами учета проблемных активов

19
Спасибо за
внимание!

21

More Related Content

Similar to 2013 Разработка программно-математического комплекса поддержки скоринга востребования

Инсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунИнсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунHackIT Ukraine
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full versionDmitry Guzenko
 
Maevsky прогнозирование процесса выявления дефектов
Maevsky прогнозирование процесса выявления дефектовMaevsky прогнозирование процесса выявления дефектов
Maevsky прогнозирование процесса выявления дефектовSQALab
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverDATA
 
Кейсы машинного обучения в Сбербанке
 Кейсы машинного обучения в Сбербанке Кейсы машинного обучения в Сбербанке
Кейсы машинного обучения в СбербанкеИнфобанк бай
 
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...ph.d. Dmitry Stepanov
 
система управления портфельными инвестициями пифия
система управления портфельными инвестициями пифиясистема управления портфельными инвестициями пифия
система управления портфельными инвестициями пифияOleg Nikitin
 
2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базыBankir_Ru
 
6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системеViktoriia Oleshko
 
дипломная презентация по экспресс диагностике финансового состояния
дипломная презентация по экспресс диагностике финансового состояниядипломная презентация по экспресс диагностике финансового состояния
дипломная презентация по экспресс диагностике финансового состоянияIvan Simanov
 
жуков презентация конф
жуков презентация конфжуков презентация конф
жуков презентация конфcontrolling2000
 
Deductor Credit Scorecard Modeler
Deductor Credit Scorecard ModelerDeductor Credit Scorecard Modeler
Deductor Credit Scorecard ModelerLoginom
 
дипломная презентация по управлению рисками
дипломная презентация по управлению рискамидипломная презентация по управлению рисками
дипломная презентация по управлению рискамиIvan Simanov
 
Business Analytics Systems (Small business)
Business Analytics Systems (Small business)Business Analytics Systems (Small business)
Business Analytics Systems (Small business)Victor Romanov
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореIT Group
 

Similar to 2013 Разработка программно-математического комплекса поддержки скоринга востребования (20)

Инсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей КавунИнсайдеры: стороны взаимодействия - Сергей Кавун
Инсайдеры: стороны взаимодействия - Сергей Кавун
 
RISK MANAGEMENT U2
RISK MANAGEMENT U2RISK MANAGEMENT U2
RISK MANAGEMENT U2
 
Dsml for business.full version
Dsml for business.full versionDsml for business.full version
Dsml for business.full version
 
Conference
ConferenceConference
Conference
 
Maevsky прогнозирование процесса выявления дефектов
Maevsky прогнозирование процесса выявления дефектовMaevsky прогнозирование процесса выявления дефектов
Maevsky прогнозирование процесса выявления дефектов
 
CleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.KanevskyCleverCLUB-26.03.15-G.Kanevsky
CleverCLUB-26.03.15-G.Kanevsky
 
Кейсы машинного обучения в Сбербанке
 Кейсы машинного обучения в Сбербанке Кейсы машинного обучения в Сбербанке
Кейсы машинного обучения в Сбербанке
 
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...
Диплом "Автоматизация ключевых бизнес-процессов городской больницы на основе ...
 
система управления портфельными инвестициями пифия
система управления портфельными инвестициями пифиясистема управления портфельными инвестициями пифия
система управления портфельными инвестициями пифия
 
2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы2017 06 15_эволюция систем сегментирования клиентской базы
2017 06 15_эволюция систем сегментирования клиентской базы
 
6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе6 сигм. Сокращение количества ошибок в информационной системе
6 сигм. Сокращение количества ошибок в информационной системе
 
#corpriskforum2016 - Aizhan Stanbaeva
#corpriskforum2016 - Aizhan Stanbaeva#corpriskforum2016 - Aizhan Stanbaeva
#corpriskforum2016 - Aizhan Stanbaeva
 
дипломная презентация по экспресс диагностике финансового состояния
дипломная презентация по экспресс диагностике финансового состояниядипломная презентация по экспресс диагностике финансового состояния
дипломная презентация по экспресс диагностике финансового состояния
 
Debt Collection Conveyor
Debt Collection ConveyorDebt Collection Conveyor
Debt Collection Conveyor
 
жуков презентация конф
жуков презентация конфжуков презентация конф
жуков презентация конф
 
Deductor Credit Scorecard Modeler
Deductor Credit Scorecard ModelerDeductor Credit Scorecard Modeler
Deductor Credit Scorecard Modeler
 
дипломная презентация по управлению рисками
дипломная презентация по управлению рискамидипломная презентация по управлению рисками
дипломная презентация по управлению рисками
 
Business Analytics Systems (Small business)
Business Analytics Systems (Small business)Business Analytics Systems (Small business)
Business Analytics Systems (Small business)
 
Прогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом сектореПрогнозная аналитика в финансовом секторе
Прогнозная аналитика в финансовом секторе
 
Владимир Кононов (UCS)
Владимир Кононов (UCS)Владимир Кононов (UCS)
Владимир Кононов (UCS)
 

More from RF-Lab

2021 Филипповский А.В. "Разработка программно-математических средств для биом...
2021 Филипповский А.В. "Разработка программно-математических средств для биом...2021 Филипповский А.В. "Разработка программно-математических средств для биом...
2021 Филипповский А.В. "Разработка программно-математических средств для биом...RF-Lab
 
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...RF-Lab
 
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...RF-Lab
 
2017 ВКФ Костомаха И.А.
2017 ВКФ Костомаха И.А.2017 ВКФ Костомаха И.А.
2017 ВКФ Костомаха И.А.RF-Lab
 
2017 ВКФ Храбров И. С.
2017 ВКФ Храбров И. С.2017 ВКФ Храбров И. С.
2017 ВКФ Храбров И. С.RF-Lab
 
Иванов "Разработка программных средств моделирования для лоценки производител...
Иванов "Разработка программных средств моделирования для лоценки производител...Иванов "Разработка программных средств моделирования для лоценки производител...
Иванов "Разработка программных средств моделирования для лоценки производител...RF-Lab
 
2007 Селеменев "Разработка программно-математических средств для оценки произ...
2007 Селеменев "Разработка программно-математических средств для оценки произ...2007 Селеменев "Разработка программно-математических средств для оценки произ...
2007 Селеменев "Разработка программно-математических средств для оценки произ...RF-Lab
 
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...RF-Lab
 
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...2004 Белова "Моделирование систем синхронизации с использованием хаотических ...
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...RF-Lab
 
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"Петрикин "Разработка программных средств лоя идентификации диктора по голосу"
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"RF-Lab
 
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...RF-Lab
 
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...RF-Lab
 
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...RF-Lab
 
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...RF-Lab
 
2014 Разработка программного средства для оценки параметров широкополосного с...
2014 Разработка программного средства для оценки параметров широкополосного с...2014 Разработка программного средства для оценки параметров широкополосного с...
2014 Разработка программного средства для оценки параметров широкополосного с...RF-Lab
 
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...RF-Lab
 
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...RF-Lab
 
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...RF-Lab
 
2013 Кириченко диплом
2013 Кириченко диплом2013 Кириченко диплом
2013 Кириченко дипломRF-Lab
 
2013 Токарев диплом
2013 Токарев диплом2013 Токарев диплом
2013 Токарев дипломRF-Lab
 

More from RF-Lab (20)

2021 Филипповский А.В. "Разработка программно-математических средств для биом...
2021 Филипповский А.В. "Разработка программно-математических средств для биом...2021 Филипповский А.В. "Разработка программно-математических средств для биом...
2021 Филипповский А.В. "Разработка программно-математических средств для биом...
 
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...
2020 ВКФ Павлов Ю.А. "Разработка программноматематических средств для управле...
 
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...
2020 - Масленков Г.Д. "Разработка программных средств для регистрации, анализ...
 
2017 ВКФ Костомаха И.А.
2017 ВКФ Костомаха И.А.2017 ВКФ Костомаха И.А.
2017 ВКФ Костомаха И.А.
 
2017 ВКФ Храбров И. С.
2017 ВКФ Храбров И. С.2017 ВКФ Храбров И. С.
2017 ВКФ Храбров И. С.
 
Иванов "Разработка программных средств моделирования для лоценки производител...
Иванов "Разработка программных средств моделирования для лоценки производител...Иванов "Разработка программных средств моделирования для лоценки производител...
Иванов "Разработка программных средств моделирования для лоценки производител...
 
2007 Селеменев "Разработка программно-математических средств для оценки произ...
2007 Селеменев "Разработка программно-математических средств для оценки произ...2007 Селеменев "Разработка программно-математических средств для оценки произ...
2007 Селеменев "Разработка программно-математических средств для оценки произ...
 
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...
2007 Никольская "Разработка программных средств для помехоустойчивого кодиров...
 
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...2004 Белова "Моделирование систем синхронизации с использованием хаотических ...
2004 Белова "Моделирование систем синхронизации с использованием хаотических ...
 
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"Петрикин "Разработка программных средств лоя идентификации диктора по голосу"
Петрикин "Разработка программных средств лоя идентификации диктора по голосу"
 
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...
2015 Дипломная работа Калиновского Вячеслава Валентиновича "Разработка програ...
 
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...
2016 Дипломный проект Харитончук Сергея Анатольевича на тему "Разработка прог...
 
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...
2016 Забелин Вячеслав Андреевич Бакалаврская работа: Разработка программных с...
 
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...
2016 Бакалаварская работа Лукьянчикова Андрея Игоревича на тему "Разработка п...
 
2014 Разработка программного средства для оценки параметров широкополосного с...
2014 Разработка программного средства для оценки параметров широкополосного с...2014 Разработка программного средства для оценки параметров широкополосного с...
2014 Разработка программного средства для оценки параметров широкополосного с...
 
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...
2011 ДИПЛОМНЫЙ ПРОЕКТ Селезнева Д.А. на тему "Разработка программно-аппаратны...
 
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...
2004 Дипломный проект студентки Балашовой В.Д. на тему: «Обработка изображени...
 
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...
2011 Никифоров А.А. доклад " Применение алгоритма DELAY AND MULTIPLY APPROACH...
 
2013 Кириченко диплом
2013 Кириченко диплом2013 Кириченко диплом
2013 Кириченко диплом
 
2013 Токарев диплом
2013 Токарев диплом2013 Токарев диплом
2013 Токарев диплом
 

2013 Разработка программно-математического комплекса поддержки скоринга востребования

  • 1. МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПРИБОРОСТРОЕНИЯ И ИНФОРМАТИКИ Кафедра ИТ6 «Управление и моделирование систем» ДИПЛОМНЫЙ ПРОЕКТ на тему «Разработка программно-математического комплекса поддержки скоринга востребования» Выполнил: Руководитель: Царьков Юрий Александрович Мельников Алексей Олегович Москва, 2013
  • 2. Скоринг (от англ. score - счет) Кредитный система оценки заемщика, основанная на численных статистических методах оценка кредитоспособности заемщика при выдаче кредита Мошенничеств а оценка вероятности мошеннических действий со стороны потенциального заемщика Поведенческий анализ кредитной истории с целью изменения стратегии взаимодействия с заемщиком Востребования анализ информации о заемщике с целью возврата просроченного платежа Прекратить взыскание Продолжить прежним методом Установка контакта с должником Анализ результатов Принятие стратегическог о решения Изменить метод взыскания Списать задолженность 2
  • 3. Разработка программно-математического комплекса, выполняющего кластеризацию новых задолженностей, основываясь на статистической информации о ранее осуществленных контактах с должниками Задачи: 1 • изучение существующих программных средств и математических методов скоринга 2 • выбор математического метода для использования в дипломном проекте 3 • разработка алгоритмов для реализации выбранного метода 4 • описание структуры программного комплекса и написание программного кода, реализующего разработанные алгоритмы 5 • анализ опасных для пользователя ПЭВМ факторов и разработка комплекса мероприятий по обеспечению безопасности эксплуатации ПЭВМ 6 • расчет экономической эффективности от реализации проекта 3
  • 4. Разработать эффективный механизм кластеризации вновь поступивших задолженностей, основывающийся на информации, полученной в ходе работы по возврату других задолженностей, в результате работы которого, каждый долг можно было отнести к одной из двух групп – «плохие» или Критерий качества «хорошие» задолженностей «плохие» задолженности работа по взысканию признана неуспешной «хорошие» задолженности работа по взысканию признана успешной Да «Хороший» Нет «Плохой» 4
  • 5. линейная регрессия логистическая регрессия метод ближайших соседей линейное программирование генетические алгоритмы Математические методы скоринга нейронные сети деревья решений байесовский подход Таблица 1 – Сравнение точности классификации различных методов*, % Линейная регрессия Логистическ ая регрессия Метод ближайш их соседей [43,4 – 87,5] 68,66 [43,3 – 89,3] 66,63 [43,8 – 93,2] 68,32 Линейное программ ирование Нейронны е сети [74,7 – 86,1] 80,4 [62 - 64] 63 Генетическ ий алгоритм Деревья решений 64,5 [78,5 – 92,1] 83,88 * Значения точности классификации для всех методов получены путем вычисления среднего арифметического результатов тестов, приведенных в таблице 1 пояснительной записки дипломного проекта. 5
  • 6. IBM SPSS, пакет Clementine Scorto Ample Collection, пакет Loan Decision SAS, пакет Enterprise Miner Ksema TERN Group, пакет KXEN Analytic Framework Таблица 2 – Сравнительная характеристика программных продуктов в области ско Продукт Scorto IBM SPSS SAS KSEN Возможность Построен интеграции ие со стратеги сторонними й АС есть нет нет есть есть нет нет есть Наличие АРМ Используемые алгоритмы обработки данных Стоимость (минималь ная стоимость пакета, руб.) есть лог. регрессия, деревья решений 65 000 есть лог. регрессия, деревья решений, нейронные сети 82 000 нет лог. регрессия, деревья решений, нейронные сети 600 000 нет лог. регрессия, деревья решений, нейронные сети, сети Байеса 2 700 000 6
  • 7. I >> 1 Коллектор Коллектор Контакт I Результат контакта (наблюдение) Результат контакта (наблюдение) БД Контакт 1 Должник Должник t I>1 Должник t 7
  • 9. Таблица 4 – Возможные причины выхода на Состояние в просрочку Номер Значение Таблица 3 – Исходы, регистрируемые по результату контакта с Состояние в заемщиком Номер Значение 1 Автоответчик 2 Должник не берет трубку 3 Должник не дождался ответа оператора 4 Информация передана 5 Клиента знают, но связи не имеют 6 Клиента не знают 7 Нарушение обязательств 8 Не берут трубку 9 Необходимо перезвонить 10 Номер не существует 11 Обещание оплаты 12 Отказ от верификации 13 Отказ от оплаты 14 Отправлен факс 15 Подозрение на мошенничество (КЛИЕНТ) 16 Подтверждение оплаты 17 Полное погашение 18 Признак мошенничества (НЕ КЛИЕНТ) 19 Сброс со стороны абонента 20 Связаться с заемщиком невозможно 21 Связь прервалась 22 Сложный (в армии, в тюрьме, алкоголик, наркоман) СММ S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S2, S3 S2, S3 S1, S2, S3 S1, S2, S3 S2 S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 S1, S2, S3 23 Сообщение прослушано не полностью (Автоинформатор) S1, S2, S3 24 Сообщение прослушано полностью (Автоинформатор) S1, S2, S3 25 Телефон занят S1, S2, S3 26 Третье лицо не знает о кредите/Отказ в передаче информации S1, S3 27 Тяжело болен/Инвалид 28 Умер/Пропал без вести 29 Частичное погашение S1, S2, S3 S1, S2, S3 S1, S2, S3 1 Нет данных в БД 2 Болезнь 3 Забыл 4 Кредит оформлял не для себя 5 Мошенничество 6 Находился в командировкеотпуске 7 Не разъяснены условия договора 8 Причина не установлена 9 Проблемы с досрочным погашением 10 Рекламация 11 Тяжелое материальное положение 12 Утеряны платежи (контроль по квитанциям) СММ S1 S2, S3 S1 S1, S3 S3 S1, S2 S1 S1, S2, S3 S2, S3 S2, S3 S2, S3 S2, S3 Таблица 5 – Правила изменения состояний СММ Переход Номер наблюдения (таблица 3) 1, 2, 3, 4, 8, 9, 10, 14, 20, 21, 23, 25 11, 16, 17, 23, 24, 29 5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28 1, 2, 3, 4, 8, 9, 10, 11, 14, 16, 17, 20, 21, 23, 24, 25, 29 5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28 11, 16, 17, 23, 24, 29 2, 3, 4, 5, 6, 7, 8, 9, Таблица1,6 24, Правила 10, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, – 25, 26, 27, 28 определения начальных 3, 4, 8, 9, 10, 14, 20, 21, 23, 25 состояний СММ 1, 2, Причина выхода Номер наблюдения на просрочку Состояние (таблица 3) 11, 16, 17, 23, 24, 29 (таблица 4) 5, 6, 7, 10, 11, 12, 13, 15, 16, S1 1 5, 6, 7, 12, 13, 15, 18, 19, 22, 23, 24, 26, 27, 28 17, 18, 20, 22, 26, 28 S2 2 – 12 11, 16, 17 5, 6, 7, 10, 12, 13, 15, 18, 20, S3 2 – 12 22, 26, 28 9
  • 11. Алгоритм прямого хода (1) Инициализация: N – число состояний Вычисление: (2) (3) 11
  • 12. Алгоритм обратного хода (4) Инициализация: N – число состояний Вычисление: (5) (6) 12
  • 13. TScore.StartScore() quScoreDe bt.Eof InitHMMValues Да TScore.quScor eDebt.First P1 := 0 P2 := 0 P1 := HMM_Good.Get ForwardProbabil ity P2 := HMM_Bad.GetF orwardProbabilit y Нет Вычисление и сравнение вероятностей для каждого долга исследуемого множества P1 > P2 quScoreDebt_S coreResult := 0 quScoreDebt_S coreResult := 1 quScoreDebt.Po st Конец quScoreDebt.Ne xt 13
  • 15. 15
  • 16. Выбираются случайным образом из всех долгов, по которым уже завершена работа Отобрать 1000 задолженностей из БД По некоторым долгам Банки присылают обновленную информацию о погашении до начала работ по взысканию Подготовка данных Отфильтровать непригодные для использования данные Отобрать 15% в тестовую группу Выполнить сбор статистики и расчет параметров моделей по обучающей группе 1000 долгов Выполнить моделирование с использованием полученных входных параметров на тестовой группе Для того, чтобы в тестовой группе присутствовали как 116 «плохие», так и «хорошие» «хороших» задолженности, отдельно отбираются по 15% долгов с хорошими и плохими 17 для признаками тестирования 57 непригодных 943 831 «плохих» 99 для расчета параметров 108 для тестирования 723 для расчета параметров 16
  • 17. Таблица 7 – Вероятности начальных состояний 10 – Вероятности начальных состояний Таблица для модели «хороших» задолженностей для модели «плохих» задолженностей π π1 π2 π3 π 1 0,262626 0,232323 0,505051 π1 π2 π3 1 0,876902 0,001383 0,121715 Таблица Таблица 8 – Вероятности изменения состояний 11 – Вероятности изменения состояний для модели «хороших» задолженностей для модели «плохих» задолженностей Таблица S S1 S2 S3 S S1 S2 S3 1 0,764151 0,018868 0,216981 2 0 0,889885 0,110115 3 0 0,191123 0,808877 13 – Результат работы ПО на тестовых «хороши е» «плохи е» 17 1 0,947418 0,003756 0,048826 2 0 0,792564 0,207436 3 0 0,018688 0,981312 108 Таблица 9 – Вероятности получения наблюдений 12 – Вероятности получения наблюдений Таблица Тестовое для модели «хороших» задолженностей для модели «плохих» задолженностей O S1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 0,009434 0,103774 0 0 0,009434 0,018868 0 0 0 0,528302 0 0 0 0 0 0 0 0 0,188679 0 0,009434 0 0,009434 0,018868 0,103774 0 0 0 0 S2 0,008323 0,067862 0,011524 0,020487 0,001921 0,011524 0 0,005122 0,016645 0,069782 0,028169 0 0,007042 0,00128 0 0,084507 0,021767 0 0,086428 0,072343 0,048015 0,00064 0,161332 0,224712 0,046095 0,002561 0 0 0,001921 S3 0,015399 0,070652 0,009964 0,008152 0,01087 0,014493 0,003623 0,007246 0,009964 0,224638 0,009058 0 0,006341 0,000906 0 0,011775 0,000906 0 0,347826 0,012681 0,029891 0 0,01721 0,152174 0,03442 0,001812 0 0 0 O S1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 0,001995 0,313967 0,00223 0,000469 0,001526 0,003873 0 0,006221 0,003052 0,524883 0 0 0,000117 0 0 0 0 0 0,043192 0,000469 0,006103 0 0,000587 0,003756 0,087441 0,000117 0 0 0 S2 0,019569 0,066536 0,013699 0,003914 0,020548 0,108611 0 0,007828 0,017613 0,093933 0,000978 0 0,001957 0,005871 0 0 0 0 0,07045 0,031311 0,053816 0 0,219178 0,216243 0,042074 0 0 0,005871 0 S3 0,0052327 0,2239768 0,0185947 0,0100916 0,0135489 0,0315829 0,0001869 0,0121473 0,0205569 0,2646234 0,0001869 9,34E-05 0,0001869 0,0020557 9,34E-05 9,34E-05 0 0,0001869 0,2883573 0,0067277 0,033732 0 0,0024295 0,0159783 0,0409269 0,0028967 0 0,005513 0 множество Правильно кластеризованно 15 СММ Правильно кластеризованно в СММ 92 Тестовое множество "хорошие" 15 17 92 "плохие" 108 Точность кластеризации 17
  • 18. Таблица 14– Смета затрат на разработку и внедрение ПО Наименование Обозначение статей Основная Сосн заработная плата Дополнительная Сдоп заработная плата Отчисления на Ссоц социальные нужды Материалы Смат Сумма, руб. 210000 В % к итогу 45,15 21000 4,6 78540 16,89 2750 0,59 Стоимость С машинного времени маш.вр 26850 5,77 Накладные расходы Сн 126000 27 Итого: 465140 100 Спр Ленточный график разработки ПО Таблица 15– Основные технико-экономические показатели Наименован ие показателя Способ обработки информации Ед. измерения - Базовый вариант Проектный вариант Проектный вариант в % к базовому В ручную С применением ЭВМ и программных средств - Используемо Пишущие ПЭВМ, е машинки принтер оборудование Годовые затраты на Чел. ч. 1798 7192 обработку Маш. ч. 1259 информации Количество Чел 4 1 работников Потребность в производстве м2 12 6 нных площадях Капитальные Руб. 180000 238217,22 вложения Годовые текущие затраты на Руб. 4511508 1132384,75 обработку информации Годовые приведенные затраты на Руб. 4538508 1158117,33 обработку информации Расчетные результаты внедрения: Годовой • экономически годовой экономический эффект в размере 3380390,67 Руб. 3380390,67 рубля й эффект • снижение следующих экономических показателей:  годовые приведенные затраты труда на 75%  количество работников на 75%  годовые текущие затраты на 75% - 25 25 50 132 25 25 - 18
  • 19.  В рамках дипломного проекта разработан программно-математический комплекс, использующий аппарат скрытых марковских моделей для кластеризации задолженностей, не требующий обучения по алгоритму Баума-Велча  В ходе тестирования установлено, что разработанный комплекс выполняет кластеризацию с высокой точностью, позволяющей повысить эффективность работы специалистов за счет выявления перспективных задолженностей на ранних стадиях работы по взысканию  Созданное ПО может быть использовано как в качестве самостоятельного средства анализа данных, так и в комплексе с системами учета проблемных активов 19