Скорінгова модель оцінки кредитоспроможності фізичних осіб у банку

Автор: Пользователь скрыл имя, 24 Октября 2013 в 21:55, доклад

Описание работы

Усі позичальники банка поділені на «гарних» і «поганих». Розбиття на ці групи закладено в результуючій функції.
Маємо наступну модель, яка пов“язує залежну змінну У з незалежними змінними х1 , х2,...,х.
Таку модель лінеаризують за допомогою логіт-перетворення:
Y’=LN(Y/(1-Y)).
Залежна змінна У інтерпретується як імовірність дефолту позичальника.

Работа содержит 1 файл

РФП.pptx

— 85.95 Кб (Скачать)

Скорінгова модель оцінки кредитоспроможності фізичних осіб у банку

Постановка задачі

 

Усі позичальники банка поділені на «гарних» і «поганих». Розбиття на ці групи закладено в результуючій функції.

 Маємо наступну  модель, яка пов“язує залежну змінну У з незалежними змінними х1 , х2,...,х.

Таку модель лінеаризують за допомогою логіт-перетворення:

Y’=LN(Y/(1-Y)).

Залежна змінна У  інтерпретується як імовірність  дефолту позичальника.

У — це бінарна  змінна, яка приймає значення 1, якщо дефолт і значення 0 в протилежному випад­ку.

Поставлена задача розв'язується за допомогою ме­тоду  максимальної правдоподібності.

 

РЕЗУЛЬТАТИ

 

Основою дослідження  є дані про кеш-кредити для  фізичних осіб у 2012 році. Інформаційна база складаєть­ся з 5700 позичальників. З даних анкет була отримана і  оброблена наступна інформація, на основі якої сфор­мувались незалежні  змінні х:

х1 — область видачі кредиту. Кожна область набу­ває певне значення з інтервалу [1, с. 24];

X, — вік позичальника. Віку від 17 до 75 років відпов­ідає інтервал значень змінної від 1 до 2,1;

Х3 — вид кредиту. Якщо кредит виданий працюючій людині, то змінна набуває значення — 1, студенту — 2, пенсіонеру — 3;

х4 — стать. Бінарна змінна (чоло­віча — 0, жіноча — 1);

х; — сімейний стан. Бінарна змінна (не одружений — ний — 1);

х6 — освіта (середня вища — 3);

х? —- особи на утримані (кількість);

• х8 — сукупний дохід позичальника, тис. грн.;

х9 — сукупні витрати, тис. грн.;

хІ0 — наявність поручителя (бінарна змінна, що приймає значення 0 — ні, 1 — так);

х11- дохід поручителя, тис. грн.

Х12 — сума необхідного кредиту, тис. грн.;

х13 — наявність власного житла (бінарна змінна, що приймає значення 0 — арендоване, 1 — власне);

Х14 — наявність рахунку в банку В (бінарна змінна,

що приймає  значення 0 — немає, 1 — є);

х15 — сума кредитів в інших банках, тис. грн.

 

Далі з усього масиву наявних даних необхідно  виб­рати такі змінні, які найкращим  чином пояснюють ре­зультативну змінну. Існують різні способи  вибору не­залежних змінних (метод  виключення квазінезмінних змінних, метод аналізу вектора і матриці коефіцієнтів кореляції, метод показників інформаційної місткості). Один зі способів полягає в виключенні так званих кваз­інезмінних факторів на основі наперед заданого значен­ня коефіцієнта варіації (у нашому випадку 0,15). Резуль­тати розрахунків наведені в таблиці 1.

 

 

 

 

 

 

 

 

Змінні

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Коефіцієнт

 

Варіації

 

 

 

 

 

0,1903

 

 

 

 

 

0,1454

 

 

 

 

 

0,3516

 

 

 

 

 

0,9791

 

 

 

 

 

0,8139

 

 

 

 

 

0,2998

 

 

 

 

 

0,9719

Змінні

Х8

Х9

Х10

Х11

Х12

X14

х 15

 

 

 

Коефіцієнт

Варіації

 

 

 

 

 

1,4583

 

 

 

 

 

1,2637

 

 

 

 

 

3,7326

 

 

 

 

 

6,4663

 

 

 

 

 

0,8193

 

 

 

 

 

1,7432

 

 

 

 

 

6,0472


Всі значення коефіцієнтів варіації більші ніж напе­ред задане (критичне), тобто всі змінні не являються  квазінезмінними і можуть бути використані як пояснюючі.

Оскільки задачею  моделювання є побудова скорінгової моделі, то обов'язковою є перевірка всіх почат­кових даних на нормальний розподіл. Перевірка здійснювалась на основі побудови гістограм, для кож­ної з пояснюючих змінних. Результат аналізу показав, що всі змінні розподілені достатньо рівномірно.

У будь-якій моделі з декількома пояснюючими змін­ними  може бути наявна мультиколінеарність. Це яви­ще, при якому пояснюючі змінні лінійно залежні. Для виявлення наявності мультиколінеарності була побудо­вана матриця коефіцієнтів кореляції і використай алго­ритм Глобера-Фаррара, який дозволяє вияснити питан­ня мультиколінеарності всього масиву змінних, мульти­колінеарності кожного регресора з іншим і кожної пари регресорів, при незмінних інших. У результаті виклю­чення мультиколінеарних змінних, для побудови скорі- нгової моделі, обираємо змінні х38, х10, х13, х14 як пояс­нюючі.

 

Далі за допомогою  пакету StatSoftSTATISTICA, ви­користовуючи Квазиньютонівський метод оцінювання, було побудовано декілька моделей логістичної регресії. Була відібрана наступна модель:

Logit=4,61-0,01x -0,27х +0,22х -0,01х -0,37х?- -0,26х6+0,03х7-0,77х8-0,/х]?-0,ІУх13-0,13хн.

Дана модель має  найменшу функцію втрат і рівень довіри не менше 95%.

Використовуючи  формулу логістичного перетво­рення, отримали значення імовірності дефолту  пози­чальника:

p=EXP(Logit)/(l+ EXP(Logit)).

Logit — моделі оцінки ризику дефолту не пропону­ють діапазонів прийняття рішень. Висновок про імовірність дефолту робиться на основі висновку кре­дитного експерта, залежно від розрахункового значен­ня імовірності р. Модель припускає 5 зон значень імов­ірності р з кроком 0,2, що дозволяє віднести позичаль­ника в ту чи іншу категорію ризику неповернення кре­диту.

Ключовим принципом  реалізації побудованої моделі є розрахунок імовірності на основі моделі, порівня якої з пороговими значеннями дозволяє зробити висновок про ризик дефолту.

 

ВИСНОВКИ  

 

За допомогою  квазиньютонівського методу були знайдені невідомі параметри логістичної регресії була запропонована оригінальна модель, що прогнозує імовірність дефолту позичальника залежно від 11 по- яснюючих змінних (табл. 2). Модель була побудована враховуючи помилки першого та другого роду. Рівень довіри моделі 95%. Дана модель має чітку інтерпретацію, легко використовується для прогнозу (наприклад на відміну від нейронних сіток).

 

 

Імовірність

Ступінь ризику

0<р  < 0,2

Мінімальний ризик

0,2<р  < 0,4

Низький ризик

0,4<р<0,6

Середній ризик

0,6<р<0,8

Високий ризик

0,8<р  < 1

Максимальний ризик


Тестові завдання:

 

1.Як виглядає  формула логістичного перетворення?

А) p=EXP(Logit)

Б) p=EXP(Logit)/(l+ EXP(Logit)).

В) p=l+ EXP(Logit).

2.Провівши дослідження,  рівень довіри моделі становить:

А) 85%

Б) 100%

В) 95%

 

Тестові завдання:

 

3. Формула логіт- перетворення виглядає як:

А) Y’=LN(Y/(1-Y)).

Б) Y’= (Y/(1-Y)).

В) Y’=LN(1-Y).

 

Дякую за увагу!!!


Информация о работе Скорінгова модель оцінки кредитоспроможності фізичних осіб у банку