Автор: Пользователь скрыл имя, 24 Октября 2013 в 21:55, доклад
Усі позичальники банка поділені на «гарних» і «поганих». Розбиття на ці групи закладено в результуючій функції.
Маємо наступну модель, яка пов“язує залежну змінну У з незалежними змінними х1 , х2,...,х.
Таку модель лінеаризують за допомогою логіт-перетворення:
Y’=LN(Y/(1-Y)).
Залежна змінна У інтерпретується як імовірність дефолту позичальника.
Скорінгова модель оцінки кредитоспроможності фізичних осіб у банку
Постановка задачі
Усі позичальники банка поділені на «гарних» і «поганих». Розбиття на ці групи закладено в результуючій функції.
Маємо наступну модель, яка пов“язує залежну змінну У з незалежними змінними х1 , х2,...,х.
Таку модель лінеаризують за допомогою логіт-перетворення:
Y’=LN(Y/(1-Y)).
Залежна змінна У інтерпретується як імовірність дефолту позичальника.
У — це бінарна змінна, яка приймає значення 1, якщо дефолт і значення 0 в протилежному випадку.
Поставлена задача розв'язується за допомогою методу максимальної правдоподібності.
РЕЗУЛЬТАТИ
Основою дослідження є дані про кеш-кредити для фізичних осіб у 2012 році. Інформаційна база складається з 5700 позичальників. З даних анкет була отримана і оброблена наступна інформація, на основі якої сформувались незалежні змінні х:
х1 — область видачі кредиту. Кожна область набуває певне значення з інтервалу [1, с. 24];
X, — вік позичальника. Віку від 17 до 75 років відповідає інтервал значень змінної від 1 до 2,1;
Х3 — вид кредиту. Якщо кредит виданий працюючій людині, то змінна набуває значення — 1, студенту — 2, пенсіонеру — 3;
х4 — стать. Бінарна змінна (чоловіча — 0, жіноча — 1);
х; — сімейний стан. Бінарна змінна (не одружений — ний — 1);
х6 — освіта (середня вища — 3);
х? —- особи на утримані (кількість);
• х8 — сукупний дохід позичальника, тис. грн.;
х9 — сукупні витрати, тис. грн.;
хІ0 — наявність поручителя (бінарна змінна, що приймає значення 0 — ні, 1 — так);
х11- дохід поручителя, тис. грн.
Х12 — сума необхідного кредиту, тис. грн.;
х13 — наявність власного житла (бінарна змінна, що приймає значення 0 — арендоване, 1 — власне);
Х14 — наявність рахунку в банку В (бінарна змінна,
що приймає значення 0 — немає, 1 — є);
х15 — сума кредитів в інших банках, тис. грн.
Далі з усього масиву наявних даних необхідно вибрати такі змінні, які найкращим чином пояснюють результативну змінну. Існують різні способи вибору незалежних змінних (метод виключення квазінезмінних змінних, метод аналізу вектора і матриці коефіцієнтів кореляції, метод показників інформаційної місткості). Один зі способів полягає в виключенні так званих квазінезмінних факторів на основі наперед заданого значення коефіцієнта варіації (у нашому випадку 0,15). Результати розрахунків наведені в таблиці 1.
Змінні |
Х1 |
Х2 |
Х3 |
Х4 |
Х5 |
Х6 |
Х7 |
Коефіцієнт
Варіації |
0,1903 |
0,1454 |
0,3516 |
0,9791 |
0,8139 |
0,2998 |
0,9719 |
Змінні |
Х8 |
Х9 |
Х10 |
Х11 |
Х12 |
X14 |
х 15 |
Коефіцієнт Варіації |
1,4583 |
1,2637 |
3,7326 |
6,4663 |
0,8193 |
1,7432 |
6,0472 |
Всі значення коефіцієнтів варіації більші ніж наперед задане (критичне), тобто всі змінні не являються квазінезмінними і можуть бути використані як пояснюючі.
Оскільки задачею моделювання є побудова скорінгової моделі, то обов'язковою є перевірка всіх початкових даних на нормальний розподіл. Перевірка здійснювалась на основі побудови гістограм, для кожної з пояснюючих змінних. Результат аналізу показав, що всі змінні розподілені достатньо рівномірно.
У будь-якій моделі з декількома пояснюючими змінними може бути наявна мультиколінеарність. Це явище, при якому пояснюючі змінні лінійно залежні. Для виявлення наявності мультиколінеарності була побудована матриця коефіцієнтів кореляції і використай алгоритм Глобера-Фаррара, який дозволяє вияснити питання мультиколінеарності всього масиву змінних, мультиколінеарності кожного регресора з іншим і кожної пари регресорів, при незмінних інших. У результаті виключення мультиколінеарних змінних, для побудови скорі- нгової моделі, обираємо змінні х3-х8, х10, х13, х14 як пояснюючі.
Далі за допомогою пакету StatSoftSTATISTICA, використовуючи Квазиньютонівський метод оцінювання, було побудовано декілька моделей логістичної регресії. Була відібрана наступна модель:
Logit=4,61-0,01x -0,27х +0,22х
-0,01х -0,37х?- -0,26х6+0,03х7-0,77х8-0,/х]?-
Дана модель має найменшу функцію втрат і рівень довіри не менше 95%.
Використовуючи формулу логістичного перетворення, отримали значення імовірності дефолту позичальника:
p=EXP(Logit)/(l+ EXP(Logit)).
Logit — моделі оцінки ризику дефолту не пропонують діапазонів прийняття рішень. Висновок про імовірність дефолту робиться на основі висновку кредитного експерта, залежно від розрахункового значення імовірності р. Модель припускає 5 зон значень імовірності р з кроком 0,2, що дозволяє віднести позичальника в ту чи іншу категорію ризику неповернення кредиту.
Ключовим принципом реалізації побудованої моделі є розрахунок імовірності на основі моделі, порівня якої з пороговими значеннями дозволяє зробити висновок про ризик дефолту.
ВИСНОВКИ
За допомогою квазиньютонівського методу були знайдені невідомі параметри логістичної регресії була запропонована оригінальна модель, що прогнозує імовірність дефолту позичальника залежно від 11 по- яснюючих змінних (табл. 2). Модель була побудована враховуючи помилки першого та другого роду. Рівень довіри моделі 95%. Дана модель має чітку інтерпретацію, легко використовується для прогнозу (наприклад на відміну від нейронних сіток).
Імовірність |
Ступінь ризику |
0<р < 0,2 |
Мінімальний ризик |
0,2<р < 0,4 |
Низький ризик |
0,4<р<0,6 |
Середній ризик |
0,6<р<0,8 |
Високий ризик |
0,8<р < 1 |
Максимальний ризик |
Тестові завдання:
1.Як виглядає
формула логістичного
А) p=EXP(Logit)
Б) p=EXP(Logit)/(l+ EXP(Logit)).
В) p=l+ EXP(Logit).
2.Провівши дослідження,
рівень довіри моделі
А) 85%
Б) 100%
В) 95%
Тестові завдання:
3. Формула логіт- перетворення виглядає як:
А) Y’=LN(Y/(1-Y)).
Б) Y’= (Y/(1-Y)).
В) Y’=LN(1-Y).
Дякую за увагу!!!
Информация о работе Скорінгова модель оцінки кредитоспроможності фізичних осіб у банку