Защищенная информационная система оценки кредитоспособности физических лиц

Автор: Пользователь скрыл имя, 13 Мая 2012 в 13:48, дипломная работа

Описание работы

В данном проекте рассматриваются вопросы оценки кредитоспособности физических лиц, анализируются существующие подходы анализа оценки кредитоспособности, описываются преимущества адаптивной скоринговой оценки кредитоспособности физических лиц, предлагается методика оценки кредитоспособности, производится апробация методики оценки кредитоспособности, анализируется ее эффективность.

Содержание

введение
1. Оценка кредитоспособности физических лиц
1.1. Обобщенные кредитные продукты физических лиц
1.1.1. Потребительское кредитование на неотложные нужды
1.1.2. Овердрафт
1.1.3. Автокредитование
1.1.4. Ипотечное кредитование
1.2. Анализ подходов оценки кредитоспособности физических лиц.
1.2.1. Классическая скоринговая система
1.2.2. Статистические методы
1.2.3. Метод k-ближайших соседей
1.2.4. Нейросетевые методы
1.2.5. Методы построения деревьев решений
1.2.6. Экспертные системы
1.2.7. Преимущества использования скоринговой системы.
1.3. Выводы
2. разработка защищенной адаптивной скоринговой системы оценки кредитоспособности физических лиц
2.1. Формирование базы данных
2.1.1. Заявление анкета заемщика
2.1.2. Анализ доходов и расходов заемщика
2.1.3. База данных кредитных историй
2.2. Очистка, предобработка и подготовка данных
2.2.1. Обработка дубликатов и противоречий
2.2.2. Обработка аномалий
2.2.3. Корреляционный анализ
2.2.4. Трансформация данных
2.3. Построение дерева решений
2.3.1. Выбор критерия точности прогноза
2.3.2. Выбор типа ветвления
2.3.3. Определение момента прекращения ветвлений
2.3.4. Определение «подходящих» размеров дерева
2.4. Система оценки кредитоспособности физических лиц
2.4.4. Комплексная система оценки кредитоспособности физических лиц
2.4.5. Защита информационной системы.
2.5. Выводы
3. Апробация системы оценки кредитоспособности физических лиц
3.1. Цель апробация системы оценки кредитоспособности физических лиц
3.1.1. Определение адекватности построения дерева решений
3.1.2. Анализ целесообразности внедрения скоринговой системы в бизнес процесс
3.2. Условия и порядок проведения испытаний
3.2.1. Описание среды проведения испытаний
3.2.2. Получение исходных данных
3.2.3. Квантование данных
3.2.3. Замена данных
3.2.4. Очистка данных
3.2.5. Построение дерева принятия решений
3.3. Результаты апробации адаптивной скоринговой системы
3.4. Выводы
4. Безопасность жизнедеятельности
4.1. Введение
4.2. Охрана труда
4.2.1. Микроклимат рабочего помещения
4.2.2. Эргономика рабочего помещения
4.2.3. Освещенность рабочего места
4.2.2. Расчет естественного освещения
4.3. Охрана окружающей среды
4.3.1. Защита окружающей среды от электромагнитных излучений
4.3.2. Рекомендации
4.4. Чрезвычайные ситуации
5.Экономика защиты информации
5.1. Расчет затрат на внедрение системы
5.1.1. Общее описание системы
5.1.2. Расчет единовременных затрат
5.1.3. Расчет постоянных затрат
5.2. Расчет эффективности внедрения информационной системы оценки кредитоспособности физических лиц.
Заключение
Список литературы

Работа содержит 1 файл

+Абдулхаков - Пояснительная записка.doc

— 2.25 Мб (Скачать)

В процессе обучения алгоритм просто запоминает все векторы признаков и соответствующие им метки классов. При работе с реальными данными, т.е. наблюдениями, метки класса которых неизвестны, вычисляется расстояние между вектором нового наблюдения и ранее запомненными векторами. Затем выбирается k ближайших к нему векторов и новый объект относится к классу, которому принадлежат большинство из них.

Выбор параметра k противоречив. С одной стороны, увеличение его значения повышает достоверность классификации, но при этом границы между классами становятся менее четкими. На практике, хорошие результаты дают эвристические методы выбора параметра k, например, перекрестная проверка.

Несмотря на свою относительную алгоритмическую простоту, метод показывает хорошие результаты. Главным его недостатком является высокая вычислительная трудоемкость, которая возрастает квадратично с ростом числа записей в наборе данных.

1.2.4. Нейросетевые методы

Это большой класс систем, архитектура которых имеет аналогию с построением нервной системы человека [11]. В одной из наиболее распространенных архитектур (многослойном перцептроне) имитируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т.д. Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ – реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде необходимо обучить на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Обучение состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам.

Для некоторых групп потенциальных заемщиков необходимо дать нечеткую оценку его кредитоспособности, например, введя понятие вероятности возврата кредита полностью и в срок. Это необходимо, если руководство банка выразит желание смягчить или, наоборот, ужесточить требования к потенциальным заемщикам. Для построения такой модели необходимо представить решение о выдаче кредита в числовом виде: 0 – "плохой кредит", 1 – "хороший кредит". Тогда после построения модели на выходе как раз и получится вероятность возврата. Управляющему же остается лишь задать пороговое значение вероятности, и если результат выше его, то принимать решение о выдачи кредита, если ниже, то отказывать. Полученная модель дает возможность напрямую управлять уровнем риска. Можно свести риск к минимуму, указав в качестве порога 1 или повысить его при меньших значениях порога (но и, согласно применяющейся в банках практике, переложить его на заемщиков). Это позволит оставаться в выигрышном положении перед конкурентами: снизить стоимость определенных услуг до уровня конкурентов, но также при этом увеличить порог, снизив риск.

Полученную модель эксперт может анализировать, выявляя ее годность. Это осуществляется при помощи диаграммы "что-если". В ней можно увидеть влияние на результат всего ряда значений какого-нибудь фактора при неизменных остальных факторах и оценить верность данной зависимости. Если модель ведет себя неадекватно, то, возможно, что не учтены какие-то факторы либо недостаточно данных.

Основным недостатком нейросетевой парадигмы является необходимость иметь очень большой объем обучающей выборки [11]. Другой существенный недостаток заключается в том, что даже натренированная нейронная сеть представляет собой «черный ящик». Знания, зафиксированные, как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком.

1.2.5. Методы построения деревьев решений

Деревья решений – один из методов интеллектуального анализа данных[12]. Получаемая модель – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Сущность этого метода заключается в следующем [12].

1.      На основе данных за прошлые периоды строится дерево. При этом класс каждой из ситуаций, на основе которых строится дерево, заранее известен. В нашем случае должно быть известно, была ли возвращена основная сумма долга и проценты и не было ли просрочек в платежах. При построении дерева все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам, которые в свою очередь также могут быть разбиты на дочерние узлы. Критерий разбиения – это различные значения какого-либо входного фактора. Для определения поля, по которому будет происходить разбиение, используется показатель, называемый энтропия – мера неопределенности. Выбирается то поле, при разбиении по которому устраняется больше неопределенности. Неопределенность тем выше, чем больше примесей (объектов, относящихся к различным классам) находятся в одном узле. Энтропия равна нулю, если в узле будут находиться объекты, относящиеся к одному классу.

2.      Полученную модель используют при определении класса (Давать/Не давать кредит) вновь возникших ситуаций (поступила заявка на получение кредита).

3.      При существенном изменении текущей ситуации на рынке, дерево можно легко и быстро перестроить, т.е. адаптировать к изменившимся условиям.

Преимущества деревьев решений [12]:

      стоимость адаптации сводится практически к минимуму за счет того, что алгоритмы построения модели классификации (дерево решений) представляют собой самоадаптируемые модели (вмешательство человека при этом минимально);

      качество результата достаточно велико за счет того, что алгоритм выбирает наиболее значимые факторы для определения конечного ответа, при этом полученный результат является статистически обоснованным;

      метод строит модель принятия решений в виде правил, и она получается интуитивно понятной и интерпретируемой.

 

1.2.6. Экспертные системы

Экспертные системы представляют собой специальные программы, в которые закладываются знания экспертов и используются в дальнейшем для принятия решений. При этом экспертная система анализирует все положительные и отрицательные характеристики заемщика. Затем механизм логического вывода, реализованный в экспертной системе, выдает рекомендацию о выдаче либо отказе в выдачи кредита потенциальному заемщику.

Процесс разработки экспертных систем является дорогостоящим. Известно, что большинство выдаваемых кредитов являются потребительскими и суммы кредита невелики. Поэтому, использование для принятия решений экспертных систем часто является нерентабельным.

Преимущество данного метода заключается в качестве принятия решений. Поэтому, экспертные системы целесообразно использовать для принятия решения по кредитным заявкам на большие суммы.

 

1.2.7. Преимущества использования скоринговой системы.

Благодаря использованию скоринга банк получает снижение числа «плохих» кредитов[13]. Приведем в пример данные по кредитованию физических лиц с использованием системы скоринга фирмы Fair Isaac. После «пропускания» факторов, характеризующих заемщика, через скоринговую модель получим число, определяющее уровень риска, свойственного кредитованию данного заемщика. Это число принимает одно из значений от 300 до 850. Каждое из этих значений характеризует различную возможность погашения кредитных обязательств. Разные значения кредитного скоринга определяют различные соотношения «хороших» и «плохих» заемщиков (табл.1.1).

Табл.1.1. Зависимость отношения заемщиков от скоринга.

Численная оценка скоринга

Соотношение «хороших» и «плохих» заемщиков

Менее 600

8:1

601-659

26:1

660-679

38:1

680-699

55:1

700-719

123:1

720-759

323:1

760-799

597:1

Более 800

1292:1

Таким образом, кредитуя заемщиков с высоким значением скоринга, банк уменьшает вероятность невозврата кредитов. Тем самым уменьшаются потери и увеличивается прибыль от кредитной деятельности без снижения стандартов кредитования.

Используя скоринговую систему[14], банк получает ряд преимуществ перед конкурентами:

        сокращаются сроки принятия решений о предоставлении кредита. Увеличивается число и скорость обработки заявок за счет минимизации документооборота при выдаче кредита частным клиентам, как важнейший способ обеспечения доходности кредитования;

        снижается влияние субъективных факторов при принятии решения о предоставлении кредита. Обеспечивается объективность в оценке заявок кредитными инспекторами во всех филиалах и подразделений банка;

        реализуется возможность единого подхода при оценке заемщиков для различных типов кредитных продуктов банка;

        сокращение численности банковского персонала, экономия за счет использования персонала более низкой квалификации;

        контроль за всеми шагами рассмотрения кредитной заявки;

        возможность вносить коррективы в методологию оценки централизованно и немедленно вводить их в действие во всех отделениях банка.

1.3. Выводы

У каждого метода есть как достоинства, так и недостатки. Целесообразно использовать несколько методов в совокупности в виде некоторого гибридной модели, в которой сочетались бы достоинства отдельных подходов.

Математический аппарат деревьев решений является наиболее приемлемым для решения массовых задач по принятию решений, так как они обладают рядом достоинств по сравнению с другими методами, а именно:

      низкая стоимость адаптации к изменяющимся условиям кредитования;

      высокое качество результатов;

      способность перенастраиваться при добавлении новых параметров;

      интуитивная понятность и прозрачность;

      наличие инструментов для ручной корректировки правил для исправления противоречий.

Метод деревьев решений целесообразно применять при решения по кредитным заявкам на выдачу кредитов небольших сумм.

Экспертные системы необходимы для принятия решений по кредитным заявкам, запрашивающих большие суммы, так как они должны рассматриваться в индивидуальном порядке. Только в таких ситуациях целесообразно применение данного подхода, так как он является относительно дорогим, но более точным методом оценки кредитоспособности.

2. разработка защищенной адаптивной скоринговой системы оценки кредитоспособности физических лиц

Построение модели оценки кредитоспособности физических лиц (см. рис. 2.1) подразумевает последовательность обработки данных и построение дерева принятия решений (см. рис. 2.2).

90

 



Рис. 2.1. Разработка системы оценки кредитоспособности ФЛ.

Рис. 2.2. Этапы построения системы оценки кредитоспобности ФЛ

90

 



2.1. Формирование базы данных

База знаний для оценки кредитоспособности физических лиц состоит из 3 частей:

1) анкета заемщика.

2) решения кредитного комитета по кредитным заявкам клиентов.

3) база данных кредитных историй.

Качество оценки клиента во многом зависит от достаточности анализируемой информации, первичным источником которой является заявление анкета заемщика для получения кредита. Важным требованием является, с одной стороны, получение наибольшего количества информации, с другой стороны, сокращение избыточных данных, что позволяет соответственно проводить наиболее полный анализ банком и одновременно упростить процедуру заполнения документов для клиента.

 

2.1.1. Заявление анкета заемщика

В данной главе сделан акцент на разработку решений, позволяющих повысить достоверность оценки кредитоспособности заемщиков, получить максимально возможное количество необходимой информации о клиенте, а также затруднить мошеннические действия со стороны неблагонадежных клиентов, пытающихся соответствовать условиям, предъявляемым банками для получения кредита.

Основные параметры кредитных заявок [15], указываемые в заявлении на кредит и используемые в дальнейшем при оценке кредитоспособности заемщика кредитными организациями, занимающими первые десять мест рейтинга РБК по объему выданных потребительских кредитов по итогам 2007 г., сведены в таблице 2.1. Как видно из таблицы, большинство информационных данных, используемых в анкетах клиента для предоставления кредита, совпадают. Банками анализируются параметры испрашиваемого кредита, а также персональные сведения о потенциальном заемщике и его семье, степень платежеспособности, социальный статус и т.п. Рассмотрим более детально приведенные данные.

Табл.2.1. Анкета заемщика.

Основные параметры

Сбер-банк

ВТБ24

Рус-ский Стан-дарт

Рос-банк

Банк Москвы

Райффай-зенбанк Австрия

Урал-сиб

УРСА Банк

Юни-кредит Банк

Рос-сельхозбанк

Сумма и валюта кредита

+

+

+

+

+

+

+

+

+

+

Срок кредита

+

+

+

+

+

+

+

+

+

+

Процентная ставка

-

-

-

+

-

-

-

-

-

-

Предполагаемое обеспечение

+

+

-

+

-

-

+

-

-

+

Желаемый платеж

-

-

+

-

-

-

+

_

-

-

Порядок погашения

+

-

+

+

-

-

-

-

-

-

Цель кредита

+

+

+

+

+

+

+

+

+

+

ФИО

+

+

+

+

+

+

+

+

+

+

Прежние фамилия/ФИО

+

+

+

-

-

+

+

-

+

+

Дата и место рождения

-

+

+

+

+

+

+

+

+

+

Пол

-

+

+

-

+

+

+

-

-

+

Гражданство

-

+

+

-

+

+

-

-

+

-

Паспортные данные

-

+

+

+

-

+

+

+

+

+

Данные предыдущего паспорта

-

-

-

-

+

-

-

-

-

-

Данные дополнительных документов (водительское удостоверение, заграничный паспорт, ИНН, свидетельство государственного пенсион­ного страхования, военный билет)

-

-

+

+

+

+

+

+

+

+

Места регистрации и фактического жительства

+

+

+

+

+

+

+

+

+

+

Время проживания в населенном пункте/Дата регистрации по месту жительства

+

-

+

+

+

+

+

 

+

 

Контактная информация (номера телефонов, e-mail)

+

+

+

 

+

+

+

+

+

+

Отношение к воинской службе

-

+

-

-

+

-

-

-

-

+

Семейное положение, количество членов семьи

+

-

+

+

+

+

+

+

+

+

Сведения о супруге/созаем-щике

+

+

+

+

-

+

+

+

+

+

Наличие брачного договора

-

-

-

+

-

-

+

-

-

+

Образование

+

+

+

+

+

+

+

-

+

-

Сфера занятости, место работы должность, способ получения заработной платы

+

+

+

+

+

+

+

+

+

+

Предыдущее место работы

-

-

-

-

-

+

_

-

-

-

Трудоспособ-ность

-

+

-

-

-

+

+

-

-

-

Доходы/ расходы

+

+

+

+

+

+

+

+

+

+

Имущество

+

+

+

+

+

+

+

-

+

+

Информация о банковских счетах, имеющихся и погашенных кредитах

+

+

+

+

+

+

+

+

+

+

Информация о привлечении к административной и уголовной ответственнос-ти

-

+

+

+

+

+

+

-

-

+

Источник информации о кредите, сведения о сотрудничестве

+

-

-

+

+

+

+

-

+

-

Согласие на предоставление данных в БКИ

+

+

+

+

+

+

+

+

+

+

Информация о работе Защищенная информационная система оценки кредитоспособности физических лиц