Защищенная информационная система оценки кредитоспособности физических лиц

Автор: Пользователь скрыл имя, 13 Мая 2012 в 13:48, дипломная работа

Описание работы

В данном проекте рассматриваются вопросы оценки кредитоспособности физических лиц, анализируются существующие подходы анализа оценки кредитоспособности, описываются преимущества адаптивной скоринговой оценки кредитоспособности физических лиц, предлагается методика оценки кредитоспособности, производится апробация методики оценки кредитоспособности, анализируется ее эффективность.

Содержание

введение
1. Оценка кредитоспособности физических лиц
1.1. Обобщенные кредитные продукты физических лиц
1.1.1. Потребительское кредитование на неотложные нужды
1.1.2. Овердрафт
1.1.3. Автокредитование
1.1.4. Ипотечное кредитование
1.2. Анализ подходов оценки кредитоспособности физических лиц.
1.2.1. Классическая скоринговая система
1.2.2. Статистические методы
1.2.3. Метод k-ближайших соседей
1.2.4. Нейросетевые методы
1.2.5. Методы построения деревьев решений
1.2.6. Экспертные системы
1.2.7. Преимущества использования скоринговой системы.
1.3. Выводы
2. разработка защищенной адаптивной скоринговой системы оценки кредитоспособности физических лиц
2.1. Формирование базы данных
2.1.1. Заявление анкета заемщика
2.1.2. Анализ доходов и расходов заемщика
2.1.3. База данных кредитных историй
2.2. Очистка, предобработка и подготовка данных
2.2.1. Обработка дубликатов и противоречий
2.2.2. Обработка аномалий
2.2.3. Корреляционный анализ
2.2.4. Трансформация данных
2.3. Построение дерева решений
2.3.1. Выбор критерия точности прогноза
2.3.2. Выбор типа ветвления
2.3.3. Определение момента прекращения ветвлений
2.3.4. Определение «подходящих» размеров дерева
2.4. Система оценки кредитоспособности физических лиц
2.4.4. Комплексная система оценки кредитоспособности физических лиц
2.4.5. Защита информационной системы.
2.5. Выводы
3. Апробация системы оценки кредитоспособности физических лиц
3.1. Цель апробация системы оценки кредитоспособности физических лиц
3.1.1. Определение адекватности построения дерева решений
3.1.2. Анализ целесообразности внедрения скоринговой системы в бизнес процесс
3.2. Условия и порядок проведения испытаний
3.2.1. Описание среды проведения испытаний
3.2.2. Получение исходных данных
3.2.3. Квантование данных
3.2.3. Замена данных
3.2.4. Очистка данных
3.2.5. Построение дерева принятия решений
3.3. Результаты апробации адаптивной скоринговой системы
3.4. Выводы
4. Безопасность жизнедеятельности
4.1. Введение
4.2. Охрана труда
4.2.1. Микроклимат рабочего помещения
4.2.2. Эргономика рабочего помещения
4.2.3. Освещенность рабочего места
4.2.2. Расчет естественного освещения
4.3. Охрана окружающей среды
4.3.1. Защита окружающей среды от электромагнитных излучений
4.3.2. Рекомендации
4.4. Чрезвычайные ситуации
5.Экономика защиты информации
5.1. Расчет затрат на внедрение системы
5.1.1. Общее описание системы
5.1.2. Расчет единовременных затрат
5.1.3. Расчет постоянных затрат
5.2. Расчет эффективности внедрения информационной системы оценки кредитоспособности физических лиц.
Заключение
Список литературы

Работа содержит 1 файл

+Абдулхаков - Пояснительная записка.doc

— 2.25 Мб (Скачать)

7.      Рассмотрение кредитной заявки кредитным комитетом является последним шагом. Кредитный комитет принимает решение о выдаче кредита, либо об отказе.

Рис. 2.5. Алгоритм принятия решений по кредитным заявкам.

2.4.5. Защита информационной системы.

Для оценки кредитоспособности идентификационные данные, такие как удостоверение личности, ФИО не имеет никакого значения, этим самым сохраняем конфиденциальность персональных данных. Таким образом разработчики методики оценки кредитоспособности физических лиц работают только с обезличенными данными.

При внедрении системы оценки кредитоспособности физических лиц, скоринговая карта кредитной организации должна быть включена в перечень, охраняемых сведений коммерческой организации, так как в силу известности методики третьим лицам, предприятию может быть нанесен материальный ущерб.

Доступ к аналитической платформе должен согласовываться со следующими категориями лиц:

1.      Непосредственный руководитель сотрудника.

2.      Начальник службы защиты информации.

3.      Начальник управления кредитования.

4.      Председателя правления кредитной организации.

Аналитическая платформа располагается на удаленной машине, доступ к которой осуществляется администратором терминала удаленного доступа. Идентификация и аутентификация пользователя происходит во время подключения к удаленному компьютеру.

 

2.5. Выводы

В данной главе разработана защищенная информационная система оценки кредитоспособности физических лиц на основе модели дерева принятия решений. Проведена подготовка исходных данных для построения дерева принятия решений.

3. Апробация системы оценки кредитоспособности физических лиц

В данной главе проводится апробация скоринговой оценки кредитоспособности физических лиц. Описываются условия и порядок проведения испытаний. Проводится сравнение статистики по принятиям решений по кредитным заявкам кредитным комитетом без скоринговой оценки кредитоспособности физических лиц и после ее внедрения.

 

3.1. Цель апробация системы оценки кредитоспособности физических лиц

3.1.1. Определение адекватности построения дерева решений

              Для определения адекватности построения дерева принятия решений по кредитным заявкам необходимо построить модель, по которой скоринговая система принимала решение об отказе в выдаче кредита, а кредитный комитет подтверждал выдачу кредита, которое приняла скоринговая система (см. рис. 3.1.)

              В такой схеме скоринговая система однозначно не решает о выдаче кредита, а помогает в принятии решения кредитному комитету, которое и является ответственным лицом за принятие положительного решения.

Рис. 3.1. Алгоритм принятия решений

3.1.2. Анализ целесообразности внедрения скоринговой системы в бизнес процесс

Кредитные операции являются одним из основных источников дохода банковских организаций. Суммы запрашиваемых кредитов в большинстве кредитных заявок незначительны, поэтому и суммы процентов получаемые банком за эти операции незначительны. Для увеличения доходности от кредитных операций необходимо оптимизировать процесс принятия решений по кредитным заявкам, а также сократить расходы на анализ кредитоспособности физических лиц.

Разработанная в дипломном проекте модель оценки кредитоспособности физических лиц будет использована в бизнес процессе кредитной организации для принятия решений по кредитным заявкам, а следовательно повысит эффективность ее работы.

Таким образом, внедрение результатов дипломного проекта в бизнес процесс в виде методики построения информационной системы оценки кредитоспособности физических лиц целесообразно и актуально.

 

3.2. Условия и порядок проведения испытаний

Для каждого региона и кредитного продукта должны быть построены различные модели, так как должна учитываться специфика отдельного региона, в котором проживает и работает клиент, а также кредитного продукта по которому принимается решение о выдаче кредита.

В дипломном проекте рассматриваются кредитные заявки по потребительскому кредитования с суммой кредита размером до 150 000 рублей. В данной работе используются не все параметры кредитной заявки в целях защиты коммерческой тайны.

3.2.1. Описание среды проведения испытаний

Для обработки исходных данных и построения дерева принятия решений была использована аналитическая платформа версии 5.1, разработанный компанией BaseGroupLabs, г. Рязань.

Deductor – это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов (см. рис.3.2).

Рис. 3.2. Аналитическая платформа Detuctor 5.1.

В окне «Мастера импорта» (см. рис.3.3.) представлены все источники данных сгруппированы по следующим пяти категориям:

1. хранилища данных;

2. базы данных;

3. прямой доступ к файлам;

4. механизм MS ADO;

5. бизнес-приложения.

Рис. 3.3. Источники импорта данных

 

3.2.2. Получение исходных данных

              Для определения параметров кредитной заявки, которые участвуют в определении кредитоспособности заемщика была создана экспертная группа из 5 человек: 2 человека из управление кредитования и 3 человека из управления анализа рисков. Были определены следующие параметры, которые будут использованы при построении дерева принятия решений:

1)     сумма кредита;

2)     срок кредита;

3)     пол заемщика;

4)     возраст заемщика;

5)     образование;

6)     семейное положение;

7)     статус занятости;

8)     длительность работы на предыдущем месте;

9)     наличие квартиры в собственности;

10) наличие детей;

11) наличие положительной кредитной истории.

Среди приведенных параметров отсутствуют параметры, которые определяют физическое лицо, т.е. его персональные данные, так как паспортные данные, ИНН, страховое свидетельство, водительское удостоверение и т.д. Это означает что в выгрузке данных из кредитной системы параметры, не участвующие в оценке кредитоспособности физических лиц не осуществляется. Таким образом, в выгрузке хранится только коммерческая тайна кредитной организации, так как зная параметры кредитной заявки, которые является более значимые для оценки кредитоспособности данной кредитной организации может привести к финансовому ущербу организации.

Выгрузка выполнялась в файл «loans.csv» для последующей загрузки в аналитическую платформу (см. рис.3.4).

Рис. 3.4. Импорт данных

Первая строка в данных для импорта содержит наименование столбца, т.е. наименование параметра. Символом-разделителем является «;» (см.рис 3.5).

Рис. 3.5. Определение формата испорта

Далее необходимо определить тип данных параметров кредитной заявки, для дальнейшего исследования (см.рис. 3.6). На данном этапе проверяется соответствие импортируемых данных введенным параметрам.

Рис. 3.6. Определение типов данных


После процедуры импорта все записи отражаются в виде таблицы для дальнейшей обработки (см. рис.3.7).

Рис.3.7. Таблица исходной выборки

3.2.3. Квантование данных

              Высокая степень детализации данных ухудшает результаты анализа. Квантование используется для сокращения размерности данных, а именно уменьшения числа разнообразных значений признака. Таким образом, квантование позволяет наиболее полно выразить отношения между группами клиентов, исключив при этом влияние случайных вариаций, которые характерны при рассмотрении всего разнообразия значений признака.

              Квантования в аналитической платформе находится в меню «Мастер обработке» в разделе «Трансформация данных» (см. рис.3.8).

Рис. 3.8 Квантование данных

              Квантование необходимо производить по следующим параметрам:

1)     срок кредита;

2)     сумма кредита;

3)     возраст заемщика;

4)     среднемесячный доход;

5)     количество детей.

Значения этих параметров сильно разбросаны, поэтому необходимо разделить их на интервалы. Экспертным путем было получено следующее разбиение на интервалы (см. рис.3.9 и рис.3.10).

1.      Срок кредита:

1)     до 12 месяцев;

2)     от 1 года до 2 лет;

3)     от 2 лет до 3 лет;

4)     от 3 лет до 4 лет;

5)     от 4 лет до 5 лет.

2.      Сумма кредита:

1)     до 50000 рублей;

2)     от 50000 до 100000 рублей;

3)     от 100000 рублей.

3.      Возраст заемщика:

1)     от 21 до 24 лет;

2)     от 24 до 27 лет;

3)     от 27 до 31 года;

4)     от 31 до 40 лет;

5)     от 40 лет.

4.      Среднемесячный доход:

1)     до 5000 рублей;

2)     от 5000 до 10000 рублей;

3)     от 10000 до 15000 рублей;

4)     от 15000 до 30000 рублей;

5)     от 30000 до 50000 рублей.

5.      количество детей:

1)     нет детей;

2)     1 и более ребенок.

Рис. 3.9. Квантование данных

Рис. 3.10. Определение периодов

              После процедуры квантования данные в таблице заменяются по заданным условиям квантования и в следствии будут использованы при последующей обработки.

Рис. 3.11. Таблица данных после обработки квантованием.

3.2.3. Замена данных

              В базе данных кредитные заявки имеют различные статусы обработки (см. рис.3.13):

1)     выдан кредит;

2)     договор подписан;

3)     отклонена;

4)     утверждена;

5)     условно-утверждена;

6)     формирование договора.

Для построения дерева принятия решений необходимо каждый статус обработки кредитной заявки привести к 2-м выходным параметрам: выдать кредит и отказ в выдаче. Для этой операции необходима процедура замены данных, которая находится в разделе «Трансформация данных»(см. рис.3.12).

Рис3.12. Замена данных

 

3.13. Замена статусов кредитной заявки

3.2.4. Очистка данных

              Для очистки данных от дубликатов и противоречий необходима выполнить процедуру «Выявление дубликатов и противоречий» в разделе «Очистка данных» с указанием параметров, которые влияют на выходное значение дерева принятия решений (см. рис. 3.14).

В таблице отображаются дубликаты и противоречия, которые при построении дерева принятия решений отключаются в целях более точного его построения (см. рис. 3.15).

Рис. 3.14. Определение входных и выходных параметров обработки

 

Рис. 3.15. Отображения данных с выделением дубликатов и противоречий

Проанализируем полученные данные (см. рис. 3.16). Выявление дубликатов и противоречий показало, что противоречиями оказалось 6% исходных данных, т.е. 102 заявки из 1708. Под «чистые» данные подразумеваются данные, которые будут использованы при построении дерева принятия решений.

Рис. 3.16. Соотношение противоречий, дубликатов и «чистых» данных

3.2.5. Построение дерева принятия решений

              Построение дерева принятия решений является последним шагом для определения правил принятия решений. Для этого необходимо запустить процедуру построения дерева решений в разделе «Data Mining» (см. рис. 3.17).

Рис. 3.17. Выбор процедуры построения дерева решений

              На следующем этапе необходимо выбрать входные и выходные параметры для построения дерева принятия решений. Также необходимо исключать дубликаты и противоречия и использовать данные, которые были заменены, так как операция замена данных порождает дополнительный параметр (см. рис. 3.18).

Рис.3.18. Настройка параметров

              Конечным этапом является модели дерева принятия решений, которое построено на обработанных данных (см. рис. 3.19,3.20). Ветви можно разворачивать и сворачивать для удобства. Эта модель обладает необходимым свойством для аналитиков и экспертов, как наглядность и прозрачность. Далее правила, которые построены по каждой ветви экспортируются в систему обработки кредитных заявок и используется для принятия решений.

Рис. 3.19. Дерево принятия решений (свернутое)

Рис. 3.20. Дерево принятия решений (развернутое)

 

В результате построения дерева принятия решений построено дерево принятия решений, которое состоит из 33 правил. Для каждой ветки дерева принятия решения можно увидеть исходные данные по которым была построена данная ветвь, а также отдельное правило (см. рис. 3.20).

Рис. 3.21. Визуализация данных

 

3.3. Результаты апробации адаптивной скоринговой системы

              По итогам 2-х месячного испытания филиала, апробация системы оценки кредитоспособности физических лиц показала высокие результаты.

Информация о работе Защищенная информационная система оценки кредитоспособности физических лиц