Основные сферы применения Data Mining

Автор: Пользователь скрыл имя, 05 Ноября 2012 в 21:10, курсовая работа

Описание работы

Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих «сырых» данных заключены знания, которые могут быть использованы при принятии решений. Для того чтобы провести автоматический анализ данных, используется Data Mining.

Содержание

Введение. Что такое Data Mining? 3
Применение Data Mining для решения бизнес-задач 4
Применение Data Mining в CRM 11
Data Mining для научных исследований 14
Web Mining 16
Text Mining 20
Call Mining 21
Список используемой литературы 23

Работа содержит 1 файл

курсовая Анализ данных.docx

— 52.88 Кб (Скачать)

Федеральное агентство  по образованию

 


Государственное образовательное  учреждение

высшего профессионального  образования

«Санкт-Петербургский  государственный технологический  институт

(технический  университет)»

 


 

Кафедра экономики и менеджмента

Форма обучения: очное

Направление подготовки: бизнес-информатика

Степень (квалификация): бакалавр

Учебная дисциплина: Анализ данных

 

 

Курсовая работа на тему:

«Основные сферы применения Data Mining».

 

 

Студент группы №6119:Агафонова Олеся Андреевна

Руководитель: Москвичева Анастасия Игоревна

Санкт-Петербург  2011

Оглавление

 

Введение. Что  такое Data Mining? 3

Применение Data Mining для решения бизнес-задач 4

Применение Data Mining в CRM 11

Data Mining для научных исследований 14

Web Mining 16

Text Mining 20

Call Mining 21

Список используемой литературы 23

 

 

 

Введение. Что такое Data Mining?

 

Развитие методов записи и хранения данных привело к бурному  росту объемов собираемой и анализируемой  информации. Объемы данных настолько  внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в  этих «сырых» данных заключены знания, которые могут быть использованы при принятии решений. Для того чтобы  провести автоматический анализ данных, используется Data Mining.

Data Mining – это процесс обнаружения в «сырых» данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Информация, найденная в  процессе применения методов Data Mining, должна быть нетривиальной и ранее неизвестной, например, средние продажи не являются таковыми. Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других и т.д. Найденные знания должны быть применимы и на новых данных с некоторой степенью достоверности. Полезность заключается в том, что эти знания могут приносить определенную выгоду при их применении.

Следует отметить, что на сегодняшний день наибольшее распространение  технология Data Mining получила при решении бизнес-задач. Возможно, причина в том, что именно в этом направлении отдача от использования инструментов Data Mining может составлять, по некоторым источникам, до 1000% и затраты на ее внедрение могут достаточно быстро окупиться. Сейчас технология Data Mining используется практически во всех сферах деятельности человека, где накоплены ретроспективные данные.

Применение  Data Mining для решения бизнес-задач

 

Банковское дело.

Технология Data Mining используется в банковской сфере для решения ряда типичных задач.

Задача "Выдавать ли кредит клиенту?"

Классический пример применения Data Mining в банковском деле - решение задачи определения возможной некредитоспособности клиента банка. Эту задачу также называют анализом кредитоспособности клиента или "Выдавать ли кредит клиенту?".

Без применения технологии Data Mining задача решается сотрудниками банковского учреждения на основе их опыта, интуиции и субъективных представлений о том, какой клиент является благонадежным. По похожей схеме работают системы поддержки принятия решений и на основе методов Data Mining. Такие системы на основе исторической (ретроспективной) информации и при помощи методов классификации выявляют клиентов, которые в прошлом не вернули кредит.

Задача "Выдавать ли кредит клиенту?" при помощи методов Data Mining решается следующим образом. Совокупность клиентов банка разбивается на два класса (вернувшие и не вернувшие кредит); на основе группы клиентов, не вернувших кредит, определяются основные "черты" потенциального неплательщика; при поступлении информации о новом клиенте определяется его класс ("вернет кредит", "не вернет кредит").

Задача привлечения  новых клиентов банка.

С помощью инструментов Data Mining возможно провести классификацию на "более выгодных" и "менее выгодных" клиентов. После определения наиболее выгодного сегмента клиентов банку есть смысл проводить более активную маркетинговую политику по привлечению клиентов именно среди найденной группы.

Другие задачи сегментации клиентов.

Разбивая клиентов при  помощи инструментов Data Mining на различные группы, банк имеет возможность сделать свою маркетинговую политику более целенаправленной, а потому - эффективной, предлагая различным группам клиентов именно те виды услуг, в которых они нуждаются.

Задача управления ликвидностью банка. Прогнозирование  остатка на счетах клиентов.

Проводя прогнозирования  временного ряда с информацией об остатках на счетах клиентов за предыдущие периоды, применяя методы Data Mining, можно получить прогноз остатка на счетах в определенный момент в будущем. Полученные результаты могут быть использованы для оценки и управления ликвидностью банка.

Задача выявления  случаев мошенничества с кредитными карточками.

Для выявления подозрительных операций с кредитными карточками применяются  так называемые "подозрительные стереотипы поведения", определяемые в результате анализа банковских транзакций, которые впоследствии оказались  мошенническими. Для определения  подозрительных случаев используется совокупность последовательных операций на определенном временном интервале. Если система Data Mining считает очередную операцию подозрительной, банковский работник может, ориентируясь на эту информацию, заблокировать операции с определенной карточкой.

 

Страхование

Страховой бизнес связан с  определенным риском. Здесь задачи, решаемые при помощи Data Mining, сходны с задачами в банковском деле.

Информация, полученная в  результате сегментации клиентов на группы, используется для определения  групп клиентов. В результате страховая  компания может с наибольшей выгодой  и наименьшим риском предлагать определенные группы услуг конкретным группам  клиентов.

Задача выявление мошенничества  решается путем нахождения некого общего стереотипа поведения клиентов-мошенников.

Телекоммуникации

В сфере телекоммуникаций достижения Data Mining могут использоваться для решения задачи, типичной для любой компании, которая работает с целью привлечения постоянных клиентов, - определения лояльности этих клиентов. Необходимость решения таких задач обусловлена жесткой конкуренцией на рынке телекоммуникаций и постоянной миграцией клиентов от одной компании в другую. Как известно, удержание клиента намного дешевле его возврата. Поэтому возникает необходимость выявления определенных групп клиентов и разработка наборов услуг, наиболее привлекательных именно для них. В этой сфере, так же как и во многих других, важной задачей является выявление фактов мошенничества.

Помимо таких задач, являющихся типичными для многих областей деятельности, существует группа задач, определяемых спецификой сферы телекоммуникаций.

Электронная коммерция

В сфере электронной коммерции Data Mining применяется для формирования рекомендательных систем и решения задач классификации посетителей Web-сайтов. Такая классификация позволяет компаниям выявлять определенные группы клиентов и проводить маркетинговую политику в соответствии с обнаруженными интересами и потребностями клиентов. Технология Data Mining для электронной коммерции тесно связана с технологией Web Mining.

Промышленное  производство

Особенности промышленного  производства и технологических  процессов создают хорошие предпосылки  для возможности использования  технологии Data Mining в ходе решения различных производственных задач. Технический процесс по своей природе должен быть контролируемым, а все его отклонения находятся в заранее известных пределах;

т.е. здесь мы можем говорить об определенной стабильности, которая  обычно не присуща большинству задач, встающих перед технологией Data Mining.

Основные задачи Data Mining в промышленном производстве:

  • комплексный системный анализ производственных ситуаций;
  • краткосрочный и долгосрочный прогноз развития производственных ситуаций;
  • выработка вариантов оптимизационных решений;
  • прогнозирование качества изделия в зависимости от некоторых параметров технологического процесса;
  • обнаружение скрытых тенденций и закономерностей развития производственных процессов;
  • прогнозирование закономерностей развития производственных процессов;
  • обнаружение скрытых факторов влияния;
  • обнаружение и идентификация ранее неизвестных взаимосвязей между производственными параметрами и факторами влияния;
  • анализ среды взаимодействия производственных процессов и прогнозирование изменения ее характеристик;
  • выработку оптимизационных рекомендаций по управлению производственными процессами;
  • визуализацию результатов анализа, подготовку предварительных отчетов и проектов допустимых решений с оценками достоверности и эффективности возможных реализаций.

Маркетинг

В сфере маркетинга Data Mining находит очень широкое применение.

Основные вопросы маркетинга "Что продается?", "Как продается?", "Кто является потребителем?"

В лекции, посвященной задачам  классификации и кластеризации, подробно описано использование  кластерного анализа для решения  задач маркетинга, как, например, сегментация  потребителей.

Другой распространенный набор методов для решения  задач маркетинга - методы и алгоритмы  поиска ассоциативных правил.

Также успешно здесь используется поиск временных закономерностей.

Розничная торговля

В сфере розничной торговли, как и в маркетинге, применяются:

  • алгоритмы поиска ассоциативных правил (для определения часто встречающихся наборов товаров, которые покупатели покупают одновременно). Выявление таких правил помогает размещать товары на прилавках торговых залов, вырабатывать стратегии закупки товаров и их размещения на складах и т.д.
  • использование временных последовательностей, например, для определения необходимых объемов запасов товаров на складе.
  • методы классификации и кластеризации для определения групп или категорий клиентов, знание которых способствует успешному продвижению товаров.

Фондовый рынок

Вот список задач фондового  рынка, которые можно решать при  помощи технологии Data Mining:

  • прогнозирование будущих значений финансовых инструментов и индикаторов по их прошлым значениям;
  • прогноз тренда (будущего направления движения - рост, падение, флэт) финансового инструмента и его силы (сильный, умеренно сильный и т.д.);
  • выделение кластерной структуры рынка, отрасли, сектора по некоторому набору характеристик;
  • динамическое управление портфелем;
  • прогноз волатильности;
  • оценка рисков;
  • предсказание наступления кризиса и прогноз его развития;
  • выбор активов и др.

Кроме описанных выше сфер деятельности, технология Data Mining может применяться в самых разнообразных областях бизнеса, где есть необходимость в анализе данных и накоплен некоторый объем ретроспективной информации.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Применение  Data Mining в CRM

 

Одно из наиболее перспективных  направлений применения Data Mining - использование данной технологии в аналитическом CRM.

CRM (Customer Relationship Management) - управление отношениями с клиентами.

При совместном использовании  этих технологий добыча знаний совмещается  с "добычей денег" из данных о  клиентах.

Важным аспектом в работе отделов маркетинга и отдела продаж является составление целостного представления  о клиентах, информация об их особенностях, характеристиках, структуре клиентской базы. В CRM используется так называемое профилирование клиентов, дающее полное представление всей необходимой  информации о клиентах. Профилирование клиентов включает следующие компоненты: сегментация клиентов, прибыльность клиентов, удержание клиентов, анализ реакции клиентов. Каждый из этих компонентов  может исследоваться при помощи Data Mining, а анализ их в совокупности, как компонентов профилирования, в результате может дать те знания, которые из каждой отдельной характеристики получить невозможно.

В результате использования Data Mining решается задача сегментации клиентов на основе их прибыльности. Анализ выделяет те сегменты покупателей, которые приносят наибольшую прибыль. Сегментация также может осуществляться на основе лояльности клиентов. В результате сегментации вся клиентская база будет поделена на определенные сегменты, с общими характеристиками. В соответствии с этими характеристиками компания может индивидуально подбирать маркетинговую политику для каждой группы клиентов.

Также можно использовать технологию Data Mining для прогнозирования реакции определенного сегмента клиентов на определенный вид рекламы или рекламных акций - на основе ретроспективных данных, накопленных в предыдущие периоды.

Таким образом, определяя  закономерности поведения клиентов при помощи технологии Data Mining, можно существенно повысить эффективность работы отделов маркетинга, продаж и сбыта. При объединении технологий CRM и Data Mining и грамотном их внедрении в бизнес компания получает значительные преимущества перед конкурентами.

Исследования  для правительства

В планах правительства США  стоит создание системы, которая  позволит отслеживать всех иностранцев, приезжающих в страну. Задача этого  комплекса: начиная с пограничного терминала, на основе технологии биометрической идентификации личности и различных  других баз данных контролировать, насколько реальные планы иностранцев  соответствуют заявленным ранее (включая перемещения по стране, сроки отъезда и др.). Предварительная стоимость системы составляет более 10 млрд. долларов, разработчик комплекса - компания Accenture.

По данным аналитического отчета Главного контрольного управления американского Конгресса, правительственные  ведомства США участвуют приблизительно в двухстах проектах на основе анализа  данных (Data Mining), собирающих разнообразную информацию о населении. Более ста из этих проектов направлены на сбор персональной информации (имена, фамилии, адреса e-mail, номера соцстрахования и удостоверений водительских прав), и на основе этой информации осуществляют предсказания возможного поведения людей. Поскольку в упомянутом отчете не приведена информация о секретных отчетах, надо полагать, что общее число таких систем значительно больше.

Информация о работе Основные сферы применения Data Mining