Кластерный анализ

Автор: Пользователь скрыл имя, 20 Марта 2011 в 15:27, реферат

Описание работы

Кластерный анализ - совокупность математических методов, предназначенных для формирования относительно "отдаленных" друг от друга групп "близких" между собой объектов по информации о расстояниях или связях (мерах близости) между ними.

Содержание

1. Понятие кластерного анализа. Его значение…………………….3
2. Задачи, этапы, требования к данным кластерного анализа……..5
3. Методы кластерного анализа………………………….…………..7
4. Применение кластерного анализа………………………………...9
5. Анализ результатов кластерного анализа……………………….12
Список литературы………………………………………………….14

Работа содержит 1 файл

доклад.doc

— 71.00 Кб (Скачать)

   В результате применения кластерного  анализа были получены следующие  пять групп стран:

   1)афро-азиатская группа; 2)латино-азиатская группа; 3)латино-среднеземноморская группа; 4)группа развитых капиталистических стран (без США).

   Введение  новых индикаторов сверх используемого  здесь 31 показателя или замена их другими, естественно, приводят к изменению результатов классификации стран.

   Деление стран по критерию близости культуры.

   Как известно маркетинг должен учитывать  культуру стран (обычаи, традиции, и  т.д.).

   Посредством кластеризации были получены следующие  группы стран:

   Арабские; ближневосточные; скандинавские; германоязычные; англоязычные; романские европейские; латиноамериканские; дальневосточные. 
 
 
 
 
 
 
 
 
 
 

  5 Анализ результатов кластерного анализа 

   При анализе результатов социологических  исследований рекомендуется осуществлять анализ методами иерархического агломеративного семейства, а именно методом Уорда, при котором внутри кластеров оптимизируется минимальная дисперсия, в итоге создаются кластеры приблизительно равных размеров. Метод Уорда наиболее удачен для анализа социологических данных. В качестве меры различия лучше квадратичное евклидово расстояние, которое способствует увеличению контрастности кластеров. Главным итогом иерархического кластерного анализа является дендрограмма или «сосульчатая диаграмма». При её интерпретации исследователи сталкиваются с проблемой того же рода, что и толкование результатов факторного анализа — отсутствием однозначных критериев выделения кластеров. В качестве главных рекомендуется использовать два способа — визуальный анализ дендрограммы и сравнение результатов кластеризации, выполненной различными методами.

   Визуальный  анализ дендрограммы предполагает «обрезание»  дерева на оптимальном уровне сходства элементов выборки. «Виноградную ветвь» (терминология Олдендерфера М. С. и Блэшфилда  Р. К.) целесообразно «обрезать» на отметке 5 шкалы Rescaled Distance Cluster Combine, таким образом будет достигнут 80 % уровень сходства. Если выделение кластеров по этой метке затруднено (на ней происходит слияние нескольких мелких кластеров в один крупный), то можно выбрать другую метку. Такая методика предлагается Олдендерфером и Блэшфилдом.

   Теперь  возникает вопрос устойчивости принятого  кластерного решения. По сути, проверка устойчивости кластеризации сводится к проверке её достоверности. Здесь  существует эмпирическое правило —  устойчивая типология сохраняется при изменении методов кластеризации. Результаты иерархического кластерного анализа можно проверять итеративным кластерным анализом по методу k-средних. Если сравниваемые классификации групп респондентов имеют долю совпадений более 70 % (более 2/3 совпадений), то кластерное решение принимается.

   Проверить адекватность решения, не прибегая к  помощи другого вида анализа, нельзя. По крайней мере, в теоретическом  плане эта проблема не решена. В  классической работе Олдендерфера и  Блэшфилда «Кластерный анализ» подробно рассматриваются и в итоге отвергаются дополнительные пять методов проверки устойчивости: 1) кофенетическая корреляция — не рекомендуется и ограниченна в использовании; 2) тесты значимости (дисперсионный анализ) — всегда дают значимый результат; 3) методика повторных (случайных) выборок, что, тем не менее, не доказывает обоснованность решения; 4) тесты значимости для внешних признаков пригодны только для повторных измерений; 5) методы Монте-Карло очень сложны и доступны только опытным математикам. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Список  литературы 

1. www.ed.vseved.ru

2. Шарп У., Александер Г., Бэйли Дж. Инвестиции: Пер. с англ. –

М.: ИНФРА-М, 2001. – XII, 1028 с.

3. Никифорова Н.С. Кластерный анализ в задачах социально-экономического прогнозирования.

Информация о работе Кластерный анализ