Кластерный анализ

Автор: Пользователь скрыл имя, 16 Декабря 2010 в 17:12, практическая работа

Описание работы

Проранжируем данные по всем показателям и исключим аномальные наблюдения: визуальный анализ диаграмм рассеяния показал, что таких наблюдений нет.

Работа содержит 1 файл

кластерный.docx

— 134.31 Кб (Скачать)

a  Dependent Variable: X1 

      Т.к. модель, включающая константу и показатели X3 и X4, признанные значимыми, имеет наибольший коэффициент детерминации (R2=0,723), а также меньшую стандартную ошибку (S=617,28), то моделью, наиболее точно описывающей эмпирические данные, признается она. Уравнение регрессии значимо. Тем не менее, модель недостаточно точна. 

Окончательное уравнение регрессии примет вид: Y = 1760,55 + 2,82X– 71,11X4,

                                                                                     (399,86)    (0,36)      (26,25)

                                                                                          S = 617,28, R2 = 0,723. 

      б) 2 кластер 

Методом пошагового исключения регрессоров: 

      Model Summary 

Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,537(a) ,288 ,237 3451,98271
2 ,714(b) ,510 ,435 2971,01623

a  Predictors: (Constant), X2

b  Predictors: (Constant), X2, X3 

      Coefficients(a) 

Model    Unstandardized Coefficients Standardized Coefficients t Sig.
       B Std. Error Beta      
1 (Constant) 6398,518 2234,302    2,864 ,013
    X2 15,419 6,477 ,537 2,381 ,032
2 (Constant) 2653,089 2464,892    1,076 ,301
    X2 16,319 5,587 ,568 2,921 ,012
    X3 2,495 1,027 ,472 2,429 ,030

a  Dependent Variable: X1 

Т.к. модель, включающая константу и показатели X2 и X3 имеет наибольший коэффициент детерминации (R2=0,510), а также меньшую стандартную ошибку (S=2971,02), то моделью, наиболее точно описывающей эмпирические данные, признается она. Однако константа оказалась незначимой.  

Окончательное уравнение регрессии примет вид: Y = 16,32X + 2,5X3,

                                                                                       (5,59)       (1,03)

                                                                             S = 2971,02, R2 = 0,510. 

Из-за низкого  коэффициента детерминации модель не является пригодной для дальнейшего  анализа. 

      в) 3 кластер 

      Model Summary 

Model R R Square Adjusted R Square Std. Error of the Estimate
1 ,617(a) ,380 ,339 757,93106

a  Predictors: (Constant), X4 

      Coefficients(a) 

Model    Unstandardized Coefficients Standardized Coefficients t Sig.
       B Std. Error Beta      
1 (Constant) 3546,704 507,444    6,989 ,000
    X4 91,949 30,305 ,617 3,034 ,008

a  Dependent Variable: X1 

Модель имеет  коэффициент детерминации R2=0,380, стандартную ошибку (S=757,93). Коэффициенты и уравнение регрессии признаны значимыми. 

Тогда окончательное  уравнение регрессии примет вид: Y = 3546,7  + 91,95X4,

                                                                                              (507,44)  (30,31)

                                                                                         S = 757,93, R2 = 0,380. 

Из-за низкого  коэффициента детерминации модель не является пригодной для дальнейшего  анализа.

6. Выводы. 

      Использование типологических регрессий не было целесообразным. Все модели, полученные в предыдущем пункте, уступают по качеству первой построенной  модели. Возможно, необходимо было разбить  совокупность на другое количество кластеров  или использовать другие методы кластеризации.

Информация о работе Кластерный анализ