Автор: Пользователь скрыл имя, 24 Октября 2011 в 13:26, курсовая работа
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью.
Содержание
Введение 3
Теоретическое обоснование модели 5
Построение и анализ эконометрической модели 6
Заключение 11
Список использованных источников 12
Приложение 13
Коэффициенты модели статистически значимы, R-квадрат достаточно высокий, Высокое значение F- статистики (2,57) и соответствующее ему значение Pvalue =3,52 подтверждают его значимость.
Проинтерпретируем коэффициенты при переменных.
- коэффициент 2314,22 при totsq означает, что увеличение общей площади квартиры на 1 кв.м при прочих равных приводит к увеличению цены в среднем на 2314,22 долл.
- коэффициент при distc означает, что увеличение расстояния до центра на 1 км при прочих равных приводит к уменьшению цены на 1,77281 долл., коэффициент значим, следовательно, цена квартиры зависит от расстояния до центра.
Проверим модель на мультиколлинеарность
Одним
из условий Гаусса – Маркова для
множественной регрессии
Проведя соответствующие расчеты в Excel получи следующие парные коэффициенты корреляции:
Таблица (2)
Столбец 1 | Столбец 2 | Столбец 3 | |
Столбец 1 | 1 | ||
Столбец 2 | -0,20837 | 1 | |
Столбец 3 | 0,905958 | -0,08987 | 1 |
Из приведенной выше таблицы можно сделать вывод об отсутствии мультиколлинеарности в модели.
Присутствие
автокорреляции в данной модели маловероятно,
т.к. приведенные данные являются перекрестными.
Проверим
остатки модели на
нормальность.
Остатки модели имеют нормальный закон распределения.
Высокое значение t-статистики коэффициента при переменной totsq (16,6592) может свидетельствовать о наличие в модели проблемы гетероскедастичности. Для того, чтобы исключить возможность ложных выводов о значимости коэффициентов при переменных и коэффициента детерминации, проведем тесты на гетероскедастичность.
Тест Голдфельда- Квандта проверяет, зависит ли дисперсия случайных возмущений от какого- то конкретного показателя.
Тест применяется, как правило, когда есть предположение о прямой зависимости дисперсии ошибок от величины некоторой объясняющей переменной, входящей в модель.
Проверяем по Х1 (См. Приложение 4): по переменной Х1 ГС отсутствует.
Проверяем по Х2 (См. Приложение 5):по переменной Х2 ГС присутствует.
В результате проведенного теста Голдфелда-Квандта установлено, что
Fнабл < Fкрит, то есть гипотеза Но отвергается, то есть дисперсия случайных возмущений не зависит от Х1.
Гомоскедастичность- дисперсия каждого отклонения εi одинакова для всех значений i.
Гетероскедастичность- дисперсия объясняемой переменной не постоянна.
В тесте на гетероскедастичность мы должны проверить основную гипотезу
H0:σ12= σ22=…= σn2 (т.е. модель гомоскедастична) против альтернативной гипотезы H1: не H0 (т.е. модель гетероскедастична).
В ряде случаев на базе знаний характера данных появление проблемы гетероскедастичности можно предвидеть и попытаться устранить этот недостаток еще на этапе спецификации. Однако значительно чаще эту проблему приходится решать после построения уравнения регрессии.
Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности.
Проанализировав график остатков выдвигаем гипотезу Но: дисперсия случайных возмущений зависит от Х1.
Проанализировав график остатков выдвигаем гипотезу Но: дисперсия случайных возмущений зависит от Х2.
Делаем
вывод, что дисперсия случайных возмущений
зависит отX1 (distc) и Х2(totsq).
Попробуем изменить спецификацию модели. Построим логарифмическую модель. Возможно, это устранит проблему гетероскедастичности.
Коэффициент | Ст. ошибка | t-статистика | P-значение | |
const | 8,26775 | 0,372518 | 22,1942 | <0,00001 |
l_distc | -0,097844 | 0,0348353 | -2,8088 | 0,00680 |
l_totsq | 1,0377 | 0,048156 | 21,5486 | <0,00001 |
Регрессионная статистика | |
Множественный R | 0,891053 |
R-квадрат | 0, 894746 |
Нормированный R-квадрат | 0,026731 |
Стандартная ошибка | 0,121195 |
Высокий коэффициент детерминации (0,89), его значимость (F-stat=242,273 Pvalue=0,0000), значимые коэффициенты при независимых переменных, говорят о хорошем качестве модели.
Проинтерпретируем коэффициенты при экзогенных переменных:
- коэффициент 1,0377 при LNTOTSQ означает, что увеличение общей площади квартиры на 1% при прочих равных приводит к увеличению цены в среднем на 1,0377%.
- коэффициент при DISTC проинтерпретируем следующим образом: при увеличении расстояния до центра на 1% при прочих равных приводит к увеличению цены в среднем на 0,097844%; этот коэффициент значим, следовательно, цена квартиры зависит от расстояния до центра.
Проверив модель на мультиколлинеарность можно сделать вывод об её отсутствии.
Высокое значение t-статистики коэффициента при переменной TOTSQ (21,5486) может свидетельствовать о наличие в модели проблемы гетероскедастичности. Для того, чтобы исключить возможность ложных выводов о значимости коэффициентов при переменных проверим наличие либо отсутствие в модели гетероскедастичности с помощью тестов.
Тест Вайта (White) на гетероскедастичность
МНК, использованы наблюдения 1-60
Зависимая переменная:
uhat^2
Коэффициент Ст. ошибка t-статистика P-значение
------------------------------
const 0,624788 2,00841 0,3111 0,7569
l_distc -0,0284895 0,336370 -0,08470 0,9328
l_totsq -0,278008 0,462921 -0,6006 0,5507
sq_l_distc 0,00165119 0,0155584 0,1061 0,9159
X2_X3 -0,000151004 0,0264857 -0,005701 0,9955
sq_l_totsq
0,0393224 0,0397294 0,9898
0,3267
Неисправленный
R-квадрат = 0,134431
Тестовая статистика: TR^2 = 8,065876,
р-значение = P(Хи-квадрат(5) > 8,065876) = 0,152642
Тест
Вайта показал, что в модели отсутствует
гетероскедастичность. Таким образом,
можно сделать вывод, что при
использовании преобразованных
данных можно избежать проблемы гетероскедастичности
в модели.
В
ходе проведенной работы были построены
две регрессионные модели, описывающие
зависимость продажной цены квартиры
от двух факторов: общей площади
квартиры и величины, равной расстоянию
до центра. В качестве регрессоров были
рассмотрены и другие факторы, но они оказались
незначимыми, и поэтому были исключены
из модели. Незначимость переменных может
быть связана с рядом факторов: небольшой
объем выборки, неточность данных или
их действительно незначимый вклад в определение
цены квартиры. В первой линейной модели
было обнаружено одно из нарушений классических
предпосылок МНК – непостоянство дисперсий
отклонений – гетероскедастичность. Поэтому
вопреки хорошим показателям модели (высокие
t-статистики, коэффициент детерминации)
вывод о ее хорошем качестве может быть
ложным из-за нарушения предпосылки о
гомоскедастичности остатков. Для борьбы
с этим явлением была изменена спецификация
модели. В новой логарифмической модели
проблема гетероскедастичости по результатам
теста Уайта устранилась, соответственно
можно сделать вывод о том, что изменение
спецификации модели может служить хорошим
методом для устранения гетероскедастичности.
Таблица №1: Данные,
используемые в работе
Price | distc | obrdistc | totsq | Livsq | Kitsq | dopsq | floor | totfloor | bal | tel | year |
55000 | 6307 | 0,000159 | 30 | 17 | 6 | 5 | 0 | 5 | 0 | 1 | 23 |
56000 | 18385 | 5,44E-05 | 31 | 16 | 6,8 | 1 | 0 | 5 | 1 | 0 | 17 |
57000 | 7131 | 0,00014 | 34 | 20 | 5,3 | 4 | 1 | 5 | 1 | 1 | 13 |
59500 | 14118 | 7,08E-05 | 34 | 17 | 7,1 | 1 | 0 | 9 | 1 | 1 | 2 |
60000 | 3822 | 0,000262 | 30 | 20 | 5,3 | 3 | 1 | 5 | 1 | 0 | 20 |
61000 | 5813 | 0,000172 | 32 | 19 | 5,7 | 4 | 0 | 4 | 1 | 1 | 40 |
61000 | 9367 | 0,000107 | 34 | 17 | 7,2 | 2 | 1 | 9 | 1 | 0 | 13 |
62000 | 6611 | 0,000151 | 34 | 17 | 7,1 | 3 | 0 | 9 | 1 | 1 | 17 |
62000 | 7374 | 0,000136 | 35 | 18 | 7,6 | 5 | 1 | 5 | 1 | 0 | 11 |
63000 | 7584 | 0,000132 | 33 | 17 | 7,6 | 1 | 1 | 9 | 1 | 1 | 1 |
63000 | 5608 | 0,000178 | 31 | 16 | 5,7 | 1 | 0 | 5 | 1 | 0 | 20 |
63000 | 14073 | 7,11E-05 | 34 | 18 | 9,2 | 10 | 0 | 10 | 1 | 1 | 27 |
64000 | 5341 | 0,000187 | 33 | 17 | 7 | 6 | 0 | 9 | 1 | 1 | 18 |
64000 | 7181 | 0,000139 | 33 | 17 | 7,1 | 6 | 0 | 9 | 1 | 1 | 18 |
65000 | 4309 | 0,000232 | 34 | 18 | 7 | 2 | 1 | 9 | 1 | 1 | 33 |
65800 | 6667 | 0,00015 | 35 | 18 | 7,4 | 3 | 1 | 5 | 1 | 0 | 5 |
66000 | 3776 | 0,000265 | 31 | 18 | 5,1 | 7,9 | 1 | 4 | 1 | 1 | 17 |
66000 | 5936 | 0,000168 | 33 | 17 | 7,5 | 8,5 | 1 | 9 | 1 | 1 | 10 |
67000 | 11172 | 8,95E-05 | 29 | 18 | 5,8 | 5,2 | 0 | 5 | 1 | 1 | 0 |
67000 | 11203 | 8,93E-05 | 34 | 18 | 9,3 | 6,7 | 0 | 9 | 0 | 1 | 33 |
67800 | 4566 | 0,000219 | 40,3 | 28 | 5,8 | 6,5 | 0 | 2 | 0 | 1 | 40 |
71000 | 4623 | 0,000216 | 37 | 27 | 5 | 5 | 1 | 3 | 0 | 1 | 1 |
72000 | 11232 | 8,9E-05 | 40,37 | 23,8 | 6,4 | 10,17 | 1 | 5 | 1 | 1 | 40 |
74000 | 3230 | 0,00031 | 45,5 | 29 | 6,2 | 10,3 | 0 | 4 | 0 | 1 | 22 |
76000 | 6598 | 0,000152 | 44 | 31 | 5,8 | 7,2 | 0 | 5 | 1 | 1 | 47 |
76000 | 5924 | 0,000169 | 45,7 | 30,6 | 5,7 | 9,4 | 1 | 5 | 1 | 1 | 43 |
80000 | 5560 | 0,00018 | 45 | 30 | 6 | 9 | 1 | 5 | 1 | 1 | 45 |
83000 | 6970 | 0,000143 | 44 | 28,7 | 6,1 | 9,2 | 1 | 5 | 1 | 1 | 2 |
83000 | 8524 | 0,000117 | 46,5 | 27,5 | 7,1 | 11,9 | 1 | 9 | 1 | 1 | 33 |
85000 | 6404 | 0,000156 | 43,5 | 31,8 | 5,8 | 5,9 | 1 | 4 | 1 | 1 | 23 |
88000 | 9170 | 0,000109 | 49 | 28,2 | 8 | 12,8 | 1 | 9 | 1 | 1 | 20 |
88000 | 9139 | 0,000109 | 48,8 | 30,37 | 6,1 | 12,33 | 1 | 5 | 1 | 1 | 41 |
88000 | 2361 | 0,000424 | 47,7 | 30,6 | 5,8 | 11,3 | 1 | 5 | 1 | 1 | 40 |
90000 | 11209 | 8,92E-05 | 46,7 | 28,3 | 7,1 | 11,3 | 0 | 9 | 1 | 1 | 13 |
93000 | 3095 | 0,000323 | 44 | 28 | 6 | 10 | 1 | 5 | 1 | 1 | 45 |
93000 | 7569 | 0,000132 | 49 | 34 | 6 | 9 | 0 | 5 | 1 | 1 | 39 |
93500 | 11784 | 8,49E-05 | 51 | 29 | 9,2 | 12,8 | 1 | 9 | 1 | 1 | 17 |
95000 | 8094 | 0,000124 | 67,1 | 43,8 | 8,5 | 14,8 | 1 | 9 | 1 | 1 | 20 |
98000 | 10854 | 9,21E-05 | 50,3 | 23,2 | 9,6 | 17,5 | 1 | 12 | 1 | 1 | 10 |
99000 | 11867 | 8,43E-05 | 58 | 36 | 8,3 | 13,7 | 0 | 5 | 1 | 1 | 27 |
104000 | 12306 | 8,13E-05 | 63,2 | 43,5 | 7,1 | 12,6 | 0 | 9 | 1 | 1 | 12 |
104500 | 10741 | 9,31E-05 | 67,5 | 46 | 7,4 | 14,1 | 1 | 9 | 1 | 1 | 2 |
107000 | 6798 | 0,000147 | 65,1 | 39,7 | 8,54 | 16,86 | 0 | 12 | 1 | 1 | 27 |
107000 | 12267 | 8,15E-05 | 64 | 44 | 7,2 | 12,8 | 0 | 9 | 1 | 1 | 14 |
111000 | 9178 | 0,000109 | 55 | 29 | 10,4 | 15,6 | 1 | 9 | 1 | 0 | 1 |
113000 | 8155 | 0,000123 | 61,6 | 32,7 | 11,1 | 17,8 | 1 | 8 | 1 | 0 | 1 |
122000 | 9810 | 0,000102 | 64,8 | 38,3 | 8,8 | 17,7 | 1 | 12 | 1 | 1 | 17 |
122000 | 6371 | 0,000157 | 63 | 43 | 7,5 | 12,5 | 1 | 9 | 1 | 1 | 13 |
123000 | 10631 | 9,41E-05 | 80 | 47 | 19,5 | 13,5 | 0 | 9 | 1 | 0 | 2 |
123000 | 5346 | 0,000187 | 63 | 43 | 7,2 | 12,8 | 1 | 9 | 1 | 1 | 2 |
125000 | 7349 | 0,000136 | 68,5 | 31,1 | 12,5 | 24,9 | 1 | 19 | 1 | 0 | 1 |
125000 | 7116 | 0,000141 | 72 | 43,5 | 9,3 | 19,2 | 1 | 9 | 1 | 1 | 11 |
138000 | 3267 | 0,000306 | 64,3 | 42,5 | 9 | 12,8 | 0 | 5 | 1 | 1 | 26 |
145000 | 4998 | 0,0002 | 62,9 | 37,1 | 8,9 | 16,9 | 1 | 12 | 1 | 1 | 23 |
147000 | 5647 | 0,000177 | 63,9 | 37,1 | 9,8 | 17 | 1 | 6 | 1 | 1 | 15 |
150000 | 10746 | 9,31E-05 | 73,5 | 45,3 | 7,8 | 20,4 | 0 | 18 | 1 | 1 | 12 |
165000 | 6355 | 0,000157 | 67,5 | 47,8 | 7 | 12,7 | 0 | 9 | 1 | 1 | 34 |
183600 | 4770 | 0,00021 | 90,5 | 50,8 | 12,2 | 27,5 | 1 | 9 | 1 | 0 | 1 |
189000 | 8685 | 0,000115 | 66 | 39 | 9,4 | 17,6 | 1 | 12 | 1 | 1 | 18 |
333000 | 1800 | 0,000556 | 114,6 | 66 | 18,5 | 30,1 | 1 | 16 | 1 | 1 | 1 |