Автор: Пользователь скрыл имя, 24 Октября 2011 в 13:26, курсовая работа
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью.
Содержание
Введение 3
Теоретическое обоснование модели 5
Построение и анализ эконометрической модели 6
Заключение 11
Список использованных источников 12
Приложение 13
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Экономический факультет
Кафедра
банковской и финансовой экономики
КУРСОВОЕ
ПРОЕКТИРОВАНИЕ
на тему:
Методы коррекции гетероскедастичности
случайных отклонений, тестирование гетероскедастичности
в скорректированной модели с помощью
теста Голдфелда-Квандта
Студентки
3 курса __________ дневного отделения
Научный
руководитель __________
Минск 2010
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью. Невыполнимость данной предпосылки называется гетероскедастичностью. Гетероскедастичность может быть вызвана следующими причинами:
Обычно проблема гетероскедастичности характерна для моделей, построенных на пространственных данных. Наличие гетероскедастичности влечет за собой следующие последствия:
Оценки коэффициентов модели остаются линейными и несмещенными, но перестают быть эффективными. Оценки не будут даже асимптотически эффективными.
Дисперсия случайного отклонения рассчитывается со смещением, поэтому дисперсии оценок или параметров модели также являются смещенными оценками;
Выводы о качестве регрессионной модели, сделанные на основании t- и F-статистик, становятся ненадежными, а заключение, сделанное на основании этих статистик, может быть ошибочным.
Следовательно,
при присутствии
Итак, иногда на практике, зная природу данных, проблему гетероскедастичности можно предвидеть и попытаться устранить ее на этапе спецификации модели. Однако чаще всего проблему обнаружения гетероскедастичности приходится решать уже после оценивания регрессионной модели.
Для выявления проблемы гетероскедастичности могут использоваться следующие методы:
При
обнаружении
Я исследовала модель на
Таким
образом, целью данной работы является
исследование модели на наличие гетероскедастичности
и последующее ее устранение. Для
проведения данного анализа будет
исследована зависимость цены квартиры
в г. Минске от ее характеристик (приложение,
таблица№1).
В исследуемой модели в качестве зависимой переменной взята цена квартиры в городе Минске. Целесообразно проводить оценку продажной цены квартиры (price, $) по следующим факторам:
В модели предполагается положительная зависимость PRICE от TOTSQ, LIVSQ, KITSQ, FLOOR, BAL, TEL; отрицательная — от DISTC, YEAR. При исследовании зависимости между данными переменными вероятно возникновение проблемы гетероскедастичности (PRICE будет иметь большую ошибку для больших квартир.
Для устранения гетероскедастичности используется взвешенный метод наименьших квадратов. Преобразование модели зависит от того, известны дисперсии случайных отклонений или нет. Если дисперсии случайных отклонений известны можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение среднего квадратического отклонения. Для преобразованной модели выполняются все предпосылки МНК; оценки, полученные по МНК являются BLUE- оценками. Оценки, полученные для исправленного уравнения, используются в исходном уравнении. Однако на практике значения дисперсии чаще всего неизвестны, и для применения взвешенного МНК необходимо сделать реалистичные предположения о дисперсии.
Для начала необходимо проверить модель на адекватность.
Если
знак положителен , то это прямая зависимость:
при повышении Х – растет Y,
и аналогично при уменьшении Х – падает
Y. Это полностью согласовывается с экономической
теорией.
Для начала мы исследуем значимость влияния всех факторов на цену квартиры.
Коэффициенты | Ст. ошибка | t-статистика | P-Значение | |
Y-пересечение | -23663,9 | 18732,7 | -1,2632 | 0,21248 |
distc | -2,14783 | 0,878342 | -2,4453 | 0,01811 |
totsq | 3904,6 | 1553,3 | 2,5137 | 0,01528 |
Livsq | -2129,74 | 1632,66 | -1,3045 | 0,19817 |
Kitsq | 132,229 | 2208,8 | 0,0599 | 0,95251 |
dopsq | -960,113 | 1207,84 | -0,7949 | 0,43051 |
floor | -717,44 | 5969,81 | -0,1202 | 0,90483 |
totfloor | 288,872 | 1208,88 | 0,2390 | 0,81213 |
bal | 3163,87 | 10069,3 | 0,3142 | 0,75470 |
tel | 13496,5 | 8115,84 | 1,6630 | 0,10270 |
year | -34,0782 | 220,289 | -0,1547 | 0,87770 |
Для проверки значимости коэффициентов используем P-value- вероятность того, что статистика будет меньше, чем t-набл.
Так, если P-value<Alpha, то коэффициенты значимы, если же
P-value>Alpha, коэффициенты незначимы.
В нашем случае P-value <0,05.
И в
итоге значимыми оказались факторы
– distc, totsq. Все незначимые факторы мы исключим
из модели и построим новую модель.
R2=0,858209, F(R2)=29,65795
Регрессионная статистика | |
Множественный R | 0,807777 |
R-квадрат | 0,858209 |
Нормированный R-квадрат | 0,829272 |
Стандартная ошибка | 18590,73 |
Наблюдения | 59 |
Полученное при построении регрессии значение коэффициента детерминации R2=0,858209 свидетельствует о сравнительно невысокой точности модели, т.е. о том, что изменение данных факторов в совокупности лишь в некоторой степени определяет изменение зависимой переменной Y. Влияние случайной составляющей на наблюдаемые значения объясняемой переменной значительно.
Коэффициенты | Ст. ошибка | t-статистика | P-Значение | |
Y-пересечение | -5290,571274 | 9675,674362 | -0,546791 | 0,586657 |
distc | -1,772805891 | 0,743724094 | -2,383688 | 0,020494 |
totsq | 2314,219149 | 138,915663 | 16,659166 | 1,44E-23 |
R2=0,837008, F(R2)=146, 3555
Регрессионная статистика | |
Множественный R | 0,91488154 |
R-квадрат | 0,837008233 |
Нормированный R-квадрат | 0,831289223 |
Стандартная ошибка | 18480,59217 |
Наблюдения | 60 |