Методы коррекции гетероскедастичности случайных отклонений, тестирование гетероскедастичности в скорректированной модели с помощью тес

Автор: Пользователь скрыл имя, 24 Октября 2011 в 13:26, курсовая работа

Описание работы

При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение). Выполнимость данной предпосылки называется гомоскедастичностью.

Содержание

Содержание
Введение 3
Теоретическое обоснование модели 5
Построение и анализ эконометрической модели 6
Заключение 11
Список использованных источников 12
Приложение 13

Работа содержит 1 файл

готовая.doc

— 380.50 Кб (Скачать)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Экономический факультет

Кафедра банковской и финансовой экономики 
 
 
 
 
 
 

КУРСОВОЕ  ПРОЕКТИРОВАНИЕ 

на тему: Методы коррекции гетероскедастичности случайных отклонений, тестирование гетероскедастичности в скорректированной модели с помощью теста Голдфелда-Квандта 
 
 
 

    Студентки 3 курса    __________  дневного отделения    
 
 

    Научный руководитель   __________  старший преподаватель    
 
 
 
 
 
 
 
 
 
 

Минск 2010

Содержание

Введение

     При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить внимание на проблемы, связанные с выполнимостью свойств случайных отклонений модели. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Данное условие подразумевает, что, несмотря на то, что при каждом конкретном наблюдении случайное отклонение может быть либо большим, либо меньшим, не должно быть некой априорной причины, вызывающей большую ошибку (отклонение).  Выполнимость данной предпосылки называется гомоскедастичностью. Невыполнимость данной предпосылки называется гетероскедастичностью. Гетероскедастичность может быть вызвана следующими причинами:

    1. Разброс в значениях переменных
    2. Наличие резко выделяющихся наблюдений
    3. Ошибки спецификации модели (наличие пропущенных переменных)
    4. Ассиметрия распределения данных по какой-либо экзогенной переменной
    5. Ошибки в преобразовании данных

     Обычно  проблема гетероскедастичности характерна для моделей, построенных на пространственных данных. Наличие гетероскедастичности влечет за собой следующие последствия:

     Оценки  коэффициентов модели остаются линейными  и несмещенными, но перестают быть эффективными. Оценки не будут даже асимптотически эффективными.

     Дисперсия случайного отклонения рассчитывается со смещением, поэтому дисперсии оценок или параметров модели также являются смещенными оценками;

     Выводы  о качестве регрессионной модели, сделанные на основании t- и F-статистик, становятся ненадежными, а заключение, сделанное на основании этих статистик, может быть ошибочным.

     Следовательно, при присутствии гетероскедастичности, модель не может давать адекватные прогнозы, и ее использование становится нецелесообразным. Поэтому при построении регрессионную модель необходимо тестировать  на наличие гетероскедастичности. Если по результатам анализа гетероскедастичность обнаруживается, исходная модель не может быть использована и требует проведения преобразований с целью устранения гетероскедастичности.

     Итак, иногда на практике, зная природу данных, проблему гетероскедастичности можно предвидеть и попытаться устранить ее на этапе спецификации модели. Однако чаще всего проблему обнаружения гетероскедастичности приходится решать уже после оценивания регрессионной модели.

     Для выявления проблемы гетероскедастичности могут использоваться следующие методы:

    1. Графический анализ
    2. Тест Голдфелда-Квандта
    3. Тест Парка
    4. Тест Глейзера

     При обнаружении гетероскедастичности ее необходимо устранить. Для этого  используется взвешенный метод наименьших квадратов.

       Я исследовала модель на гетероскедастичнось  с помощью теста Голдфелда-Квандта (как и по условию).

Таким образом, целью данной работы является исследование модели на наличие гетероскедастичности и последующее ее устранение. Для  проведения данного анализа будет  исследована зависимость цены квартиры в г. Минске от ее характеристик (приложение, таблица№1). 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Теоретическое обоснование модели

     В исследуемой модели в качестве зависимой  переменной взята цена квартиры в  городе Минске. Целесообразно проводить  оценку продажной цены квартиры (price, $) по следующим факторам:

    1. общая площадь (м2) (totsq): при увеличении количества квадратных метров общей площади квартиры пропорционально возрастает ее стоимость;
    2. жилая площадь(м2) (livsq): при увеличении количества квадратных метров жилой площади квартиры пропорционально возрастает ее стоимость;
    3. площадь кухни(м2)( kitsq): при увеличении количества квадратных метров кухни пропорционально возрастает стоимость квартиры;
    4. расстояние до центра (м) (distc): чем меньше расстояние от квартиры до центра города, тем выше стоимость данной квартиры;
    5. этаж – 0 – первый или последний, 1 – нет(floor): стоимость квартиры, находящейся на первом или последнем этаже ниже стоимости квартир, находящихся на промежуточных этажах;
    6. наличие балкона – 1 – есть хотя бы один или лоджия, 0 – нет(bal): наличие в квартире балкона повышает ее стоимость;
    7. наличие телефона – 1- есть, 0 - нет (tel): наличие в квартире телефонной связи увеличивает ее стоимость;
    8. «возраст» дома (year): квартиры более раннего года постройки, как правило, дешевле аналогичных квартир более позднего года постройки.

     В модели предполагается положительная  зависимость PRICE от TOTSQ, LIVSQ, KITSQ, FLOOR, BAL, TEL;  отрицательная — от DISTC, YEAR. При исследовании зависимости между данными переменными вероятно возникновение проблемы гетероскедастичности (PRICE будет иметь большую ошибку для больших квартир.

     Для устранения гетероскедастичности используется взвешенный метод наименьших квадратов. Преобразование модели зависит от того, известны дисперсии случайных отклонений или нет. Если дисперсии случайных отклонений известны можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение среднего квадратического отклонения. Для преобразованной модели выполняются все предпосылки МНК; оценки, полученные по МНК являются BLUE- оценками. Оценки, полученные для исправленного уравнения, используются в исходном уравнении. Однако на практике значения дисперсии чаще всего неизвестны, и для применения взвешенного МНК необходимо сделать реалистичные предположения о дисперсии.

Построение  и анализ эконометрической модели

 Для начала необходимо проверить модель на адекватность.

Если  знак положителен , то это прямая зависимость: при повышении Х – растет Y,  и аналогично при уменьшении Х – падает Y. Это полностью согласовывается с экономической теорией. 

Для начала мы  исследуем значимость влияния  всех факторов на цену квартиры.

  Коэффициенты Ст. ошибка t-статистика P-Значение
Y-пересечение -23663,9 18732,7 -1,2632 0,21248
distc -2,14783 0,878342 -2,4453 0,01811
totsq 3904,6 1553,3 2,5137 0,01528
Livsq -2129,74 1632,66 -1,3045 0,19817
Kitsq 132,229 2208,8 0,0599 0,95251
dopsq -960,113 1207,84 -0,7949 0,43051
floor -717,44 5969,81 -0,1202 0,90483
totfloor 288,872 1208,88 0,2390 0,81213
bal 3163,87 10069,3 0,3142 0,75470
tel 13496,5 8115,84 1,6630 0,10270
year -34,0782 220,289 -0,1547 0,87770
 
 

     Для проверки значимости коэффициентов  используем P-value- вероятность того, что статистика будет меньше, чем t-набл.

     Так, если P-value<Alpha, то коэффициенты значимы, если же

P-value>Alpha, коэффициенты незначимы.

В нашем  случае P-value <0,05.

И в  итоге значимыми оказались факторы – distc, totsq. Все незначимые факторы мы исключим из модели и построим новую модель. 

R2=0,858209, F(R2)=29,65795

Регрессионная статистика
Множественный R 0,807777
R-квадрат 0,858209
Нормированный R-квадрат 0,829272
Стандартная ошибка 18590,73
Наблюдения 59
 

Полученное  при построении регрессии значение коэффициента детерминации R2=0,858209 свидетельствует о сравнительно невысокой точности модели, т.е. о том, что изменение данных факторов в совокупности лишь в некоторой степени определяет изменение зависимой переменной Y. Влияние случайной составляющей на наблюдаемые значения объясняемой переменной значительно.

  Коэффициенты Ст. ошибка t-статистика P-Значение
Y-пересечение -5290,571274 9675,674362 -0,546791 0,586657
distc -1,772805891 0,743724094 -2,383688 0,020494
totsq 2314,219149 138,915663 16,659166 1,44E-23
 

R2=0,837008, F(R2)=146, 3555

Регрессионная статистика
Множественный R 0,91488154
R-квадрат 0,837008233
Нормированный R-квадрат 0,831289223
Стандартная ошибка 18480,59217
Наблюдения 60

Информация о работе Методы коррекции гетероскедастичности случайных отклонений, тестирование гетероскедастичности в скорректированной модели с помощью тес