Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка

Автор: Пользователь скрыл имя, 10 Марта 2013 в 18:31, курсовая работа

Описание работы

Целью работы является демонстрация работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.

Содержание

Введение…………………………………………………………...………………3
Теоретическое и статистическое обоснование модели……………………….4
Построение и анализ эконометрической модели……………………………….7
Построение базовой регрессионной модели и оценка её качества…….7
Проверка модели на гетероскедастичность……………………….…….10
Коррекция гетероскедастичности………………………………………..12
Заключение……………………………………………………………………….14
Список использованных источников……………………………………...……15
Приложения…………………………………………..........................................16

Работа содержит 1 файл

курсовая по эконометрике.docx

— 103.66 Кб (Скачать)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ

БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Экономический факультет

Кафедра экономической информатики  и математической экономики

 

 

 

 

КУРСОВАЯ РАБОТА

на тему: «Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка»

 

 

 

Студентки 3 курса


дневного  отделения

«Экономическая  теория»

 


Научный руководитель

старший преподаватель

 

 

 

 

 

Минск, 2012

СОДЕРЖАНИЕ

 

Введение…………………………………………………………...………………3

Теоретическое  и статистическое  обоснование модели……………………….4

Построение и анализ эконометрической модели……………………………….7

  • Построение базовой регрессионной модели и оценка её качества…….7
  • Проверка модели на гетероскедастичность……………………….…….10
  • Коррекция гетероскедастичности………………………………………..12

Заключение……………………………………………………………………….14

Список использованных источников……………………………………...……15

Приложения…………………………………………..........................................16

 

 

 

ВВЕДЕНИЕ

 

Данная  работа посвящена исследованию проблемы выявления и коррекции гетероскедастичности, а также рассмотрению взаимосвязи следующих показателей: валовая добавленная стоимость произведённых товаров сельского хозяйства, численность сельского населения и площадь сельскохозяйственных земель. Для построения модели данной взаимосвязи используются пространственные данные по тридцати пяти странам мира за 2011 год. Мною выбраны именно пространственные данные, так как проблема гетероскедастичности более характерна для пространственных данных и довольно редко встречается при анализе временных данных.  Исходные данные для этой работы взяты с официального сайта Мирового банка.

Целью работы является демонстрация  работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.

Достижение  поставленной цели обусловило постановку и решение следующих задач:

   1.  анализ регрессий на адекватность;

   2.  выявление возможных ошибок спецификации;

   3.  исследование модели на наличие гетероскедастичности;

   4.  устранение гетероскедастичности остатков.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ТЕОРЕТИЧЕСКОЕ И СТАТИСТИЧЕСКОЕ ОБОСНОВАНИЕ МОДЕЛИ

 

Сельское  хозяйство  -  одна из важнейших  отраслей экономики, производящая продукты питания для населения, сырьё для пищевой и лёгкой промышленности и обеспечивающая продовольственную независимость государства.

Данная  работа предполагает построение модели зависимости между валовой добавленной стоимостью в сельском хозяйстве, численностью сельского населения и площадью сельскохозяйственных земель.

Валовая добавленная стоимость  сельского хозяйства  рассчитывается как разница  между валовым выпуском и промежуточным потреблением отрасли сельского хозяйства. Она рассчитывается без отчислений на амортизацию готовых активов или истощения и деградации природных ресурсов.

Сельское  хозяйство включает в себя лесное хозяйство, охоту и рыболовство, а также выращивание сельскохозяйственных культур и продукции животноводства.

Под сельским населением понимается часть постоянного населения страны, проживающая в сельских населённых пунктах и занятая в сельском хозяйстве.

К сельскохозяйственным землям относятся земли, регулярно  используемые для производства сельскохозяйственной продукции. Они включают пашню, залежь, многолетние насаждения, сенокосы и пастбища.

Основные  статистические характеристики всех переменных данной работы приведены в таблице 1:

                                                                                                  Таблица 1

 

AGRICULTURE

POPULATION

LAND

Среднее

4.82E+10

62684808

568900.6

Медиана

7.22E+09

7410770

197950

Максимум

7.35E+11

8.53E+08

5243210

Минимум

1.63E+08

75413

1310

Стандартное отклонение

1.32E+11

1.78E+08

1036877


 

Для проверки наличия связи между переменными, воспользуемся корреляционным анализом данных. Коэффициенты корреляции представлены в таблице 2:

                                                                             Таблица 2

 

POPULATION

LAND

POPULATION

1

0.646294827328046

LAND

0.646294827328046

1




 

 

Из таблицы 2 видно, что связь между переменными  существует.

Для получения  качественных оценок в модели необходимо, чтобы выполнялся ряд предпосылок МНК относительно случайного отклонения. Одной из ключевых предпосылок МНК является постоянство дисперсий случайных отклонений (не должно быть закономерных увеличений и уменьшений её значений в зависимости от наблюдений). Если предпосылка выполняется, то мы говорим о гомоскедастичности отклонений, в обратном случае – гетероскедастичности.

Причиной  появления гетероскедастичности может служить: большой разброс и наличие выбросов в реальных данных, ошибка спецификации эконометрической и регрессионной модели, ошибки в преобразовании данных, ассиметрия распределения экзогенных переменных.

При гетероскедастичности последствия применения МНК будут следующими:

  • оценки коэффициентов остаются несмещёнными и линейными;
  • оценки параметров модели перестают быть эффективными (имеющими наименьшую дисперсию);
  • дисперсия оценок модели будет смещённой;
  • возникает вероятность завышения значений t-статистик, а это может привести к признанию статистически значимыми коэффициентов, которые на самом деле таковыми не являются.

К настоящему времени разработано достаточно большое количество методов диагностики  и выявления гетероскедастичноси: графический анализ остатков, тест Парка, тест Глейзева, тест ранговой корреляции Спирмена, тест Голдфелда-Квандта, тест Бреуша-Пагана, тест Вайта.

В данной работе я исследую проблемы гетероскедастичности, используя тест Вайта и Парка.

Алгоритм  применения теста Вайта  заключается в следующих аспектах:

  1. Получают     остатки     оцененного     уравнения    регрессии.

                            ei=Yi o- βlX1i - β2X2i - β3X3i

  1. Оценивают вспомогательное уравнение регрессии.

  1. Проверяют общую значимость уравнения с помощью критерия χ2. Тестовая статистика – n*R2. (Число степеней свободы k в критерии χ2 (k) = числу переменных вспомогательного уравнения). Если n*R2 > χ2 (k) то гипотеза о гомоскедастичности отвергается.

К сожалению, одним из явных недостатком теста  Вайта является то, что он не позволяет определить форму гетероскедастичности.

В общем  случае, аглоритм проведения теста Парка выглядит следующим образом:

  1. Получают  остатки  оцененного  уравнения  регрессии.

yi = β0 + β1 x1i + β2 x2i +ei

ei = yi - 0 - 1 x1i - 2 x2i

  1. Выбирают  фактор  пропорциональности  и  оценивают

вспомогательное  уравнение  регрессии.

ln() = α0 + α1 lnZi + ui

  1. Проверяют значимость коэффициента при lnZi. Если коэффициент статистически значим, то это означает наличие связи между ln() и lnZi, т.е. гетероскедастичности в эконометрических данных.

Использование в критерии Парка конкретной функциональной зависимости может привести к  необоснованным выводам (например, коэффициент α1 статистически незначим, а гетероскедастичность имеет место). Возможна еще одна проблема. Для случайного отклонения ui в свою очередь может иметь место гетероскедастичность. Поэтому критерий Парка дополняется другими тестами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ПОСТОРОЕНИЕ И АНАЛИЗ ЭКОНОМИЧЕСКОЙ МОДЕЛИ

Построение базовой регрессионной  модели и оценка её качества

 

По данным из приложения построим исходную модель с помощью эконометрического пакета Eviews 5. Получим следующее уравнение:

AGRICULTURE = -1.384604338e+010 + 359.0960823*POPULATION + 69421.12358*LAND

Где:

AGRICULTURE – валовая добавленная стоимость произведенных товаров сельского хозяйства за 2011 г. (в текущих долларах США),

POPULATION – численность сельского населения за 2011 г. (чел.),

LAND – площадь сельскохозяйственных земель (кв.км).

Dependent Variable: AGRICULTURE

 

Method: Least Squares

   

Date: 12/08/12   Time: 13:10

   

Sample: 1 35

     

Included observations: 35

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

-1.38E+10

9.35E+09

-1.480783

0.1484

POPULATION

359.0961

60.91275

5.895253

0.0000

LAND

69421.12

10476.28

6.626506

0.0000

         
         

R-squared

0.873920

Mean dependent var

4.82E+10

Adjusted R-squared

0.866041

S.D. dependent var

1.32E+11

S.E. of regression

4.83E+10

Akaike info criterion

52.12247

Sum squared resid

7.48E+22

Schwarz criterion

52.25579

Log likelihood

-909.1433

F-statistic

110.9040

Durbin-Watson stat

2.351587

Prob(F-statistic)

0.000000

         
         

Свободный член указывает на то, что, если все  экзогенные переменные будут равны  нулю, то изменение AGRICULTURE будет равно -13846043376,9018.

Коэффициент при переменной POPULATION указывают на то, что изменение данной переменной на единицу (или 1%) приведет к изменению добавленной стоимости сельского хозяйства  на 359.0960823. И следовательно, изменение переменной LAND на единицу приведёт к изменению AGRICULTURE на  69421.12358.

Сперва, для оценки данной модели проверим статистическую значимость коэффициента детерминации, используя критерий Фишера:

Fнаблюдаемое  = 110.9040

Fкритическое = F α, m, n-m-1 = F 0.05, 2, 32 = 3.32

F-наблюдаемое больше, чем  F-критическое и из этого следует, что коэффициент детерминации статистически значим. Уравнение регрессии на 87,392%  объясняет поведение эндогенной переменной.

Статистическую  значимость коэффициентов уравнения  регрессии проверим по t-статистике, которая равна:

AGRICULTURE = -1.384604338e+010 + 359.0960823*POPULATION + 69421.12358*LAND

(t)                    (-1.481)                           (5.895)                         (6.627) 

Возьмем уровень значимости . Тогда критическое значение t-статистики соответственно:

t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042

Значения  t-статистик рассматриваемых переменных, за исключением свободного члена, больше критического значения (распределение Стьюдента), следовательно, делаем вывод об их значимости.

Далее проведём тестирование случайных отклонений модели на наличие нормального распределения:

Статистика  Жака-Берри и соответствующее ей P-значение 0.000451 говорят об отсутствии нормального распределения случайных отклонений модели при уровне значимости α = 0,05.

Проверку  модели на присутствие автокорреляции осуществим с помощью статистики Дарбина-Уотсона:

Durbin-Watson stat

2.351587


При уровне значимости α = 0,05 D l = 1.343 , D u = 1.584.

Мы видим, что автокорреляция в данной модели отсутствует.

Подтвердим  отсутствие автокорреляции с помощью  теста Бреуша-Годфри первого порядка:

 

Breusch-Godfrey Serial Correlation LM Test:

 
         
         

F-statistic

1.028724

Probability

0.318310

Obs*R-squared

1.124157

Probability

0.289025

         
         

Информация о работе Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка