Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка

Автор: Пользователь скрыл имя, 10 Марта 2013 в 18:31, курсовая работа

Описание работы

Целью работы является демонстрация работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.

Содержание

Введение…………………………………………………………...………………3
Теоретическое и статистическое обоснование модели……………………….4
Построение и анализ эконометрической модели……………………………….7
Построение базовой регрессионной модели и оценка её качества…….7
Проверка модели на гетероскедастичность……………………….…….10
Коррекция гетероскедастичности………………………………………..12
Заключение……………………………………………………………………….14
Список использованных источников……………………………………...……15
Приложения…………………………………………..........................................16

Работа содержит 1 файл

курсовая по эконометрике.docx

— 103.66 Кб (Скачать)

Сравнивая значение Obs*R-squared с χ 2 (1), который равен 3,84 при α = 0,05, получаем, Obs*R-squared < χ 2 (1). Следовательно, в модели нет автокорреляции. 
 Для принятия решения о наличии мультиколлинеарности в модели исследуем коэффициенты корреляции между экзогенными переменными:

 

POPULATION

LAND

POPULATION

1

0.646294827328046

LAND

0.646294827328046

1




 

 

 

Высокое значение коэффициента парной корреляции входящих в модель экзогенных переменных (ǀrǀ > 0,8) говорит о наличии мультиколлинеарности. Следовательно,в данной модели можно сделать вывод об отсутствии мультиколлинеарности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка модели на гетероскедастичность

Для начала проверим модель на наличие гетероскедастичности при помощи теста Вайта:

White Heteroskedasticity Test (no cross terms):

         
         

F-statistic

39.80702

Probability

0.000000

Obs*R-squared

29.45114

Probability

0.000006

         
         

χ 2 (α,k) = χ 2 (0.05,4) = 9.49

White Heteroskedasticity Test (cross terms):

         
         

F-statistic

30.82220

Probability

0.000000

Obs*R-squared

29.45691

Probability

0.000019

         
         

χ 2 (α,k) = χ 2 (0.05,5) = 11.07

В обоих  случаях теста Вайта (no cross terms/ cross terms) значение P-вероятности меньше уровня значимости α = 0.05 и Obs*R-squared превышает χ 2 (α,k), следовательно в данной модели присутствует гетероскедастичность.

Для большей  достоверности ещё раз проверим наличие гетероскедастичности, используя тест Парка. Строим две регрессионные модели натуральных логарифмов остатков базовой модели на натуральные логарифмы каждой объясняющей переменной отдельно.

Первая  вспомогательная модель теста Парка:

LOG(RESID01^2) = 42.97704876 + 0.24739024*LOG(POPULATION)

Dependent Variable: LOG(RESID01^2)

 

Method: Least Squares

   

Date: 12/14/12   Time: 01:25

   

Sample: 1 35

     

Included observations: 35

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

42.97705

3.212374

13.37860

0.0000

LOG(POPULATION)

0.247390

0.199971

1.237129

0.2248

         
         

R-squared

0.044323

Mean dependent var

46.92201

Adjusted R-squared

0.015363

S.D. dependent var

2.315925

S.E. of regression

2.298067

Akaike info criterion

4.557459

Sum squared resid

174.2767

Schwarz criterion

4.646336

Log likelihood

-77.75553

F-statistic

1.530487

Durbin-Watson stat

1.941850

Prob(F-statistic)

0.224771

         
         

Проверим  статистическую значимость коэффициентов  уравнения регрессии по t-статистике:

LOG(RESID01^2) = 42.97704876 + 0.24739024*LOG(POPULATION)

   (t)                     (13.379)                 (1.237)                        

Возьмем уровень значимости . Тогда критическое значение t-статистики равно:

t критическое = t α/2, n-m-1= t 0.025, 35-1-1 = 2.042

Значение  t-статистики при переменной LOG(POPULATION) меньше критического значения, следовательно, делаем вывод о наличии гомоскедастичности по данной переменной.

Представим  вторую вспомогательную модель теста  Парка:

LOG(RESID01^2) = 41.48804715 + 0.4571981179*LOG(LAND)

Dependent Variable: LOG(RESID01^2)

 

Method: Least Squares

   

Date: 12/14/12   Time: 01:23

   

Sample: 1 35

     

Included observations: 35

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

41.48805

2.382721

17.41204

0.0000

LOG(LAND)

0.457198

0.198061

2.308372

0.0274

         
         

R-squared

0.139024

Mean dependent var

46.92201

Adjusted R-squared

0.112933

S.D. dependent var

2.315925

S.E. of regression

2.181236

Akaike info criterion

4.453106

Sum squared resid

157.0071

Schwarz criterion

4.541983

Log likelihood

-75.92935

F-statistic

5.328580

Durbin-Watson stat

1.749672

Prob(F-statistic)

0.027385

         
         

Проверим  статистическую значимость коэффициентов  уравнения регрессии по t-статистике:

LOG(RESID01^2) = 41.48804715 + 0.4571981179*LOG(LAND)

     (t)                   (17.412)                      (2.308)                    

Возьмем уровень значимости . Тогда критическое значение t-статистики равно:

t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042

Значение  t-статистики при переменной LOG(LAND) больше критического значения, следовательно, делаем вывод о наличии гетероскедастичности по данной переменной.

Используя тест Парка, я оценила в отдельности  каждую переменную исходной модели и  тем самым можно сделать вывод  о  наличии в данной модели герескедостичности по переменной LAND.

При помощи теста Вайта и Парка было доказано присутствие гетероскедастичности в данной модели, а, следовательно, дисперсии остатков данной модели непостоянны.

 

 

 

 

 

 

 

Коррекция гетероскедастичности

Устраним гетероскедастичность, выявленную ранее при помощи теста Вайта и Парка, в нашей исходной модели, используя метод взвешенных наименьших квадратов. Для этого возьмём вес равный .

Построим  новую скорректированную методом  взвешенных наименьших квадратов модель и оценим её качество:

AGRICULTURE = 90189600.61 + 226.3069961*POPULATION + 60250.1229*LAND

Dependent Variable: AGRICULTURE

 

Method: Least Squares

   

Date: 12/14/12   Time: 01:57

   

Sample: 1 35

     

Included observations: 35

   

Weighting series: 1/LAND

   
         
         

Variable

Coefficient

Std. Error

t-Statistic

Prob.  

         
         

C

90189601

1.02E+08

0.884216

0.3832

POPULATION

226.3070

59.24623

3.819770

0.0006

LAND

60250.12

16435.03

3.665959

0.0009

         
         
 

Weighted Statistics

   
         
         

R-squared

0.320647

Mean dependent var

2.29E+09

Adjusted R-squared

0.278188

S.D. dependent var

2.18E+09

S.E. of regression

1.85E+09

Akaike info criterion

45.59652

Sum squared resid

1.10E+20

Schwarz criterion

45.72984

Log likelihood

-794.9391

F-statistic

29.94796

Durbin-Watson stat

1.963625

Prob(F-statistic)

0.000000

       

Сперва, для оценки данной модели проверим статистическую значимость коэффициента детерминации, используя критерий Фишера:

Fнаблюдаемое  = 29.948

Fкритическое = F α, m, n-m-1 = F 0.05, 2, 32 = 3.32

F-наблюдаемое больше, чем  F-критическое и из этого следует, что коэффициент детерминации статистически значим.

Статистическую  значимость коэффициентов уравнения  регрессии проверим по t-статистике, которая равна:

AGRICULTURE = 90189600.61 + 226.3069961*POPULATION + 60250.1229*LAND

        (t)                (0.884)                     (3.819)                         (3.666) 

Возьмем уровень значимости . Тогда критическое значение t-статистики соответственно:

t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042

Значения  t-статистик рассматриваемых переменных, за исключением свободного члена, больше критического значения (распределение Стьюдента), следовательно, делаем вывод об их значимости.

Проверку  модели на присутствие автокорреляции осуществим с помощью статистики Дарбина-Уотсона:

Durbin-Watson stat

1.963625


Воспользовавшись  грубым правилом (согласно которому автокорреляции нет при значениях DW от 0.5 до 2.5), принимает вывод об отсутствии автокорреляции.

Для проверки модели на гетероскедастичность воспользуемся тестом Вайта:

White Heteroskedasticity Test (no cross terms)

         
         

F-statistic

0.237977

Probability

0.914643

Obs*R-squared

1.076404

Probability

0.897998

         
         

χ 2 (α,k) = χ 2 (0.05,4) = 9.49

White Heteroskedasticity Test (cross terms):

         
         

F-statistic

0.191241

Probability

0.963498

Obs*R-squared

1.117202

Probability

0.952570

         
         

χ 2 (α,k) = χ 2 (0.05,5) = 11.07

Информация о работе Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка