Автор: Пользователь скрыл имя, 10 Марта 2013 в 18:31, курсовая работа
Целью работы является демонстрация работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.
Введение…………………………………………………………...………………3
Теоретическое и статистическое обоснование модели……………………….4
Построение и анализ эконометрической модели……………………………….7
Построение базовой регрессионной модели и оценка её качества…….7
Проверка модели на гетероскедастичность……………………….…….10
Коррекция гетероскедастичности………………………………………..12
Заключение……………………………………………………………………….14
Список использованных источников……………………………………...……15
Приложения…………………………………………..........................................16
Сравнивая
значение Obs*R-squared с χ
2 (1), который равен 3,84 при α = 0,05, получаем,
Obs*R-squared < χ
2 (1). Следовательно, в модели нет автокорреляции.
Для принятия решения о наличии мультиколлинеарности
в модели исследуем коэффициенты корреляции
между экзогенными переменными:
POPULATION |
LAND | |
POPULATION |
1 |
0.646294827328046 |
LAND |
0.646294827328046 |
1 |
Высокое значение коэффициента парной корреляции входящих в модель экзогенных переменных (ǀrǀ > 0,8) говорит о наличии мультиколлинеарности. Следовательно,в данной модели можно сделать вывод об отсутствии мультиколлинеарности.
Проверка модели на гетероскедастичность
Для начала проверим модель на наличие гетероскедастичности при помощи теста Вайта:
White Heteroskedasticity Test (no cross terms):
F-statistic |
39.80702 |
Probability |
0.000000 | |
Obs*R-squared |
29.45114 |
Probability |
0.000006 | |
χ 2 (α,k) = χ 2 (0.05,4) = 9.49
White Heteroskedasticity Test (cross terms):
F-statistic |
30.82220 |
Probability |
0.000000 | |
Obs*R-squared |
29.45691 |
Probability |
0.000019 | |
χ 2 (α,k) = χ 2 (0.05,5) = 11.07
В обоих случаях теста Вайта (no cross terms/ cross terms) значение P-вероятности меньше уровня значимости α = 0.05 и Obs*R-squared превышает χ 2 (α,k), следовательно в данной модели присутствует гетероскедастичность.
Для большей достоверности ещё раз проверим наличие гетероскедастичности, используя тест Парка. Строим две регрессионные модели натуральных логарифмов остатков базовой модели на натуральные логарифмы каждой объясняющей переменной отдельно.
Первая вспомогательная модель теста Парка:
LOG(RESID01^2) = 42.97704876 + 0.24739024*LOG(POPULATION)
Dependent Variable: LOG(RESID01^2) |
||||
Method: Least Squares |
||||
Date: 12/14/12 Time: 01:25 |
||||
Sample: 1 35 |
||||
Included observations: 35 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
42.97705 |
3.212374 |
13.37860 |
0.0000 |
LOG(POPULATION) |
0.247390 |
0.199971 |
1.237129 |
0.2248 |
R-squared |
0.044323 |
Mean dependent var |
46.92201 | |
Adjusted R-squared |
0.015363 |
S.D. dependent var |
2.315925 | |
S.E. of regression |
2.298067 |
Akaike info criterion |
4.557459 | |
Sum squared resid |
174.2767 |
Schwarz criterion |
4.646336 | |
Log likelihood |
-77.75553 |
F-statistic |
1.530487 | |
Durbin-Watson stat |
1.941850 |
Prob(F-statistic) |
0.224771 | |
Проверим статистическую значимость коэффициентов уравнения регрессии по t-статистике:
LOG(RESID01^2) = 42.97704876 + 0.24739024*LOG(POPULATION)
(t)
(13.379)
(1.237)
Возьмем уровень значимости . Тогда критическое значение t-статистики равно:
t критическое = t α/2, n-m-1= t 0.025, 35-1-1 = 2.042
Значение t-статистики при переменной LOG(POPULATION) меньше критического значения, следовательно, делаем вывод о наличии гомоскедастичности по данной переменной.
Представим вторую вспомогательную модель теста Парка:
LOG(RESID01^2) = 41.48804715 + 0.4571981179*LOG(LAND)
Dependent Variable: LOG(RESID01^2) |
||||
Method: Least Squares |
||||
Date: 12/14/12 Time: 01:23 |
||||
Sample: 1 35 |
||||
Included observations: 35 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
41.48805 |
2.382721 |
17.41204 |
0.0000 |
LOG(LAND) |
0.457198 |
0.198061 |
2.308372 |
0.0274 |
R-squared |
0.139024 |
Mean dependent var |
46.92201 | |
Adjusted R-squared |
0.112933 |
S.D. dependent var |
2.315925 | |
S.E. of regression |
2.181236 |
Akaike info criterion |
4.453106 | |
Sum squared resid |
157.0071 |
Schwarz criterion |
4.541983 | |
Log likelihood |
-75.92935 |
F-statistic |
5.328580 | |
Durbin-Watson stat |
1.749672 |
Prob(F-statistic) |
0.027385 | |
Проверим статистическую значимость коэффициентов уравнения регрессии по t-статистике:
LOG(RESID01^2) = 41.48804715 + 0.4571981179*LOG(LAND)
(t) (17.412) (2.308)
Возьмем уровень значимости . Тогда критическое значение t-статистики равно:
t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042
Значение t-статистики при переменной LOG(LAND) больше критического значения, следовательно, делаем вывод о наличии гетероскедастичности по данной переменной.
Используя тест Парка, я оценила в отдельности каждую переменную исходной модели и тем самым можно сделать вывод о наличии в данной модели герескедостичности по переменной LAND.
При помощи теста Вайта и Парка было доказано присутствие гетероскедастичности в данной модели, а, следовательно, дисперсии остатков данной модели непостоянны.
Коррекция гетероскедастичности
Построим
новую скорректированную
AGRICULTURE = 90189600.61 + 226.3069961*POPULATION + 60250.1229*LAND
Dependent Variable: AGRICULTURE |
||||
Method: Least Squares |
||||
Date: 12/14/12 Time: 01:57 |
||||
Sample: 1 35 |
||||
Included observations: 35 |
||||
Weighting series: 1/LAND |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
90189601 |
1.02E+08 |
0.884216 |
0.3832 |
POPULATION |
226.3070 |
59.24623 |
3.819770 |
0.0006 |
LAND |
60250.12 |
16435.03 |
3.665959 |
0.0009 |
Weighted Statistics |
||||
R-squared |
0.320647 |
Mean dependent var |
2.29E+09 | |
Adjusted R-squared |
0.278188 |
S.D. dependent var |
2.18E+09 | |
S.E. of regression |
1.85E+09 |
Akaike info criterion |
45.59652 | |
Sum squared resid |
1.10E+20 |
Schwarz criterion |
45.72984 | |
Log likelihood |
-794.9391 |
F-statistic |
29.94796 | |
Durbin-Watson stat |
1.963625 |
Prob(F-statistic) |
0.000000 | |
Сперва, для оценки данной модели проверим статистическую значимость коэффициента детерминации, используя критерий Фишера:
Fнаблюдаемое = 29.948
Fкритическое = F α, m, n-m-1 = F 0.05, 2, 32 = 3.32
F-наблюдаемое больше, чем F-критическое и из этого следует, что коэффициент детерминации статистически значим.
Статистическую значимость коэффициентов уравнения регрессии проверим по t-статистике, которая равна:
AGRICULTURE = 90189600.61 + 226.3069961*POPULATION + 60250.1229*LAND
(t)
(0.884)
(3.819)
Возьмем уровень значимости . Тогда критическое значение t-статистики соответственно:
t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042
Значения t-статистик рассматриваемых переменных, за исключением свободного члена, больше критического значения (распределение Стьюдента), следовательно, делаем вывод об их значимости.
Проверку модели на присутствие автокорреляции осуществим с помощью статистики Дарбина-Уотсона:
Durbin-Watson stat |
1.963625 |
Воспользовавшись грубым правилом (согласно которому автокорреляции нет при значениях DW от 0.5 до 2.5), принимает вывод об отсутствии автокорреляции.
Для проверки модели на гетероскедастичность воспользуемся тестом Вайта:
White Heteroskedasticity Test (no cross terms)
F-statistic |
0.237977 |
Probability |
0.914643 | |
Obs*R-squared |
1.076404 |
Probability |
0.897998 | |
χ 2 (α,k) = χ 2 (0.05,4) = 9.49
White Heteroskedasticity Test (cross terms):
F-statistic |
0.191241 |
Probability |
0.963498 | |
Obs*R-squared |
1.117202 |
Probability |
0.952570 | |
χ 2 (α,k) = χ 2 (0.05,5) = 11.07