Автор: Пользователь скрыл имя, 10 Марта 2013 в 18:31, курсовая работа
Целью работы является демонстрация работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.
Введение…………………………………………………………...………………3
Теоретическое и статистическое обоснование модели……………………….4
Построение и анализ эконометрической модели……………………………….7
Построение базовой регрессионной модели и оценка её качества…….7
Проверка модели на гетероскедастичность……………………….…….10
Коррекция гетероскедастичности………………………………………..12
Заключение……………………………………………………………………….14
Список использованных источников……………………………………...……15
Приложения…………………………………………..........................................16
МИНИСТЕРСТВО ОБРАЗОВАНИЯ
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Экономический факультет
Кафедра экономической информатики и математической экономики
КУРСОВАЯ РАБОТА
на тему: «Исследование проблемы выявления и коррекции гетероскедастичности с использованием тестов Вайта и Парка»
Студентки 3 курса
дневного отделения
«Экономическая теория»
Научный руководитель
старший преподаватель
Минск, 2012
СОДЕРЖАНИЕ
Введение…………………………………………………………
Теоретическое и статистическое обоснование модели……………………….4
Построение и анализ эконометрической модели……………………………….7
Заключение……………………………………………………
Список использованных источников……………………………………...……
Приложения…………………………………………....
ВВЕДЕНИЕ
Данная
работа посвящена исследованию проблемы
выявления и коррекции
Целью работы является демонстрация работы тестов Парка и Вайта, выявляющих наличие в модели гетероскедастичности остатков, а также коррекция модель так, чтобы выполнялась вторая предпосылка МНК: дисперсии случайных ошибок равны между собой, т.е. имеет место гомоскедастичность.
Достижение поставленной цели обусловило постановку и решение следующих задач:
1. анализ регрессий на адекватность;
2. выявление возможных ошибок спецификации;
3. исследование модели на наличие гетероскедастичности;
4. устранение гетероскедастичности остатков.
ТЕОРЕТИЧЕСКОЕ И СТАТИСТИЧЕСКОЕ ОБОСНОВАНИЕ МОДЕЛИ
Сельское хозяйство - одна из важнейших отраслей экономики, производящая продукты питания для населения, сырьё для пищевой и лёгкой промышленности и обеспечивающая продовольственную независимость государства.
Данная работа предполагает построение модели зависимости между валовой добавленной стоимостью в сельском хозяйстве, численностью сельского населения и площадью сельскохозяйственных земель.
Валовая добавленная стоимость сельского хозяйства рассчитывается как разница между валовым выпуском и промежуточным потреблением отрасли сельского хозяйства. Она рассчитывается без отчислений на амортизацию готовых активов или истощения и деградации природных ресурсов.
Сельское
хозяйство включает в себя лесное
хозяйство, охоту и рыболовство,
а также выращивание
Под сельским населением понимается часть постоянного населения страны, проживающая в сельских населённых пунктах и занятая в сельском хозяйстве.
К сельскохозяйственным землям относятся земли, регулярно используемые для производства сельскохозяйственной продукции. Они включают пашню, залежь, многолетние насаждения, сенокосы и пастбища.
Основные статистические характеристики всех переменных данной работы приведены в таблице 1:
AGRICULTURE |
POPULATION |
LAND | |
Среднее |
4.82E+10 |
62684808 |
568900.6 |
Медиана |
7.22E+09 |
7410770 |
197950 |
Максимум |
7.35E+11 |
8.53E+08 |
5243210 |
Минимум |
1.63E+08 |
75413 |
1310 |
Стандартное отклонение |
1.32E+11 |
1.78E+08 |
1036877 |
Для проверки наличия связи между переменными, воспользуемся корреляционным анализом данных. Коэффициенты корреляции представлены в таблице 2:
POPULATION |
LAND | |
POPULATION |
1 |
0.646294827328046 |
LAND |
0.646294827328046 |
1 |
Из таблицы 2 видно, что связь между переменными существует.
Для получения качественных оценок в модели необходимо, чтобы выполнялся ряд предпосылок МНК относительно случайного отклонения. Одной из ключевых предпосылок МНК является постоянство дисперсий случайных отклонений (не должно быть закономерных увеличений и уменьшений её значений в зависимости от наблюдений). Если предпосылка выполняется, то мы говорим о гомоскедастичности отклонений, в обратном случае – гетероскедастичности.
Причиной появления гетероскедастичности может служить: большой разброс и наличие выбросов в реальных данных, ошибка спецификации эконометрической и регрессионной модели, ошибки в преобразовании данных, ассиметрия распределения экзогенных переменных.
При гетероскедастичности последствия применения МНК будут следующими:
К настоящему времени разработано достаточно большое количество методов диагностики и выявления гетероскедастичноси: графический анализ остатков, тест Парка, тест Глейзева, тест ранговой корреляции Спирмена, тест Голдфелда-Квандта, тест Бреуша-Пагана, тест Вайта.
В данной работе я исследую проблемы гетероскедастичности, используя тест Вайта и Парка.
Алгоритм применения теста Вайта заключается в следующих аспектах:
ei=Yi -βo- βlX1i - β2X2i - β3X3i
К сожалению, одним из явных недостатком теста Вайта является то, что он не позволяет определить форму гетероскедастичности.
В общем случае, аглоритм проведения теста Парка выглядит следующим образом:
yi = β0 + β1 x1i + β2 x2i +ei
ei = yi - 0 - 1 x1i - 2 x2i
вспомогательное уравнение регрессии.
ln() = α0 + α1 lnZi + ui
Использование в критерии Парка конкретной функциональной зависимости может привести к необоснованным выводам (например, коэффициент α1 статистически незначим, а гетероскедастичность имеет место). Возможна еще одна проблема. Для случайного отклонения ui в свою очередь может иметь место гетероскедастичность. Поэтому критерий Парка дополняется другими тестами.
ПОСТОРОЕНИЕ И АНАЛИЗ ЭКОНОМИЧЕСКОЙ МОДЕЛИ
Построение базовой
По данным из приложения построим исходную модель с помощью эконометрического пакета Eviews 5. Получим следующее уравнение:
AGRICULTURE = -1.384604338e+010 + 359.0960823*POPULATION + 69421.12358*LAND
Где:
AGRICULTURE – валовая добавленная стоимость произведенных товаров сельского хозяйства за 2011 г. (в текущих долларах США),
POPULATION – численность сельского населения за 2011 г. (чел.),
LAND – площадь сельскохозяйственных земель (кв.км).
Dependent Variable: AGRICULTURE |
||||
Method: Least Squares |
||||
Date: 12/08/12 Time: 13:10 |
||||
Sample: 1 35 |
||||
Included observations: 35 |
||||
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
C |
-1.38E+10 |
9.35E+09 |
-1.480783 |
0.1484 |
POPULATION |
359.0961 |
60.91275 |
5.895253 |
0.0000 |
LAND |
69421.12 |
10476.28 |
6.626506 |
0.0000 |
R-squared |
0.873920 |
Mean dependent var |
4.82E+10 | |
Adjusted R-squared |
0.866041 |
S.D. dependent var |
1.32E+11 | |
S.E. of regression |
4.83E+10 |
Akaike info criterion |
52.12247 | |
Sum squared resid |
7.48E+22 |
Schwarz criterion |
52.25579 | |
Log likelihood |
-909.1433 |
F-statistic |
110.9040 | |
Durbin-Watson stat |
2.351587 |
Prob(F-statistic) |
0.000000 | |
Свободный член указывает на то, что, если все экзогенные переменные будут равны нулю, то изменение AGRICULTURE будет равно -13846043376,9018.
Коэффициент при переменной POPULATION указывают на то, что изменение данной переменной на единицу (или 1%) приведет к изменению добавленной стоимости сельского хозяйства на 359.0960823. И следовательно, изменение переменной LAND на единицу приведёт к изменению AGRICULTURE на 69421.12358.
Сперва, для оценки данной модели проверим статистическую значимость коэффициента детерминации, используя критерий Фишера:
Fнаблюдаемое = 110.9040
Fкритическое = F α, m, n-m-1 = F 0.05, 2, 32 = 3.32
F-наблюдаемое больше, чем F-критическое и из этого следует, что коэффициент детерминации статистически значим. Уравнение регрессии на 87,392% объясняет поведение эндогенной переменной.
Статистическую значимость коэффициентов уравнения регрессии проверим по t-статистике, которая равна:
AGRICULTURE = -1.384604338e+010 + 359.0960823*POPULATION + 69421.12358*LAND
(t)
(-1.481)
Возьмем уровень значимости . Тогда критическое значение t-статистики соответственно:
t критическое = t α/2, n-m-1= t 0.025, 35-2-1 = 2.042
Значения t-статистик рассматриваемых переменных, за исключением свободного члена, больше критического значения (распределение Стьюдента), следовательно, делаем вывод об их значимости.
Далее проведём
тестирование случайных отклонений
модели на наличие нормального
Статистика Жака-Берри и соответствующее ей P-значение 0.000451 говорят об отсутствии нормального распределения случайных отклонений модели при уровне значимости α = 0,05.
Проверку модели на присутствие автокорреляции осуществим с помощью статистики Дарбина-Уотсона:
Durbin-Watson stat |
2.351587 |
При уровне значимости α = 0,05 D l = 1.343 , D u = 1.584.
Мы видим, что автокорреляция в данной модели отсутствует.
Подтвердим отсутствие автокорреляции с помощью теста Бреуша-Годфри первого порядка:
Breusch-Godfrey Serial Correlation LM Test: |
||||
F-statistic |
1.028724 |
Probability |
0.318310 | |
Obs*R-squared |
1.124157 |
Probability |
0.289025 | |