Автор: Пользователь скрыл имя, 28 Февраля 2013 в 17:17, практическая работа
Торговля, по взглядам классических и современных либеральных экономистов - это двигатель экономического роста. Различные исследования свидетельствуют о положительной корреляции и сильных причинных связях между внешней торговлей и экономическим ростом и развитием многих стран (Balassa, 1987). C помощью торговли страны завоевывают “друзей” и становятся в состоянии ломать традиционные формы изоляции. Это увеличивает рост совокупной производительности факторов производства и привлекает прямые иностранные инвестиции.
Однако мы можем проверить, как GNS влияет на экспорт. При помощи команды ls y c gns получаем регрессионый анализ. Результаты анализа представлены на рисунке 2.2.
Рисунок 2.2. Регрессионный анализ Y GNS
При проведении регрессионного анализа, основанного на методе наименьших квадратов, следует обращать внимание на проблемы, связанные с выполнимостью свойств случайных отклонений моделей. Свойства оценок коэффициентов регрессии напрямую зависят от свойств случайного члена в уравнении регрессии. Для получения качественных оценок необходимо следить за выполнимостью предпосылок МНК (условий Гаусса-Маркова), так как при их нарушении МНК может давать оценки с плохими статистическими свойствами. Одной изключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений. Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений), невыполнимость – гетероскедастичностью.
Проверим нашу регрессию на гетероскедастичность. Для этого используем команду View-Residua Test-White Heteroskedasticity(cross terms).
Рисунок 2.3. Тест на гетероскедастичность
Так как Probability в нашем случае больше 0,05, мы не отвергаем нулевую гипотезу о гомоскедастичности.
Проведем регрессионный анализ нескольких переменных. Зависимость Y от GDP (ls y c gdp) показана на рисунке 2.4.
Рисунок 2.4. Регрессионный анализ переменной Y и GDP
Проверка на гетероскедастичность:
Probability меньше 0.05, следовательно нулевая
гипотеза отвергается. Необходимо исправить
ошибки(Estimate-Options-
Однако даже при изменении ошибок наши выводы не изменились.
При проведении регрессионного анализа, необходимо знать, как трактуются полученные показатели.
Coefficient - оценки параметров модели.
Standart error - стандартные
ошибки коэффициентов
t - statistics - дает
наблюдаемое значение t - статистики.
Ее значение используется для
проверки значимости
Probability - показывает
вероятность принять или
R - Squared - коэффициент детерминации - одна из наиболее эффективных оценок адекватности регрессионной модели, мера качества уравнения регрессии, характеристика прогностической силы анализируемой регрессионной модели. В общем случае показывает, какая часть зависимой переменной может быть объяснена с помощью независимых переменных включенных в модель. Если значение R2 равно 1, то между переменными существует точная линейная связь. Если R2 равно нулю, то статистическая линейная связь отсутствует.
Adjusted R - Squared - скорректированный коэффициент детерминации. Важным свойством коэффициента детерминации является то, что R2 - неубывающая функция от количества факторов, входящих в модель. Поэтому для сравнения коэффициентов детерминации разных моделей надо уравнивать количество факторов. Для сравнения моделей по коэффициенту детерминации корректируют коэффициент детерминации так, чтобы он как можно меньше зависел от количества факторов. Скорректированный коэффициент детерминации может быть использован для выбора лучшей модели при небольшом объеме выборки. Он учитывает число степеней свободы. Т.к. в нашем случае объем наблюдений равен 48, поэтому мы будем рассматривать не скорректированный коэффициент детерминации, а простой коэффициент детерминации.
S.E. of regression – стандартная ошибка регрессии в результате решения уравнения. Прогнозы производятся с ошибками, где ошибки – это разность между фактическим и прогнозируемым значением yt - ŷt.
Sum Squared Resid – сумма квадратов остатков.
Log likelihood - показывает
значение функции
Durbin-Watson Stat –
Статистика Дарбина-Уотсона.
Mean dependent var –
среднее арифметическое
S.D. Dependent var –
стандартное среднее
Akaike info criterion – информационный критерий Акаике, AIC.
Schwarz criterion – критерий Шварца. Его отличие от AIC состоит в большем штрафе за количество параметров.
F-Statistic - F-статистика.
Значение F-статистики служит для
проверки модели на
В нашем случае коэффициент детерминации R2 равен 0.953778, что говорит о том, что доля влияния GDP на экспорт значительна. Probability при GDP равна 0.0000, значит коэффициент при данном факторе не равен нулю. Значение коэффициента 0.258427 говорит о том, что при росте ВВП на 1 миллиард долларов США экспорт страны увеличивается на 0.258 млрд долларов.
Добавим в регрессию еще один фактор (NER), проверим модель на гетероскедастичность, исправим ошибки. Полученный анализ:
Здесь мы видим, что обменный курс имеет обратную зависимость с экспортом. При росте обменного курса на 1 рубль, экспорт уменьшается на 2.2 миллиарда долларов.
Для того чтобы избежать слишком сильных взлетов и падений, будем измерять все факторы в форме натурального логарифма. Мы также проверяем модель на гетероскедастичность и исправляем ошибки.
Рисунок 2.5. Регрессионный анализ Y NER GDP в логарифмической форме
Мы можем заметить, что значения
стали другими. Необходимо однако помнить,
что при измерении показателей в логарифмической
форме, коэффициент регрессии при переменной
X1 выражает предельный прирост зависимой
переменной при изменении переменной
X1, при условии постоянства других
переменных. Таким образом, при увеличении
ВВП на 1% экспорт увеличивается на e0.78,
т.е. приблизительно на 2,17.
При увеличении обменного курса на 1%, экспорт уменьшается на e0.81, т.е. на 2,24.
При введении в регрессию всех переменных мы получаем результат:
Значимыми мы можем считать только коэффициены при GDP, NER и FDI. Причем прямые иностранные инвестиции имеют отрицательную связь с экспортом – при росте инвестиций на 1 млрд долларов, экспорт уменьшается на 0,35 млрд.
Рисунок 2.6. Введение всех переменных в модель
Из-за явления мультиколлинеарности мы не можем изучить, как все факторы в совокупности влияют на экспорт России. Для того чтобы исключить это явление, необходимо добрать выборку, однако такого доступа к данным у нас нет.
Необходимо исключить из модели переменную, имеющую наибольший коэффициент корреляции с фактором GDP.
Принимаем решение исключить фактор
добавленной стоимости в промышлености,
так как этот показатель имеет тесную
связь с другими факторами в модели.
Однако, даже после исключения INVAD, мы не удовлетворены результатами регрессионного анализа.
Исследование остатков поможет изменить модель.
Остатки – это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследуя остатки, мы можем оценить степень адекватности модели опытным данным. При изменении спецификации модели значение оценок остатков могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование остаточных величин.
Для проверки статистической
достоверности уравнения
Поэтому после построения уравнения регрессии исследуется выполнение следующих предпосылок относительно остатков:
Если распределение случайных остатков не соответствует некоторым предпосылкам МНК, то следует корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии.
Проверим нашу модель на автокорреляцию остатков.
В соответствии с предпосылками метода наименьших квадратов, возмущения должны быть случайными. Однако нередко встречается ситуация, когда остатки содержат тенденцию или циклические колебания, т.е. каждое следующее значение возмущения зависит от предшествующих. В этом случае говорят об автокорреляции остатков.Также часто автокорреляция возникает вследствие не включения в модель существенной переменной. В случае временных рядов в качестве такой переменной выступает лаговое значение.
Для определения
наличия автокорреляции используется
тест Q-statistics (View-Residual Tests-Correlogram-Q-
Лаг – порядок коэффициента автокорреляции, т.е. число периодов, по которым рассчитывается коэффициент. Например, если лаг равен 1, будет рассчитан коэффициент автокорреляции первого порядка, измеряющий зависимость между соседними остатками. Q-statistic для лага k – это тестовая статистика для нулевой гипотезы о том, что до порядка k явление автокорреляции не наблюдается. Если Prob(Q-Stat)>0.05, а коэффициенты автокорреляции и частной автокорреляции близки к нулю, то значение этой статистики может считаться незначимым, а автокорреляция – отсутствующей.
Рисунок 3.1. Автокореляция в модели с исключенной переменной INVAD
В нашем случае, все Probabilities меньше 0,05. Следовательно, мы отвергаем нулевую гипотезу об отсутствии автокорреляции.
Попробуем включить в модель лаговые переменные.
Рисунок 3.2. Включение в модель лаговых переменных
Проверим теперь
первую предпосылку о случайном
характере остатков. Для этого построим график остатков
(View-Actual,Fitted,Residual-
Рисунок 3.3. График остатков
Из графика видно, что остатки не имеют никакой закономерности и всего 9 точек из 48 находятся за пределами границ.
Это означает, что остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения.
Проверим вторую предпосылку (E(Residi)=0).
Неравное нулю математическое ожидание позволяет сделать вывод, что оценки остатков зависят от Y и что модель неадекватна. Равенство нулю нарушается либо из-за неправильной спецификации модели (зависимость не линейная, а иная), либо из-за нарушения 3-ей предпосылки МНК (о постоянном значении дисперсии).
Получим значение математического ожидания (View-Residual Tests-Histogram-Normality Test). Mean = 8.92e-15, т.е. среднее значение остатков примерно равно 0. Предпосылка выполняется.
Рисунок 3.4. Математическое ожидание
Третья предпосылка
говорит о наличии
Равенство дисперсий возмущений (ошибок) регрессии является существенным условием линейной классической регрессионной модели множественной регрессии. Свойство постоянства дисперсий ошибок регрессии называется гомоскедастичностью. Наиболее простой и часто употребляемый тест на гомоскедастичность – тест Уайта.
Ранее мы уже исправляли ошибки, чтобы избежать явления гетероскедастичности. Повторим выполнение теста.
Рисунок 3.5. Тест Уайта
Мы видим, что гипотеза о гомоскедастичности подтвердилась, т.к. Prob=0.112782 больше 0,05.
Осталось проверить пятую предпосылку, которая говорит о том, что остатки подчиняются нормальному закону распределения.
Чтобы определить нормальность распределения остатков воспользуемся статистикой Jarque-Bera, которая используется для проверки гипотезы о нормальности распределения исследуемого ряда.
Н0: Распределение не отличается от нормального;
Н1: Распределение существенно отличается от нормального.
Вероятность Probability - это вероятность того, что статистика Jarque-Bera превышает (по абсолютному значению) наблюдаемое значение для нулевой гипотезы. На рисунке 3.4. показано, что Prob в нашем случае равна 0.577501. Таким образом, нулевая гипотеза принимается, распределение не отличается от нормального.