Автор: Пользователь скрыл имя, 13 Мая 2012 в 07:18, курсовая работа
Цель данной курсовой работы: рассмотреть понятие о фиктивных переменных и способы их использования в эконометрических моделях.
Задачи данной курсовой:
Рассмотреть все необходимые виды фиктивных переменных;
Обозначить необходимость использования фиктивной переменной представленных эконометрических моделях;
Выяснить, можно ли объединить две выборки в одну с помощью теста Чоу;
Решение задачи с введением фиктивных переменных на примере зависимости заработной платы работника от их возраста;
Введение 3
Понятие фиктивной переменной 4
Фиктивные переменные сдвига 6
Фиктивные переменные наклона 8
Необходимость фиктивной переменной в регрессии 9
Фиктивные переменные во множественной регрессии 11
Использование фиктивных переменных в моделях с временными рядами 16
Использование фиктивных переменных в моделях сезонных колебаний 17
Линейные регрессионные модели с переменной структурой 19
ANCOVA-модели при использовании фиктивной переменной 22
Модели LMP при использовании фиктивной переменной 25
Тест Чоу 28
Практическое задание 30
Заключение 32
Список использованных источников 33
Правда, можно отметить, что невыполнимость предпосылки МНК о нормальном распределении случайных отклонений не столь существенна при определении опенок уравнения регрессии (они остаются несмещенными), но она достаточно важна при анализе проверок соответствующих гипотез. Однако с ростом объема выборки биноминальное распределение стремится к нормальному распределению.
2. Случайные отклонения не обладают свойством постоянства дисперсии (гомоскедастичности). Действительно, (т.к. ). Тогда:
Следовательно, D( ) зависит от вероятностен соответствующих значении Y, которые в свою очередь зависят от выбранных значений X. Это означает, что дисперсии отклонений могут быть различными для различных наблюдений. Однако данная проблема гетероскедастнчности также преодолима.
3. Очевидно, использование формул (60) — (64) может привести к ситуации, когда некоторые , будут либо меньше нуля, либо больше единицы.
Тогда мы получим противоречие с (65), т. к. . Возможный вариант устранения данной проблемы рассматривается в следующем разделе.
4. Применение модели LPM весьма проблематично с содержательной точки зрения.
Действительно, увеличение в (64) значения переменной X на одну единицу приводит к изменению значения Y на величину вне зависимости от конкретного значения X, что, безусловно, противоречит теоретическим и практическим выкладкам (например, закону убывающей эффективности и т. п.).
Все
вышеперечисленное позволяет
В практике нередки случаи, когда имеются две выборки пар значений зависимой и объясняющих переменных . Например, одна выборка пар значений переменных объемом получена при одних условиях, а другая, объемом — при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле. Другими словами, выяснить, можно ли объединить две выборки в одну и рассматривать единую модель регрессии Y по X.
Предположим, что имеется выборка, состоящая из двух подвыборок, и что возникает вопрос, следует ли объединить их для оценивания общей регрессии Р или оценить отдельные регрессии А и В. Обозначим суммы квадратов остатков для регрессий подвыборок . Пусть — суммы квадратов остатков в объединенной регрессии для наблюдений, относящихся к двум рассматриваемым подвыборкам. Так как отдельные регрессии для подвыборок должны соответствовать наблюдениям, по меньшей мере, так же хорошо, если не лучше, чем объединенная регрессия, то и . Следовательно, , где общая сумма квадратов остатков в объединенной регрессии равна сумме . Это поясняется на рисунке 3. Предположим, что имеются данные временного ряда по двум переменным и что в период выборки произошло структурное изменение, разделяющее наблюдения на подвыборки А и В. На рисунке 3 регрессии для подвыборок обеспечивают вполне адекватное соответствие данным, обусловливая низкие значения . Если бы требовалось оценить объединенную регрессию, как на рисунке 3, то остатки в обеих подвыборках в целом были бы значительно больше. Равенство между и будет иметь место только при совпадении коэффициентов регрессии для объединенной регрессии и регрессий подвыборок. В общем случае при разделении выборки будет наблюдаться улучшение качества уравнения, что можно представить как . Это имеет свою цену: используются дополнительных степеней свободы, так как вместо параметров для одной объединенной регрессии мы теперь должны оценить в сумме параметров ( — число объясняющих переменных, единица соответствует постоянному члену). После разделения выборки, однако, остается необъясненная сумма квадратов остатков и, кроме того, степеней свободы.
Рисунок 3 – Регрессии, оцениваемые для теста Чоу
Теперь мы можем определить, является ли значимым улучшение качества уравнения после разделения выборки. Для этого используется .F-статистика:
(67)
которая распределена с и степенями свободы.
Критерий Г. Чоу может быть использован при построении регрессионных моделей при воздействии качественных признаков, когда имеется возможность разделения совокупности наблюдений по степени воздействия этого фактора на отдельные группы и требуется установить возможность использования единой модели регрессии.
Задание: Требуется построить регрессионную модель зависимости заработной платы работника (Y) от возраста (Х) с использованием фиктивной переменной по фактору «пол» по 20 работникам одного предприятия (Таблица 2).
Таблица 2 – Исходные данные
№ | Y – заработная плата работника за месяц ($) | X - возраст работника (лет) | Z – пол,
М/Ж |
1 | 300 | 29 | Ж |
2 | 400 | 40 | М |
3 | 300 | 36 | Ж |
4 | 320 | 32 | Ж |
5 | 200 | 23 | М |
6 | 350 | 45 | Ж |
7 | 350 | 38 | Ж |
8 | 400 | 40 | М |
9 | 380 | 50 | М |
10 | 400 | 47 | М |
11 | 250 | 28 | Ж |
12 | 350 | 30 | М |
13 | 200 | 25 | М |
14 | 400 | 48 | М |
15 | 220 | 30 | Ж |
16 | 320 | 40 | М |
17 | 390 | 40 | М |
18 | 360 | 38 | М |
19 | 260 | 29 | Ж |
20 | 250 | 25 | М |
Решение:
Введем в модель фиктивную переменную Z, которая принимает два значения: 1 – если пол мужской; 0 – если пол женский. Оценим параметры модели методом наименьших квадратов. Для вычислений воспользуемся Пакетом анализа в EXCEL. Уравнение множественной регрессии примет вид:
. (68)
Коэффициент детерминации равен 0,74.
Уравнение регрессии значимо по F-критерию на 5% уровне, так как
(69)
Из
полученного уравнения
Из модели, включающей фиктивную переменную можно получить частные уравнения регрессии для работников мужчин (z = 1) и женщин (z = 0):
(70)
Сопоставляя частные уравнения регрессии, видим, что эти уравнения регрессии отличаются значениями свободного члена, а соответствующие линии регрессии параллельны (Рисунок 3). График частного уравнения регрессии для мужчин будет располагаться выше, чем график частного уравнения регрессии для женщин.
Рисунок 3 - Графики частных уравнений регрессии.
Вывод: В результате проделанных вычислений с введением фиктивной переменной я выяснила, что при одном и том же возрасте заработная плата в месяц среди 20 работников одного возраста одного предприятия, у работников мужчин выше, чем у женщин.
Заключение
Фиктивные переменные, несмотря на спою внешнюю простоту, являются весьма гибким инструментом при исследовании влияния качественных признаков. Оценивание регрессии с использованием фиктивных переменных более информативно в том отношении, что позволяет использовать t-критерий для оценки существенности влияния каждой фиктивной переменной на зависимую переменную.
Регрессионные модели являются достаточно гибким инструментом, позволяющим, в частности, оценивать влияние качественных признаков на изучаемую переменную. Это достигается введением в число факторов, так называемых фиктивных переменных, принимающих, как правило, значения 1 или 0 в зависимости от наличия или отсутствия соответствующего признака в очередном наблюдении. С формальной точки зрения фиктивные переменные ничем не отличаются от других факторов. Наиболее сложный вопрос, возникающий при их использовании, — это правильная интерпретация получаемых оценок.
Как правило, независимые переменные в регрессионных моделях имеют "непрерывные" области изменения (национальный доход, уровень безработицы, размер зарплаты и т.п.). Однако теория не накладывает никаких ограничений на характер факторов, в частности, некоторые переменные могут принимать всего два значения или, в более общей ситуации, дискретное множество значений. Необходимость рассматривать такие переменные возникает довольно часто в тех случаях, когда требуется принимать во внимание какой-либо качественный признак. С таким примером мы столкнулись ранее, когда рассматривали модель стоимости жилой площади в Москве. В качестве такого признака рассматривалась «этажность»: необходимо было разделить первый, последний и другие этажи.
Есть и другие примеры. Так при исследовании зависимости зарплаты от различных факторов может возникнуть вопрос, влияет ли на ее размер и, если да, то в какой степени, наличие у работника высшего образования. Точно также можно выяснить в какой степени имеются различия в оплате труда между мужчинами и женщинами. Для решения подобных задач в принципе можно оценивать соответствующие уравнения внутри каждой категории, а затем изучать различия между ними, но введение дискретных или группирующих переменных позволяет определить параметры модели сразу по всем категориям. Фиктивные переменные, несмотря на свою внешнюю простоту, являются весьма гибким инструментом при исследовании влияния качественных признаков.
Список использованных источников
Информация о работе Использование фиктивных переменных в эконометрических моделях