Использование фиктивных переменных в эконометрических моделях

Автор: Пользователь скрыл имя, 13 Мая 2012 в 07:18, курсовая работа

Описание работы

Цель данной курсовой работы: рассмотреть понятие о фиктивных переменных и способы их использования в эконометрических моделях.
Задачи данной курсовой:
Рассмотреть все необходимые виды фиктивных переменных;
Обозначить необходимость использования фиктивной переменной представленных эконометрических моделях;
Выяснить, можно ли объединить две выборки в одну с помощью теста Чоу;
Решение задачи с введением фиктивных переменных на примере зависимости заработной платы работника от их возраста;

Содержание

Введение 3
Понятие фиктивной переменной 4
Фиктивные переменные сдвига 6
Фиктивные переменные наклона 8
Необходимость фиктивной переменной в регрессии 9
Фиктивные переменные во множественной регрессии 11
Использование фиктивных переменных в моделях с временными рядами 16
Использование фиктивных переменных в моделях сезонных колебаний 17
Линейные регрессионные модели с переменной структурой 19
ANCOVA-модели при использовании фиктивной переменной 22
Модели LMP при использовании фиктивной переменной 25
Тест Чоу 28
Практическое задание 30
Заключение 32
Список использованных источников 33

Работа содержит 1 файл

КР Фиктивные переменные.doc

— 2.46 Мб (Скачать)

     Пусть d=0, тогда модель (5) принимает вид:

             (6)

     При d=1 получим:

              (7)

 или   (8)

     Модель (8), соответствующая d=1 отличается коэффициентами регрессии от модели (7). В ней учитывается как «параллельный» сдвиг, так и изменение угла наклона (изменение коэффициента ).

 

  1. Необходимость фиктивной переменной в регрессии

     Часто факторы, которые следует ввести в регрессионную модель, являются качественными по своей природе и, следовательно, не измеряются в числовой шкале. Приведем несколько примеров:

  • Исследуется зависимость между продолжительностью полученного образования и доходом, и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, обусловливает ли пол различие в результатах.
  • Исследуется зависимость между доходом и потреблением в Бельгии, и выборка включает как франкоговорящие семьи, так и семьи, говорящие по-фламандски. Нужно выяснить, имеет ли существенное значение это этническое различие.
  • Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это какое-либо влияние на исследуемую зависимость.

     В каждом из этих примеров возможны  два  решения:

      1. оценивание отдельных регрессий для двух указанных категорий с последующим выяснением, различаются ли полученные коэффициенты.
      2. оценивание единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения фиктивной переменной - переменной, принимающей в каждом наблюдении два значения: 1 - "да" или 0 - "нет".

     Фиктивные переменные включаются в модель множественной регрессии, если необходимо узнать влияние каких-нибудь дискретных факторов - например, числа человек в семье, месяца года, цвета окраски машины и т.п.

     По  данным «Таблицы 1» можно видеть, что в 1974 г. наблюдалось резкое снижение расходов на автомобили. Имел место нефтяной кризис, и снижение было одним из его результатов. Однако впоследствии расходы на автомобили начали снова расти.

                            Таблица 1 - Расходы на автомобиль в 1963-1982 гг.

Год Цена, млрд. долл.
1963 18,5
1964 19,7
1965 23,5
1966 23,6
1967 22,2
1968 26,5

                      Продолжение таблицы 1

Год Цена, млрд. долл.
1969 26,7
1970 22,7
1971 28
1972 31,6
1973 33,9
1974 25,5
1975 25,4
1976 31,1
1977 34,4
1978 34,8
1979 32,9
1980 28,7
1981 29,6
1982 28,8

 

     Следовательно, можем выдвинуть гипотезу, что функция спроса в 1974 г. сдвинулась вниз, как показано на рисунке 1, где у — расходы на автомобили, х — располагаемый личный доход

Рисунок 1 – Сдвиг функции спроса

     Мы  можем выразить этот сдвиг математически, введя в уравнение фиктивную  переменную D, принимая ее значения равными нулю для 1963 - 1973 гг. и единице для 1974 - 1982 гг.:

             (9)

     Для периода 1963-1973 гг. при D = 0 уравнение принимает вид:

             (10)

а для периода 1974-1982 гг. при D = 1:

             (11)

     Коэффициент при фиктивной переменной, отрицателен. В случае оценивания функции спроса получаем:

            ,  (12)

     Это означает, что величина свободного члена в уравнении регрессии  для периода 1963 - 1973 гг. составляет 0,57, а для периода 1974 - 1982 гг. она равна -3,83. Проверка значимости с помощью t-теста для коэффициента при фиктивной переменной с использованием одностороннего критерия (поскольку мы предвидим, что коэффициент будет отрицательным), показывает, что сдвиг является значимым при уровне значимости в 5%.

     В модели множественной регрессии  всегда желательно присутствие хоть одной нефиктивной переменной, так как дисперсия фиктивной переменной очень мала и это сказывается на достоверности оценок. В модели с фиктивными переменными коэффициент часто бывает очень малым, а значения t-статистики незначимо отличаются от 0 для фиктивных переменных. Это не является поводом для выбрасывания фиктивных переменных из модели - чаще всего они описывают небольшие, но важные поправки к главной (нефиктивной) объясняющей переменной.

 

  1. Фиктивные переменные во множественной регрессии

     До  сих пор в качестве факторов рассматривались  экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В отечественной литературе можно встретить термин «структурные переменные».

     Рассмотрим  применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

              (13)

где у   — количество потребляемого кофе; х  — цена.

     Аналогичные уравнения могут быть найдены  отдельно для лиц 

мужского пола   ,  (14)

и женского пола:     (15)

     Различия  в потреблении кофе проявятся  в различии средних и . Вместе с тем сила влияния х на у может быть одинаковой, т. е. В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и у2 и вводя фиктивные переменные, можно прийти к следующему выражению:

             (16)

где z1 и z2 - фиктивные переменные, принимающие значения:

               (17)

     В общем уравнении регрессии зависимая переменная у рассматривается как функция не только цены х, но и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом, когда z1=1, то z2 = 0 и, наоборот, при z1= 0 переменная z2 = 1

     Для лиц мужского пола, когда z1= 1 и z2 = 0, объединенное уравнение регрессии составит: ,  а для лиц женского пола, когда z1= 0 и z2 = 1, . Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии: . Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.

     Следует иметь в виду, что при введении фиктивных переменных z1 и z2 в модель (16) применение МНК для оценивания параметров а1 и а2 приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т. е. уравнение примет вид:

             (18)

     Предполагая при параметре А независимую переменную, равную 1, имеем матрицу исходных данных:

           

 (19)

     В рассматриваемой матрице существует линейная зависимость между первым, вторым и третьим столбцами: первый равен сумме второго и третьего столбцов. Поэтому матрица исходных факторов вырождена. Выходом из создавшегося затруднения может явиться переход к уравнениям

или   (20)

т. е. каждое уравнение включает только одну фиктивную переменную z1 или z2

     Предположим, что определено уравнение

             (21)

где z1 - принимает значения 1 для мужчин и 0 для женщин.

     Теоретические значения размера потребления кофе для мужчин будут получены из уравнения:

             (22)

     Для женщин соответствующие значения получим из уравнения

             (23)

     Сопоставляя эти результаты, видим, что различия в уровне потребления мужчин и  женщин состоят в различии свободных  членов данных уравнений: А — для женщин и А + А1 — для мужчин.

     Пример. Проанализируем с использованием фиктивных  переменных зависимость урожайности  пшеницы у от вида вспашки z и количества внесенного органического удобрения х.

     По 25 наблюдениям уравнение парной регрессии (без учета вила вспашки) составило:

             (24)

     Для его расчета использовалась следующая  система нормальных уравнений:

             (25)

     Уравнение регрессии статистически значимо - превышают табличные значения: при 5 %-ном уровне существенности и числе степеней свободы 23: , tb - 2,069, rxy = 0,398; при 1 %-ном уровне значимости: F = 7,88, tb = 2,807, rxy=0,507.

     По  виду вспашки поля характеризовались  двумя категориями: зяблевая и весенняя. Вид вспашки не влияет на количество внесенных удобрений, но обусловливает различия в урожайности. Чтобы убедиться в этом, введем в уравнение регрессии фиктивную переменную z для отражения эффекта вида вспашки, а именно: z = 1 для зяблевой вспашки и  z =  0 для весенней вспашки. Уравнение регрессии примет вид:

              (26)

     Применяя  метод наименьших квадратов для  оценки параметров данного уравнения, получим следующую систему нормальных уравнений:

           

  (27)

     Ввиду того, что z принимает лишь два значения (1 и 0), (число полей с зяблевой вспашкой),   (количество внесенных удобрений на полях с зяблевой вспашкой),   (сумма y по полям зяблевой вспашки).

Информация о работе Использование фиктивных переменных в эконометрических моделях