Использование фиктивных переменных в эконометрических моделях

Автор: Пользователь скрыл имя, 13 Мая 2012 в 07:18, курсовая работа

Описание работы

Цель данной курсовой работы: рассмотреть понятие о фиктивных переменных и способы их использования в эконометрических моделях.
Задачи данной курсовой:
Рассмотреть все необходимые виды фиктивных переменных;
Обозначить необходимость использования фиктивной переменной представленных эконометрических моделях;
Выяснить, можно ли объединить две выборки в одну с помощью теста Чоу;
Решение задачи с введением фиктивных переменных на примере зависимости заработной платы работника от их возраста;

Содержание

Введение 3
Понятие фиктивной переменной 4
Фиктивные переменные сдвига 6
Фиктивные переменные наклона 8
Необходимость фиктивной переменной в регрессии 9
Фиктивные переменные во множественной регрессии 11
Использование фиктивных переменных в моделях с временными рядами 16
Использование фиктивных переменных в моделях сезонных колебаний 17
Линейные регрессионные модели с переменной структурой 19
ANCOVA-модели при использовании фиктивной переменной 22
Модели LMP при использовании фиктивной переменной 25
Тест Чоу 28
Практическое задание 30
Заключение 32
Список использованных источников 33

Работа содержит 1 файл

КР Фиктивные переменные.doc

— 2.46 Мб (Скачать)

     В этом случае первоначальная регрессионная  модель (45) заработной платы изменится и примет вид:

              (46)

     Таким образом, принимая модель (46), мы считаем, что средняя заработная плата у мужчин на выше, чем у женщин, при неизменных значениях других параметров модели. А проверяя гипотезу мы можем установить существенность влияния фактора «пол» на размер заработной платы работника.

     Следует отметить, что в принципе качественное различие можно формализовать с  помощью любой переменной, принимающей два разных значения, не обязательно 0 или 1. Однако в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», так как при этом интерпретация полученных результатов выглядит наиболее просто. Так, если бы в модели (46) в качестве фиктивной выбрали переменную принимающую значения (для работников-мужчин) и (для женщин), то коэффициент регрессии при этой переменной равнялся бы , т. е. одной трети среднего изменения заработной платы у мужчин.

     Если  рассматриваемый качественный признак  имеет несколько  уровней (градаций), то в принципе можно было ввести в регрессионную модель дискретную переменную, принимающую такое же количество значений (например, при исследовании зависимости заработной платы от уровня образования можно рассматривать значения: при наличии начального образования, - среднего и при наличии высшего образования). Однако обычно так не поступают из-за трудности содержательной интерпретации соответствующих коэффициентов регрессии, а вводят (k-1) бинарных переменных.

     В рассматриваемом примере для  учета фактора образования можно было в регрессионную модель (46) ввести бинарные переменные и :

             (47)

где   

     Третьей бинарной переменной , очевидно, не требуется: если i-й работник имеет начальное образование, это будет отражено парой значений  , .

     Более того, вводить третью бинарную переменную (со значениями - если работник имеет начальное образование; — в остальных случаях) нельзя, так как при этом дли любого i-го работника т. е. при суммировании элементов столбцов обшей матрицы плана, соответствующих фиктивным переменным мы получили бы столбец, состоящий из одних единиц. А так как в матрице плана такой столбец из единиц уже есть (напомню, что это первый столбец, соответствующий свободному члену уравнения регрессии), то это означало бы линейную зависимость значений (столбцов) общей матрицы плана X, т. е. нарушило бы предпосылку 6 регрессионного анализа. Таким образом, мы оказались бы в условиях мультиколлинеарности в функциональной форме и как следствие — невозможности получения оценок методом наименьших квадратов.

     Такая ситуация, когда сумма значений нескольких переменных, включенных в регрессию, равна постоянному числу (единице), получила название «dummy trap» или «ловушки». Чтобы избежать такие ловушки, число вводимых бинарных переменных должно быть на единицу меньше числа уровней (градаций) качественного признака.

     Следует отметить не совсем удачный перевод  на русский язык термина «dummy variables» как «фиктивная» переменная. Во-первых, в модели регрессионного анализа мы уже имеем фиктивную переменную X при коэффициенте . всегда равную единице. Во-вторых, и это главное — все процедуры регрессионного анализа (оценка параметров регрессионной модели, проверка значимости се коэффициентов и т. п.) проводятся при включении фиктивных переменных так же, как и «обычных», количественных объясняющих переменных. «Фиктивность» же переменных Z1 состоит только в том, что они количественным образом описывают качественный признак.

     Рассматриваемые выше регрессионные модели (46) и (47) отражали влияние качественного признака (фиктивных переменных) только на значения переменной , т. е. на свободный член уравнения регрессии. В более сложных моделях может быть отражена также зависимость фиктивных переменных на сами параметры при переменных регрессионной модели. Например, при наличии в модели объясняющих переменных — количественной наличии в модели объясняющих переменных — количественной X1 и фиктивных из которых влияют только на значение коэффициента при , a — только на величину свободного члена уравнения, такая регрессионная модель примет вид:

             (48)

     Модели  типа (48) используются, например, при исследовании зависимости объема потребления Y некоторого продукта от дохода потребителя X, когда одни качественные признаки (например, фактор сезонности) влияют лишь на количество потребляемого продукта (свободный член уравнения регрессии), а другие (например, уровень доходности домашнего хозяйства) — на параметр при X, интерпретируемый как «склонность к потреблению».

 

  1. ANCOVA-модели при использовании фиктивной переменной

     Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного анализа). ANOVA-модели представляют собой кусочно-постоянные функции. Однако такие модели в экономике крайне редки. Гораздо чаще встречаются модели, содержащие как качественные, так и количественные переменные.

     Вначале рассмотрим простейшую ANCOVA - модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:

                  (49)

     Если  качественная переменная имеет к альтернативных значений, то при моделировании используются только (k - 1) фиктивных переменных.

     Если  не следовать данному правилу, то при моделировании исследователь  попадает в ситуацию совершенной  мультиколлинеарности или так называемую ловушку фиктивной переменной.

     Значения  фиктивной переменной можно изменять на противоположные. Суть модели от этого  не изменится. Например, в модели (49) можно, например, положить, что:

              (50)

     Однако  при этом знак коэффициента изменится на противоположный .

     Значение  качественной переменной, для которого принимается D = 0. называется базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.

     Коэффициент у в модели (49) иногда называется дифференциальным коэффициентом свободного члена, т. к. он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равном единице, от свободного члена модели при базовом значении фиктивной переменной.

     Пусть рассматривается модель с двумя  объясняющими переменными, одна из которых количественная, а другая - качественная. Причем качественная переменная имеет три альтернативы. Например, ситуация, связанная с расходами на содержание ребенка, может быть связана с доходами домохозяйств и возрастом ребенка: дошкольный, младший школьный и старший школьный. Так как качественная переменная связана с тремя альтернативами, то по общему правилу моделирования необходимо использовать две качественные переменные. Таким образом, модель может быть представлена в виде:

            , (51)

где Y – расходы, X - доходы

     Здесь - дифференциальные свободные члены. Таким образом, получаются три регрессионные прямые (49), (50), (51) параллельные друг другу (Рисунок 2):

Рисунок 2 - Регрессионные прямые

     После определения коэффициентов уравнений  регрессии определяется статистическая значимость коэффициентов  на основе обычной t-статистики.

     Многие  экономические показатели напрямую связаны с сезонными колебаниями. Например, спрос на туристические путевки, охлажденную воду и мороженое существенно выше летом, чем зимой. Спрос на обогреватели, шубы выше зимой. Некоторые показатели имеют существенные квартальные колебания и т. д.

     Обычно  сезонные колебания характерны для  временных рядов. Устранение или  нейтрализация сезонного фактора в таких моделях позволяет сконцентрироваться на других важных количественных и качественных характеристиках модели, в частности на общем направлении развития модели, так называемом тренде. Такое устранение сезонного фактора называется сезонной корректировкой.

       Пусть переменная Y определяется количественной переменной X. причем эта зависимость существенно разнится по кварталам. Тогда общую модель в этой ситуации можно представить в виде:

             (52)

где  

     Заметим, что число кварталов равно  четырем, а следовательно число  фиктивных переменных должно быть равно трем. В нашем примере в качестве базы выбран I квартал. Если значения Y существенно различаются по кварталам (сезонам), то в уравнении (52) коэффициенты при фиктивных переменных окажутся статистически значимыми. Тогда ожидаемое значение Y по кварталам определяется следующими соотношениями:

            - для I квартала,  (53)

            - для II квартала,  (54)

            - для III квартала,  (55)

            - для IV квартала.  (56)

     Легко видеть, что в модели (11.19) рассматриваются  такие ситуации, при которых квартальные различия отражаются лишь в различии свободных членов моделей. Если же различия затрагивают и изменения коэффициента пропорциональности, то это может быть отражено следующей моделью:

             (57)

     Выбор правильной формы модели регрессии является в данной ситуации достаточно серьезной проблемой, т. к. в этом случае вполне вероятны ошибки спецификации. Наиболее рациональной практической стратегией выбора модели является следующая схема.

     Вначале рассматривается модель (52). Определяется статистическая значимость коэффициентов. Если дифференциальные угловые коэффициенты оказываются статистически незначимыми, то переходят к модели (52). Если в этой модели дифференциальные свободные члены оказываются статистически незначимыми, то делают вывод, что квартальные (сезонные) изменения несущественны для рассматриваемой зависимости.

 

  1. Модели LMP при использовании фиктивной переменной

     Рассмотрим  модели, в которых зависимая переменная выражается в виде фиктивной (двоичной) переменной. Объясняющие переменные могут быть как количественными, так и качественными.

     Например, анализируется наличие работы у  субъекта в зависимости от возраста, образования, семейного положения, доходов остальных членов семьи и т. д. В этом случае зависимая переменная Y имеет два возможных состояния:

             (58)

     Или, например, при исследовании торгового  баланса в качестве зависимой  может быть использована следующая переменная:

             (59)

     Представим  рассматриваемые модели в виде:

             (60)

     Например, пусть Y - результат сдачи с первой попытки экзамена в ГАИ: Х1 - количество часов вождения в автошколе; Х2 - средний процент выпускников данной автошколы, сдающих экзамен в ГАИ с первой попытки; D3 - использование компьютерной методики обучения. В этой ситуации:

             (61)

     Пусть 0 < X1 < 50 часов. 0 < Х2 < 100 %,

             (62)

     Тогда получим следующую модель:

              (63)

     Модели  вида (60) и (63) называются линейными вероятностными моделями (linear probability models,) (LPM-моделями). Суть этого названия поясним на простейшем примере данной модели:

         (64)

     При использовании модели (64 среднее ожидаемое значение Y (условное математическое ожидание Y) при X = х с учетом того, что M( ) = 0, определяется соотношением C другой стороны, Следовательно, из (64) имеем:

             (65)

     С учетом вышесказанного можно отметить, что применимость МНК к моделям lpm имеет определенные ограничения:

     1. Случайные отклонения  в данных моделях не являются нормальными случайными величинами, а скорее всего, имеют биноминальное распределение.

     Из (64) следует, что . Тогда:

             при 

             при 

Информация о работе Использование фиктивных переменных в эконометрических моделях