Автор: Пользователь скрыл имя, 28 Марта 2012 в 14:10, реферат
Модели дискретного выбора [discrete choice models] (иначе называемые моделями качественного отклика [qualitative response models]) — определяют вероятностное распределение дискретных зависимых переменных как функцию независимых переменных и неизвестных параметров. Их применение в эконометрике определяется тем, что решение экономического субъекта часто включает дискретный выбор (напр., решение поступать на работу или не поступать, выбор занятия, выбор маршрута перевозки груза и т. п.).
§ 1 Модели дискретного выбора
§ 2 Модели с бинарными переменными
§ 3 Модели бинарного и множественного выбора
§ 4 Probit- и logit-модели
§ 5 Случайная выборка
Список литературы.
Федеральное агентство по образованию
Южно-Уральский Государственный Университет
Факультет экономики и управления
Кафедра Экономической теории и мировой экономики
Реферат
На тему: Модели дискретного выбора
Выполнил: Дубовикова А.В.
Группа: ЭиУ-471
Проверил: Тетин И.А.
Челябинск
2011
Содержание:
§ 1 Модели дискретного выбора
§ 2 Модели с бинарными переменными
§ 3 Модели бинарного и множественного выбора
§ 4 Probit- и logit-модели
§ 5 Случайная выборка
Список литературы.
§1 Модели дискретного выбора
Модели дискретного выбора [discrete choice models] (иначе называемые моделями качественного отклика [qualitative response models]) — определяют вероятностное распределение дискретных зависимых переменных как функцию независимых переменных и неизвестных параметров. Их применение в эконометрике определяется тем, что решение экономического субъекта часто включает дискретный выбор (напр., решение поступать на работу или не поступать, выбор занятия, выбор маршрута перевозки груза и т. п.). В каком-то смысле эти модели противоположны агрегированным макроэкономическим моделям, которые описывают массовые, а не индивидуальные факты. В разных постановках моделей дискретного выбора в качестве математического аппарата применяются цепи Маркова (см. Марковские процессы), модели с бинарными переменными, многомерные модели (совместное распределение вероятностей для двух или большего числа дискретных зависимых переменных), случайные выборки и др.
§ 2 Модели с бинарными переменными.
1. Выбор из двух или нескольких
альтернатив. Если есть только
две возможности (бинарный
В этих случаях соответствующую переменную называют номинальной (qualitative).
2. Ранжированный выбор. Как и в нервом случае, есть несколько альтернатив, но они некоторым образом упорядочены. Соответствующая переменная называется порядковой, ординальной ИЛИ ранговой (ranking).
3. Количественная целочисленная характеристика.
Сначала мы рассмотрим модели бинарного выбора, затем будет показано, что модели с несколькими альтернативами могут быть либо непосредственно сведены к моделям бинарного выбора, либо могут быть исследованы аналогичными методами
§ 3 Модели бинарного и множественного выбора
Зависима переменная у. Выдвигая различные предположения о характере зависимости у от x, будем получать разные модели. Здесь мы рассмотрим три модели: линейную модель вероятности и так называемые probit- и logit-моделп.
Линейная модель вероятности
Воспользуемся обычной линейной моделью регрессии:
где t — номер наблюдения (семьи), β = (β1,..., βk.)' — набор неизвестных параметров (коэффициентов), ε t — случайная ошибка.
Так как y t принимает значения 0 или 1 и E(ε t) = 0, то
E(y t) = 1 +Р(y = 1) + 0 -Р(y t = 0) = Р(y t = 1) = x't β.
Таким образом, модель (12.1) может быть записана в виде
2) Р(y t =1)= x't β
поэтому ее называют линейной моделью вероятности (linear probability model).
Ошибка ε в каждом наблюдении может принимать только два значения: ε t = 1 — x't β с вероятностью Р(y t = 1) и ε t = —x't β с вероятностью 1 — P(y t — 1). Это не позволяет считать ошибку нормально распределенной или имеющей распределение, близкое к нормальному. Получаем, что дисперсия ошибки V(ε t)= x't β (1 - x't β) зависит от xt, т.е. модель гетероскедастична. Самым серьезным недостатком линейной модели вероятности является тот факт, что прогнозные значения ŷ t = x't β, которые по смыслу модели есть прогнозные значения вероятности P(y t = l), могут лежать вне отрезка [0,1]. Это обстоятельство существенно ограничивает область применимости линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонкими методами.
§ 4 Probit- и logit-модели.
Основной недостаток линейной модели вероятности есть следствие предположения о линейной зависимости вероятности P(yt = 1) от β. Его можно преодолеть, если считать, что
P(yt = l) = F(x't β),
где F(-) — некоторая функция, область значений которой лежит в отрезке [0,1]. В качестве F(-) можно взять функцию распределения некоторой случайной величины.
Одна из возможных интерпретаций модели (12.3) выглядит следующим образом. Предположим, что существует некоторая количественная переменная у*, связанная с независимыми переменными xt обычным регрессионным уравнением
y*t = x'tP + εt
где ошибки εt независимы и одинаково распределены с нулевым средним и дисперсией σ². Пусть также F(') — функция распределения нормированной случайной ошибки εt/ σ Величина y*t является ненаблюдаемой (латентной), а решение, соответствующее значению yt = 1, принимается тогда, когда y*t превосходит некоторое пороговое значение. Величину y*t можно также интерпретировать как разность полезностей альтернативы 1 и альтернативы 0.
Таким образом,
y= 1, если y*t ≥ 0,
yt = 0, если y*t <0.
Тогда, предполагая, что случайные ошибки εt имеют одно и то же симметричное распределение F(-) (т.е. F(-x) = 1 — F(x)), получаем:
Р(yt = 1) = Р(y*t ≥ 0) = P(x't β+ εt ≥ 0)
= P(εt > -< x't β) = P(εt < x't β) = F ( )
Наиболее часто в качестве функции F(-) используют:
— функцию стандартного нормального распределения:
F(u)=Ф(u)= dz
и соответствующую модель называют probit-моделью;
— функцию логистического распределения:
F(u)=Ʌ(u)=
и соответствующую модель называют logit-моделью.
Модели множественного выбора
Модели множественного выбора, когда имеется не две, а несколько альтернатив, можно строить и изучать, обобщая подходы и методы, используемые для моделей бинарного выбора.
Номинальные зависимые переменные
Если соответствующая
Выбор одной из альтернатив можно описать в виде дерева последовательных решений, в узлах которого происходит бинарный выбор. В каждом узле, применяя технику оценивания для бинарных моделей, можно оценить условную вероятность выбора соответствующей альтернативы.
Однако у данного способа построения моделей множественного выбора есть очевидный недостаток: дерево последовательных решений можно строить по-разному, и результаты оценивания будут разными.
Другой подход к моделям множественного выбора с качественной зависимой переменной основан на понятии случайной полезности.
Итак, предположим, что имеется т альтернатив. Будем считать, что для индивидуума t альтернатива j имеет полезность Utj = utj + εtj, где utj — неслучайная составляющая, a εtj — случайная составляющая полезности. Тогда индивидуум t выберет альтернативу j , если Utj > Utk для любого к ≠ j . Иными словами,
Р(yt = j) = Р(utj + εtj > utk + εtk ¥ k≠j; k= l,... m).
В общем случае для нахождения этой
вероятности требуется
Р(yt =j)=
Предполагая, что полезность utj зависит от наблюдаемых экзогенных характеристик xtj и неизвестных параметровβ:
utj= x'tj β
получаем модель
Р(yt =j)=
которая называется logit-моделыо множественного выбора (multinomial logit model).
Среди экзогенных переменных xtj могут быть характеристики, зависящие только от индивидуума и не зависящие от альтернативы.
Выделим такие переменные: x’tj =[y’tj, ztj] и соответствующим образом разобьем вектор неизвестных параметров на две компоненты: β' = [ϒ',δ']. Тогда числитель и знаменатель правой части формулы будут содержать общий сомножитель exp(z't δ), а это означает, что вектор параметров δ оценить невозможно (неидентифицируемость). Следовательно, если необходимо учесть индивидуальные эффекты, logit-модель множественного выбора должна быть модифицирована. Например, можно считать, что коэффициенты δ могут зависеть от альтернативы, т.е. utj = y'tj ϒ + z't δj.
Порядковые зависимые переменные
Если альтернативы упорядочены, то, используя скрытую (латентную) переменную, можно построить естественное обобщение модели. Рассмотрим на примере. Предположим, что есть три варианта. Выбор варианта, описываемый переменной y, распределяется следующим образом:
у=1, если у*=с1
у = 2, если с1 < у* ≤ с2,
у = 3, если у* > сr,
где ci,C2 — некоторые фиксированные уровни. Предполагая, что величина у* удовлетворяет уравнению, и считая для простоты, что дисперсия ошибок а = 1, имеем:
Р(уt=1)=F(с1-хtβ)
Р(уt=2)= F(с2-хtβ)- F(с1-хtβ)
Р(уt=1)=1- F(с2-хtβ)
Выбирая в качестве функции F(-) функцию нормального или логистического распределения, будем получать порядковые probit- или logit-модели.
Функция правдоподобия имеет следующий вид:
L=
Уровни c1, c2 могут быть априорно заданы, а могут быть неизвестны. В любом случае на основании этой формулы для порядковых probit- или logit-иоделей. можно строить оценки максимального правдоподобия параметров β и, если необходимо, c1,с2.
§ 5 Случайная выборка.
Cлучайной величиной мы называем какую-либо числовую характеристику, связанную с изучаемым объектом, значение которой принципиально не может быть предсказано точно и зависит от случая.
Формально случайная величина X — это числовая функция, заданная на некотором вероятностном пространстве (Ω,P): X =Х(w), wЄΩ. Функцией распределения случайной величины X называется числовая функция числового аргумента, определяемая равенством:
F ( x ) = Р ( Х ≤ х ) , x € R
(R — множество действительных чисел). Часто, чтобы подчеркнуть связь функции распределения со случайной величиной, используют обозначение F(x) — Fx(x). Каждая функция распределения обладает следующими свойствами:
Любая функция, удовлетворяющая условиям, является функцией распределения некоторой случайной величины.
Можно выделить два класса случайных величин — дискретные и непрерывные. Случайная величина X называется дискретной, если множество ее значений конечно или счетно. Несмотря на то что функция распределения универсальным образом описывает вероятностный характер случайной величины, дискретную случайную величину удобно представлять в виде таблицы
X= , pk = P(X=xk).
Случайная выборка. Последовательность наблюдений X1,... ,Хn называется случайной выборкой объема п, если Х1,...,Хп получены как независимые реализации некоторой случайной величины X с распределением F(x). При этом также говорят, что X1,...,Xn есть выборка из генеральной совокупности X (или F(x)). С теоретико-вероятностной точки зрения случайная выборка Х1,... ,Хп может рассматриваться как последовательность независимых случайных величин, имеющих одно и то же распределение F(x).
Список литературы