Лекции по эконометрике

Автор: Пользователь скрыл имя, 20 Ноября 2011 в 12:22, лекция

Описание работы

Статистические (эконометрические) методы используются в зарубежных и отечественных экономических и технико-экономических исследованиях, работах по управлению (менеджменту). Применение прикладной статистики и других статистических методов дает заметный экономический эффект. Например, в США - не менее 20 миллиардов долларов ежегодно только в области статистического контроля качества. В 1988 г. затраты на статистический анализ данных в нашей стране оценивались в 2 миллиарда рублей ежегодно [1]

Содержание

Предисловие

Глава 1. Структура современной эконометрики
1.1. Эконометрика сегодня
1.2. Эконометрика = экономика + метрика
1.3. Структура эконометрики
1.4. Специфика экономических данных
1.5. Нечисловые экономические величины
1.6. Статистика интервальных данных - научное направление на стыке метрологии и математической статистики
1.7. Эконометрические модели
1.8. Применения эконометрических методов
1.9. Эконометрика как область научно-практической деятельности
1.10. Эконометрические методы в практической и учебной деятельности
Цитированная литература

Глава 2. Выборочные исследования
2.1. Построение выборочной функции спроса
2.2. Маркетинговые опросы потребителей
2.3. Проверка однородности двух биномиальных выборок
Цитированная литература

Глава 3. Основы теории измерений
3.1. Основные шкалы измерения
3.2. Инвариантные алгоритмы и средние величины
3.3. Средние величины в порядковой шкале
3.4. Средние по Колмогорову
Цитированная литература

Глава 4. Статистический анализ числовых величин (непараметрическая статистика)
4.1. Часто ли распределение результатов наблюдений является нормальным?
4.2. Неустойчивость параметрических методов отбраковки резко выделяющихся результатов наблюдений
4.3. Непараметрическое доверительное оценивание характеристик распределения
4.4. О проверке однородности двух независимых выборок
4.5. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?
4.6. Состоятельные критерии проверки однородности для независимых выборок
4.7. Методы проверки однородности для связанных выборок
Цитированная литература

Глава 5. Многомерный статистический анализ
5.1. Оценивание линейной прогностической функции
5.2. Основы линейного регрессионного анализа
5.3. Основные понятия теории классификации
5.4. Эконометрика классификации
Цитированная литература

Глава 6. Эконометрика временных рядов
6.1. Модели стационарных и нестационарных временных рядов, их идентификация
6.2. Системы эконометрических уравнений
6.3. Оценивание длины периоды и периодической составляющей
6.4. Метод ЖОК оценки результатов взаимовлияний факторов
Цитированная литература

Глава 7. Эконометрический анализ инфляции
7.1. Определение индекса инфляции
7.2. Практически используемые потребительские корзины и соответствующие индексы инфляции
7.3. Свойства индексов инфляции
7.4. Возможности использования индекса инфляции в экономических расчетах
7.5. Динамика цен на продовольственные товары в Москве и Московской области
Цитированная литература

Глава 8. Статистика нечисловых данных
8.1. Объекты нечисловой природы
8.2. Вероятностные модели конкретных видов объектов нечисловой природы
8.3. Структура статистики объектов нечисловой природы
8.4. Законы больших чисел и состоятельность статистических оценок в пространствах произвольной природы
8.5. Непараметрические оценки плотности в пространствах произвольной природы
Цитированная литература

Глава 9. Статистика интервальных данных
9.1. Основные идеи статистики интервальных данных
9.2. Примеры статистического анализа интервальных данных
9.3. Статистика интервальных данных и оценки погрешностей характеристик финансовых потоков инвестиционных проектов
Цитированная литература

Глава 10. Проблемы устойчивости эконометрических процедур
10.1. Общая схема устойчивости
10.2. Робастность статистических процедур
10.3. Устойчивость по отношению к объему выборки
10.4. Устойчивость по отношению к горизонту планирования
Цитированная литература

Глава 11. Эконометрические информационные технологии
11.1. Проблема множественных проверок статистических гипотез
11.2. Проблемы разработки и обоснования статистических технологий
11.3. Методы статистических испытаний (Монте-Карло) и датчики псевдослучайных чисел
11.4. Методы размножения выборок (бутстреп-методы)
11.5.Эконометрика в контроллинге
Цитированная литература

Глава 12. Эконометрические методы проведения экспертных исследований и анализа оценок экспертов
12.1. Примеры процедур экспертных оценок
12.2. Основные стадии экспертного опроса
12.3. Подбор экспертов
12.4. О разработке регламента проведения сбора и анализа экспертных мнений
12.5. Методы средних баллов
12.6. Метод согласования кластеризованных ранжировок
12.7. Математические методы анализа экспертных оценок
Цитированная литература

Глава 13. Эконометрические методы управления качеством и сертификации продукции
13.1. Основы статистического контроля качества продукции
13.2. Асимптотическая теория одноступенчатых планов статистического контроля
13.3. Некоторые практические вопросы статистического контроля качества продукции и услуг
13.4. Всегда ли нужен контроль качества продукции?
13.5. Статистический контроль по двум альтернативным признакам и метод проверки их независимости по совокупности малых выборок
13.6. Эконометрика качества и сертификация
Цитированная литература

Глава 14. Эконометрика прогнозирования и риска
14.1. Методы социально-экономического прогнозирования
14.2. Основные идеи технологии сценарных экспертных прогнозов
14.3. Различные виды рисков
14.4. Подходы к управлению рисками
Цитированная литература

Глава 15. Современные эконометрические методы
15.1. О развитии эконометрических методов
15.2. Точки роста
15.3. О некоторых нерешенных вопросах эконометрики и прикладной статистики
15.4. Высокие статистические технологии и эконометрика

Работа содержит 1 файл

лекции по эконометрике.doc

— 310.00 Кб (Скачать)
 

 

 
 
 
А.И. Орлов 
Эконометрика 
Учебник. М.: Издательство "Экзамен", 2002.
Предыдущая Оглавление Следующая
 
Глава 5. Многомерный статистический анализ

5.1. Оценивание линейной  прогностической  функции

Начнем с задачи точечного и доверительного оценивания линейной прогностической функции одной переменной.

Исходные данные – набор n пар чисел (tk , xk), k = 1,2,…,n, где tk – независимая переменная (например, время), а xk – зависимая (например, индекс инфляции, курс доллара США, объем месячного производства или размер дневной выручки торговой точки). Предполагается, что переменные связаны зависимостью

xk = a (tk - tср)+ b + ek , k = 1,2,…,n,

где a и b – параметры, неизвестные статистику и подлежащие оцениванию, а ek – погрешности, искажающие зависимость. Среднее арифметическое моментов времени

tср = (t1 + t2 +…+tn ) / n

введено в модель для облегчения дальнейших выкладок.

Обычно оценивают  параметры a и b линейной зависимости методом наименьших квадратов. Затем восстановленную зависимость используют для точечного и интервального прогнозирования.

Как известно, метод  наименьших квадратов был разработан великим немецким математиком К. Гауссом в 1794 г. Согласно этому методу для расчета наилучшей функции, приближающей линейным образом зависимость  x от t, следует  рассмотреть функцию двух переменных

 
 
 

 
Оценки метода наименьших квадратов - это такие значения a* и b*, при которых функция  f(a,b) достигает минимума по всем значениям аргументов. Чтобы найти эти оценки, надо вычислить частные производные от функции f(a,b) по аргументам a и b, приравнять их 0, затем из полученных уравнений найти оценки: Имеем:

Преобразуем правые части полученных соотношений. Вынесем  за знак суммы общие множители 2 и (-1). Затем рассмотрим слагаемые. Раскроем скобки в первом выражении, получим, что каждое слагаемое разбивается на три. Во втором выражении также каждое слагаемое есть сумма трех. Значит, каждая из сумм разбивается на три суммы. Имеем:

 
 
 

 

Приравняем частные  производные 0. Тогда в полученных уравнениях можно сократить множитель (-2). Поскольку

(1)

уравнения приобретают  вид

Следовательно, оценки метода наименьших квадратов  имеют вид

 (2)

 
 
 

 
В силу соотношения (1) оценку а* можно  записать в более симметричном виде:

Эту оценку нетрудно преобразовать и к виду

Следовательно, восстановленная функция, с помощью которой можно прогнозировать и интерполировать, имеет вид

x*(t) = a*(t - tср)+ b*.

Обратим внимание на то, что использование tср  в последней формуле ничуть не ограничивает ее общность. Сравним с моделью вида

xk = c tk+ d + ek , k = 1,2,…,n.

Ясно, что 

Аналогичным образом  связаны оценки параметров:

Для получения  оценок параметров и прогностической  формулы нет необходимости обращаться к какой-либо вероятностной модели. Однако для того, чтобы изучать  погрешности оценок параметров и восстановленной функции, т.е. строить доверительные интервалы для a*, b* и x*(t), подобная модель необходима.

Непараметрическая вероятностная модель. Пусть значения независимой переменной t детерминированы, а погрешности ek , k = 1,2,…,n, - независимые одинаково распределенные случайные величины с нулевым математическим ожиданием и дисперсией неизвестной статистику.

В дальнейшем неоднократно будем использовать Центральную  Предельную Теорему (ЦПТ) теории вероятностей для величин ek , k = 1,2,…,n (с весами), поэтому для выполнения ее условий необходимо предположить, например, что погрешности ek , k = 1,2,…,n, финитны или имеют конечный третий абсолютный момент. Однако заострять внимание на этих внутриматематических "условиях регулярности" нет необходимости.

Асимптотические распределения оценок параметров. Из формулы (2) следует, что

 (5)

Согласно ЦПТ  оценка b* имеет асимптотически нормальное распределение с математическим ожиданием b и дисперсией оценка которой приводится ниже.

 
Из формул (2) и (5) вытекает, что

Последнее слагаемое  во втором соотношении при суммировании по i обращается в 0, поэтому из формул (2-4) следует, что

 (6)

Формула (6) показывает, что оценка  является асимптотически нормальной с математическим ожиданием и дисперсией

Отметим, что  многомерная нормальность имеет  быть, когда каждое слагаемое в  формуле (6) мало сравнительно со всей суммой, т.е.

 

Из формул (5) и (6) и исходных предположений о  погрешностях вытекает также несмещенность  оценок параметров.

Несмещенность и асимптотическая нормальность оценок метода наименьших квадратов позволяют легко указывать для них асимптотические доверительные границы (аналогично границам в предыдущей главе) и проверять статистические гипотезы, например, о равенстве определенным значениям, прежде всего 0. Предоставляем читателю возможность выписать формулы для расчета доверительных границ и сформулировать правила проверки упомянутых гипотез.

Асимптотическое распределение прогностической  функции. Из формул (5) и (6) следует, что

т.е. рассматриваемая  оценка прогностической функции  является несмещенной. Поэтому 

При этом, поскольку  погрешности независимы в совокупности и  , то

Таким образом,

Итак, оценка является несмещенной и асимптотически нормальной. Для ее практического использования необходимо уметь оценивать остаточную дисперсию

Оценивание  остаточной дисперсии. В точках tk , k = 1,2,…,n, имеются исходные значения зависимой переменной xk  и восстановленные значения x*(tk). Рассмотрим остаточную сумму квадратов

В соответствии с формулами (5) и (6)

Найдем математическое ожидание каждого из слагаемых:

Из сделанных  ранее предположений вытекает, что  при  имеем следовательно, по закону больших чисел статистика SS/n является состоятельной оценкой остаточной дисперсии .

Получением состоятельной  оценкой остаточной дисперсии завершается  последовательность задач, связанных  с рассматриваемым простейшим вариантом  метода наименьших квадратов. Не представляет труда выписывание верхней и  нижней границ для прогностической  функции:

где погрешность  имеет вид

Здесь p - доверительная вероятность, U(p), как и в главе 4 - квантиль нормального распределения порядка (1+р)/2, т.е.

При p= 0,95 (наиболее применяемое значение) имеем U(p) = 1,96. Для других доверительных вероятностей соответствующие значения квантилей можно найти в статистических таблицах (см., например, наилучшее в этой сфере издание [1]).

Сравнение параметрического и  непараметрического подходов. Во многих литературных источниках рассматривается параметрическая вероятностная модель метода наименьших квадратов. В ней предполагается, что погрешности имеют нормальное распределение. Это предположение позволяет математически строго получить ряд выводов. Так, распределения статистик вычисляются точно, а не в асимптотике, соответственно вместо квантилей нормального распределения используются квантили распределения Стьюдента, а остаточная сумма квадратов SS делится не на n, а на  (n-2). Ясно, что при росте объема данных различия стираются.

Рассмотренный выше непараметрический подход не использует нереалистическое предположение о нормальности погрешностей (см. начало главы 4).. Платой за это является асимптотический характер результатов. В случае простейшей модели метода наименьших квадратов оба подхода дают практически совпадающие рекомендации. Это не всегда так, не всегда два подхода бают близкие результаты. Напомним, что в задаче обнаружения выбросов методы, опирающиеся на нормальное распределение, нельзя считать обоснованными, и обнаружено это было с помощью непараметрического подхода (см. главу 4).

Общие принципы. Кратко сформулируем несколько общих принципов построения, описания и использования эконометрических методов анализа данных. Во-первых, должны быть четко сформулированы исходные предпосылки, т.е. полностью описана используемая вероятностно-статистическая модель. Во-вторых, не следует принимать предпосылки, которые редко выполняются на практике. В-третьих, алгоритмы расчетов должны быть корректны с точки зрения математико-статистической теории. В-четвертых, алгоритмы должны давать полезные для практики выводы.

Применительно к задаче восстановления зависимостей это означает, что целесообразно  применять непараметрический подход, что и сделано выше. Однако предположение  нормальности, хотя и очень сильно сужает возможности применения, с чисто математической точки зрения позволяет продвинуться дальше. Поэтому для первоначального изучения ситуации, так сказать, "в лабораторных условиях", нормальная модель может оказаться полезной.

Пример  оценивания по методу наименьших квадратов. Пусть даны n=6 пар чисел (tk , xk), k = 1,2,…,6, представленных во втором и третьем столбцах табл.1. В соответствии с формулами (2) и (4) выше для вычисления оценок метода наименьших квадратов достаточно найти суммы выражений, представленных в четвертом и пятом столбцах табл.1.

Табл.1. Расчет по методу наименьших квадратов при  построении

линейной  прогностической функции одной  переменной

i ti xi
(
)2
1 1 12 1 12 3,14 12,17 -0,17 0,03
2 3 20 9 60 9,42 18,45 1,55 2,40
3 4 20 16 80 12,56 21,59 -1,59 2,53
4 7 32 49 224 21,98 31,01 0,99 0,98
5 9 35 81 315 28,26 37,29 -2,29 5,24
6 10 42 100 420 31,40 40,43 1,57 2,46
34 161 256 1111     0,06 13,64
5,67 26,83 42,67 185,17        
 

В соответствии с формулой (2) b* =26,83, а согласно формуле (4)

Следовательно, прогностическая формула имеет  вид

Следующий этап анализа данных - оценка точности приближения  функции методом наименьших квадратов. Сначала рассматриваются т.н. восстановленные  значения

Это те значения, которые полученная в результате расчетов прогностическая функция принимает в тех точках, в которых известны истинные значения зависимой переменной xi .

Вполне естественно  сравнить восстановленные и истинные значения. Это и сделано в шестом - восьмом столбцах табл. 1. Для простоты расчетов в шестом столбце представлены произведения , седьмой отличается от шестого добавлением константы 9,03 и содержит восстановленные значения. Восьмой столбец - это разность третьего и седьмого.

Непосредственный  анализ восьмого столбца табл.1 показывает, что содержащиеся в нем числа сравнительно невелики по величине по сравнению с третьим столбцом (на порядок меньше по величине). Кроме того, знаки "+" и "-" чередуются. Эти два признака свидетельствуют о правильности расчетов. При использовании метода наименьших квадратов знаки не всегда чередуются. Однако если сначала идут только плюсы, а потом только минусы (или наоборот, сначала только минусы, а потом только плюсы), то это верный показатель того, что в вычислениях допущена ошибка.

Верно следующее  утверждение.

Теорема.

Доказательство  этой теоремы оставляем читателю в качестве упражнения.

Однако сумма  по восьмому столбцу дает 0,06, а не 0. Незначительное отличие от 0 связано  с ошибками округления при вычислениях. Близость суммы значений зависимой  переменной и суммы восстановленных значений - практический критерий правильности расчетов.

В последнем  девятом столбце табл.1 приведены  квадраты значений из восьмого столбца. Их сумма - это остаточная сумма квадратов  SS = 13,64. В соответствии со сказанным выше оценками дисперсии погрешностей и их среднего квадратического отклонения являются

Рассмотрим распределения  оценок параметров. Оценка b* имеет асимптотически нормальное распределение с математическим ожиданием b и дисперсией, которая оценивается как 2,27/6=0,38 (здесь считаем, что 6 - "достаточно большое" число, что, конечно, можно оспаривать). Оценкой среднего квадратического отклонения является 0,615. Следовательно, при доверительной вероятности 0,95 доверительный интервал для параметра b имеет вид (26,83 - 1,96.0,615; 26,83 + 1,96.0,615) = (25,625; 28,035).

В формулах для  дисперсий участвует величина

Подставив численные  значения, получаем, что

Дисперсия для  оценки а* коэффициента при линейном члене прогностической функции оценивается как 2,27/63,1=0,036, а среднее квадратическое отклонение - как 0,19. Следовательно, при доверительной вероятности 0,95 доверительный интервал для параметра а имеет вид (3,14 - 1,96.0,19; 3,14 + 1,96,0,19) = (2,77; 3,51).

Прогностическая формула с учетом погрешности  имеет вид (при доверительной вероятности 0,95)

В этой записи сохранено  происхождение различных составляющих. Упростим:

Например, при  t = 12 эта формула дает

Следовательно, нижняя доверительная граница - это 44,095, а верхняя доверительная  граница - это 49,325.

Насколько далеко можно прогнозировать? Обычный ответ  таков - до тех пор, пока сохраняется  тот стабильный комплекс условий, при  котором справедлива рассматриваемая  зависимость. Изобретатель метода наименьших квадратов Карл Гаусс исходил  из задачи восстановления орбиты астероида (малой планеты) Церера. Движение подобных небесных тел может быть рассчитано на сотни лет. А вот параметры комет (например, срок возвращения) не поддаются столь точному расчету, поскольку за время пребывания в окрестности Солнца сильно меняется масса кометы. В социально-экономической области горизонты надежного прогнозирования еще менее определены. В частности, они сильно зависят от решений центральной власти.

Чтобы выявить  роль погрешностей в прогностической  формуле, рассмотрим формальный предельный переход  Тогда слагаемые 9,03; 1/6; 5,67 становятся бесконечно малыми, и

Таким образом, погрешности составляют около 

от тренда (математического  ожидания) прогностической функции. В социально-экономических исследованиях  подобные погрешности считаются вполне приемлемыми.

Информация о работе Лекции по эконометрике