Политическое прогнозирование

Автор: Пользователь скрыл имя, 04 Ноября 2012 в 22:53, реферат

Описание работы

По периоду упреждения — промежутку времени, на который рассчитан прогноз, —
оперативные (текущие), кратко-, средне-, долго- и дальнесрочные (сверхдолгосрочные)
По объекту исследования
естествоведческие, научно-технические и обществоведчески

Скачать полностью (592.45 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

prognozy-otvety.doc

— 805.00 Кб (Скачать)

Есть метки включения константы в уравнение, задание критических значений F-статистики, различные графики.

16) Вывод формул коэффициентов зависимости в линейной регрессии.

17) Проверка гипотезы о независимости наблюдаемых переменных.

Простая регрессия

Есть 2 набора величин (Х и У) и нужно установить, имеется ли связь между этими величинами.

; ;

Точное равенство означает, что =1

При исследовании корреляционных зависимостей между признаками решению подлежит широкий круг вопросов, к которым следует отнести :

1)Предварительный анализ свойств моделируемой совокупности единиц;

2)Установление факта наличия связи, определение её формы и направления;

3)Измерение степени тесноты связи между признаками;

4)Построение регрессивной модели, т.е. нахождение аналитического выражения связи;

5)Оценка адекватности модели, её экономическая интерпретация и практическое использование.

Для того, чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определённые требования

1.Требование однородности тех единиц, которые подвергаются изучению.

2.Количественная оценка однородности исследуемой совокупности по комплексу признаков (расчет относительных показателей вариации, коэффициент вариации, отношение размаха вариации к среднему квадратическому отклонению).

3.Достаточное число наблюдений.

4.Исследуемая совокупность должна иметь нормальное распределение.

5.Факторы должны иметь количественное выражение.

2.2.Статистические методы выявления наличия корреляционной связи между двумя признаками

Простейшим приёмом обнаружения связи является сопоставление двух параллельных рядов – ряда значений признака-фактора и соответствующих ему значений результативного признака. Значение факторного признака располагается в возрастающем порядке и затем прослеживается направление изменения величины результативного признака. Результативный признак (функция) обозначается через y, а факторный признак через x.

Ниже приведён пример обнаружения корреляционной связи между стажем.

Наличие большого числа различных значений результирующего признака затрудняет восприятие таких параллельных рядов. В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционной таблицей. Корреляционная таблица позволяет изложить материал сжато, компактно и наглядно.

Построение корреляционной таблицы начинают с группировки значений фактического и результативного признаков. В первый столбик следует вписать значения факторного признака (x), а первую строку заполнить значениями результативного признака (y). Числа, полученные на пересечении строк и столбцов, означают частоту повторения данного сочетания значений x и y.

Данная корреляционная таблица уже при общем знакомстве даёт возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить её направление, Если частоты расположены по диагонали из верхнего левого угла в правый нижний, то связь между признаками прямая. Если же частоты расположены по диагонали справа налево, - то связь обратная. В данном случае можно предположить наличие прямой связи.

Корреляционная зависимость чётко обнаруживается только при рассмотрении средних значений результативного признака, соответствующих определённым значениям факторного признака, т.к. при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов будет взаимопогашаться, и чётче выступит зависимость результирующего признака от фактора, положенного в основу группировки.

Для предварительного выявления наличия связи и раскрытия её характера, применяют графический метод. Используя данные об индивидуальных значениях признака-фактора и соответствующих ему значениях результативного признака, строится в прямоугольных координатах точечный график, который называют «полем корреляции». Для данного примера поле корреляции имеет следующий вид ( см. рис. 2.1).
[pic]

Точки корреляционного поля не лежат на одной линии, они вытянуты определённой полосой слева на право. Нанеся средние значения факторного и результирующего признаков на график и соединяя последовательно отрезками прямых соответствующие им точки, получают эмпирическую линию связи.

Если эмпирическая линия связи по своему виду приближается к прямой линии, то это свидетельствует о наличии прямолинейной корреляционной связи между признаками. Если же имеется тенденция неравномерного изменения значений результирующего признака, и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием криволинейной корреляционной связи.

2.3. Множественная корреляция

Проведенный выше анализ статистических совокупностей позволяет изучить взаимосвязь только двух переменных.

На практике же часто приходится исследовать зависимость результирующего признака от нескольких факторных признаков. В этом случае статистическая модель может быть представлена уравнением регрессии с несколькими переменными. Такая регрессия называется множественной
(множественная корреляция).

Например, линейная регрессия с m независимыми переменными имеет вид: yi = a0x0 + a1x1 + a2x2 + … + amxm,

(2.1) где а0, а1, а2, …, аm – параметры уравнения регрессии,

m – число независимых переменных, х0, х1, х2, …, хm – значения факторного признака, yi – значение результирующего признака.

При оценке параметров этого уравнения в каждом i-том наблюдении фиксируют значения результирующего признака у и факторных признаков хi0…хim.

Оценки параметров уравнения регрессии находятся с помощью метода наименьших квадратов, который в случае множественной регрессии удобнее представить в матричной форме.

Применяются следующие обозначения: а = (аj), j = 0,1,…,m – вектор оценок параметров, m – число неизвестных параметров; у = (уi), i = 1,2,…,n – вектор значений зависимой переменной, n – число наблюдений; х = (хij) – матрица значений независимых переменных размерностью n(m+1); е = (ei) – вектор ошибок в уравнении с оцененными параметрами.

18) Статистический анализ модели многомерной регрессии: ANOVA.

19) Проверка мультиколлинеарности независимых переменных.

Проверка сводится к выяснению линейной независимости полиномов.

20) Виды трендовых кривых. Преобразования переменных, сводящие тренд к линейной регрессии.

21) Линейный, квадратичный и экспоненциальный рост в экономике.

22) S-образная кривая как график распространения нового товара.

Суть: стадии разработки, внедрения на рынок, роста, зрелости, насыщения, спада....рисуем прибыль и выручку – они s-образны. По осям – время по оси абсцис, выручка и прибыль – по оси ординат.

23) Примеры производственных функций.

четыре типа производственных функций и изоквант. 1. Функции с полным взаимозамещением ресурсов, например, Y=a1X1+a2X2 2. Неоклассическая производственная функция, например, Y=X1a1X2a2, a1+a2<=1 3. Функции с полным взаимодополнением ресурсов, например, 4. Функции смешанного типа, например, Y=y1+y2 : Xi=>aiy1+biy2, i=1,2.

24) Описание модели ARIMA.

AR(p)+MA(q)->ARMA(p,q)->ARMA(p,q)(P,Q)->ARIMA(p,q,r)(P,Q,R)->...

AR(p) -авторегрессионая модель порядка p.

Модель имеет вид:

Y(t)=f_0+f_1*Y(t-1)+f_2*Y(t-2)+...+f_p*Y(t-p)+E(t)

где
Y(t)-зависимая переменная в момент времени t. f_0, f_1, f_2, ..., f_p - оцениваемые параметры. E(t) - ошибка от влияния переменных, которые не учитываются в данной модели. Задача заключается в том, чтобы определить f_0, f_1, f_2, ..., f_p.

MA(q) -модель со скользящим средним порядка q.

Модель имеет вид:

Y(t)=m+e(t)-w_1*e(t-1)-w_2*e(t-2)-...-w_p*e(t-p)

Где Y(t)-зависимая переменная в момент времени t. w_0, w_1, w_2, ..., w_p - оцениваемые параметры.

три типа параметров модели: параметры авторегрессии (p), порядок разности (d), параметры скользящего среднего (q). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авторегрессии (p) и 2 параметра скользящего среднего (q), которые вычисляются для ряда после взятия разности с лагом 1.

25) Подбор модели Бокса-Дженкинса по полным и частичным автокорреляциям временного ряда.

расчет значений автокорреляционной функции, например, методом МНК

необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром d (см. предыдущий раздел). Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг=1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности (см. ниже). Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов.

Один параметр (p): АКФ - экспоненциально убывает; ЧАКФ - имеет резко выделяющееся значение для лага 1, нет корреляций на других лагах.
Два параметра авторегрессии (p): АКФ имеет форму синусоиды или экспоненциально убывает; ЧАКФ имеет резко выделяющиеся значения на лагах 1, 2, нет корреляций на других лагах.
Один параметр скользящего среднего (q): АКФ имеет резко выделяющееся значение на лаге 1, нет корреляций на других лагах. ЧАКФ экспоненциально убывает.
Два параметра скользящего среднего (q): АКФ имеет резко выделяющиеся значения на лагах 1, 2, нет корреляций на других лагах. ЧАКФ имеет форму синусоиды или экспоненциально убывает.
Один параметр авторегрессии (p) и один параметр скользящего среднего (q): АКФ экспоненциально убывает с лага 1; ЧАКФ - экспоненциально убывает с лага 1.

26) Преимущества и недостатки модели ARIMA.

27) Применение модели ARIMA к сезонным временным рядам.

Сезонные модели. Мультипликативная сезонная АРПСС представляет естественное развитие и обобщение обычной модели АРПСС на ряды, в которых имеется периодическая сезонная компонента. В дополнении к несезонным параметрам, в модель вводятся сезонные параметры для определенного лага (устанавливаемого на этапе идентификации порядка модели). Аналогично параметрам простой модели АРПСС, эти параметры называются: сезонная авторегрессия (ps), сезонная разность (ds) и сезонное скользящее среднее (qs). Таким образом, полная сезонная АРПСС может быть записана как АРПСС (p,d,q)(ps,ds,qs). Например, модель (0,1,2)(0,1,1) включает 0 регулярных параметров авторегрессии, 2 регулярных параметра скользящего среднего и 1 параметр сезонного скользящего среднего. Эти параметры вычисляются для рядов, получаемых после взятия одной разности с лагом 1 и далее сезонной разности. Сезонный лаг, используемый для сезонных параметров, определяется на этапе идентификации порядка модели.

Общие рекомендации относительно выбора обычных параметров (с помощью АКФ и ЧАКФ) полностью применимы к сезонным моделям. Основное отличие состоит в том, что в сезонных рядах АКФ и ЧАКФ имеют существенные значения на лагах, кратных сезонному лагу (в дополнении к характерному поведению этих функций, описывающих регулярную (несезонную) компоненту АРПСС).

28) Средняя квадратичная ошибка как основной критерий адекватности модели. Подбор параметров модели по методу наименьших квадратов.

29) Основные информационные критерии: AIC и BIC.

30) Методы анализа независимости остатков.

Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Изучение графика остатков может показать наличие какой-то зависимости, неучтенной в модели, например, показать необходимость перехода к нелинейной модели или включения в модель периодических компонент. Для проверки нормальности распределения остатков используется график нормального распределения, критерии типа Колмогорова-Смирнова, хи-квадрат и др. Для проверки независимости остатков обычно используются критерий серий и критерий Дарбина-Уотсона. В случае выявления сильной корреляции остатков следует перейти от регрессионной модели к моделям типа авторегрессии * скользящего среднего и возможно использовать разностные и сезонные операторы удаления тренда.

Могут быть двугорбые распределения остатков, следовательно, существует несколько прямых регрессий, значит нужно осуществить разбиение респондентов по какому-то признаку, и построить несколько регрессионных зависимостей. Смотрим на хвосты:

резкое отличие от остальных
крайние точки – «выбросы» (outliers)

ошибки (набора...)
особые люди

понять причину возникновения
выкинуть, но можно рассмотреть отдельно

если выбросы в находящихся подряд анкетах – интервьюер

Выбросам надо уделять особое внимание, так как их присутствие может грубо искажать значения оценок (особенно если для их получения используется МНК). Устранение эффектов выбросов может проводиться любо с помощью удаления этих точек из анализируемых данных, либо с помощью применения методов оценивания параметров, устойчивых к подобным грубым отклонениям.

Методы выкидывания:

просто выкинуть (цензурирование)
заменить модельными значениями

Информация о работе Политическое прогнозирование