Автор: Пользователь скрыл имя, 04 Ноября 2012 в 22:53, реферат
По периоду упреждения — промежутку времени, на который рассчитан прогноз, —
оперативные (текущие), кратко-, средне-, долго- и дальнесрочные (сверхдолгосрочные)
По объекту исследования
естествоведческие, научно-технические и обществоведчески
Есть метки включения константы в уравнение, задание критических значений F-статистики, различные графики.
Есть 2 набора величин (Х и У) и нужно установить, имеется ли связь между этими величинами.
; ;
Точное равенство означает, что =1
При исследовании корреляционных зависимостей между признаками решению подлежит широкий круг вопросов, к которым следует отнести :
1)Предварительный анализ свойств моделируемой совокупности единиц;
2)Установление
факта наличия связи,
3)Измерение степени тесноты связи между признаками;
4)Построение
регрессивной модели, т.е. нахождение
аналитического выражения
5)Оценка адекватности
модели, её экономическая
Для того, чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определённые требования
1.Требование однородности тех единиц, которые подвергаются изучению.
2.Количественная
оценка однородности
3.Достаточное число наблюдений.
4.Исследуемая совокупность должна иметь нормальное распределение.
5.Факторы должны
иметь количественное
2.2.Статистические
методы выявления наличия
Простейшим
приёмом обнаружения связи
Ниже приведён пример обнаружения корреляционной связи между стажем.
Наличие большого числа различных значений результирующего признака затрудняет восприятие таких параллельных рядов. В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционной таблицей. Корреляционная таблица позволяет изложить материал сжато, компактно и наглядно.
Построение корреляционной таблицы начинают с группировки значений фактического и результативного признаков. В первый столбик следует вписать значения факторного признака (x), а первую строку заполнить значениями результативного признака (y). Числа, полученные на пересечении строк и столбцов, означают частоту повторения данного сочетания значений x и y.
Данная корреляционная
таблица уже при общем
Корреляционная
зависимость чётко
Для предварительного
выявления наличия связи и
раскрытия её характера, применяют
графический метод. Используя данные
об индивидуальных значениях признака-фактора
и соответствующих ему значениях результативного
признака, строится в прямоугольных координатах
точечный график, который называют «полем
корреляции». Для данного примера поле
корреляции имеет следующий вид ( см. рис.
2.1).
[pic]
Точки корреляционного поля не лежат на одной линии, они вытянуты определённой полосой слева на право. Нанеся средние значения факторного и результирующего признаков на график и соединяя последовательно отрезками прямых соответствующие им точки, получают эмпирическую линию связи.
Если эмпирическая линия связи по своему виду приближается к прямой линии, то это свидетельствует о наличии прямолинейной корреляционной связи между признаками. Если же имеется тенденция неравномерного изменения значений результирующего признака, и эмпирическая линия связи будет приближаться к какой-либо кривой, то это может быть связано с наличием криволинейной корреляционной связи.
2.3. Множественная корреляция
Проведенный выше анализ статистических совокупностей позволяет изучить взаимосвязь только двух переменных.
На практике же часто приходится
исследовать зависимость результирующего
признака от нескольких факторных признаков.
В этом случае статистическая модель может
быть представлена уравнением регрессии
с несколькими переменными. Такая регрессия
называется множественной
(множественная корреляция).
Например, линейная регрессия с m независимыми переменными имеет вид: yi = a0x0 + a1x1 + a2x2 + … + amxm,
(2.1) где а0, а1, а2, …, аm – параметры уравнения регрессии,
m – число независимых переменных, х0, х1, х2, …, хm – значения факторного признака, yi – значение результирующего признака.
При оценке параметров этого уравнения в каждом i-том наблюдении фиксируют значения результирующего признака у и факторных признаков хi0…хim.
Оценки параметров уравнения регрессии находятся с помощью метода наименьших квадратов, который в случае множественной регрессии удобнее представить в матричной форме.
Применяются следующие обозначения: а = (аj), j = 0,1,…,m – вектор оценок параметров, m – число неизвестных параметров; у = (уi), i = 1,2,…,n – вектор значений зависимой переменной, n – число наблюдений; х = (хij) – матрица значений независимых переменных размерностью n(m+1); е = (ei) – вектор ошибок в уравнении с оцененными параметрами.
Проверка сводится к выяснению линейной независимости полиномов.
Суть:
стадии разработки, внедрения на рынок,
роста, зрелости, насыщения, спада....рисуем
прибыль и выручку – они s-
четыре типа производственных функций и изоквант. 1. Функции с полным взаимозамещением ресурсов, например, Y=a1X1+a2X2 2. Неоклассическая производственная функция, например, Y=X1a1X2a2, a1+a2<=1 3. Функции с полным взаимодополнением ресурсов, например, 4. Функции смешанного типа, например, Y=y1+y2 : Xi=>aiy1+biy2, i=1,2.
AR(p)+MA(q)->ARMA(p,q)->ARMA(
Модель имеет вид:
Y(t)=f_0+f_1*Y(t-1)+f_2*Y(t-2)
где
Y(t)-зависимая переменная в момент времени
t. f_0, f_1, f_2, ..., f_p - оцениваемые параметры.
E(t) - ошибка от влияния переменных, которые
не учитываются в данной модели. Задача
заключается в том, чтобы определить f_0,
f_1, f_2, ..., f_p.
Модель имеет вид:
Y(t)=m+e(t)-w_1*e(t-1)-w_2*e(
Где Y(t)-зависимая переменная в момент времени t. w_0, w_1, w_2, ..., w_p - оцениваемые параметры.
три типа параметров модели: параметры авторегрессии (p), порядок разности (d), параметры скользящего среднего (q). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авторегрессии (p) и 2 параметра скользящего среднего (q), которые вычисляются для ряда после взятия разности с лагом 1.
расчет значений автокорреляционной функции, например, методом МНК
необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром d (см. предыдущий раздел). Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг=1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности (см. ниже). Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов.
Сезонные модели. Мультипликативная сезонная АРПСС представляет естественное развитие и обобщение обычной модели АРПСС на ряды, в которых имеется периодическая сезонная компонента. В дополнении к несезонным параметрам, в модель вводятся сезонные параметры для определенного лага (устанавливаемого на этапе идентификации порядка модели). Аналогично параметрам простой модели АРПСС, эти параметры называются: сезонная авторегрессия (ps), сезонная разность (ds) и сезонное скользящее среднее (qs). Таким образом, полная сезонная АРПСС может быть записана как АРПСС (p,d,q)(ps,ds,qs). Например, модель (0,1,2)(0,1,1) включает 0 регулярных параметров авторегрессии, 2 регулярных параметра скользящего среднего и 1 параметр сезонного скользящего среднего. Эти параметры вычисляются для рядов, получаемых после взятия одной разности с лагом 1 и далее сезонной разности. Сезонный лаг, используемый для сезонных параметров, определяется на этапе идентификации порядка модели.
Общие рекомендации относительно выбора обычных параметров (с помощью АКФ и ЧАКФ) полностью применимы к сезонным моделям. Основное отличие состоит в том, что в сезонных рядах АКФ и ЧАКФ имеют существенные значения на лагах, кратных сезонному лагу (в дополнении к характерному поведению этих функций, описывающих регулярную (несезонную) компоненту АРПСС).
Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Изучение графика остатков может показать наличие какой-то зависимости, неучтенной в модели, например, показать необходимость перехода к нелинейной модели или включения в модель периодических компонент. Для проверки нормальности распределения остатков используется график нормального распределения, критерии типа Колмогорова-Смирнова, хи-квадрат и др. Для проверки независимости остатков обычно используются критерий серий и критерий Дарбина-Уотсона. В случае выявления сильной корреляции остатков следует перейти от регрессионной модели к моделям типа авторегрессии * скользящего среднего и возможно использовать разностные и сезонные операторы удаления тренда.
Могут быть двугорбые распределения остатков, следовательно, существует несколько прямых регрессий, значит нужно осуществить разбиение респондентов по какому-то признаку, и построить несколько регрессионных зависимостей. Смотрим на хвосты:
Выбросам надо
уделять особое внимание, так как
их присутствие может грубо
Методы выкидывания: