Автор: Пользователь скрыл имя, 27 Ноября 2012 в 10:26, реферат
Характерной чертой временного ряда является то, что порядок в последовательности значений входной переменной t и выходной переменной y(t) существен. Входную переменную мы всегда будем называть временем, хотя, в принципе, она может быть и пространственной (длина, расстояние). К рядам типа временных относится, например, распределение температуры (давления) по высоте, толщины нити по длине и т. д. Параметр t может быть непрерывным, и тогда речь идет, вообще говоря, о случайном процессе y(t). Реализацией такого процесса является, например, запись значений некоторого технологического параметра, осуществляемая самопишущим прибором.
В курсе эконометрики рассматриваются в основном дискретные временные ряды, характерные для экономических процессов. В дальнейшем мы будем предполагать, что интервал между каждыми двумя соседними моментами времени один и тот же, то есть ti+1 – ti = Δt = const__
5. АНАЛИЗ ВРЕМЕННЫХ РЯДОВ
Временным рядом называется упорядоченная совокупность зна-
чений случайной величины у, наблюдаемых в последовательные
моменты времени t1, t2, …, tn. Таким образом, временной ряд – это
последовательность
y(t1), y(t2), …, y(tn).
Характерной чертой временного ряда является то, что порядок в
последовательности значений входной переменной t и выходной
переменной y(t) существен. Входную переменную мы всегда будем
называть временем, хотя, в принципе, она может быть и простран-
ственной (длина, расстояние). К рядам типа временных относится,
например, распределение температуры (давления) по высоте, тол-
щины нити по длине и т. д. Параметр t может быть непрерывным, и
тогда речь идет, вообще говоря, о случайном процессе y(t). Реализа-
цией такого процесса является, например, запись значений некото-
рого технологического параметра, осуществляемая самопишущим
прибором. В курсе эконометрики рассматриваются в основном дис-
кретные временные ряды, характерные для экономических процес-
сов. В дальнейшем мы будем предполагать, что интервал между ка-
ждыми двумя соседними моментами времени один и тот же, то есть
ti+1 – ti = Δt = const__
Выбирая в качестве единицы времени интервал Δt, можно счи-
тать, что переменная t принимает значения из натурально ряда чи-
сел t = 1, 2, …, n. Тогда временной ряд образует последовательность
y1, y2, …, yt, …, yn.
Иногда нам потребуются значения ряда в моменты времени,
предшествующие начальному. В таких случаях мы будем использо-
вать обозначения y–1, y–2 и т. д.
Характер дискретности, как и интервал Δt, зависит от характера
процесса. Так, в данных о ежемесячном, ежеквартальном или годо-
вом доходе предприятия дискретность обусловлена агрегацией, она
же определяет и интервал дискретизации. Дискретность временного
ряда урожайности пшеницы представляет пример существенной
дискретности – урожай собирается раз в год. В случае непрерывных
процессов, как правило, осуществляется их дискретизация, совме-
щенная зачастую с агрегированием. Так, на основе непрерывного
процесса энергопотребления в зависимости от решаемых задач мо-
гут формироваться графики энергопотребления:
суточные с интервалом в один час;
− недельные с интервалом в один день;
− месячные с интервалом в одну неделю;
− годовые с интервалом в один месяц;
− многолетние с интервалом в один год.
Анализ графиков энергопотребления позволяет решать задачи
оперативного управления режимами (суточные графики), планиро-
вания профилактики и текущего ремонта оборудования (недельные
и месячные графики), капитального ремонта оборудования, плани-
рования поставок энергоресурсов (годовые графики) и, наконец,
планирования развития генерирующих мощностей, электрических
сетей и т. д. (многолетние графики).
Задачи анализа временных рядов
Изучая реальные ситуации, можно прийти к выводу, что в об-
щем случае типичные временные ряды складываются из четырех
составляющих:
− тренд, описывающий долговременную тенденцию измене-
ния выходной переменной;
− сезонные колебания;
− периодические колебания относительно тренда;
− случайная, нерегулярная составляющая.
Дадим краткую характеристику выделенным составляющим.
Тренд. Определить понятие тренда довольно трудно. Вообще,
под трендом понимают некоторое устойчивое, систематическое из-
менение, наблюдаемое в течение длительного времени и описы-
вающее долговременную тенденцию развития изучаемого показате-
ля. Главная трудность состоит в том, что понятия «длительный»,
«долговременный» весьма относительны. Если мы исследуем неко-
торые макроэкономические показатели за период 10–12 лет, то мед-
ленные и систематические изменения могут быть восприняты как
тренд, хотя на самом деле эти изменения – лишь часть колебатель-
ного процесса с большим периодом, например «большие циклы»
Кондратьева с периодами 45–60 лет. С другой стороны, если целью
анализа является прогноз на 1–2 года вперед, очевидно, не очень
важно, что представляют на самом деле исследуемые изменения –
тренд или отрезок периодического процесса. Главное, чтобы прогноз был достаточно точным. Поэтому способ выделения тренда и
его эконометрическая модель в значительной степени зависят от
цели исследования. В следующем подразделе мы достаточно под-
робно рассмотрим методы сглаживания временных рядов с целью
выделения тренда. Здесь же отметим лишь тот очевидный факт, что
математическое описание тренда не представляет особых трудно-
стей, если исследователь на основании тщательного изучения пред-
метной области правильно определил долговременную тенденцию
развития изучаемого процесса.
Эффект сезонности. Эта составляющая, пожалуй, наиболее
легка для обнаружения, выделения и изучения. Здесь мы имеем дело
с некоторым внешним циклическим механизмом, который в сочета-
нии с внутренним механизмом поведения изучаемой системы фор-
мирует циклическое изменение выходных переменных. Периоды
сезонных циклов могут иметь длительность в сутки, неделю, месяц,
год, но в любом случае они отражают связь изучаемых процессов с
календарем. Так, цикл с периодом в один год характерен для про-
цессов производства (и потребления) сельскохозяйственной ェ__0-_про-
дукции. В производстве и потреблении электрической энергии на-
блюдаются суточные, недельные, месячные и годовые циклы, что
вызвано как природными явлениями (смена времени года), так и
трудовыми процессами, привязанными к календарю и часам суток.
Следует отличать эффект сезонности от периодических колебаний
вообще. Последние имеют период, не кратный календарным отрез-
кам времени и, что, пожалуй, более важно, их природа зачастую не
ясна.
Колебания и случайная компонента. После выделения тренда и
сезонных циклов остается временной ряд, представляющий случай-
ные колебания более или менее регулярного типа. На этом этапе
решается следующая задача: является ли остаточный ряд некоторой
функциональной, периодической зависимостью или же он пред-
ставляет случайную выборку из некоторой однородной генеральной
совокупности. Чаще всего некоторый колебательный процесс на-
блюдается на фоне так называемого стационарного случайного про-
цесса. В этом случае возникают задачи выделения колебаний и ана-
лиза стационарных остатков. Ниже соответствующие методы будут рассмотрены.
5.2. Определение тренда
Формально определение тренда состоит из трех этапов:
– выбора математической модели – аппроксимирующей функ-
ции f(t);
– определения параметров модели на основании наблюденных
значений ряда yt, t = 1, 2, …, n;
– построения доверительных интервалов для параметров и урав-
нения тренда, оценки значимости тренда.
В качестве математической модели тренда выбирают кривую,
наилучшим образом отражающую характер изучаемого ряда. В про-
стейшем случае это может быть прямая
f(t) = a0 + a1t1,
в более сложном случае – полином порядка m
f(t) = a0 + a1t + … + amtm.
Если ряд имеет характер процесса с насыщением, используют
одну из стандартных кривых:
экспоненциальную кривую
f(t) = ke–
t
β
;
логистическую кривую
( )
1 − =
+ at
f t k
bc
и другие.
Выбор модели – дело вкуса и опыта исследователя, но в любом
случае она должна отвечать характеру изучаемого процесса. Пара-
метры модели определяются методом наименьших квадратов.
Оценка значимости, доверительные интервалы и полосы вычисля-
ются стандартными методами, изложенными в разд. 4. Тот факт, что
t принимает последовательные значения из натурального ряда чи-
сел, в некоторых случаях существенно упрощает вычисления.
Другим, альтернативным методом сглаживания временного ряда
является метод скользящих средних. Простейший вариант метода,
давший ему название, состоит в следующем.
Пусть ряд состоит из n членов. Длину интервала сглаживания
примем равной 2m+1<n. Определим среднее для первых 2m+1 чле-
нов исходного ряда и присвоим его значение члену сглаженного ря-
да с номером m+1. Сдвинем интервал сглаживания на один элемент
вправо, снова найдем среднее и присвоим его значение члену сгла-
женного ряда с номером m+2. Продолжим этот процесс до тех пор,
пока правый конец интервала не совпадет с последним членом ис-
ходного ряда. Вычислим последнее среднее и присвоим его значе-
ние элементу сглаженного ряда с номером n – (m+1). Результатом
проделанной операции будет сглаженный ряд, имеющий дисперсию
в 2m+1 раз меньше, чем исходный. Случайные колебания будут в
какой-то степени сглажены. Недостатком нового ряда является от-
сутствие первых и последних m членов. Так что, если m достаточно
велико, хорошо сглаженный ряд может оказаться слишком корот-
ким. При небольших m сглаживание невелико. Выбор оптимальной
длины интервала сглаживания определяется длиной исходного ряда,
целями сглаживания и некоторыми другими факторами, о которых
речь пойдет ниже.
Более совершенным способом сглаживания является аппрокси-
мация ряда на интервале сглаживания полиномом степени, не пре-
вышающей числа точек интервала. Пусть по-прежнему число чле-
нов интервала сглаживания нечетно и равно 2m+1<n, а аппроксими-
рующий полином имеет степень k<2m+1:
y = a0 + a1t + … +ak t k.__
Ради удобства изложения изменим нумерацию внутри интервала
сглаживания так, чтобы момент t = 0 соответствовал середине ин-
тервала. В результате значения членов ряда внутри интервала будут
обозначаться символами
y–m, y–(m–1), …, y0, …, ym–1, ym..
Определим коэффициенты полинома методом наименьших
квадратов. Для а0 имеем
a0 = c1y–m + c2y–(m–1) + …+c2m+1ym,
причем коэффициенты ci зависят только от m и k и не зависят от ве-
личин yi.
Значение y в точке t = 0, то есть в середине интервала, равно a0:
y(0) = a0.
Так как коэффициенты ci не зависят от положения интервала
сглаживания на временном ряду, то, вычислив однажды коэффици-
енты ci, перемещая интервал длиной 2m+1 вдоль ряда и подставляя
соответствующие значения yi в выражении для а0, получим сгла-
женный ряд, усеченный слева и справа на m членов.
В случае полиномиального сглаживания процедура дополнения
недостающих отрезков в начале и в конце очевидна. Достаточно на
первом и последнем шаге определить все коэффициенты ai и вычис-
лить недостающие значения сглаженного ряда подстановкой в по-
лученные полиномы соответствующих значений t: –m, –(m–1), …, –1
для первого отрезка; 1, 2, …, m для последнего отрезка.
До сих пор мы не говорили о том, как выбрать степень полинома
k и длину интервала сглаживания 2m+1. Простых критериев здесь
нет. Решение зависит от того, какие цели ставит исследователь, ин-
тересуется ли он остаточными эффектами или тренд выделяется,
главным образом, для изучения общей тенденции. Некоторую по-
мощь может оказать исследование влияния выделения тренда на
оставшиеся компоненты.
Пусть ряд состоит из трех частей: тренда y1, колебательной со-
ставляющей y2 и случайного элемента y3:
yt = y1t + y2t + y3t.
Символом T обозначим операцию сглаживания методом сколь-
зящих средних:
Тyt =Т y1t + Т y2t +Т y3t.
В идеале y1t = Т y1t. Исключая тренд, получим остаток в виде
yt – Тyt = (y2t – Т y2t)+( y3t +Т y3t).
Рассмотрим качественно влияние выделения тренда на колеба-
тельную составляющую. Пусть вначале скользящая средняя есть
просто средняя за интервал сглаживания. Если длина интервала
2m+1 равна или кратна периоду колебательной составляющей, то
ряд y2t – Тy2t в идеале представляет чистые колебания, так как сред-
нее за период равно нулю. Этот очевидный факт весьма полезен для
выделения периодических составляющих ряда. Если 2m+1 сущест-
венно меньше периода колебаний, то они воспринимаются скользя-
щей средней как тренд и остаток y2t – Тy2t практически не содержит
колебательной составляющей или, по крайней мере, ее амплитуда
мала. Если интервал сглаживания больше периода, то результат
сглаживания зависит от соотношения их длин.
Рассмотрим влияние процедуры сглаживания на случайную
компоненту y3t. При обычном предположении о некоррелированно-
сти остатков y3t последовательные величины Тy3t, а значит и y3t – Тy3t,
уже не являются независимыми, так как значения y3i и Тy3j зависят от
(2m+1)–i+j общих величин y3t и коррелированны, если i – j < 2m+1.
Следовательно, ряд Тy3t является более гладким по сравнению с y3t.
Сглаживание методом скользящего среднего чисто случайного ряда
порождает положительную коррелированность сглаженного ряда,
которая приводит к появлению периодичности (эффект Слуцкого–
Юла). Эти привнесенные процедурой сглаживания колебания могут
быть похожи на колебательные процессы, встречающиеся в эконо-
мике. Поэтому, выделяя тренд, необходимо быть уверенным, что эта
операция не порождает ложных колебательных процессов.
Сглаженный ряд, полученный по методу скользящего среднего,
по-прежнему остается дискретным рядом, не имеющим аналитиче-
ского описания. Поэтому после процедуры сглаживания обычно ис-
пользуют один из двух методов:
– аппроксимируют «гладкий» ряд подходящей гладкой функцией;
– выполняют на отдельных интервалах полиномиальную ап-
проксимацию с припасовкой решений на границах интервалов из
условия непрерывности интервалов.