Автор: Пользователь скрыл имя, 09 Марта 2013 в 18:39, курсовая работа
Целью работы является построение качественного прогноза на основе построенной модели. Исходя из этого, поставлены следующие задачи:
- изучение общих сведений о производстве мяса;
- исследование и анализ временного производства мяса;
Введение 2
1 Анализ временного ряда производства мяса 4
1.1 Графический и аналитический анализ динамики 4
1.2 Построение автокорреляционной функции и каррелограммы 6
1.3 Проверка гипотезы о наличии тренда 8
1.4 Моделирование тенденции временного ряда 9
1.5 Моделирование сезонных и циклических колебаний 10
1.6 Построение аддитивной модели 11
1.6 Исследование сезонности с помощью ряда Фурье 21
2 Проверка адекватности модели реальному явлению. 24
2.1 Проверка временного ряда на наличие автокорреляции в остатках 24
2.1.1Обнаружение автокорреляции 25
2.1.2 Графический метод 25
2.1.3 Метод рядов 26
2.1.4 Критерий Дарбина – Уотсона 27
2.2 Проверка временного ряда на гетероскедастичночть 28
2.2.1 Обнаружение гетероскедастичности 28
2.2.2 Графический анализ остатков 29
2.2.3 Тест ранговой корреляции Спирмена 30
2.2.4 Тест Парка 31
2.2.5 Тест Глейзера 32
2.2.6 Тест Голдфелда−Квандта 33
3 Точечные и интервальные прогнозы. 36
3.1 Прогноз с помощью аддитивной модели 36
3.2 Прогноз с помощью ряда Фурье 37
3.3 Прогноз с помощью экспоненциального сглаживания 38
Заключение 40
Список использованных источников 41
Одним из наиболее распространенных способов моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим выравниванием временного ряда.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются:
следующие функции:
• линейный тренд
• гипербола
• экспоненциальный тренд
• тренд в форме степенной функции
• парабола второго и более высоких порядков
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t=1,2,...n, а в качестве зависимой переменной - фактические уровни временного ряда уt. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации. [2]
Известно несколько способов определения типа тенденции; к наиболее распространенным относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов. [2]
Выбор наилучшего уравнения в случае, если ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и выбора уравнения тренда с максимальным значением скорректированного коэффициента детерминации.
Известно несколько подходов к анализу структуры временных рядов, содержащих сезонные или циклические колебания.
Простейший подход - расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий:
Y=T+S+E,
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой T, сезонной S и случайной Е компонент. Общий вид мультипликативной модели выглядит так:
Y=T*S*E.
Данная модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой T, сезонной S и случайной E компонент. Выбор одной из двух моделей проводится на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты. [2]
Построение аддитивной и мультипликативной моделей сводится к расчету значений T,S и E для каждого уровня ряда.
По графику потребления
мяса за 2005-2009гг. можно установить наличие
приблизительно равной амплитуды колебаний.
Это свидетельствует о
Для расчета ее компонентов будем использовать метод центрированного среднего. Для ежемесячных данных имеем следующую формулу:
Получаем следующую таблицу данных.
Таблица 1.3 – Центрированные средние.
2005 |
2006 |
2007 |
2008 | |
янв |
166781,2 |
201479,2 |
230074 | |
фев |
168803,4 |
204477,1 |
232076,5 | |
мар |
171184,8 |
206619,4 |
234426,7 | |
апр |
174202,3 |
208400 |
236771,1 | |
май |
177132,1 |
210760 |
238497,8 | |
июн |
180270,5 |
212785,3 |
240526,7 | |
июл |
155425,3 |
183714,9 |
214727,8 |
|
авг |
156954,8 |
186686,6 |
217647 |
|
сен |
158563,3 |
189425,5 |
220644,6 |
|
окт |
160210 |
192448,3 |
223415,4 |
|
ноя |
162297,8 |
195683,9 |
225859 |
|
дек |
164625,3 |
198559,8 |
228015,8 |
Построим график исходных данных и центрированных средних.
Рисунок 1.3 - График исходных данных и центрированных средних.
Затем считаем разницу между исходными данными и центрированными средними, т.е. отклонения, которые и есть эффект сезонности.
Получаем следующую таблицу данных.
Таблица 1.4 – Таблица аддитивных индексов сезонности.
2005 |
2006 |
2007 |
2008 | |
янв |
-15629,2 |
-11167,2 |
-8659,04 | |
фев |
-15554,4 |
-19068,1 |
-7710,5 | |
мар |
-1245,79 |
-3107,42 |
2071,333 | |
апр |
-4461,29 |
316,0417 |
5458,917 | |
май |
-431,083 |
4620,042 |
2015,208 | |
июн |
-4038,54 |
-6209,33 |
-7320,67 | |
июл |
-6803,25 |
-9789,92 |
-1082,79 |
|
авг |
3931,25 |
-2570,58 |
-1300,96 |
|
сен |
2237,667 |
5298,542 |
-6734,58 |
|
окт |
11503,96 |
17762,71 |
10342,58 |
|
ноя |
6069,25 |
4501,125 |
7418,958 |
|
дек |
16693,71 |
26264,17 |
12324,17 |
Для определения влияния каждого конкретного периода года на динамику рассчитываются средние (по месяцам).
Таблица 1.5 – Средние значения по месяцам.
янв |
-11818,5 |
фев |
-14111 |
мар |
-760,625 |
апр |
437,8889 |
май |
2068,056 |
июн |
-5856,18 |
июл |
-5891,99 |
авг |
19,90278 |
сен |
267,2083 |
окт |
13203,08 |
ноя |
5996,444 |
дек |
18427,35 |
Сезонный индекс определяется из соотношения:
Где
Это соотношение необходимо, чтобы суммарное воздействие индексов сезонности на динамику было нейтральным.
Получаем и следующую таблицу индексов сезонности.
Таблица 1.6 – Сезонные индексы.
янв |
-11983,6 |
фев |
-14276,1 |
мар |
-925,764 |
апр |
272,75 |
май |
1902,917 |
июн |
-6021,32 |
июл |
-6057,13 |
авг |
-145,236 |
сен |
102,0694 |
окт |
13037,94 |
ноя |
5831,306 |
дек |
18262,21 |
Рисунок 1.4 – График индексов сезонности
Анализ графика индексов сезонности позволяет сделать вывод о том, что наибольшее количество мяса производится в декабре, а наименьшее - в январе.
Далее исключаем влияние сезонной компоненты. Получим величины T+E=Y-S.
Определим трендовую компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T+E).
Получаем следующий линейный тренд:
T=138376+2434.8*t
Подставляя в уравнение значения t=1, …, 48, найдем уровни T для каждого момента времени.
График уравнения тренда приведен на рисунке.
Рисунок 1.5 – График потребления мяса: тренд и выровненные по аддитивной модели значения уровней ряда.
Для выявления наилучшего уравнения тренда определим параметры основных видов трендов в программном пакете Statistica.
Для линейного тренда имеем следующее уравнение:
Рисунок 1.6.1 – Расчет линейного тренда в Statistica.
Рисунок 1.6.2 – Коэффициент детерминации для линейного тренда.
Значимость коэффициентов будем проверять с помощью t – статистики. Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми. Значимость коэффициента R2 проверим с помощью F – статистики. Для коэффициента R2 p-level=1,03614E-42<0.05, следовательно он является значимым.
Рисунок 1.6.3 – Функция линейного тренда
.
Для параболы второго порядка имеем следующее уравнение:
Рисунок 1.6.4 – Расчет параболы второго порядка в Statistica.
Рисунок 1.6.5 – Коэффициент детерминации для параболы второго порядка.
Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми. Для коэффициента a3 p-level>0.05, следовательно данный коэффициент является не значимым.
Рисунок 1.6.6 – Функция полинома второй степени.
Для гиперболы имеем следующее уравнение:
Рисунок 1.6.7– Расчет уравнения гиперболы в Statistica.
Рисунок 1.6.8– Коэффициент детерминации для гиперболической функции.
Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми.
Для показательной функции имеем следующее уравнение:
Рисунок 1.6.9– Расчет уравнения показательной функции в Statistica.
Рисунок 1.6.10– Коэффициент детерминации для показательной функции.
Для коэффициента a1 p – level<0.05, следовательно данный коэффициент является значимым. Для коэффициента a0 p-level>0.05, следовательно данный коэффициент является не значимым.
Для степенной функции имеем следующее уравнение:
Рисунок 1.6.11– Расчет уравнения степенной функции в Statistica.
Рисунок 1.6.12– Коэффициент детерминации для степенной функции.
Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми.
Рисунок 1.6.13 – Степенная функция.
Для полулогарифмической
функции имеем следующее
Рисунок 1.6.14 – Расчет уравнения полулогарифмической функции в Statistica.
Рисунок 1.6.15 – Коэффициент детерминации для полулогарифмической функции.
Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми.
Рисунок 1.6.16 - Полулогарифмическая функция.
Для экспоненциальной функции имеем следующее уравнение: