Автор: Пользователь скрыл имя, 09 Марта 2013 в 18:39, курсовая работа
Целью работы является построение качественного прогноза на основе построенной модели. Исходя из этого, поставлены следующие задачи:
- изучение общих сведений о производстве мяса;
- исследование и анализ временного производства мяса;
Введение 2
1 Анализ временного ряда производства мяса 4
1.1 Графический и аналитический анализ динамики 4
1.2 Построение автокорреляционной функции и каррелограммы 6
1.3 Проверка гипотезы о наличии тренда 8
1.4 Моделирование тенденции временного ряда 9
1.5 Моделирование сезонных и циклических колебаний 10
1.6 Построение аддитивной модели 11
1.6 Исследование сезонности с помощью ряда Фурье 21
2 Проверка адекватности модели реальному явлению. 24
2.1 Проверка временного ряда на наличие автокорреляции в остатках 24
2.1.1Обнаружение автокорреляции 25
2.1.2 Графический метод 25
2.1.3 Метод рядов 26
2.1.4 Критерий Дарбина – Уотсона 27
2.2 Проверка временного ряда на гетероскедастичночть 28
2.2.1 Обнаружение гетероскедастичности 28
2.2.2 Графический анализ остатков 29
2.2.3 Тест ранговой корреляции Спирмена 30
2.2.4 Тест Парка 31
2.2.5 Тест Глейзера 32
2.2.6 Тест Голдфелда−Квандта 33
3 Точечные и интервальные прогнозы. 36
3.1 Прогноз с помощью аддитивной модели 36
3.2 Прогноз с помощью ряда Фурье 37
3.3 Прогноз с помощью экспоненциального сглаживания 38
Заключение 40
Список использованных источников 41
имеет распределение Стьюдента с числом степеней свободы ν = n − 2.
Следовательно, если наблюдаемое значение t-статистики превышает tкр = tα,n−2 (определяемое по таблице критических точек распределения Стьюдента), то необходимо отклонить гипотезу о равенстве нулю коэффициента корреляции ρх,е, а следовательно, и об отсутствии гетероскедастичности. В противном случае гипотеза об отсутствии гетероскедастичности принимается. [4]
Выдвигаем нулевую гипотеза об отсутствии гетероскедастичности:
H0:
Рисунок 2.5 – Расчет коэффициента корреляции .
Так как p=0.953285>0.05, следовательно коэффициент корреляции не значим и нет оснований отвергнуть нулевую гипотезу об отсутствии гетероскедастичности.
Р. Парк предложил критерий
определения
Прологарифмировав, получим:
Так как дисперсии обычно неизвестны, то их заменяют оценками квадратов отклонений
Критерий Парка включает следующие этапы:
1. Строится уравнение регрессии
2. Для каждого наблюдения определяются
3. Строится регрессия
где α = lnσ2.
В случае множественной регрессии зависимость (8.5) строится
для каждой объясняющей переменной.
4. Проверяется статистическая
значимость коэффициента β
на основе t-статистики.
Если коэффициент β статистически значим, то это означает наличие связи между lnei2 и lnxi, т. е. гетероскедастичности в статистических данных. [4]
Для каждого наблюдения определим и построим регрессию .
Рисунок 2.6 – Оценка коэффициентов регрессии.
Так как p-level=0.428072 для коэффициента меньше 0.05, то он является статистически не значимым, следовательно гетероскедастичность отсутствует.
Тест Глейзера по своей сути аналогичен тесту Парка и дополняет его анализом других (возможно, более подходящих) зависимостей между дисперсиями отклонений σi и значениями переменной хi. По данному методу оценивается регрессионная зависимость модулей отклонений ei (тесно связанных с σi2) от хi. При этом рассматриваемая зависимость моделируется следующим уравнением регрессии:
| ei |= α + βхik + vi .
Изменяя значения k, можно построить различные регрессии. Обычно k = …, −1, −0.5, 0.5, 1, … Статистическая значимость коэффициента β в каждом конкретном случае фактически означает наличие гетероскедастичности.
Построим уравнение регрессии для k=-1.
Рисунок - Уравнение регрессии для k=-1.
Так как p - level коэффициента b меньше 0,05, следовательно он является не значимым.
Построим уравнение регрессии для k=-0,05.
Рисунок - Уравнение регрессии для k=-0,05.
Так как p - level коэффициента b меньше 0,05, следовательно он является не значимым.
Построим уравнение регрессии для k=0,05.
Рисунок - Уравнение регрессии для k=0,05.
Так как p - level коэффициента b меньше 0,05, следовательно он является не значимым.
Построим уравнение регрессии для k=1.
Рисунок - Уравнение регрессии для k=0,05.
Так как во всех случаях коэффициент b является не значимым, то можно сделать вывод об отсутствии гетеро седастичности.
В данном случае также предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению хi переменной Х в этом наблюдении, т. е. уi2 = у2xi2 . Предполагается, что εi имеет нормальное распределение и отсутствует автокорреляция остатков.
Тест Голдфелда−Квандта состоит в следующем:
1. Все n наблюдений упорядочиваются по величине Х.
2. Вся упорядоченная
выборка после этого
3. Оцениваются отдельные
регрессии для первой
4. Для сравнения соответствующих дисперсий строится следующая F-статистика:
Здесь (k − m − 1) − число степеней свободы соответствующих выборочных дисперсий (m − количество объясняющих переменных в уравнении регрессии).
При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы ν1 = ν2 = k − m − 1.
5.Если , то гипотеза об отсутствии гетероскедастичности отклоняется (здесь α − выбранный уровень значимости).
Для выполнения этого теста разобьем наш временной ряд на три равных части по 16 значений. Если гетероскедастичность будет иметь место, то сумма квадратов отклонений по первой подвыборке будет существенно меньше суммы квадратов отклонений по третьей подвыборке .
Получаем S1= 1179223631, S3=1298587795. Рассчитываем F – критерий: . F=1,1012, Fкр= 2,4837. Так как Fр<Fкр, то нет оснований отвергнуть гипотезу об отсутствии гетероскедастичности.
2.3 Проверка точности модели
И, наконец, исследуем данную модель на точность. Для этого будем использовать среднюю относительную ошибку по модулю:
Получаем E= 3,3757, что говорит о хорошем качестве модели, так как ошибка аппроксимации не превышает 5-7%.
1) Произведем прогноз
потребления мяса на
Построим график фактических значений и прогнозных данных.
Рисунок – Прогнозирование на последующие периоды.
Анализируя построенный график можно сказать, что полученные прогнозные значения являются достаточно точными.
2) Интервальные прогнозы построим на основе точечных прогнозов по аддитивной модели. Для этого рассчитаем величину U(k), которая для модели линейного тренда будет иметь вид:
Где Se – стандартная ошибка.
Получаем Se= 4449,585, ta,n-1= 2,01174. Представим в виде таблицы значения U(k), а также верхнюю и нижнюю границу доверительного интервала.
Таблица 3.1– Интервальные прогнозы.
U(k) |
нижняя граница |
верхняя граница |
у факт | |
49 |
9328,352 |
237180,7726 |
255837,4766 |
247251 |
50 |
9351,6341 |
236867,2101 |
255570,4783 |
246685 |
51 |
9375,7862 |
254180,1423 |
272931,7147 |
269791 |
52 |
9400,8015 |
257558,0654 |
276359,6684 |
274159 |
53 |
9426,6732 |
258652,8717 |
277506,2181 |
268816 |
54 |
9453,3942 |
252591,1932 |
271497,9817 |
263884 |
55 |
9480,9574 |
257136,7872 |
276098,702 |
278966 |
56 |
9509,3555 |
264781,9525 |
283800,6635 |
282042 |
57 |
9538,5809 |
267639,6759 |
286716,8377 |
289766 |
58 |
9568,6261 |
282539,4024 |
301676,6547 |
312348 |
59 |
9599,4835 |
276574,1606 |
295773,1276 |
311421 |
60 |
9631,1451 |
293481,3019 |
312743,5922 |
335070 |
Таким образам, анализируя полученные прогнозы, можно сказать, что они являются достаточно эффективными, однако доля фактических данных, не попавших в интервал также велика.
Произведем прогноз
Таблица 3.3 – Прогноз с помощью ряда Фурье.
t |
y t |
t(Радианы) |
y фурье | |
янв.09 |
49 |
247251 |
25,13274123 |
252950,7 |
фев.09 |
50 |
246685 |
25,65634 |
245999,3 |
мар.09 |
51 |
269791 |
26,17993878 |
254673,8 |
апр.09 |
52 |
274159 |
26,70353756 |
266507,2 |
май.09 |
53 |
268816 |
27,22713633 |
267298,0 |
июн.09 |
54 |
263884 |
27,75073511 |
263538,3 |
июл.09 |
55 |
278966 |
28,27433388 |
267695,0 |
авг.09 |
56 |
282042 |
28,79793266 |
277134,6 |
сен.09 |
57 |
289766 |
29,32153143 |
283940,9 |
окт.09 |
58 |
312348 |
29,84513021 |
290014,6 |
ноя.09 |
59 |
311421 |
30,36872898 |
296565,1 |
дек.09 |
60 |
335070 |
30,89232776 |
294673,6 |
Рисунок 3.3 – Прогноз производства мяса по ряду Фурье.
Анализ графика подтверждает эффективность прогноза с помощью модели ряда Фурье.
3.3 Прогноз с помощью экспоненциального сглаживания.
Допустим, что a=0.25. Тогда фактор затухания будет равен (1-а)=0,75. Произведем экспоненциальное сглаживание временного ряда. Имея фактические данные на последующие 12 месяцев, сравним их с прогнозными значениями.
Результаты расчета для всех месяцев года представлены в таблице.
Таблица 3.2 - Экспоненциальные прогнозы производства мяса.
t |
факт |
прогноз |
янв.09 |
247251 |
251911,5 |
фев.09 |
246685 |
252263,1 |
мар.09 |
269791 |
248953,4 |
апр.09 |
274159 |
264581,6 |
май.09 |
268816 |
271764,6 |
июн.09 |
263884 |
269553,2 |
июл.09 |
278966 |
265301,3 |
авг.09 |
282042 |
275549,8 |
сен.09 |
289766 |
280419 |
окт.09 |
312348 |
287429,2 |
ноя.09 |
311421 |
306118,3 |
дек.09 |
335070 |
310095,3 |
Представим фактические и прогнозные данные об объемах производства мяса в виде графика.
Рисунок 3.1– Экспоненциальные прогнозы производства мяса.
Затем построим график прогноза, сделанного с помощью аддитивной модели, график прогноза, сделанного с помощью экспоненциального сглаживания и сравним их с фактическими данными.
Рисунок 3.2 – Сравнение получившихся прогнозов с фактическими данными
Анализируя все полученные прогнозы, делаем вывод о том, что все они являются эффективными и достаточно точно отражают фактические данные.
В результате проведенных исследований были выполнены установленные задачи и достигнута поставленная цель.
На первом этапе был произведен анализ временного ряда производства мяса. А именно, была построена автокорреляционная функция, исходя из которой было выяснено, что данный временной ряд содержит положительную тенденцию и сезонные колебания периодичностью 12 месяцев.