Анализ динамики производства мяса

Автор: Пользователь скрыл имя, 09 Марта 2013 в 18:39, курсовая работа

Описание работы

Целью работы является построение качественного прогноза на основе построенной модели. Исходя из этого, поставлены следующие задачи:
- изучение общих сведений о производстве мяса;
- исследование и анализ временного производства мяса;

Содержание

Введение 2
1 Анализ временного ряда производства мяса 4
1.1 Графический и аналитический анализ динамики 4
1.2 Построение автокорреляционной функции и каррелограммы 6
1.3 Проверка гипотезы о наличии тренда 8
1.4 Моделирование тенденции временного ряда 9
1.5 Моделирование сезонных и циклических колебаний 10
1.6 Построение аддитивной модели 11
1.6 Исследование сезонности с помощью ряда Фурье 21
2 Проверка адекватности модели реальному явлению. 24
2.1 Проверка временного ряда на наличие автокорреляции в остатках 24
2.1.1Обнаружение автокорреляции 25
2.1.2 Графический метод 25
2.1.3 Метод рядов 26
2.1.4 Критерий Дарбина – Уотсона 27
2.2 Проверка временного ряда на гетероскедастичночть 28
2.2.1 Обнаружение гетероскедастичности 28
2.2.2 Графический анализ остатков 29
2.2.3 Тест ранговой корреляции Спирмена 30
2.2.4 Тест Парка 31
2.2.5 Тест Глейзера 32
2.2.6 Тест Голдфелда−Квандта 33
3 Точечные и интервальные прогнозы. 36
3.1 Прогноз с помощью аддитивной модели 36
3.2 Прогноз с помощью ряда Фурье 37
3.3 Прогноз с помощью экспоненциального сглаживания 38
Заключение 40
Список использованных источников 41

Работа содержит 1 файл

анализ динамики.docx

— 552.49 Кб (Скачать)

Рисунок 1.6.17 – Расчет уравнения экспоненциальной функции в Statistica.

 

Рисунок 1.6.18 – Коэффициент детерминации для экспоненциальной функции.

Для коэффициентов a0, a1 p – level<0.05, следовательно данные коэффициенты являются значимыми.

Рисунок 1.6.19 – Экспоненциальная функция.

 

Анализируя все полученные модели тренда, можно сделать вывод что наилучшей является линейная форма тренда, так как, хотя наибольшим коэффициентом детерминации обладает парабола второго порядка, однако она имеет не значимый коэффициент при переменной t2, следовательно с помощью этой модели не может быть сделан эффективный прогноз.

В соответствии с методикой  построения аддитивной модели расчет ошибки произведем по формуле:

E=Y-(T+S)

Это абсолютная ошибка. Сумма  квадратов абсолютных ошибок равна  60794762014. Следовательно, средняя квадратичная абсолютная ошибка составит:

Сумма квадратов отклонений от уровней ряда составит:

Сравним его с суммой квадратов  абсолютных ошибок:

Таким образом, можно сказать, что аддитивная модель на 98,58% объясняет  общую вариацию уровней временного ряда потребления мяса.

Так как амплитуда колебаний  приблизительно постоянна, то достаточно построить аддитивную модель, в которой  значения сезонной компоненты предполагаются постоянными для различных циклов.

1.6 Исследование сезонности с помощью ряда Фурье

При исследовании явлений  периодического типа в качестве аналитической  формы развития во времени принимается  уравнение следующего типа (ряд Фурье):

В этом уравнении величина k определяет гармонику ряда Фурье и может быть взята с разной степенью точности (чаще всего от 1 до 4). Для отыскания параметров уравнения используется метод наименьших квадратов т.е.

Найдя частные производные  этой функции и приравняв их к  нулю, получим систему нормальных уравнений , решение которой дает следующие формулы вычисления параметров:

Как видим, параметры уравнения  зависят от значений y и связанных с ними последовательных значений coskt и sinkt.

Для изучения сезонных колебаний  на протяжении года необходимо взять  n=48. Тогда, представим периоды как часть длины окружности.

Так как t в годовой динамике означает номер соответствующего месяца, то t=0 соответствует январю, t=π/6 соответствует февралю и т.д. Для нахождения параметров ak и bk надо иметь произведение уровней данного месяца на синусы и косинусы соответствующих гармоник.

Для исследования сезонности с помощью ряда Фурье перейдем от порядкового номера периода к углу в радианах, и построим ряд для четырех гармоник.

Рисунок 1.7 – Расчет уравнения для модели ряда Фурье с четырьмя гармониками в Statistica.

 

Переменная a1, a3, a4 оказываются не значимыми. Исключаем sin t, sin 3t, sin4t и получившийся ряд.

Рисунок 1.8 – Расчет уравнения для модели ряда Фурье в Statistica.

 

Рисунок 1.9 – Коэффициент детерминации для модели ряда Фурье.

 

Так как для коэффициентов  c0, c1, b1, a2,b2, b3, b4 p – level<0.05, то данные коэффициенты являются значимыми, следовательно полученная модель является эффективной.

Таким образом, уравнение для модели ряда Фурье будет иметь следующий вид:

Построим  ряд Фурье отбросив sin4t.

Рисунок 1.10 – Расчет уравнения для модели ряда Фурье в Statistica.

 

Все оцениваемые коэффициенты значимы. Имеем следующую модель:

Сопоставление выровненных  значений временного ряда с sin3t и без него, позволяет сделать вывод что sin3t нельзя исключать, так как средняя ошибка для этих двух моделей оказывается достаточно большой.

Коэффициент детерминации данной модели R2=0,97236665. Следовательно, данная модель является достаточно эффективной, однако, наиболее эффективной из всех будет линейная модель, поэтому будем применять ее в дальнейшем анализе.

 

2 Проверка адекватности модели реальному явлению.

Для проверки адекватности модели реальному явлению будем  исследовать ряд остатков , то есть, отклонения расчетных значений от фактических данных.[3]

Проверка условия независимости уровней ряда остатков.

Выдвигаем нулевую гипотезу:

С этой целью строим t – статистику:

.

Где .

Получаем tрасч= 6,13E-15 , находим tкр=1,6779. Так как tрасч< tкр, то гипотеза о равенстве математического ожидания уровней ряда остатков нулю принимается. Полученная модель линейного тренда является адекватной реальному явлению.

2.1 Проверка временного ряда на наличие автокорреляции в остатках

Важной  предпосылкой  построения  качественной  регрессионной  модели по МНК является независимость значений случайных отклонений εi  от значений отклонений во всех других наблюдениях .

Отсутствие зависимости гарантирует отсутствие коррелированности между любыми отклонениями (σ(εi, εj) = cov(εi, εj) = 0 при i ≠ j) и, в частности, между соседними отклонениями (σ(εi−1, εi) =  0),    i = 2, 3, …, n.

Автокорреляция (последовательная корреляция)  определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные данные). Автокорреляция остатков (отклонений) обычно встречается в  регрессионном анализе при использовании  данных  временных  рядов. При использовании перекрестных данных наличие автокорреляции (пространственной корреляции) крайне редко.[4]

2.1.1Обнаружение автокорреляции

В силу неизвестности значений параметров уравнения регрессии неизвестными  будут также и истинные  значения  отклонений  εt.  Поэтому выводы об их независимости осуществляются на основе  оценок еt, полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

2.1.2 Графический метод

Существует  несколько  вариантов  графического  определения  автокорреляции. Один из них, увязывающий отклонения еt с моментами t  их  получения (их  порядковыми номерами i), приведен  на  рис 2.1.

Это  так  называемые  последовательно-временные  графики.  В  этом случае по оси абсцисс  обычно откладываются либо момент получения  статистических данных, либо порядковый номер наблюдения, а по оси ординат  отклонения  εt  (либо оценки отклонений еt). [4]

Если имеются определенные связи между отклонениями, то автокорреляция имеет место. 

Построим график зависимости  остатков от времени.

Рисунок 2.1 – График зависимости остатков от времени.

Рисунок 2.2 – График остатков в Statistica.

Анализ графика не позволяет  сделать точного вывода о наличии  автокорреляции в остатках, поэтому  для ее определения применим метод  рядов, а затем критерий Дарбина - Уотсона.

2.1.3 Метод рядов

Этот  метод  достаточно  прост:  последовательно  определяются знаки отклонений et. Например,

(− − − − −)(+ + + + + + +)(− − −)(+ + + +)(−),

т. е. 5 “−“, 7 “+”, 3 “−”, 4 “+”, 1 “−”  при 20 наблюдениях.

Ряд определяется как непрерывная  последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда. [4]

Визуальное  распределение  знаков  свидетельствует  о  неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, то вероятна  отрицательная  автокорреляция.  Для  более  детального  анализа предлагается следующая процедура. Пусть

n  − объем выборки; n1 − общее количество знаков “+” при n аблюдениях (количество положительных отклонений et); n2 − общее количество знаков “−” при n наблюдениях (количество отрицательных отклонений et); k  − количество рядов.

При достаточно большом количестве наблюдений (n1 > 10, n2 > 10) и отсутствии автокорреляции СВ k имеет асимптотически нормальное распределение с

          

Тогда, если  M(k) – uα/2⋅D(k) < k < M(k) + uα/2⋅D(k), то гипотеза об отсутствии автокорреляции принимается.

Получаем следующие данные:

n1=26, n2=22; k=16, M(k)= 24,833, D(k)= 11,579. k1=2.14, k2=47.5. Так как полученное значение k находится в найденных пределах, то нет оснований отвергнуть нулевую гипотезу об отсутствии автокорреляции в остатках.

2.1.4 Критерий Дарбина – Уотсона

Наиболее  известным  критерием  обнаружения  автокорреляции первого  порядка  является  критерий  Дарбина–Уотсона. Суть его состоит в вычислении статистики DW Дарбина–Уотсона и на основе ее величины − осуществлении выводов об автокорреляции.  [4]

                                                        (9.1)

Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое  об ее наличии, была построена таблица критических точек распределения Дарбина–Уотсона. По ней для заданного уровня значимости α, числа наблюдений n и количества  объясняющих  переменных m определяются  два значения:   

dl − нижняя граница и du − верхняя граница.

Общая схема критерия Дарбина–Уотсона будет следующей:

1. По построенному эмпирическому уравнению регрессии определяются значения отклонений 

для каждого  наблюдения t, t = 1, 2, …, n.

2. По формуле (9.1) рассчитывается  статистика DW.

3. По таблице критических  точек Дарбина–Уотсона определяются  

два числа dl и du  и осуществляют выводы.

Выдвигаем нулевую гипотезу об отсутствии автокорреляции в остатках.

Находим расчетное значение критерия.

Получаем d= 1,10209.

Рисунок 2.3 – Расчет критерия Дарбина – Уотсона в Statistica.

Так как p-level коэффициента d меньше 0,05, то он является не значимым, следовательно нет оснований отвергнуть нулевую гипотезу об отсутствии автокорреляции в остатках.

 

2.2 Проверка временного ряда на гетероскедастичночть.

При рассмотрении выборочных данных требование  постоянства  дисперсии случайных отклонений может вызвать определенное недоумение в силу того, что при каждом i-м наблюдении имеется единственное  значение  εi.  Откуда  же  появляется  разброс?  Дело  в  том,  что при рассмотрении выборочных данных мы имеем дело с конкретными реализациями  зависимой  переменной yi  и соответственно c определенными случайными отклонениями   εi, i = 1, 2, ..., n. Но до осуществления выборки эти показатели априори могли принимать произвольные  значения  на  основе  некоторых  вероятностных  распределений.

2.2.1 Обнаружение гетероскедастичности

В ряде случаев на базе знаний характера данных появление проблемы гетероскедастичности можно предвидеть и попытаться устранить этот недостаток еще на этапе спецификации. Однако значительно чаще  эту  проблему  приходится  решать  после  построения  уравнения регрессии.

Естественно,  не существует какого-либо однозначного метода определения  гетероскедастичности.  Однако  к настоящему  времени для такой проверки разработано довольно большое число тестов и критериев для них. Рассмотрим наиболее популярные и наглядные: графический анализ отклонений, тест ранговой корреляции Спирмена, тест Парка, тест Голдфелда−Квандта.[4]

2.2.2 Графический анализ остатков

Использование  графического  представления  отклонений  позволяет  определиться  с  наличием  гетероскедастичности.  В этом  случае по оси абсцисс откладывается объясняющая переменная Х (либо линейная  комбинация  объясняющих переменных Y = b0 + b1X1  +  ...  +      + bmXm), а по оси ординат либо отклонения еi, либо их квадраты  

Если на полученном графике  отклонения   находятся внутри  полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий   от значений переменной Х и их постоянстве, т.е. в этом случае мы находимся в условиях гомоскедастичности.

Построим график квадрата остатков от периода времени t.

Рисунок 2.4 - График зависимости квадрата остатков от периода времени t

 

Так как, почти все отклонения находятся в пределах одной полуполосы постоянной ширины, параллельной оси абсцисс, то можно сделать вывод об отсутствии зависимости между и периодом времени t, а следовательно и об отсутствии гетероскедастичности.

2.2.3  Тест ранговой корреляции Спирмена

При использовании данного  теста предполагается, что дисперсия  отклонения будет либо увеличиваться, либо уменьшаться с увеличением  значения Х. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений еi и значения хi СВ Х будут коррелированы. Значения хi и еi ранжируются (упорядочиваются по величинам).

Затем определяется коэффициент  ранговой корреляции: 

                                                (8.1)

где di − разность между рангами хi  и ei , i = 1, 2, … , n;  n − число наблюдений.

Например, если х20 является 25-м по величине среди всех наблюдений Х; а е20 − является 32-м, то di = 25 − 32= −7.

Доказано,  что если коэффициент  корреляции ρх,е  для генеральной совокупности равен нулю, то статистика

Информация о работе Анализ динамики производства мяса