Применение статистических методов в анализе и прогнозировании развития потребительского рынка в России

Автор: Пользователь скрыл имя, 06 Мая 2012 в 13:18, курсовая работа

Описание работы

На сегодняшний день в экономических исследованиях для того, чтобы наблюдать за ходом развития экономики, проводить ее анализ и прогнозирование необходимо выявление факторов, определяющих уровень и динамику экономического процесса. Все факторы включаются в одну задачу, которая чаще всего решается методами корреляционного и регрессионного анализа. Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и дать им количественную оценку. Этот подход требует поиска причинных зависимостей. Причинная зависимость - это такая связь между процессами, когда изменение одного из них является следствием изменения другого.

Содержание

ВВЕДЕНИЕ

ГЛАВА 1. ТЕОРЕТИКО-МЕТОДИЧЕСКИЕ ПОДХОДЫ К АНАЛИЗУ ДИНАМИКИ РАЗВИТИЯ ПОТРЕБИТЕЛЬСКОГО РЫНКА В РФ

1.1. Товарные рынки в России: основные понятия, виды и структура.
1.2. Основные направления функционирования и развития товарных рынков в современных условиях.
1.3. Основы теории анализа и прогнозирования временных рядов

ГЛАВА 2. ИССЛЕДОВАНИЕ ДИНАМИКИ РАЗВИТИЯ ПОТРЕБИТЕЛЬСКОГО РЫНКА В РОССИИ ЗА 2006 – 2010г.г.

2.1 Формирование информационной базы для анализа временных рядов
2.2 Построение и анализ многофакторной корреляционной модели оборота розничной торговли, оценка адекватности.
2.3 Прогнозирование розничного оборота в РФ, с помощью регрессионных моделей.

ЗАКЛЮЧЕНИЕ

Работа содержит 1 файл

курсовая Лукьяновой Н..doc

— 723.50 Кб (Скачать)

-              Установление параметрического семейства моделей;

-              Оценка параметров;

-              Проверка гипотез относительно значимости параметров;

-              Проверка гипотез о независимости случайных возмущений;

-              Построение прогнозов  по имеющимся данным  и полученным оценкам.

3. Построение модели временного ряда

Временной ряд имеет две основные особенности, отличающие его от случайной выборки. Во-первых, наблюдения временного ряда не являются взаимно-независимыми, и, в частности, значение, которое мы получим в один момент времени, может существенно зависит от предыдущего наблюдения. Во-вторых, наблюдения временного ряда не образуют стационарной последовательности, это значит, что средняя и дисперсия зависят от номера наблюдений. Иначе говоря, при исследовании временных рядов существенное значение имеет тот порядок, в котором проводились наблюдения над исследуемой величиной.

Динамика рядов экономических показателей в общем случае складывается из четырех компонентов:

1) тенденции, характеризующей долговременную основную закономерность развития исследуемого явления;

2) периодического компонента, связанного с влиянием сезонности развития изучаемого явления;

3) циклического компонента, характеризующего циклические колебания, свойственные любому воспроизводству (например, циклы обновления, связанные с чисто техническими проблемами);

4) случайного компонента как результата влияния множества случайных факторов.

3.1 Аналитическое выравнивание временных рядов

Трендовые модели

Сглаживание по аналитическим формулам позволяет представить долгосрочную тенденцию развития временных рядов в виде некоторой функции времени. Трендовая модель временного ряда 

Возмущения t для любых моментов времени t некоррелированы, имеют нулевое математическое ожидание и постоянную дисперсию.

Детерминированная составляющая представляет собой некоторую функцию времени f(t). Если f(t) является линейной, то задача сводится к оценке параметров с помощью классического метода наименьших квадратов. Однако тенденция развития чаще представляет собой  некоторую достаточно гладкую кривую, тогда в качестве f(t) используют нелинейные функции, которые называют кривыми роста. Проблема состоит в том, чтобы подобрать наиболее подходящий тип кривой и сделать оценку параметров. Выбор типа кривой можно проводить визуально на основе графического представления временных данных или применить метод последовательных разностей для определения степени выравнивающего полинома.

Для описания тренда с постоянным абсолютным приростом или снижением показателей чаще всего применяют линейную функцию

Если для анализируемой тенденции характерны постоянные темпы роста, то целесообразно проводить выравнивание по показательной функции:

    или по  

В случае, когда присутствуют ограничивающие рост факторы, можно использовать модифицированную экспоненту:

Процессы с переменными темпами роста, когда, например, до определенного момента наблюдается развитие с ускорением, а после точки перегиба с замедлением, хорошо аппроксимируются S-образными кривыми. К ним относят логистические кривые, например:

  и кривую Гомперца:

Если функция линейна относительно своих параметров, то для оценки тренда используют традиционную технику регрессионного анализа. В остальных случаях применяют приемы преобразования уравнений (линеаризация и замена переменных)  или  нелинейных квадратов.

3.2 Модели автокорреляции и авторегрессии

Автокорреляция уровней временного ряда имеет место, когда члены ряда статистически зависимы друг от друга. То есть значение переменной y в момент времени t во многом определяется значениями этой же переменной в предшествующие моменты времени t-1,t-2,t-3 и т. д. Величину запаздывания уt относительно уt-t называют временным лагом.

Оценить зависимость между уровнями временного ряда можно с помощью коэффициента автокорреляции:    

Изменяясь в пределах от -1 до +1, свидетельствует об отсутствие автокорреляции уровней ряда, если »0, или об автокоррелированности значений Yt если представляет собой достаточно большую величину. Величина временного лага не должна превышать одной четвертой объема выборки, т.е. в моем случаи t =15.

Совокупность значений коэффициента автокорреляции для t=1,...,р называют корреляционной функцией, ее графическая интерпретация называется коррелограммой. Анализ коррелограмм позволяет сделать некоторые заключения о внутренней структуре временного ряда.

Автокорреляция искажает характер и тесноту зависимости между изучаемыми показателями. Поэтому коррелировать уровни рядов динамики можно лишь в том случае, если в каждом из них отсутствует автокорреляция. Следовательно, в случае наличия автокорреляции между уровнями ряда последняя должна быть устранена. Существуют различные методы ее устранения, и почти все они преследуют одну цель - исключение из исследуемых рядов основной тенденции. Наиболее применяемые из этих методов:

1) метод последовательных или конечных разностей. Это метод коррелирования первых, вторых и так далее разностей уровней временных рядов. При этом учитывается вид тренда. Если аппроксимирующие функции линейные, то коррелируются первые разности, если они представляют собой параболы 2-го порядка, то коррелируются вторые разности и т. д. Коррелируя разности уровней, тем самым механически уменьшают автокорреляцию в каждом из рассматриваемых рядов.

2) метод коррелирования отклонений уровней ряда от основной тенденции. Этот способ автокорреляции заключается в том, что коррелируются не сами уровни, а отклонения фактических уровней от выровненных, отражающих тренд, т.е. коррелируются остаточные величины

Методически наиболее правомерным методом коррелирования временных рядов является метод измерения тесноты связи между отклонениями эмпирических значений уровней от выровненных по тренду.

Для рядов динамики, у которых установлено наличие автокорреляции, каждый уровень (уt) может рассматриваться как функция предыдущих значений уровней. Уравнение, выражающее эту зависимость, называется уравнением авторегрессии. Уравнение авторегрессии, связывающее исходные уровни ряда с теми же уровнями, сдвинутыми на определенный лаг, находится по общим правилам регрессионного анализа.

Наиболее простой формой зависимости между уровнями ряда может служить линейная, выражающаяся уравнением 

Более сложной формой линейной авторегрессионой зависимости будет такая, при которой значение уровня в каждый момент t характеризуется зависимостью нескольких предшествующих значений данного показателя одновременно. Обычно чтобы определить число предшествующих уровней, которые могут оказывать влияние на уровень t-ого периода, рекомендуется найти уравнение авторегрессии первого порядка, затем второго, третьего и т. д.

3.3  Многомерные временные ряды. Лаговая корреляция и лаговая регрессия

Основная особенность коррелирования временных показателей связана с автокорреляцией  уровней ряда. Присутствие автокорреляции искажает картину взаимосвязи признаков. Если уровни рядов автокоррелированы, то корреляционный анализ исходных наблюдений следует дополнить анализом значений временных рядов очищенных от автокорреляции.

Один из способов устранения автокорреляции заключается в удалении тренда из временного ряда. В этом случае коррелируют не сами уровни рядов, а их отклонения от трендов.  Тренд может быть  выделен путем аналитического выравнивания или одним из методов сглаживания. После удаления тренда необходимо убедиться в отсутствии автокорреляции в отклонениях. Формула коэффициента корреляции по отклонениям от трендов имеет вид

где хt, Yt  - фактические значения показателей; , -детерминированная  составляющая  трендовой модели; - возмущения трендовой модели.

В качестве этих оценок выступают отклонения  наблюдений от оцененной линии трендов. При этом следует убедиться в отсутствии автокорреляции в остатках.

Второй способ удаления автокорреляции из временных  рядов  -  вычисление  последовательных разностей. Пусть хt, Yt  временные ряды, а - первые разности (от последующего наблюдения отнимаем предыдущее с соответствующим шагом t=2,3,…T) для них:

Коэффициент корреляции последовательных разностей определяют как:

Корреляция последовательных разностей более эффективна для рядов, включающих краткосрочные корреляции уровней. Для подобных временных рядов удаление трендов не всегда дает хорошие результаты, иногда при удалении тренда автокорреляция сохраняется в остатках. Вычисление последовательных разностей позволяет освободить временные ряды от автокорреляции.

Построение регрессионных зависимостей по временным рядам встречает две основных проблемы. Первая возникает в связи с высокой коррелированностью уровней временных показателей, включающих тренды. Высока вероятность мультиколлинеарности объясняющих переменных в регрессионной модели. Решение этой проблемы связано с использованием пошаговых процедур отбора факторов.

Вторая проблема сопряжена с появлением автокорреляции в остаточной компоненте регрессионной модели. Если модель построена на пространственной выборке, то независимость остатков означает, что случайные возмущения или помехи на одном объекте не оказывают влияния на случайные возмущения на другом объекте. Для временных выборок это условие подразумевает независимость временной последовательности остатков.

Лаговая корреляция рассматривать в ситуациях, связанных с запаздыванием, когда влияние одного показателя на другой проявляется с некоторым интервалом времени. Этот временной интервал также называют запаздыванием или временным лагом. Для лаговых зависимостей используется стандартная техника корреляционного и регрессионного анализа, но при условии, что временные ряды сдвинуты относительно друг друга на величину τ. При этом число взаимосвязанных наблюдений уменьшится на τ. Коэффициент лаговой корреляции рассчитывается по формуле:

Величина лага находится по формуле , где Т – количество наблюдений.

4.      Проверка модели на адекватность

Оценить качество полученной модели можно несколькими способами. Я выделила 4 наиболее значимых:

      Коэффициент детерминации

      Критерий Фишера

      Критерий Стьюдента

      Анализ остатков

Разберем каждый метод подробнее:

4.1  Коэффициент детерминации

Одним из показателей характеристики качества уравнения регрессии является коэффициент детерминации  

Коэффициент детерминации показывает долю объясненной уравнением регрессии дисперсии зависимой переменной. Он изменяется от 0 до 1. Высокое значение R2 говорит о том, что включенные в уравнение регрессии факторы в основном объясняют вариацию значений зависимого признака. При невысоком значении R2 можно сделать вывод о том, что факторы, оказывающие существенное влияние на результирующий показатель в уравнение не вошли. Несколько сужает сферу применения R2 эффект, связанный с ростом R2 при возрастании числа и переменных в уравнении. Попыткой устранить этот эффект является скорректированный R2adj=. В определенной степени его применение более корректно для сравнения регрессий при различном количестве переменных.

4.2 Проверка значимости уравнения регрессии c помощью критерия Фишера

Целью данной процедуры является установление статистически значимой регрессионной зависимости между результирующей и объясняющими переменными. Нулевая процедура проверки значимости состоит в том, что уравнение регрессии незначимо, и следовательно, общая и остаточная дисперсии зависимой переменной равны:

Альтернативная гипотеза утверждает, что уравнение значимо, то есть общая дисперсия больше остаточной:

Для проверки гипотезы в качестве критерия используется статистика, имеющая распределение Фишера-Снедекора. Для оценки теоретических дисперсий принимают выборочные оценки общей и остаточной дисперсий. Критерий строится следующим образом:

  где n - объем выборки, p - количество факторов в уравнении регрессии.

Расчетное значение F-критерия сравнивают с квантилью распределения Фишера Fγ1γ2 α соответствующей уровню значимости α и числу степеней свободы числителя γ1| = n -1, и знаменателя γ2 = n - p -1.

Если Fрасч> Fтабл, то общая дисперсия существенно превышает остаточную, и нулевая гипотеза отвергается. Можно сделать вывод, что уравнение регрессии является значимым с вероятностью 1-α. И, наоборот, если расчетное значение       F-статистики меньше критического, то нет оснований отвергать нулевую гипотезу, и делаем вывод о не значимости уравнения; результаты, полученные на основе данного уравнения, будут ненадежными.

Надежность выводов о значимости уравнения определяется уровнем значимости α. Причинами не значимости уравнения регрессии могут быть малый объем выборки, неудачный выбор объектов выборки, недостаточный размах вариации предсказывающих переменных, слабая зависимость между объясняемой и объясняющими переменными, неверный выбор формы регрессионной модели.

4.3 Проверка значимости параметров уравнения c помощью критерия Стьюдента

Процедура проверки значимости параметров позволяет установить существенность влияния отдельных факторов на зависимую переменную. Нулевая гипотеза относительно параметров модели гласит о том, что параметр регрессии βj не значимо отличается от нуля

альтернативная ей гипотеза утверждает, что βj значимо отличается от нуля

Проверка значимости параметров проводится с использованием критерия Стьюдента:

  где t - расчетная величина, если верна нулевая гипотеза, то статистка t имеет распределение Стьюдента;  - абсолютное значение оценки параметра; - стандартная ошибка параметра.

Информация о работе Применение статистических методов в анализе и прогнозировании развития потребительского рынка в России