Автор: Пользователь скрыл имя, 13 Января 2011 в 01:29, курсовая работа
Целью курсовой работы является регрессионный анализ зависимости между денежными доходами на душу и потребительскими расходами на душу населения по данным 2007 года и анализ динамики естественного прироста, убыли населения Республики Беларусь.
Введение 3
1 Описание экономических понятий, используемых в работе 4
2 Описание математического аппарата и статистических критериев, используемых в работе 9
2.1 Статистическая группировка и основные характеристики
2.2 Основы регрессионного и корреляционного анализа 12
2.3 Статистические показатели динамики социально – экономических явлений
3 Статистический анализ исходных данных 18
3.1 Выявление и удаление из статистической выборки аномальных наблюдений 18
3.2 Оценка описательных статистических параметров совокупности 19
3.3 Оценка связи между факторным и результативным признаком 22
3.4 Построение линейной регрессионной модели и оценка ее качества 24
3.5 Расчет и анализ показателей ряда динамики 27
3.6 Прогноз социально-экономического показателя 30
Заключение 33
Список использованных источников 34
Приложение А Исходные данные для статистического анализа 35
Приложение Б Расчет остаточной дисперсии
Дисперсия ( ) наиболее часто используемый показатель вариации, показывает среднюю площадь отклонений вариантов признака от средней величины.
простая дисперсия ,
взвешенная
дисперсия
.
Среднее квадратическое отклонение ( ) определяется как квадратный корень из дисперсии. .
Для
сравнения степени вариации признака
в разных совокупностях используется
коэффициент вариации (ν):
Коэффициент
вариации может также использоваться
для характеристики степени однородности
исследуемой совокупности. В статистике
совокупности, имеющие коэффициент вариации
больше 30–35 %, принято считать неоднородными.
2.2
Основы регрессионного и корреляционного
анализа
Во многих технических, экономических, организационных задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X. Зависимость между значениями параметров X и Y может быть:
- функциональной;
- статистической;
- корреляционной.
Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед неизвестное и зависящее от случайных причин, которые заранее не могут быть учтены.
Параметр
Y связан с параметром X функциональной
зависимостью в том случае, когда конкретному
значению
соответствует одно и только одно
значение
. Например, если принять, что X - это
градусы по шкале Цельсия, а Y - градусы
по шкале Фаренгейта, то между этими параметрами
существует функциональная зависимость
Функциональность связи определяется тем, что для конкретной температуры по Цельсию существует одна и только одна температура по Фаренгейту.
В
экономических процессах
Статистическую зависимость называют корреляционной, если при изменении одной из величин X изменяется среднее значение другой. Например, с одинаковых по площади участков земли при равных количествах внесенных удобрений X снимают различный урожай Y, т.е. Y не является функцией от X. Это объясняется влиянием случайных факторов (осадки, температура воздуха, плодородие почвы и др.). Но как показывает опыт, средний урожай является функцией от количества удобрений, т.е. Y связан с X корреляционной зависимостью.
Рассмотрим
графическое представление
Рисунок
1.1 – Статистическая зависимость между
величинами Х и Y
Из графика a) видно, что связь между параметрами близка к линейной. В случае данных, представленных на графике b) можно предположить, что линейная модель неприменима для описания исследуемой зависимости. Уравнение прямой из рис.1 а) является моделью связи, существующей между параметрами X и Y.
Первым шагом в анализе связи между параметрами является изучение переменных. Параметр Y, значение которого нужно предсказывать, является зависимым. Параметр X, значения которого нам известны заранее, и который влияет на значения Y называется независимым. Важным моментом является то, что для любого конкретного значения параметра Х существует распределение возможного значения Y. Для усреднения всех возможных значений параметра Y, которые соответствуют значению , используют понятие условного среднего , т.е. среднего арифметического всех значений Y, которые наблюдались при значении . Если каждому значению x соответствует одно значение условной средней , то условная средняя есть функция от x; в этом случае говорят, что Y зависит от X корреляционно.
Корреляционная зависимость Y от X - это функциональная зависимость условной средней от x: . Данное уравнение называется уравнением регрессии Y на X.
Выделяют две основные задачи регрессионного и корреляционного анализа:
Перед
тем, как использовать коэффициент
корреляции, необходимо проверить его
значимость. Для этого вычисляется
расчетное значение:
Расчетное значение сравнивают с критическим. Критическое значение вычисляют с использованием функции СТЬЮДРАСПОБР.
Уравнения регрессии применимо прогнозирования возможных ожидаемых значений результативного признака. При этом следует учесть, что перенос закономерности связи, измеренной в варьирующей совокупности, в статике на динамику не является, строго говоря, корректным и требует проверки условий допустимости такого переноса (экстраполяции), что выходит за рамки статистики и может быть сделано только специалистом, хорошо знающим объект (систему) и возможности его развития в будущем.
Ограничением прогнозирования на основании регрессионного уравнения, тем более парного, служит условие стабильности или по крайней мере малой изменчивости других факторов и условий изучаемого процесса, не связанных с ними. Если резко изменится "внешняя среда" протекающего процесса, прежнее уравнение регрессии результативного признака на факторный потеряет свое значение. В сильно засушливый год доза удобрений может не оказать влияния на урожайность сельскохозяйственной культуры, так как последнюю лимитирует недостаточная влагообеспеченность.
Прогнозируемое значение результативного показателя получается при подстановке в уравнение регрессии ожидаемой величины факторного признака. При таком прогнозировании следует соблюдать еще одно ограничение: нельзя подставлять значения факторного признака, значительно отличающиеся от входящих в базисную информацию, по которой вычислено уравнение регрессии. При качественно иных уровнях фактора, если они даже возможны в принципе, были бы другими параметры уравнения.
Можно рекомендовать при определении значений факторов не выходить за пределы трети размаха вариации как за минимальное, так и за максимальное значение признака-фактора, имевшееся в исходной информации.
Прогноз, полученный подстановкой в уравнение регрессии ожидаемого значения фактора, называют точечным прогнозом. Вероятность точной реализации такого прогноза крайне мала. Необходимо сопроводить его значением средней ошибки прогноза или доверительным интервалам прогноза с достаточно большой вероятностью.
При
статистической постановке прогнозной
задачи
где
— заданное, а
среднее значение независимой переменной
х.
Для вычисления доверительных границ прогноза линии регрессии нужно умножить ее среднюю ошибку на t-критерий Стьюдента.
Если нанести доверительные границы на график, то они расположены выше и ниже линии регрессии в виде ветвей гиперболы, ограничивая доверительную область (рис. 1.2).
Доверительный
интервал уменьшается при увеличении
продолжительности наблюдения (периода
основания прогноза) и растет с увеличением
периода упреждения прогноза.
Рисунок
1.2 - Динамика доверительного интервала
2.3
Статистические показатели
Для
количественной оценки динамики социально–экономических
явлений применяются
В основе расчета показателей рядов динамики лежит сравнение его уровней. В зависимости от применяемого способа сопоставления показатели динамики могут вычисляться на постоянной и переменной базах сравнения.
Для расчета показателей динамики на постоянной базе каждый уровень ряда сравнивается с одним и тем же базисным уровнем. Исчисляемые при этом показатели называются базисными. Для расчета показателей динамики на переменной базе каждый последующий уровень ряда сравнивается с предыдущим . Такие показатели называются цепными.
Абсолютный
прирост – важнейший
Абсолютный
прирост может иметь и
Ускорение
– разность между абсолютным приростом
за данный период и абсолютным приростом
за предыдущий период равной длительности:
Показатель
абсолютного ускорения
Темп роста – распространенный статистический показатель динамики. Он характеризует отношение двух уровней ряда и может выражаться в виде коэффициента или в процентах.
Если темп роста больше единицы (или 100 %) , то это показывает на увеличение изучаемого уровня по сравнению с базисным. Темп роста ,равный единице (или 100%), показывает, что уровень изучаемого периода по сравнению с базисным не изменился. Темп роста меньше единицы (или 100%) показывает на уменьшение уровня изучаемого периода по сравнению с базисным.
Темпы
прироста характеризуют абсолютный
прирост в относительных