Автор: Пользователь скрыл имя, 23 Декабря 2011 в 09:07, курсовая работа
Изменения в экономической и социальной жизни, вызванные кардинальным характером проводимых реформ, не могут не учитываться в статистической практике. За последние годы без преувеличения наболевшей стала для нас проблема уровня жизни населения, которая неразрывно связана с материальной обеспеченностью народа. Эти вопросы рассматривает такая отрасль статистической науки как статистика доходов и расходов населения.
Цель курсового работы – изучение источников данных и задач социальной статистики, характеристики уровня жизни населения Амурской области в 2000 - 2010 году, основных показателей и методов расчета, построение модели изменения на будущий период на основе имеющихся данных.
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
2.5.
Проверка гипотез относительно
коэффициентов линейного
1) t-статистика. Критерий Стьюдента.
С
помощью МНК мы получили лишь оценки
параметров уравнения регрессии, которые
характерны для конкретного
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.
В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Найденное по данным наблюдений значение t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).
Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое в случае линейной парной регрессии равно (n-2), n-число наблюдений.
Если фактическое значение t-критерия больше табличного (по модулю), то основную гипотезу отвергают и считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо отличается от нуля.
Если фактическое значение t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при уровне значимости α.
tкрит
(n-m-1;α/2) = (9;0.025) = 2.262
Поскольку
6.4 > 2.262, то статистическая значимость
коэффициента регрессии b подтверждается
(отвергаем гипотезу о равенстве нулю
этого коэффициента).
Поскольку 14.44 > 2.262, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).
Доверительный интервал для коэффициентов уравнения регрессии.
Определим
доверительные интервалы
(b - tкрит Sb; b + tкрит Sb)
(0.181 - 2.262 • 0.0283; 0.181 + 2.262 • 0.0283)
(0.117;0.2449)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
(a - tкрит Sa; a + tкрит Sa)
(-4940.4944 - 2.262 • 342.19; -4940.4944 + 2.262 • 342.19)
(-5714.5274;-4166.4615)
С вероятностью 95% можно утверждать, что значение данного параметра будут лежать в найденном интервале.
2) F-статистика. Критерий Фишера.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если
расчетное значение с k1=(m) и k2=(n-m-1)
степенями свободы больше табличного
при заданном уровне значимости, то модель
считается значимой.
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
2.
Далее определяют фактическое значение
F-критерия:
где m=1 для парной регрессии.
3.
Табличное значение
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=1 и k2=9, Fтабл = 5.12
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Связь
между F-критерием Фишера и t-статистикой
Стьюдента выражается равенством:
Дисперсионный анализ.
При
анализе качества модели регрессии
используется теорема о разложении
дисперсии, согласно которой общая
дисперсия результативного
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:
∑(yi - ycp)2 = ∑(y(x) - ycp)2 + ∑(y - y(x))2
где
∑(yi - ycp)2 - общая сумма квадратов отклонений;
∑(y(x) - ycp)2 - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
∑(y - y(x))2 - остаточная сумма квадратов отклонений.
Таблица 41 - Результаты дисперсионного анализа средствами MS Excel
Источник вариации | Сумма квадратов | Число степеней свободы | Дисперсия на 1 степень свободы | F-критерий |
Модель | 13843322.45 | 1 | 13843322.45 | 40.93 |
Остаточная | 3043946.28 | 9 | 338216.25 | 1 |
Общая | 16887268.73 | 11-1 |
Проверка на наличие автокорреляции остатков.
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В
экономических задачах
Отрицательная
автокорреляция фактически означает,
что за положительным отклонением
следует отрицательное и
Последствия автокорреляции схожи с последствиями гетероскедастичности: выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
Обнаружение автокорреляции
Коэффициент
автокорреляции вычисляется по формуле:
Если коэффициент автокорреляции rei < 0.5, то есть основания утверждать, что автокорреляция отсутствует.
Критерий Дарбина-Уотсона является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин ei.
Таблица 42 - Расчетная
y | y(x) | ei = y-y(x) | e2 | (ei - ei-1)2 |
-4099 | -4536.57 | 437.57 | 191468.46 | 0 |
-3978 | -4371.04 | 393.04 | 154476.72 | 1983.44 |
-4106 | -4091.43 | -14.57 | 212.38 | 166144.79 |
-3774 | -3867.41 | 93.41 | 8724.83 | 11659.71 |
-4268 | -3609.82 | -658.18 | 433200.71 | 564882.47 |
-4300 | -3241.02 | -1058.98 | 1121439.1 | 160640.94 |
-3244 | -2929.96 | -314.04 | 98620.17 | 554938.2 |
-1523 | -2491.4 | 968.4 | 937805.84 | 1644658.09 |
-1881 | -1924.91 | 43.91 | 1928.28 | 854684.64 |
-1232 | -1498.95 | 266.95 | 71261.65 | 49745.31 |
-1261 | -1103.49 | -157.51 | 24808.13 | 180161.84 |
3043946.28 | 4189499.42 |
Информация о работе Статистика уровня жизни населения Амурской области