Автор: Пользователь скрыл имя, 07 Декабря 2012 в 20:01, курсовая работа
Составление вариационных рядов рассмотрим на следующем примере. Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: урожайностью картофеля и удельным весом сортовых посевов.
Глава 1. Построение и графическое изображение вариационных рядов...3
Порядок построения вариационных рядов и их графическое изображение………………………………………………….....3
Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………....….5
Глава 2. Статистические характеристики рядов распределения………......8
2.1. Показатели центра распределения…………………………….....8
2.2. Показатели колеблемости признака……………………………...9
2.3. Показатели формы распределения……………...………..……..10
2.4. Расчет статистических характеристик рядов распределения с помощью Excel………………………………………………………..12
2.5. Статистические оценки параметров распределения…………...14
2.6. Проверка гипотезы о законе нормального распределения……15
2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel…….17
Глава 3. Корреляционно-регрессионный анализ………………………….19
3.1. Определение параметров уравнения регрессии и показателей тесноты корреляционной связи……………………………….…….19
3.2. Оценка значимости уравнения регрессии и параметров тесноты связи…………………………………………………………………..23
3.3. Корреляционно-регрессионный анализ в Excel…………
Рис.3. Хи тест
В данном примере (рис. 3.) есть неточность, поэтому результаты оценки являются смещёнными. При теоретических частотах меньше 5 необхадимо объединить соседние группы и провести тест заново.
Группа |
Фактические |
Середины |
t |
|
|
Теоретические
частоты |
17,5-21,5 |
9 |
19,5 |
-1,03 |
0,2347 |
18,57 |
4,36 |
21,5-23,5 |
12 |
22,5 |
-0,10 |
0,397 |
18,57 |
7,37 |
23,5-25,5 |
3 |
24,5 |
0,52 |
0,3485 |
18,57 |
6,47 |
|
6 |
27,5 |
1,44 |
0,1415 |
18,57 |
2,63 |
30 |
||||||
ХИ критическое |
11,07 |
|||||
Значимость ХИ |
0,00285 |
<α Нулевая гипотеза принимается | ||||
ХИ фактическое |
18,07561 |
ГЛАВА 3. Корреляционно-регрессионный анализ
3.1. Определение параметров уравнения регрессии и показателей тесноты корреляционной связи
Социально-экономические явления находятся между собой в сложной взаимосвязи, зависимости. По характеру зависимости статистика различает два вида связей:
Корреляционная связь характеризуется тем, что между изменением независимой переменной (факторного признака) и зависимой переменной нет полного соответствия: каждому значению факторного признака может соответствовать распределение значений результативного.
Корреляционная связь
По направлению различают прямые и обратные связи. При прямой связи с увеличением факторного признака увеличивается результативный. При обратной связи с ростом факторного признака значения результативного уменьшаются.
По аналитическому выражению, связи делятся на прямолинейные (линейные) и криволинейные (нелинейные). Линейная связь выражается линейной функцией (уравнением прямой), нелинейная – криволинейной в виде параболы, гиперболы, показательной кривой и т.д.
Функция, отображающая корреляционную связь между признаками, называется уравнением регрессии. Уравнение регрессии выражается функцией .
Уравнения регрессии могут иметь следующую форму.
Уравнение прямой:
Уравнение гиперболы:
Уравнение параболы второго порядка:
Степенное уравнение:
Показательное уравнение:
Многофакторная корреляционная связь чаще всего описывается линейным уравнением множественной регрессии:
Параметр в уравнении прямой называется коэффициентом регрессии. Он показывает, насколько в среднем изменяется величина результативного признака при изменении факторного на единицу. При прямой корреляционной связи коэффициент регрессии имеет положительный знак, при обратной – отрицательный.
Количественная характеристика корреляционной связи дается с помощью ряда статистических показателей – коэффициентов корреляции, регрессии и т.д.
Наиболее распространенным и совершенным методом изучения корреляционных связей является корреляционно-регрессионный анализ. В процессе корреляционно-регрессионного анализа (КРА) решаются следующие задачи:
Параметры уравнения регрессии находятся способом наименьших квадратов. Сущность метода заключается в нахождении параметров уравнения, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических, полученных по выбранному уравнению регрессии, минимальна. Он дает систему нормальных уравнений, решая которую определяют параметры уравнения регрессии.
Для уравнения парной регрессии система нормальных уравнений следующая:
Для гиперболы:
Для параболы второго порядка:
Параметры уравнения множественной регрессии при большом числе факторов рассчитываются на ЭВМ.
Для характеристики тесноты парной корреляционной связи используются в основном два показателя:
Для измерения тесноты линейной связи вычисляется линейный коэффициент корреляции. Статистика разработала ряд формул линейного коэффициента корреляции:
где – среднее квадратическое отклонение по факторному признаку;
где – среднее квадратическое отклонение по результативному признаку.
Линейный коэффициент
корреляции может принимать значение
от минус единицы до плюс единицы.
Положительный коэффициент
Квадрат коэффициента корреляции носит название коэффициента детерминации. Он показывает долю факторного признака в вариации результативного.
Коэффициент корреляции достаточно точно оценивает степень тесноты связи лишь при линейной форме зависимости. Для характеристики тесноты связи любой формы используется корреляционное отношение. Теоретическое корреляционное отношение определяется по формуле:
где – факторная дисперсия – дисперсия теоретических значений результативного признака, т.е. рассчитанных по уравнению регрессии; – дисперсия эмпирических (фактических) значений результативного признака.
Указанные дисперсии исчисляются по формулам:
где – теоретическое значение результативного признака; – среднее значение результативного признака в совокупности; – фактические (эмпирические) значения результативного признака.
При линейной связи корреляционное
отношение может принимать
Параметры уравнения регрессии и коэффициент корреляции могут быть рассчитаны с помощью табличного процессора Excel.
Мы получим результаты вычисления параметров уравнения регрессии, коэффициента корреляции и другие показатели, позволяющие определить значимость коэффициента корреляции и параметров уравнения регрессии.
Для оценки существенности, значимости коэффициента корреляции используется t-критерий Стьюдента.
Находится средняя ошибка коэффициента корреляции по формуле:
На основе ошибки рассчитывается t-критерий:
Рассчитанное значение t-критерия сравнивают с табличным, найденным в таблице распределения Стьюдента при уровне значимости 0,05 или 0,01 и числе степеней свободы n-1. Если расчетное значение t-критерия больше табличного, то коэффициент корреляции признается значимым.
При криволинейной связи
для оценки значимости корреляционного
отношения и уравнения
или
где – корреляционное отношение; n – число наблюдений; m – число параметров в уравнении регрессии.
Рассчитанное значение F сравнивается с табличным для принятого уровня значимости (0,05 или 0,01) и чисел степени свободы и . Если расчетное значение F превышает табличное, связь признается существенной.
Значимость коэффициента регрессии устанавливается с помощью t-критерия Стьюдента, который вычисляется по формуле:
где – дисперсия коэффициента регрессии.
Она вычисляется по формуле:
где k – число факторных признаков в уравнении регрессии.
Коэффициент регрессии признается значимым, если . отыскивается в таблице критических точек распределения Стьюдента при принятом уровне значимости и числе степеней свободы .
3.3. Корреляционно-регрессионный анализ в Excel
Проведём корреляционно-
ВЫВОД ИТОГОВ |
||||||||
Регрессионная статистика |
||||||||
Множественный R |
0,56971 |
|||||||
R-квадрат |
0,32457 |
|||||||
Нормированный R-квадрат |
0,30045 |
|||||||
Стандартная ошибка |
3,13013 |
|||||||
Наблюдения |
30 |
|||||||
Дисперсионный анализ |
||||||||
df |
SS |
MS |
F |
Значимость F |
||||
Регрессия |
1 |
131,8307 |
131,8307 |
13,4553 |
0,0010 |
|||
Остаток |
28 |
274,3360 |
9,7977 |
|||||
Итого |
29 |
406,1667 |
||||||
Коэффициенты |
Стандартная |
t-статистика |
P-Значение |
Нижние |
Верхние |
Нижние |
Верхние | |
Y-пересечение |
-3,5236 |
4,1444 |
-0,8502 |
0,4024 |
-12,0130 |
4,9658 |
-12,0130 |
4,9658 |
Переменная X 1 |
0,6594 |
0,1798 |
3,6681 |
0,0010 |
0,2912 |
1,0277 |
0,2912 |
1,0277 |
Информация о работе Расчетно-графическая работа по математической статистике