Автор: Пользователь скрыл имя, 07 Декабря 2012 в 20:01, курсовая работа
Составление вариационных рядов рассмотрим на следующем примере. Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: урожайностью картофеля и удельным весом сортовых посевов.
Глава 1. Построение и графическое изображение вариационных рядов...3
Порядок построения вариационных рядов и их графическое изображение………………………………………………….....3
Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………....….5
Глава 2. Статистические характеристики рядов распределения………......8
2.1. Показатели центра распределения…………………………….....8
2.2. Показатели колеблемости признака……………………………...9
2.3. Показатели формы распределения……………...………..……..10
2.4. Расчет статистических характеристик рядов распределения с помощью Excel………………………………………………………..12
2.5. Статистические оценки параметров распределения…………...14
2.6. Проверка гипотезы о законе нормального распределения……15
2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel…….17
Глава 3. Корреляционно-регрессионный анализ………………………….19
3.1. Определение параметров уравнения регрессии и показателей тесноты корреляционной связи……………………………….…….19
3.2. Оценка значимости уравнения регрессии и параметров тесноты связи…………………………………………………………………..23
3.3. Корреляционно-регрессионный анализ в Excel…………
Коэффициент вариации – отношение среднего квадратического отклонения к средней:
Зависимость распределения частот от вариации изучаемого признака есть закономерность распределения. Эмпирическое распределение – распределение, полученное в результате обработки данных статистического наблюдения (эмпирического материала). Теоретическое распределение – это распределение частот в гипотетическом вариационном ряду с бесконечно большим числом единиц совокупности и бесконечно малой величиной интервала.
Теоретическая кривая распределения выражает общую закономерность распределения в чистом виде при исключении влияния случайных факторов.
В статистике широко известны
различные виды распределений –
нормальное распределение, биноминальное,
распределение Пуассона и др. Наибольшее
распространение в социально-
В практике статистического
исследования встречаются различные
типы нормального распределения: 1)
одновершинные и
К одновершинным относят
распределения, в которых одна центральная
варианта имеет наибольшую частоту.
Многовершинные – это распределения
с несколькими максимумами
Симметричные – это распределения, в которых частоты вариант, равностоящих от центра, равны между собой. В асимметричных распределениях частоты убывают от центра вправо и влево с разной скоростью (не равны между собой).
Островершинные – эмпирические распределения, максимальная ордината которых больше максимальной ординаты теоретического распределения. В плосковершинных – максимальная ордината эмпирического распределения меньше максимальной ординаты теоретического.
Эмпирические распределения, как правило, асимметричны, то есть смещены по отношению к центру распределения влево и вправо. Для определения направления величины этого смещения применяется коэффициент асимметрии. он может быть рассчитан по формулам:
где – центральный момент третьего порядка;
Положительная величина коэффициента указывает на правостороннюю асимметрию, отрицательная – на левостороннюю.
Островершинность
где – центральный момент четвертого порядка:
Этот коэффициент положителен при островершинности и отрицателен при плосковершинности.
2.4. Расчет статистических характеристик рядов распределения с помощью Excel
Большинство параметров ряда распределения вычисляется с помощью функции Описательная статистика.
Таблица 3
Показатели центра, вариации и формы распределения
Бонитет
почв, |
Урожайность
зерновых, га |
||
Среднее |
22,833 |
Среднее |
11,53 |
Стандартная ошибка |
0,590 |
Стандартная ошибка |
0,68 |
Медиана |
23,000 |
Медиана |
11,25 |
Мода |
23,500 |
Мода |
9,50 |
Стандартное отклонение |
3,233 |
Стандартное отклонение |
3,74 |
Дисперсия выборки |
10,454 |
Дисперсия выборки |
14,01 |
Эксцесс |
-0,884 |
Эксцесс |
-0,05 |
Асимметричность |
0,060 |
Асимметричность |
0,42 |
Интервал |
11,500 |
Интервал |
13,80 |
Минимум |
17,500 |
Минимум |
6,20 |
Максимум |
29,000 |
Максимум |
20,00 |
Сумма |
685,000 |
Сумма |
346,00 |
Счет |
30,000 |
Счет |
30,00 |
Уровень надежности(95,0%) |
1,207 |
Уровень надежности(95,0%) |
1,40 |
В данной таблице представлены показатели центра распределения – средняя арифметическая, мода и медиана, показатели вариации – диспресия и среднее квадратическое отклонение, показатели формы распределения – коэффициенты асимметрии и эксцесса. Среднее – это средняя арифметическая величина, стандартная ошибка – это средняя ошибка выборки, стандартное отклонение – среднее квадратическое отклонение, эксцесс и асимметричность – коэффициенты эксцесса и асимметрии, интервал – разность между максимальным и минимальным значениями признака в совокупности, минимум – минимальное значение признака, максимум – максимальное значение признака, сумма – сумма всех значений признака, счёт – число единиц совокупности.
На основе приведенных в таблице данных вычислим коэффициент вариации.
Для урожайности зерновых:
Для бонитета почв:
Выводы. В данной совокупности сельскохозяйственных предприятий средняя урожайность зерновых составляет 11,53%, а средний бонитет почв – 22,83 ц/га.
Медиана Ме=11,25 показывает, что половина сельскохозяйственных предприятий совокупности имеет урожайность зерновых меньше 11,25, а половина – больше 11,25%; медиана Ме=23, что половина сельскохозяйственных предприятий имеет бонитет почв меньше 230 ц/га, а половина – больше 230 ц/га.
Мода Мо=9,5 показывает, что наиболее часто в данной совокупности встречается урожайность зерновых 9,5 %, мода Мо=23,5, что бонитет почв 23,5 ц/га имеет наибольшее число хозяйств.
Коэффициенты вариации свидетельствуют о слабой вариации бонитета почв, так как коэффициент меньше 20%; а урожайность зерновых обладает умеренной вариацией, так как её коэффициент вариации более 20%.
Коэффициенты эксцесса показывают, что распределение хозяйств по бонитету почв и по урожайности зерновых является плосковершинными, так как Ех<0 в обоих признаках.
По коэффициентам асимметрии можно сделать вывод о том, что распределение хозяйств по урожайности зерновых и по бонитету почв имеют правую асимметричность (As>0).
2.5. Статистические оценки параметров распределения
Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.
Статистической оценкой называется специальная функция, вычисляемая на основании выборочных данных для приближенной замены неизвестного параметра распределения или самого распределения. Различают оценки смещённые и несмещённые, точечные и интервальные.
Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.
Стандартная ошибка выборочной средней определяется по формуле:
Точечной оценкой генеральной
средней является выборочная средняя
Для определения интервальной оценки необходимо найти доверительный интервал ,
где – предельная ошибка выборочной средней; и – коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным и при малой выборке n <=30 (приложение 4).
Найдем доверительный интервал с помощью статистической функции – ДОВЕРИТ.
Для урожайности зерновых =0,05, =1, n=30, найдем предельную ошибку выборки. Она равна 0,358. С её помощью строим доверительный интервал для генеральной средней:
Вывод: с вероятностью 0,95 мы можем утверждать, что генеральная средняя не выйдет за пределы от 11,2 до 11,9%.
Аналогичные действия выполним для бонитета почв. Соответственно, =0,05, =0,87, n=30. Предельная ошибка выборки равна 0,31. Строим доверительный интервал:
Вывод: с вероятность 0,95 можно утверждать, что средний бонитет почв находится в интервале от 22,52 до 23,14 ц/га.
2.6. Проверка гипотезы о законе нормального распределения
Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Романовского, Смирнова и др. Мы рассмотрим критерий Пирсона.
Критерий Пирсона (хи-квадрат) определяется по формуле:
где (хи-квадрат) – критерий Пирсона; – эмпирические частоты; – теоретические частоты.
Теоретические частоты вычисляются по формуле:
где – теоретические частоты; – фактические частоты; – шаг (величина интервала); – нормированные отклонения; – значения функции плотности стандартизированного нормального распределения (приложение 2).
Вычисления выполняются
в следующей
отыскиваются значения
функции плотности стандартизир
Рассчитанное значение
критерия сравнивается с табличными
при соответствующем числе
Возможен вариант проверки гипотезы соответствия эмпирического распределения теоретическому с помощью таблиц определения вероятности . В таблице распределения Пирсона (приложение 9) по рассчитанной величине и числу степеней свободы v=к-1 находим вероятность . При P>0.5 считается, что эмпирическое и теоретическое распределения близки. В остальных случаях делается вывод о несовпадении эмпирического и теоретического распределений.
2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel
Вместо заполнения большого количества таблиц можно воспользоваться статистическими функциями.
Проверку гипотезы о законе нормального распределения выполним на примере интервального вариационного ряда (табл. 2) и статистических характеристик ряда (табл. 3).
Группа |
Фактические |
Середины |
t |
|
|
Теоретические
частоты |
17,5-19,5 |
5 |
18,5 |
-1,34 |
0,1626 |
18,57 |
3,02 |
19,5-21,5 |
4 |
20,5 |
-0,72 |
0,3079 |
18,57 |
5,72 |
21,5-23,5 |
12 |
22,5 |
-0,10 |
0,3970 |
18,57 |
7,37 |
23,5-25,5 |
3 |
24,5 |
0,52 |
0,3485 |
18,57 |
6,47 |
25,5-27,5 |
5 |
26,5 |
1,13 |
0,2107 |
18,57 |
3,91 |
27,5-29,5 |
1 |
28,5 |
1,75 |
0,0863 |
18,57 |
1,60 |
|
30 |
|||||
ХИ критическое |
11,07 |
|||||
Значимость ХИ |
0,2125132 |
<α Нулевая гипотеза принимается |
||||
ХИ фактическое |
7,1110264 |
Информация о работе Расчетно-графическая работа по математической статистике