Расчетно-графическая работа по математической статистике

Автор: Пользователь скрыл имя, 07 Декабря 2012 в 20:01, курсовая работа

Описание работы

Составление вариационных рядов рассмотрим на следующем примере. Имеем статистическую совокупность из 30 сельскохозяйственных организаций, охарактеризованных двумя признаками: урожайностью картофеля и удельным весом сортовых посевов.

Содержание

Глава 1. Построение и графическое изображение вариационных рядов...3
Порядок построения вариационных рядов и их графическое изображение………………………………………………….....3
Методика построения вариационных рядов и их графиков с помощью электронных таблиц Excel……………………....….5
Глава 2. Статистические характеристики рядов распределения………......8
2.1. Показатели центра распределения…………………………….....8
2.2. Показатели колеблемости признака……………………………...9
2.3. Показатели формы распределения……………...………..……..10
2.4. Расчет статистических характеристик рядов распределения с помощью Excel………………………………………………………..12
2.5. Статистические оценки параметров распределения…………...14
2.6. Проверка гипотезы о законе нормального распределения……15
2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel…….17
Глава 3. Корреляционно-регрессионный анализ………………………….19
3.1. Определение параметров уравнения регрессии и показателей тесноты корреляционной связи……………………………….…….19
3.2. Оценка значимости уравнения регрессии и параметров тесноты связи…………………………………………………………………..23
3.3. Корреляционно-регрессионный анализ в Excel…………

Работа содержит 1 файл

Шевчук Ксения Б-ЭК-Б-301.doc

— 723.00 Кб (Скачать)

Коэффициент вариации –  отношение среднего квадратического  отклонения к средней:

.

 

    1. Показатели формы распределения

 

Зависимость распределения  частот от вариации изучаемого признака есть закономерность распределения. Эмпирическое распределение – распределение, полученное в результате обработки данных статистического наблюдения (эмпирического материала). Теоретическое распределение – это распределение частот в гипотетическом вариационном ряду с бесконечно большим числом единиц совокупности и бесконечно малой величиной интервала.

Теоретическая кривая распределения  выражает общую закономерность распределения  в чистом виде при исключении влияния  случайных факторов.

В статистике широко известны различные виды распределений –  нормальное распределение, биноминальное, распределение Пуассона и др. Наибольшее распространение в социально-экономических  явлениях имеет нормальное распределение, выражающее закономерности взаимодействия случайных величин. Оно служит удачной моделью, с которой сравнивают анализируемое эмпирическое распределение. Если расхождения не велики, то их объясняют действием случайных факторов и считают данное распределение близким к нормальному. В противном случае делают вывод о несоответствии рассматриваемого распределения нормальному.

В практике статистического  исследования встречаются различные  типы нормального распределения: 1) одновершинные и многовершинные; 2) симметричные и ассиметричные; 3) островершинные и плосковершинные.

К одновершинным относят  распределения, в которых одна центральная  варианта имеет наибольшую частоту. Многовершинные – это распределения  с несколькими максимумами частот.

Симметричные – это  распределения, в которых частоты  вариант, равностоящих от центра, равны между собой. В асимметричных распределениях частоты убывают от центра вправо и влево с разной скоростью (не равны между собой).

Островершинные –  эмпирические распределения, максимальная ордината которых больше максимальной ординаты теоретического распределения. В плосковершинных – максимальная ордината эмпирического распределения меньше максимальной ординаты теоретического.

Эмпирические распределения, как правило, асимметричны, то есть смещены по отношению к центру распределения влево и вправо. Для определения направления величины этого смещения применяется коэффициент асимметрии. он может быть рассчитан по формулам:

; или 
,

где – центральный момент третьего порядка;

Положительная величина коэффициента указывает на правостороннюю асимметрию, отрицательная – на левостороннюю.

Островершинность распределения  характеризуется с помощью коэффициента эксцесса :

,

где – центральный момент четвертого порядка:

Этот коэффициент положителен  при островершинности и отрицателен  при плосковершинности.

 

2.4. Расчет статистических характеристик рядов распределения с помощью Excel

 

Большинство параметров ряда распределения вычисляется  с помощью функции Описательная статистика.

Таблица 3

Показатели центра, вариации и формы распределения

Бонитет почв, 
x

 

Урожайность зерновых,  га 
y

 
       

Среднее

22,833

Среднее

11,53

Стандартная ошибка

0,590

Стандартная ошибка

0,68

Медиана

23,000

Медиана

11,25

Мода

23,500

Мода

9,50

Стандартное отклонение

3,233

Стандартное отклонение

3,74

Дисперсия выборки

10,454

Дисперсия выборки

14,01

Эксцесс

-0,884

Эксцесс

-0,05

Асимметричность

0,060

Асимметричность

0,42

Интервал

11,500

Интервал

13,80

Минимум

17,500

Минимум

6,20

Максимум

29,000

Максимум

20,00

Сумма

685,000

Сумма

346,00

Счет

30,000

Счет

30,00

Уровень надежности(95,0%)

1,207

Уровень надежности(95,0%)

1,40


 

В данной таблице представлены показатели центра распределения – средняя арифметическая, мода и медиана, показатели вариации – диспресия и среднее квадратическое отклонение, показатели формы распределения – коэффициенты асимметрии и эксцесса. Среднее – это средняя арифметическая величина, стандартная ошибка – это средняя ошибка выборки, стандартное отклонение – среднее квадратическое отклонение, эксцесс и асимметричность – коэффициенты эксцесса и асимметрии, интервал – разность между максимальным и минимальным значениями признака в совокупности, минимум – минимальное значение признака, максимум – максимальное значение признака, сумма – сумма всех значений признака, счёт – число единиц совокупности.

На основе приведенных в таблице  данных вычислим коэффициент вариации.

Для урожайности зерновых:

Для бонитета почв:

Выводы. В данной совокупности сельскохозяйственных предприятий средняя урожайность зерновых составляет 11,53%, а средний бонитет почв – 22,83 ц/га.

Медиана Ме=11,25 показывает, что половина сельскохозяйственных предприятий совокупности имеет урожайность зерновых меньше 11,25, а половина – больше 11,25%; медиана Ме=23, что половина сельскохозяйственных предприятий имеет бонитет почв меньше 230 ц/га, а половина – больше 230 ц/га.

Мода Мо=9,5 показывает, что наиболее часто в данной совокупности встречается урожайность зерновых 9,5 %, мода Мо=23,5, что бонитет почв 23,5 ц/га имеет наибольшее число хозяйств.

Коэффициенты вариации свидетельствуют  о слабой вариации бонитета почв, так как коэффициент меньше 20%; а урожайность зерновых обладает умеренной вариацией, так как её коэффициент вариации более 20%.

Коэффициенты эксцесса показывают, что распределение хозяйств по бонитету почв и по урожайности зерновых является плосковершинными, так как Ех<0 в обоих признаках.

По коэффициентам асимметрии можно сделать вывод о том, что распределение хозяйств по урожайности зерновых и по бонитету почв имеют правую асимметричность (As>0).

 

2.5. Статистические оценки параметров распределения

 

Изучаемую совокупность можно считать выборкой из генеральной совокупности, состоящей из большого множества сельскохозяйственных предприятий. На основе показателей, рассчитанных по выборке, дают статистическую оценку параметров генеральной совокупности.

Статистической оценкой называется специальная функция, вычисляемая на основании выборочных данных для приближенной замены неизвестного параметра распределения или самого распределения. Различают оценки смещённые и несмещённые, точечные и интервальные.

Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.

Стандартная ошибка выборочной средней  определяется по формуле:

Точечной оценкой генеральной  средней является выборочная средняя 

.

Для определения интервальной оценки необходимо найти доверительный интервал ,

где – предельная ошибка выборочной средней; и – коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным и при малой выборке n <=30 (приложение 4).

Найдем доверительный интервал с помощью статистической функции  – ДОВЕРИТ.

Для урожайности зерновых =0,05, =1, n=30, найдем предельную ошибку выборки. Она равна 0,358. С её помощью строим доверительный интервал для генеральной средней:

Вывод: с вероятностью 0,95 мы можем утверждать, что генеральная средняя не выйдет за пределы от 11,2 до 11,9%.

Аналогичные действия выполним для бонитета почв. Соответственно, =0,05, =0,87, n=30. Предельная ошибка выборки равна 0,31. Строим доверительный интервал:

Вывод: с вероятность 0,95 можно утверждать, что средний бонитет почв находится в интервале от 22,52 до 23,14 ц/га.

 

2.6. Проверка  гипотезы о законе нормального  распределения

 

Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Романовского, Смирнова и др. Мы рассмотрим критерий Пирсона.

Критерий Пирсона (хи-квадрат) определяется по формуле:

,  (1)

где (хи-квадрат) – критерий Пирсона; – эмпирические частоты; – теоретические частоты.

Теоретические частоты  вычисляются по формуле:

,  (2)

где – теоретические частоты; – фактические частоты; – шаг (величина интервала); – нормированные отклонения; – значения функции плотности стандартизированного нормального распределения (приложение 2).

Вычисления выполняются  в следующей последовательности.

  1. Определяются нормированные отклонения:

  (3)

  1. При рассчитанных значениях по таблице плотности нормального распределения (значений дифференциальной функции )

отыскиваются значения функции плотности стандартизированного нормального распределения.

  1. Вычисляется выражение .
  2. По приведённой выше формуле (1) рассчитывается критерий Пирсона.
  3. Подставляя в формулу значения и , определяют теоретические частоты.

Рассчитанное значение критерия сравнивается с табличными при соответствующем числе степени  свободы и заданном уровне значимости. Если расчетное значение меньше табличного, то делается вывод о несущественности расхождений между эмпирическим и теоретическим распределением (т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, принимается). В противном случае утверждается, что исследуемое эмпирическое распределение имеет отличный от теоретического закон распределения.

Возможен вариант проверки гипотезы соответствия эмпирического  распределения теоретическому с  помощью таблиц определения вероятности  . В таблице распределения Пирсона (приложение 9) по рассчитанной величине и числу степеней свободы v=к-1 находим вероятность . При P>0.5 считается, что эмпирическое и теоретическое распределения близки. В остальных случаях делается вывод о несовпадении эмпирического и теоретического распределений.

 

2.7. Проверка гипотезы о законе нормального распределения по критерию Пирсона с помощью табличного процессора Excel

 

Вместо заполнения большого количества таблиц можно воспользоваться  статистическими функциями.

Проверку гипотезы о  законе нормального распределения выполним на примере интервального вариационного ряда (табл. 2) и статистических характеристик ряда (табл. 3).

Группа 
предприятий по бонитету почв

Фактические 
частоты 
ni

Середины 
интервалов

t

Теоретические частоты 
nt

17,5-19,5

5

18,5

-1,34

0,1626

18,57

3,02

19,5-21,5

4

20,5

-0,72

0,3079

18,57

5,72

21,5-23,5

12

22,5

-0,10

0,3970

18,57

7,37

23,5-25,5

3

24,5

0,52

0,3485

18,57

6,47

25,5-27,5

5

26,5

1,13

0,2107

18,57

3,91

27,5-29,5

1

28,5

1,75

0,0863

18,57

1,60

30

         

ХИ критическое

11,07

         

Значимость  ХИ

0,2125132

<α Нулевая гипотеза принимается

   

ХИ фактическое

7,1110264

         

Информация о работе Расчетно-графическая работа по математической статистике