Статистический анализ

Автор: Пользователь скрыл имя, 04 Марта 2013 в 18:46, контрольная работа

Описание работы

1. Исходные данные
Дана последовательность результатов соревнований на 5-том этапе кубка мира по биатлону 2011/2012 среди мужчин на дистанции 12км. Объем выборки n=100;
Для исключения ложных результатов воспользуемся таблицей распределения Стьюдента.
Подставляя наши значения, получаем, что выполняется неравенство (4), следовательно, рассматриваемые значения не исключаем. В исходной выборке нет ложных результатов.

Содержание

Исходные данные……………………………………………...........3
Исключение ложных результатов в выборке……………………..4
Оценка числовых характеристик распределения…………………5
Статистическая проверка случайности и независимости
результатов наблюдений…………………………………………...6
Проверка нормальности распределения…………………………...7
Построение гистограммы, полигона и кумулянты………………..8
Проверка согласия опытных данных с нормальным законно
распределения по критерию………………………………………..10
Проверка согласия опытных данных с нормальным законом
распределения по критерию Колмогорова………………………..13
Графики функций плотности и распределения…………………..14

Работа содержит 1 файл

1-ая работа.doc

— 365.50 Кб (Скачать)


Содержание

 

  1. Исходные данные……………………………………………...........3
  2. Исключение ложных результатов в выборке……………………..4
  3. Оценка числовых характеристик распределения…………………5
  4. Статистическая проверка случайности и независимости

 результатов наблюдений…………………………………………...6

  1. Проверка нормальности распределения…………………………...7
  2. Построение гистограммы, полигона и кумулянты………………..8
  3. Проверка согласия опытных данных с нормальным законно

распределения по критерию………………………………………..10

  1. Проверка согласия опытных данных с нормальным законом

распределения по критерию Колмогорова………………………..13

  1. Графики функций плотности и распределения…………………..14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Исходные данные

 

Дана последовательность результатов соревнований на 5-том  этапе кубка мира по биатлону 2011/2012 среди мужчин на дистанции 12км.

Объем выборки n=100;

                                 

28,06

 

27,50

 

31,07

 

27,28

29,25

 

31,41

 

31,10

 

27,54

30,22

 

28,15

 

27,45

 

28,12

31,27

 

32,29

 

28,47

 

31,14

27,22

 

28,01

 

28,20

 

32,13

28,52

 

27,15

 

29,41

 

30,32

29,13

 

30,31

 

31,21

 

27,13

29,47

 

28,09

 

32,18

 

30,22

30,53

 

27,33

 

28,24

 

29,19

32,12

 

30,40

 

29,53

 

29,52

28,25

 

28,38

 

29,22

 

30,04

29,04

 

29,06

 

30,30

 

29,32

29,20

 

30,48

 

29,21

 

30,39

32,41

 

29,23

 

31,21

 

27,36

27,42

 

28,56

 

29,16

 

29,50

30,02

 

30,02

 

29,46

 

30,16

30,36

 

31,59

 

30,04

 

29,49

28,57

 

31,59

 

28,26

 

29,24

29,12

 

29,30

 

28,59

 

28,36

29,01

 

29,30

 

30,57

 

29,06

29,37

 

31,18

 

29,36

 

31,28

31,41

 

29,37

 

30,42

 

28,57

28,27

 

30,11

 

30,40

 

29,12

29,34

 

29,12

 

29,04

 

29,34

29,34

 

29,18

 

28,55

 

32,04


 

 

 

 

 

 

 

  1. Исключение ложных результатов в выборке

 

Для исключения ложных результатов  воспользуемся таблицей распределения  Стьюдента.

                                                               (1)

                                                             (2)                   

Критерием проверки будут  служить неравенства:

                                                                                                            (3)

                                                                           (4)

                                                                                                             (5)

Из таблицы распределения  Стьюдента получаем 

Подставляя наши значения, получаем, что выполняется неравенство (4), следовательно, рассматриваемые  значения не исключаем. В исходной выборке  нет ложных результатов.

 

 

 

  1. Оценка числовых характеристик распределения:

 

  1. Среднее арифметическое: 
  2. Эмпирическая дисперсия:
  3. Среднеквадратическое отклонение:
  4. Коэффициент вариации:
  5. Коэффициент асимметрии:
  6. Коэффициент эксцесса:

 

 

 

 

 

 

 

  1. Статистическая проверка случайности и независимости результатов наблюдений

 

    1. Критерий серий, основанный на медиане выборки:

где […] – целевая часть, - число серий, - длина самой длинной серии.

 

 оба неравенства выполнены, следовательно исходные данные являются стохастически независимыми.

 

    1. Критерий  “восходящих“ и “нисходящих“ серий

 

 оба неравенства выполнены, следовательно исходные данные являются стохастически независимыми.

 

 

 

 

  1. Проверка нормальности распределения

 

1. Критерий, основанный  на вычислении среднего абсолютного  отклонения (САО)

неравенство выполнено, следовательно, выборка имеет приближенно нормальный закон распределения.

 

2. Критерий, основанный  на анализе показателей ассиметрии  и эксцесса

 

т.к. оба неравенства  выполняются, следовательно, гипотеза о нормальном законе может быть принята.

 

 

  1. Построение гистограммы, полигона и кумулянты

 

Разделим данные выборки на классы и построим полигон, гистограмму и кумулянту частот. Для этого выполним следующие преодразования:

    1. находим и
    2. наблюдений;
    3. Определяем длину интервала разбиений:

 

    1. Разбиваем массив данных на интервалы и вычисляем частоту. Результаты этой операции представляем таблица 1.

Таблица 1

Интервалы

Середина  
интервала

Частоты

абсолютные

относительные

относительные 
накопительные

27

28

27,5

10

0,10

0,10

28

29

28,5

19

0,19

0,29

29

30

29,5

34

0,34

0,63

30

31

30,5

19

0,19

0,82


 

продолжение Таблицы 1

31

32

31,5

12

0,12

0,94

32

33

32,5

6

0,06

1,00


 

    1. После составления таблица 1, строим полигон, гистограмму и кумулянту распределения результатов наблюдения:

 

Рис.1 Полигон распределения

 

Рис.2 Гистограмма распределения

 

Рис.3 Кумулянта распределения

 

По виду гистограммы  подбираем закон распределения случайной величины. В данной работе имеем гистограмму близкую к гистограмме нормального закона распределения.

 

Нормальный закон:

              

Проверим по критериям  согласия, будут ли опытные данные согласовываться с нормальным законом распределения.

 

  1. Проверка согласия опытных данных с нормальным законом распределения по критерию χ2

 

где r – число интервалов, на которые разбиты исходные опытные данные;

ni – число опытных данных, попавших в i-тый интервал (абсолютная частота);

ni! – теоретическое число, попавшее в i-тый интервал.

  где n – объем выборки.

В случае нормального  закона

где (значения данной функции берутся из таблицы ее значений).

Для первого интервала  левый конец изменим на -∞, а для последнего интервала правый конец на +∞. Таким образом, первый интервал будет (-∞;28), а последний (32; +∞). Расчет приведен в таблицах 2,3,4.

 Таблица 2

i

Границы 
интервала

Границы интервалов

1

-∞

28

-

-1,5054

-∞

-1,145862

2

28

29

-1,5054

-0,5054

-1,145862

-0,384694

3

29

30

-0,5054

0,4946

-0,384694

0,376474

4

30

31

0,4946

1,4946

0,376474

1,137642

5

31

32

1,4946

2,4946

1,137642

1,898810

6

32

+∞

2,4946

+

1,898810

+∞


 

 

 

Таблица 3

i

Границы интервала

1

-∞

-1,145862

-0,5

-0,3738

0,1262

12,62

2

-1,145862

-0,384694

-0,3738

-0,1494

0,2243

22,43

3

-0,384694

0,376474

-0,1494

0,1464

0,2958

29,58

4

0,376474

1,137642

0,1464

0,3721

0,2257

22,57

5

1,137642

1,898810

0,3721

0,4712

0,0991

9,91

6

1,898810

+∞

0,4712

0,5000

0,0288

2,88


 

 

Таблица 4

i

1

10

12,62

-2,62

6,8854

0,5454

100

7,9214

2

19

22,43

-3,43

11,7924

0,5256

361

16,0916

3

34

29,58

4,42

19,5011

0,6592

1156

39,0752

4

19

22,57

-3,57

12,7092

0,5632

361

15,9982

5

12

9,91

2,09

4,3597

0,4398

144

14,5278

6

6

2,88

3,12

9,7282

3,3767

36

12,4957

100

100

   

=6,1100

 

106,1100

Информация о работе Статистический анализ