Статистический анализ

Автор: Пользователь скрыл имя, 24 Октября 2011 в 14:11, лабораторная работа

Описание работы

При статистическом анализе информации принято считать, что результаты измерений подчиняются нормальному закону распределения. Однако на практике это не всегда верно. Наблюдаются отклонения как односторонние , так и двусторонние. Во избежание искажения значений характеристик распределения при обработке информации необходимо очистить ее от засорения случайными отклонениями.

Работа содержит 1 файл

IVЛина раб.doc

— 464.50 Кб (Скачать)

IV. Статистический анализ в Excel

Исходные  данные: 

Y1 X8 X11 X12 X13 X17
9,26 1,23 26006 167,69 47750 17,72
9,38 1,04 23935 186,1 50391 18,39
12,1 1,8 22589 220,45 43149 26,46
10,8 0,43 21220 169,3 41089 22,37
9,35 0,88 7394 39,53 14257 28,13
9,87 0,57 11586 40,41 22661 17,55
8,17 1,72 26609 102,96 52509 21,92
9,12 1,7 7801 37,02 14903 19,52
5,88 0,84 11587 45,74 25587 23,99
6,3 0,6 9475 40,07 16821 21,76
6,22 0,82 10811 45,44 19459 25,68
5,49 0,84 6371 41,08 12973 18,13
6,5 0,67 26761 136,14 50907 25,74
6,61 1,04 4210 42,39 6920 21,21
4,32 0,66 3557 37,39 5736 22,97
7,37 0,86 14148 101,78 26705 16,38
7,02 0,79 9872 47,55 20068 13,21
8,25 0,34 5975 32,61 11487 14,48
8,15 1,6 16662 103,25 32029 13,38
8,72 1,46 9166 38,95 18946 13,69
6,64 1,27 15118 81,32 28025 16,66
8,1 1,58 11429 67,26 20968 15,06
5,52 0,68 6462 59,92 11049 20,09
9,37 0,86 24628 107,34 45893 15,98
13,1 1,98 49727 512,6 99400 18,27
6,67 0,33 11470 53,81 20719 14,42
5,68 0,45 19448 80,83 36813 22,76
5,22 0,74 18963 59,42 33956 15,41
10 0,03 9185 36,96 17016 19,35
8,16 0,99 17478 91,43 34873 16,83
3,78 0,24 6265 17,16 11237 30,53
6,48 0,57 8810 27,29 17306 17,98
10,4 1,22 17659 184,33 39250 22,09
7,65 0,68 10342 58,42 19074 18,29
8,77 1 8901 59,4 18452 26,05
7 0,81 8402 49,63 17500 26,2
11 1,27 32625 391,27 7888 17,26
9,02 1,14 31160 258,62 58947 18,83
13,2 1,89 46461 75,66 94697 19,7
9,27 0,67 13833 123,68 29626 16,87
6,7 0,96 6391 37,21 11688 14,63
6,69 0,67 11115 53,37 21955 22,17
9,42 0,98 6555 32,87 12243 22,62
7,24 1,16 11085 45,63 20193 26,44
5,39 0,54 9484 48,41 20122 22,26
5,61 1,23 3967 13,58 7612 19,13
5,59 0,78 15283 63,99 27404 18,28
6,57 1,16 20874 104,55 39648 28,23
6,54 4,44 19418 222,11 43799 12,39
4,23 1,06 3351 25,76 6235 11,64
5,22 2,13 6338 29,52 11524 8,62
18 1,21 9756 41,99 17309 20,1
11 2,2 11795 78,11 22225 19,41
 
 

§ 4.1.Очистка  информации от засорения 

      При статистическом анализе информации принято считать, что результаты измерений подчиняются нормальному закону распределения. Однако на практике это не всегда верно. Наблюдаются отклонения как односторонние , так и двусторонние. Во избежание искажения значений характеристик распределения при обработке информации необходимо очистить ее от засорения случайными отклонениями.  Метод выявления аномальных наблюдений и их удаления из совокупности при обработке многомерной статистической информации может привести к отбрасыванию слишком большого количества точек наблюдения. Известны более четко обоснованные методы обнаружения засорения : метод Смирнова–Граббса проверки максимального наблюдения, критерий Граббса для обнаружения одного экстремального наблюдения, критерий исключения нескольких грубых ошибок как обобщение критерия Граббса. Все они применяются к упорядоченной совокупности (вариационному ряду): (N 25).

      Для проверки максимального и минимального  значений на наличие грубой ошибки используются критерии

          и     
  ,
 

где         

  ,  
  ,    
.

При  N>25  экстремальные значения могут быть проверены по критерию S:

 

,

 где   – стандартное отклонение, определенное для всей выборки ;

        – предполагаемый выброс.

При  Sрасч < Sкр  гипотеза  H0: – выброс   отвергается,  в противном случае  экстремальное значение  считается грубой ошибкой и из дальнейшего рассмотрения исключается. Критические значения критерия  S определяются по таблице . При уровне значимости    Sкр так зависит от объема выборки  N :  значениям N = 30 ; 50 ; 100 ; 1000  соответствуют   Sкр =  2,929 ; 3,082 ; 3,283 ; 3,884 .

      Парный  корреляционный и регрессионный  анализ удобно выполнять средствами  Excel и надстройки «Пакет анализа» (в меню – Сервис– Анализ данных ).

      Для наглядности выполним статистический анализ совокупности таких показателей:Y1, X8, X11, X12, X13, X17.

      Для проверки статистических данных на «засорение»  необходимо выполнить следующие действия :

      – скопировать все значения  показателя ( например X12) на чистый лист;

      – упорядочить их по возрастанию, для  чего выделить весь столбец без заголовка и нажать на панели кнопку сортировки  ;

      – установить курсор под последним  значением и ввести функцию Статистическая – СРЗНАЧ, а затем СТАНДОТКЛ , как показано ниже; 

                                                                                   

                J                 K   
47 169,3  
48 184,33  
49 186,1  
50 220,45  
51 222,11  
52 258,62  
53 391,27  
54 512,6  
55 91,87358 ср.знач
56 92,36779 ст.откл
57 4,554904 Sрасч
58 83,78269 ср.знач1
59 71,84395 ст.откл1
60 4,279933 Sрасч1
61 77,75353 ср.знач2
62 57,76451 ст.откл2
63 3,1311 Sрасч2
64 15,37 ср.знач.min
65 2,531442 ст.откл/min
66 0,707107 Sрасч.min
 
 
                           J                                    K 
47 169,3  
48 184,33  
49 186,1  
50 220,45  
51 222,11  
52 258,62  
53 391,27  
54 512,6  
55 =СРЗНАЧ(J2:J54) ср.знач
56 =СТАНДОТКЛОН(J2:J54) ст.откл
57 =(J54-J55)/J56 Sрасч
58 =СРЗНАЧ(J2:J53) ср.знач1
59 =СТАНДОТКЛОН(J2:J53) ст.откл1
60 =(J53-J58)/J59 Sрасч1
61 =СРЗНАЧ(J2:J52) ср.знач2
62 =СТАНДОТКЛОН(J2:J52) ст.откл2
63 =(J52-J61)/J62 Sрасч2
64 =СРЗНАЧ(J2:J3) ср.знач.min
65 =СТАНДОТКЛОН(J2:J3) ст.откл/min
66 =(J3-J64)/J65 Sрасч.min
 
 
 
 

в

ы

ч

и

с

л

и

т

ь

 

з

н

а

ч

е

н

и

е

с

т

а

т

и

с

т

и

к

и 

S

расч 

п

о

 

н

а

й

д

е

н

н

ы

м

 

х

а

р

а

к

т

е

р

и

с

т

и

к

а

м

 

д

л

я

 

н

а

и

б

о

л

ь

ш

е

г

о

 

з

н

а

ч

е

н

и

я

,

к

о

т

о

р

о

е

 

н

у

ж

н

о

 

п

о

д

с

т

а

в

и

т

ь

в

 

ф

о

р

м

у

л

у

 

в

м

е

с

т

о 

x

1

и

п

р

о

в

е

р

и

т

ь

 

г

и

п

о

т

е

з

у

 

H

0

:

н

а

и

б

о

л

ь

ш

е

е

(

п

о

с

л

е

д

н

е

е

 

в

 

с

т

о

л

б

ц

е

)

з

н

а

ч

е

н

и

е

 

в

ы

б

р

о

с

;

      

е

с

л

и 

S

расч

>

S

кр

(0,05; 50) = 3,082

,

э

т

о

 

з

н

а

ч

е

н

и

е

 

я

в

л

я

е

т

с

я

 

в

ы

б

р

о

с

о

м

,

и

 

н

е

о

б

х

о

д

и

м

о

 

п

р

о

в

е

р

и

т

ь

 

п

р

е

д

ы

д

у

щ

е

е

 

з

н

а

ч

е

н

и

е

,

т

о

л

ь

к

о

 

п

р

и

 

э

т

о

м

 

с

л

е

д

у

е

т

 

з

а

н

о

в

о

 

о

п

р

е

д

е

л

и

т

ь

с

р

е

д

н

е

е

 

з

н

а

ч

е

н

и

е

и

 

с

т

а

н

д

а

р

т

н

о

е

 

о

т

к

л

о

н

е

н

и

е,

н

о

у

ж

е

 

и

с

к

л

ю

ч

и

в

в

ы

б

р

о

с,

к

а

к

 

э

т

о

 

и

 

в

ы

п

о

л

н

е

н

о

 

в

 

п

р

и

в

е

д

е

н

н

о

й

 

т

а

б

л

и

ц

е

;

      

п

р

о

в

е

р

к

у

н

а

в

ы

б

р

о

с

с

л

е

д

у

е

т

 

п

р

о

д

о

л

ж

а

т

ь

д

о

п

е

р

в

о

г

о

 

з

н

а

ч

е

н

и

я,

д

л

я

 

к

о

т

о

р

о

г

о

 

г

и

п

о

т

е

з

а 

H

0

о

к

а

ж

е

т

с

я

 

н

е

п

р

а

в

д

о

п

о

д

о

б

н

о

й

,

т

.

е.

д

л

я

 

к

о

т

о

р

о

г

о

з

н

а

ч

е

н

и

е 

S

расч

о

к

а

ж

е

т

с

я

 

м

е

н

ь

ш

е

 

S

кр

;

      

т

а

к

у

ю

ж

е

п

р

о

в

е

р

к

у

н

е

о

б

х

о

д

и

м

о

в

ы

п

о

л

н

и

т

ь

 

и

 

н

а

ч

и

н

а

я

 

с

 

н

а

и

м

е

н

ь

ш

е

г

о

(

п

е

р

в

о

г

о

 

в

 

с

т

о

л

б

ц

е

)

з

н

а

ч

е

н

и

я,

п

о

м

н

я

 

о

 

т

о

м

,

ч

т

о

 

к

р

и

т

е

р

и

й 

S

и

м

е

е

т

д

в

у

с

т

о

р

о

н

н

ю

ю

к

р

и

т

и

ч

е

с

к

у

ю

 

о

б

л

а

с

т

ь

,

и

 

п

о

э

т

о

м

у

 

с

л

е

д

у

е

т

 

р

а

с

с

м

а

т

р

и

в

а

т

ь

 

м

о

д

у

л

ь

S

расч

.

      

Д

л

я

п

р

и

в

е

д

е

н

н

о

г

о

п

р

и

м

е

р

а

 

д

в

а

 

п

о

с

л

е

д

н

и

х

 

з

н

а

ч

е

н

и

я 

Y

2

я

в

л

я

ю

т

с

я

 

в

ы

б

р

о

с

а

м

и.

Э

т

о

 

с

л

е

д

у

е

т

 

и

з

т

а

б

л

Информация о работе Статистический анализ