Автор: Пользователь скрыл имя, 24 Октября 2011 в 14:11, лабораторная работа
При статистическом анализе информации принято считать, что результаты измерений подчиняются нормальному закону распределения. Однако на практике это не всегда верно. Наблюдаются отклонения как односторонние , так и двусторонние. Во избежание искажения значений характеристик распределения при обработке информации необходимо очистить ее от засорения случайными отклонениями.
IV. Статистический анализ в Excel
Исходные
данные:
Y1 | X8 | X11 | X12 | X13 | X17 |
9,26 | 1,23 | 26006 | 167,69 | 47750 | 17,72 |
9,38 | 1,04 | 23935 | 186,1 | 50391 | 18,39 |
12,1 | 1,8 | 22589 | 220,45 | 43149 | 26,46 |
10,8 | 0,43 | 21220 | 169,3 | 41089 | 22,37 |
9,35 | 0,88 | 7394 | 39,53 | 14257 | 28,13 |
9,87 | 0,57 | 11586 | 40,41 | 22661 | 17,55 |
8,17 | 1,72 | 26609 | 102,96 | 52509 | 21,92 |
9,12 | 1,7 | 7801 | 37,02 | 14903 | 19,52 |
5,88 | 0,84 | 11587 | 45,74 | 25587 | 23,99 |
6,3 | 0,6 | 9475 | 40,07 | 16821 | 21,76 |
6,22 | 0,82 | 10811 | 45,44 | 19459 | 25,68 |
5,49 | 0,84 | 6371 | 41,08 | 12973 | 18,13 |
6,5 | 0,67 | 26761 | 136,14 | 50907 | 25,74 |
6,61 | 1,04 | 4210 | 42,39 | 6920 | 21,21 |
4,32 | 0,66 | 3557 | 37,39 | 5736 | 22,97 |
7,37 | 0,86 | 14148 | 101,78 | 26705 | 16,38 |
7,02 | 0,79 | 9872 | 47,55 | 20068 | 13,21 |
8,25 | 0,34 | 5975 | 32,61 | 11487 | 14,48 |
8,15 | 1,6 | 16662 | 103,25 | 32029 | 13,38 |
8,72 | 1,46 | 9166 | 38,95 | 18946 | 13,69 |
6,64 | 1,27 | 15118 | 81,32 | 28025 | 16,66 |
8,1 | 1,58 | 11429 | 67,26 | 20968 | 15,06 |
5,52 | 0,68 | 6462 | 59,92 | 11049 | 20,09 |
9,37 | 0,86 | 24628 | 107,34 | 45893 | 15,98 |
13,1 | 1,98 | 49727 | 512,6 | 99400 | 18,27 |
6,67 | 0,33 | 11470 | 53,81 | 20719 | 14,42 |
5,68 | 0,45 | 19448 | 80,83 | 36813 | 22,76 |
5,22 | 0,74 | 18963 | 59,42 | 33956 | 15,41 |
10 | 0,03 | 9185 | 36,96 | 17016 | 19,35 |
8,16 | 0,99 | 17478 | 91,43 | 34873 | 16,83 |
3,78 | 0,24 | 6265 | 17,16 | 11237 | 30,53 |
6,48 | 0,57 | 8810 | 27,29 | 17306 | 17,98 |
10,4 | 1,22 | 17659 | 184,33 | 39250 | 22,09 |
7,65 | 0,68 | 10342 | 58,42 | 19074 | 18,29 |
8,77 | 1 | 8901 | 59,4 | 18452 | 26,05 |
7 | 0,81 | 8402 | 49,63 | 17500 | 26,2 |
11 | 1,27 | 32625 | 391,27 | 7888 | 17,26 |
9,02 | 1,14 | 31160 | 258,62 | 58947 | 18,83 |
13,2 | 1,89 | 46461 | 75,66 | 94697 | 19,7 |
9,27 | 0,67 | 13833 | 123,68 | 29626 | 16,87 |
6,7 | 0,96 | 6391 | 37,21 | 11688 | 14,63 |
6,69 | 0,67 | 11115 | 53,37 | 21955 | 22,17 |
9,42 | 0,98 | 6555 | 32,87 | 12243 | 22,62 |
7,24 | 1,16 | 11085 | 45,63 | 20193 | 26,44 |
5,39 | 0,54 | 9484 | 48,41 | 20122 | 22,26 |
5,61 | 1,23 | 3967 | 13,58 | 7612 | 19,13 |
5,59 | 0,78 | 15283 | 63,99 | 27404 | 18,28 |
6,57 | 1,16 | 20874 | 104,55 | 39648 | 28,23 |
6,54 | 4,44 | 19418 | 222,11 | 43799 | 12,39 |
4,23 | 1,06 | 3351 | 25,76 | 6235 | 11,64 |
5,22 | 2,13 | 6338 | 29,52 | 11524 | 8,62 |
18 | 1,21 | 9756 | 41,99 | 17309 | 20,1 |
11 | 2,2 | 11795 | 78,11 | 22225 | 19,41 |
§ 4.1.Очистка
информации от засорения
При статистическом анализе информации принято считать, что результаты измерений подчиняются нормальному закону распределения. Однако на практике это не всегда верно. Наблюдаются отклонения как односторонние , так и двусторонние. Во избежание искажения значений характеристик распределения при обработке информации необходимо очистить ее от засорения случайными отклонениями. Метод выявления аномальных наблюдений и их удаления из совокупности при обработке многомерной статистической информации может привести к отбрасыванию слишком большого количества точек наблюдения. Известны более четко обоснованные методы обнаружения засорения : метод Смирнова–Граббса проверки максимального наблюдения, критерий Граббса для обнаружения одного экстремального наблюдения, критерий исключения нескольких грубых ошибок как обобщение критерия Граббса. Все они применяются к упорядоченной совокупности (вариационному ряду): (N 25).
Для проверки максимального и минимального значений на наличие грубой ошибки используются критерии
где
При N>25 экстремальные значения могут быть проверены по критерию S:
где – стандартное отклонение, определенное для всей выборки ;
– предполагаемый выброс.
При Sрасч < Sкр гипотеза H0: – выброс отвергается, в противном случае экстремальное значение считается грубой ошибкой и из дальнейшего рассмотрения исключается. Критические значения критерия S определяются по таблице . При уровне значимости Sкр так зависит от объема выборки N : значениям N = 30 ; 50 ; 100 ; 1000 соответствуют Sкр = 2,929 ; 3,082 ; 3,283 ; 3,884 .
Парный корреляционный и регрессионный анализ удобно выполнять средствами Excel и надстройки «Пакет анализа» (в меню – Сервис– Анализ данных ).
Для наглядности выполним статистический анализ совокупности таких показателей:Y1, X8, X11, X12, X13, X17.
Для проверки статистических данных на «засорение» необходимо выполнить следующие действия :
– скопировать все значения показателя ( например X12) на чистый лист;
– упорядочить их по возрастанию, для чего выделить весь столбец без заголовка и нажать на панели кнопку сортировки ;
–
установить курсор под последним
значением и ввести функцию Статистическая
– СРЗНАЧ, а затем СТАНДОТКЛ , как показано
ниже;
J
K
|
J
|
–
в
ы
ч
и
с
л
и
т
ь
з
н
а
ч
е
н
и
е
с
т
а
т
и
с
т
и
к
и
S
расч
п
о
н
а
й
д
е
н
н
ы
м
х
а
р
а
к
т
е
р
и
с
т
и
к
а
м
д
л
я
н
а
и
б
о
л
ь
ш
е
г
о
з
н
а
ч
е
н
и
я
,
к
о
т
о
р
о
е
н
у
ж
н
о
п
о
д
с
т
а
в
и
т
ь
в
ф
о
р
м
у
л
у
в
м
е
с
т
о
x
1
и
п
р
о
в
е
р
и
т
ь
г
и
п
о
т
е
з
у
H
0
:
н
а
и
б
о
л
ь
ш
е
е
(
п
о
с
л
е
д
н
е
е
в
с
т
о
л
б
ц
е
)
з
н
а
ч
е
н
и
е
–
в
ы
б
р
о
с
;
–
е
с
л
и
S
расч
>
S
кр
(0,05; 50) = 3,082
,
э
т
о
з
н
а
ч
е
н
и
е
я
в
л
я
е
т
с
я
в
ы
б
р
о
с
о
м
,
и
н
е
о
б
х
о
д
и
м
о
п
р
о
в
е
р
и
т
ь
п
р
е
д
ы
д
у
щ
е
е
з
н
а
ч
е
н
и
е
,
т
о
л
ь
к
о
п
р
и
э
т
о
м
с
л
е
д
у
е
т
з
а
н
о
в
о
о
п
р
е
д
е
л
и
т
ь
с
р
е
д
н
е
е
з
н
а
ч
е
н
и
е
и
с
т
а
н
д
а
р
т
н
о
е
о
т
к
л
о
н
е
н
и
е,
н
о
у
ж
е
и
с
к
л
ю
ч
и
в
в
ы
б
р
о
с,
к
а
к
э
т
о
и
в
ы
п
о
л
н
е
н
о
в
п
р
и
в
е
д
е
н
н
о
й
т
а
б
л
и
ц
е
;
–
п
р
о
в
е
р
к
у
н
а
в
ы
б
р
о
с
с
л
е
д
у
е
т
п
р
о
д
о
л
ж
а
т
ь
д
о
п
е
р
в
о
г
о
з
н
а
ч
е
н
и
я,
д
л
я
к
о
т
о
р
о
г
о
г
и
п
о
т
е
з
а
H
0
о
к
а
ж
е
т
с
я
н
е
п
р
а
в
д
о
п
о
д
о
б
н
о
й
,
т
.
е.
д
л
я
к
о
т
о
р
о
г
о
з
н
а
ч
е
н
и
е
S
расч
о
к
а
ж
е
т
с
я
м
е
н
ь
ш
е
S
кр
;
–
т
а
к
у
ю
ж
е
п
р
о
в
е
р
к
у
н
е
о
б
х
о
д
и
м
о
в
ы
п
о
л
н
и
т
ь
и
н
а
ч
и
н
а
я
с
н
а
и
м
е
н
ь
ш
е
г
о
(
п
е
р
в
о
г
о
в
с
т
о
л
б
ц
е
)
з
н
а
ч
е
н
и
я,
п
о
м
н
я
о
т
о
м
,
ч
т
о
к
р
и
т
е
р
и
й
S
и
м
е
е
т
д
в
у
с
т
о
р
о
н
н
ю
ю
к
р
и
т
и
ч
е
с
к
у
ю
о
б
л
а
с
т
ь
,
и
п
о
э
т
о
м
у
с
л
е
д
у
е
т
р
а
с
с
м
а
т
р
и
в
а
т
ь
м
о
д
у
л
ь
S
расч
.
Д
л
я
п
р
и
в
е
д
е
н
н
о
г
о
п
р
и
м
е
р
а
д
в
а
п
о
с
л
е
д
н
и
х
з
н
а
ч
е
н
и
я
Y
2
я
в
л
я
ю
т
с
я
в
ы
б
р
о
с
а
м
и.
Э
т
о
с
л
е
д
у
е
т
и
з
т
а
б
л