Автор: Пользователь скрыл имя, 10 Октября 2011 в 13:59, контрольная работа
Критерии Манна-Уитни и Вилкоксона
Введение;
Основная информация о критерии Манна — Уитни:
2.1 Ограничения применимости критерия,
2.2 Использование критерия;
U критерий Манна-Уитни:
3.1 Пример расчета U-критерия Манна-Уитни "№1",
3.2 Пример расчета U-критерия Манна-Уитни "№2";
Критерий Вилкоксона:
4.1 Описание критерия,
4.2 Алгоритм,
4.3. Пример "№1",
4.4. Пример "№2";
Вывод;
Список литературы.
3.2 Пример расчета U-критерия Манна-Уитни "№2"
Сравнению подлежат результаты контрольной
работы выборки «А» из 4-х школьников,
посещавших специальные занятия, и выборки
«Б», состоящей из 7 школьников, никаких
занятий не посещавших. Последовательность
действий, для вычисления критерия Манна-Уитни
такова.
1. Проранжировать
число успешно решенных
заданий, объединив
обе выборки.
Значение | 3 | 3 | 4 | 4 | 5 | 5 | 6 | 7 | 8 | 9 | 10 | |
Ранг | 6 | 6 | 4 | 4 | 2 | 2 | 5 | 1 | 3 | 2 | 1 | |
Выборка | Б | Б | Б | Б | Б | Б | А | Б | А | А | А | |
R1 | 7 | 9 | 10 | 11 | ∑ = 37 | |||||||
R2 | 1 | 2 |
3 |
4 |
5 |
6 |
8 |
∑ = 29 |
Кол-во случаев
в первой выборке: n1=4
Кол-во случаев во второй выборке: n2 = 7
Всего случаев: N = 4+7 = 11
Сумма рангов первой выборки: R1 = 37
Сумма рангов второй выборки: R2 = 29
Для проверки вычисляем: R1+R2= (N/2)*(1+N); 37+29
= 11/2 * (1+11);
66 = 66. Расчеты верны
2. Находим эмпирическое
значение U-критерия.
Для этого вычисляем два значения:
U1= n1 * n2 + (n1*(n1 + 1) / 2) – R1
U2= n1 * n2 + (n2*(n2 + 1) / 2) – R2
Эмпирическим считается наименьшее из
U1 и U2.
U1 = 4 * 7 + 4*(4+1)/2 – 37 = 27
U2 = 4 * 7 + 7*(7+1)/2 – 29 = 31
Эмпирическое значение U=27
3. Ищем критическое
значение по
таблице.
Число на пересечении размера наибольшей
выборки (size of the largest sample) и и наименьшей
выборки (size of the smallest sample) является критическим
значением коэффициента Манна-Уитни. В
нашем случае размер наибольшей выборки
7, наименьшей – 4.
Находим критическое значение при p≤0,05
Uкрит = 3.
4. Делаем вывод.
Полученное эмпирическое значение больше
критического (27>3), значит различия достоверны.
Различия достоверны (U=27; p≤0,05)
Т-Критерий Уилкоксона - непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Уилкоксоном.
Другие названия: W критерий Уилкоксона, критерий знаковых рангов Уилкоксона, критерий суммы рангов Уилкоксона, Критерий Уилкоксона для связных выборок .
Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.
Критерий Вилкоксона - один из самых известных инструментов непараметрической статистики (наряду со статистиками типа Колмогорова-Смирнова и коэффициентами ранговой корреляции). Свойствам этого критерия и таблицам его критических значений уделяется место во многих монографиях по математической и прикладной статистике (см., например, [1-3]).
Однако в литературе имеются и неточные утверждения относительно возможностей критерия Вилкоксона. Так, одни полагают, что с его помощью можно обнаружить различие между функциями распределения F(x) и G(x). По мнению других, этот критерий нацелен на проверку равенства медиан распределений, соответствующих выборкам. И то, и другое, строго говоря, неверно. Настоящая статья написана, чтобы внести ясность в рассматриваемый вопрос.
Введем некоторые обозначения. Пусть F-1(t) - функция, обратная к функции распределения F(x). Она определена на отрезке [0;1]. Положим L(t) = G(F-1(t)). Поскольку F(x) непрерывна и строго возрастает, то F-1(t) и L(t) обладают теми же свойствами. Важную роль в дальнейшем изложении будет играть величина a = P(X < Y) . Как нетрудно показать,
a = P(X < Y) = .
Введем также
b2 = - (1 -a)2 , g2 = - a2 .
Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [1, с.160] выражаются через введенные величины:
E(U) = mna , E(S) = mn + m(m+1)/2 - E(U) = mn(1- a) + m(m+1)/2,
D(S) = D(U) = mn [ (n - 1) b2 + (m - 1) g2 + a(1 -a) ] . (1)
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными с параметрами, задаваемыми формулами (1) .
Если
выборки полностью однородны, т.е.
их функции распределения
H0: F(x) = G(x) при всех x, (2)
то L(t) = t и a= 1/2. Подставляя в формулы (1), получаем, что
E(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12 (3) .
Следовательно, распределение нормированной и центрированной статистики Вилкоксона
T = ( S - m(m+n+1)/2) (mn(m+n+1)/ 12 ) - 1/2 (4)
при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).
Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (2). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?
Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами
E(T) = ( 12mn ) 1/2 (1/2 - a) (m+n+1) - 1/2 ,
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + a(1 -a) ] (m+n+1) - 1 . (5)
Из формул (5) видно большое значение гипотезы
H01: a = P(X < Y) = 1/2 . (6)
Если эта гипотеза неверна, то, поскольку m # n, справедлива оценка
u E(T) u $ ( 12m n (2n+1) - 1) 1/2 u 1/2 - au ,
а потому u E(T) u безгранично растет при росте объемов выборок. В то же время, поскольку
b2 # # 1, g2 # # 1, a(1 -a)#1/4, то
D(T) # 12 [(n - 1) + (m - 1) + 1/4] (m+n+1) - 1 # 12. (7)
Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (6), стремится к 1 при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе
АH01: a = P(X < Y) ё 1/2 . (8) .
Если же гипотеза (6) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + 1/4 ] (m+n+1) - 1 . (9)
Приведем пример двух функций распределения F(x) и G(x):
a = P(X < Y) = тF(x)dG(x) , 1 - a = P(Y < X) = тG(x)dF(x) (10) ,
a = 1/2 в
случае справедливости
т(F(x) - G(x)) dF(x) = 0,
а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1 ; 1). Тогда формула (11) переходит в условие
т(F(x) - G(x)) dF(x) = - 1/2 т(G(x) - (x + 1)/2 ) dx = 0 (11) .
Это условие выполняется, если функция (G(x) - (x + 1)/2 ) является нечетной.
Критерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10-15% от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно отличаются между собой, и принимают какие-то конечные значения, например. +1, -1 и 0, формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.
Суть метода состоит в том, что мы сопоставляем абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Этот критерий применим в тех случаях, когда признаки измерены по крайней мере по шкале порядка, и сдвиги между вторым и первым замерами тоже могут быть упорядочены. Для этого они должны варьировать в достаточно широком диапазоне. В принципе, можно применять Т - критерий Вилкоксона и в тех случаях, когда сдвиги принимают только три значения: -1, 0 и +1, но тогда критерий Т вряд ли добавит что-нибудь новое к тем выводам, которые можно было бы получить с помощью критерия знаков. Вот если сдвиги изменяются, скажем, от -30 до +45, тогда имеет смысл их ранжировать и потом суммировать ранги.
Первоначально мы исходим из предположения о том, что типичным сдвигом будет сдвиг в более часто встречающемся направлении, а нетипичным, или редким, сдвигом - сдвиг в более редко встречающемся направлении.
Объем выборки – от 5 до 50 элементов.
Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)
Минимальное количество испытуемых, прошедших измерения в двух условиях - 5 человек. Максимальное количество испытуемых - 50 человек, что диктуется верхней границей имеющихся таблиц.
Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.
Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.
H0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
4.3. Пример "№1"