Автор: Пользователь скрыл имя, 09 Марта 2012 в 15:32, реферат
Применение критериев различия позволяет устанавливать различия по уровню исследуемого признака между двумя, тремя и более выборками испытуемых, например, определение различий между работниками государственных предприятий и частных фирм, между людьми разной культуры, возрастные различия и т.д.
Государственное областное образовательное учреждение
высшего профессионального образования
«ВОРОНЕЖСКИЙ ИНСТИТУТ ИННОВАЦИОННЫХ СИСТЕМ»
Кафедра «»
Реферат
по теме:
«Критерий Н-Крускала-Уоллиса».
Выполнила
студентка группы ПИ-3-1
Размочаева Е.В.
Руководитель
Гаршина В.В.
Воронеж
2011 г.
Содержание:
введение
Критерий H-Крускала-Уоллиса
Гипотезы
Применение критерия H-Крускала-Уоллиса
Вывод
Список используемой литературы
Введение:
Применение критериев различия позволяет устанавливать различия по уровню исследуемого признака между двумя, тремя и более выборками испытуемых, например, определение различий между работниками государственных предприятий и частных фирм, между людьми разной культуры, возрастные различия и т.д.
В результате таких исследований формируется статистически достоверный групповой профиль или усредненный портрет человека той или иной профессии, статуса, например, успешный менеджер, успешный политик. Критерии различий предполагают, что сопоставляются независимые выборки, состоящие из разных испытуемых. Решение о выборе того или иного критерия принимается на основании количества и объема
сопоставляемых выборок.
К критериям различий относятся: критерии Розенбаума, Манна-Уитни, Крускала-Уоллиса и критерий тенденций Джонкира.
Критерий H-Крускала-Уоллиса.
Критерий предназначен для оценки различий одновременно между 2, 3 и т.д. выборками по уровню какого-либо признака. Он устанавливает, что уровень признака изменяется при переходе от группы к группе, но не указывает направление этих изменений. Этот критерий является продолжением критерия Манна-Уитни больше, чем на две выборки. Все индивидуальные значения также ранжируются как одна выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки и для них рассчитываются суммы полученных рангов отдельно по каждой выборке. Если различия между выборками случайны, то суммы их рангов не будут существенно различаться. Если в одной выборке будут преобладать низкие значения, в другой - высокие, в третьей - средние, то критерий H Крускала-Уоллиса позволит их установить. В этом случае также оценивается общая сумма перекрещивающихся зон при сопоставлении всех исследуемых выборок. Если эмпирическое значение критерия невелико, то различия признаются недостоверными, случайными, то есть критерий прямой.
H0 – между выборками 1, 2, 3 и т.д. существуют лишь случайные различия по уровню исследуемого признака;
H1 – между выборками 1, 2, 3 и т.д. существуют неслучайные различия по уровню исследуемого признака.
Схема применения критерия Крускала-Уоллиса выглядит следующим образом
Приближение для большой выборки: При H0 статистика Н имеет асимитотическое χ2 – распределение с k – 1 степенями свободы. Приближенный критерий α – уровня таков: отклонить H0, если H≥χ2(k-1,α), и принять ее в противном случае.
Применение критерия H-Крускала-Уоллиса предполагает следующие ограничения:
при сопоставлении трех выборок допускается, чтобы одна из них состояла из трех измерений, а в остальных может быть по два, но при этом уровень достоверности не превосходит p<=0,05. При увеличении уровня статистической значимости наблюдений должно быть не менее трех или длины выборок должны находиться в соотношении 4:2:2; таблицы критических значений предусмотрены для трех выборок длиной не более 5 измерений каждая. Если количество выборок и (или) их длина превышает 3 и 5, то для получения критического значения H пользуются таблицей критерия χ 2 , где число степеней свободы ν рассчитывается по формуле ν=с – 1, где с - количество сопоставляемых выборок.
Непосредственный подсчет эмпирического значения критерия Крускала–Уоллиса аналогичен процедуре для критерия Манна–Уитни:
перенести все показатели на индивидуальные карточки;
пометить карточки каждой группы своим цветом;
упорядочить карточки по степени нарастания признака, как бы по объединенной выборке;
определить ранг индивидуальных значений, приписывая меньшему
значению меньший ранг. Общее количество рангов равно длине объединенной выборки;
разложить карточки по группам, ориентируясь по цвету;
подсчитать сумму рангов по каждой выборке. Проверить совпадение
общей суммы рангов с расчетной;
вычислить эмпирическое значение критерия по формуле
где ni - длина каждой группы;
n – длина объединенной выборки;
Ti-сумма рангов по каждой группе.
При количестве групп с =3, если Нэмп. больше или равно критическому
Н0.05, то Но отвергается.
Если количество групп с >3, для получения критического значения
критерия Крускала–Уоллиса используют таблицу для критерия Пирсона
χ 2 , при этом, если Нэмп. больше или равно χ 2 критическое, то Н0 также отвергается.
Рассмотрим пример. Одинаковы ли воздействия педагогического эксперимента на младших и старших школьников, а также на учителей по показателям психологической защищённости после эксперимента.
Показатель защищённости (номер) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
Младшие подростки | 2.8 | 2.8 | 2.9 | 3.1 | 2.9 | 2.5 | 2.7 | 2.8 | 2.7 |
Старшие подростки | 3.8 | 3.1 | 4.0 | 3.2 | 3.8 | 2.5 | 3.8 | 2.9 | 2.8 |
Учителя | 3.7 | 3.7 | 2.8 | 3.9 | 3.9 | 3.6 | 2.6 | 3.7 | 2.7 |
Проранжируем значения признака для всех групп, как для одной выборки, в порядке возрастания.
Далее найдём суммы рангов для каждой группы отдельно (т.е. произведём суммирование рангов по строкам, см. таблицу).
Показатель защищённости (номер) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | Сумма рангов |
Младшие подростки | 2.8 | 2.8 | 2.9 | 3.1 | 2.9 | 2.5 | 2.7 | 2.8 | 2.7 | - |
Ранг (мл. подростков) | 9 | 9 | 13 | 15.5 | 13 | 1.5 | 5 | 9 | 5 | 80 |
Старшие подростки | 3.8 | 3.1 | 4.0 | 3.2 | 3.8 | 2.5 | 3.8 | 2.9 | 2.8 | - |
Ранг (ст. подростки) | 23 | 15.5 | 27 | 17 | 23 | 1.5 | 23 | 13 | 9 | 152 |
Учителя | 3.7 | 3.7 | 2.8 | 3.9 | 3.9 | 3.6 | 2.6 | 3.7 | 2.7 | - |
Ранг (учителя) | 20 | 20 | 9 | 25.5 | 25.5 | 18 | 3 | 20 | 5 | 146 |
Найдём эмпирическое значение критерия по следующей формуле: , где N – общее количество испытуемых (N=27), Tj – сумма рангов в j-ой строке, nj – число испытуемых в j-ой группе. В рассматриваемом примере количество испытуемых во всех группах одинаково и равно 9. На практике можно использовать и выборки разных объёмов.
По таблице находим критическое значение критерия по уровню значимости и степени свободы k. При этом степень свободы рассчитывается как разность количества групп и единицы. Поэтому в нашем случае k=3-1=2. Примем, что Тогда:
Если критическое значение критерия превосходит его эмпирическое значение, то на выбранном уровне значимости следует принять нулевую гипотезу, утверждающую о несущественности различий воздействия на разные группы. В противном случае нулевая гипотеза отвергается.
В нашем случае: и нулевая гипотеза на уровне значимости 0.01 принимается. Т.е. воздействие можно считать практически одинаковым во всех группах.
1. Kruskal W. H. and Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — Pp. 583—621.
2. Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
3. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.
2