Сравнение
средних
Сравнение средних
значений различных выборок относится
к наиболее часто применяемым
методам статистического анализа.
При этом всегда должен быть выяснен
вопрос, можно ли объяснить имеющееся
различие средних значений статистическими
колебаниями или нет. В последнем случае
говорят о значимом различии.
При сравнении
средних значений выборок предполагается,
что обе выборки подчиняются
нормальному распределению. Если это
не так, то вычисляются медианы и
для сравнения выборок используется
непараметрический тест.
При сравнении
средних значений выборок выделяют
четыре различные тестовые ситуации:
- сравнение
двух независимых выборок
- сравнение
двух зависимых (спаренных) выборок
- сравнение
более двух независимых выборок
- сравнение
более двух зависимых выборок
В этих ситуациях
соответственно применяются следующие
статистические тесты:
- t-тест для
независимых выборок (тест Стьюдента)
- t-тест для
зависимых выборок
- однофакторный
дисперсионный анализ
- однофакторный
дисперсионный анализ с повторными измерениями
Первые три
из этих тестов вызываются с помощью
меню Analyze (Анализ) Compare Means (Сравнение
средних)
Чтобы провести
однофакторный дисперсионный анализ
с повторными измерениями (очень
часто встречающаяся тестовая ситуация)
надо вызвать команду меню Analyze (Анализ)
General Linear Model (Общая линейная модель) Repeated
Measures... (Повторные измерения)
Сначала мы рассмотрим
тесты, вызов которых происходит
посредством пункта меню Compare Means. Для
примера мы возьмем данные исследования
гипертонии в файле hyper.sav (см. главу 9).
- Загрузите
файл hyper.sav.
- Выберите
в меню команды Analyze (Анализ) Compare Means (Сравнение
средних)
В подменю содержатся,
в частности, t-тест для независимых
выборок (Independent-Samples Т Test), t-тест для
парных выборок (Paired-Samples Т Test) и однофакторный
дисперсионный анализ (ANOVA) для сравнения
нескольких независимых выборок ( One-Way
ANOVA).
Еще один тест, включенный
в данное подменю, это t-тест случайной
выборки, используемый для сравнения
с заданным значением (One-Sample T Test), рассматривается
в разделе 13.5. В подпункте меню Means... (Средние)
вычисляются средние значения раздельно
по категориям группирующей переменной;
здесь также можно проверить существование
значимого различия при помощи однофакторного
дисперсионного анализа. В этом отношении
данный подпункт предоставляет меньше
возможностей, чем подпункт One-Way ANOVA...,
и поэтому здесь не рассматривается.
13.1
Сравнение двух
независимых выборок
Мы хотим проверить,
значительно ли различается действие
двух групп медикаментов на людей в зависимости
от их возраста. Такое различие было бы,
конечно, нежелательным, так как в этом
случае разницу в действии лекарств можно
было бы объяснить разным возрастным составом
пациентов.
- Выберите
в подменю команду Independent-Samples T Test... (t-тест
для независимых выборок)
Откроется диалоговое
окно Independent-Samples T Test (см. рис. 13.1).
- В списке
исходных переменных щелкните на переменной
а и щелчком на кнопке с треугольником
перенесите ее в список тестируемых переменных
(Test Variable(s)).
- Таким же
способом перенесите переменную med в поле
Grouping Variable (Группирующая переменная).
- Щелчком на
кнопке Define Groups... (Определить группы) открывается
окно, в котором можно ввести значения
двух категорий для группирующей переменной.
Мы будем сравнивать две группы, удовлетворяющие
условиям соответственно med = 1 и med = 2. Поэтому
внесите в поле Group 1 (Группа 1) значение
1, а в поле Group2 — значение 2.
- Щелчком на
кнопке Continue вернитесь в основное диалоговое
окно.
- Теперь следует
выяснить, какие параметры установлены
по умолчанию. Щелкните для этого на кнопке
Options... (Параметры). Не изменяя настроек,
щелкните на кнопке Continue и вернитесь в
основное диалоговое окно.
Рис. 13.1:
Диалоговое окно Independent-Samples T Test
- Запустите
t-тест, щелкнув на ОК. В окне просмотра
появятся следующие результаты:
Group Statistics
(Статистика групп)
|
Лекарство
|
N |
Mean (Среднее)
|
Std. Deviation (Стандартное
отклонение) |
Std. Error Mean (Стандартная
ошибка среднего) |
Возраст
|
Альфасан
|
87 |
62,24 |
11,19 |
1,20 |
Бетасан
|
87 |
61,98 |
11,96 |
1,28 |
|
Independent
Samples Test (Тест для
независимых выборок)
|
Levene's Test
for Equality of Variancies (Тест Левена на равенство
дисперсий) |
t-test for Equality
of Means (Тест Стьюдента на равенство
средних) |
F
|
Sig. (Значи-мость)
|
Т |
df |
Sig. (2-tailed)
(Значимость (двусто- ронняя)) |
Mean Diffe-rence
(Разность средних) |
Std. Error Differe-псе
(Станда- ртная ошибка разницы)
|
95
% Confidence Interval of the Difference (Довери-тельный
интервал разницы)
|
Lower (Нижняя
граница) |
Upper (Верхняя
граница) |
Возраст
|
Equal variances assumed (Дис-персии
равны) |
,54 |
,462 |
,151 |
172 |
,880 |
,26 |
1,76 |
-3,20 |
3,73 |
Equal variances
not assumed (Ди- сперсии не равны) |
|
|
,15' |
171,249 |
,880 |
,26 |
1,76 |
-3,20 |
3,73 |
|
Выведенные результаты
содержат:
- количество
наблюдений, средние значения, стандартные
отклонения и стандартные ошибки средних
в обеих группах,
- результаты
теста Левена на равенство дисперсий.
Как правило, гипотеза
о равенстве (гомогенности) дисперсий
не принимается, если тест Левена дает
значение р < 0,05 (гетерогенность дисперсий).
Для случаев как гомогенности (равенства),
так и гетерогенности (неравенства) выводятся
следующие характеристики:
- результаты
t-теста: значение распределения t, количество
степеней свободы df, вероятность ошибки
р (под обозначением "Значимость (2-сторонняя)"),
а также
- разница средних
значений, ее стандартная ошибка и доверительный
интервал.
В данном примере
мы не получаем значимого различия
воздействия двух группами лекарств
по возрасту (р = 0,880).
В следующем t-тесте
мы проверим, различается ли действие
двух групп лекарств по так называемому
индексу Брока. Этот индекс, разработанный
одним парижским хирургом, предусматривает,
что нормальный вес человека можно определить
из следующего уравнения:
Нормальный вес
(кг) = Рост (см) — 100
Если взять
отношение фактического веса человека
к нормальному весу по этой рормуле,
то мы получим процентный показатель,
который у людей с нормальным
весом равен 100, у людей с избытком
веса > 100 и т.д.
Индекс Брака
=((Вес в кг)/(Рост в см - 100)) • 100
- Определим
на основе существующих переменных новую
переменную, для чего выберем команды
меню Transform (Преобразовать) Compute... (Вычислить)
- В поле выходной
переменной (Target Variable) задайте новое имя
"broca", а в поле численного выражения
(Numeric Expression) введите выражение gew I (gr- 100)
* 100
- Щелкните
на кнопке ОК. Теперь можно командами меню
Analyze (Анализ) Compare Means (Сравнение средних)
Independent Samples T Test... (t-тест для независимых
выборок) описанным выше способом провести
t-тест для новой переменной broca.
И этот тест показывает,
что между двумя труппами лекарств
не наблюдается значимого различия
по индексу Брока (р = 0,233).
13.3
Сравнение более
двух независимых
выборок
Далее мы исследуем,
существует ли значимое различие веса
(переменная gr) между четырьмя разными
возрастными группами (переменная ak).
- Выберите
в подменю команду One-Way ANOVA... (Однофакторный
дисперсионный анализ)
Подобная возможность
есть и в первом пункте подменю (Means...),
но она дает значительно более ограниченные
возможности для анализа, и поэтому мы
ее не рассматриваем. Появится диалоговое
окно One-Way AN OVA.
- Перенесите
переменную gr в список зависимых переменных
(Dependent List), a переменную ak — в поле Factor (Фактор).
- Посмотрите,
какие параметры можно задать для этого
теста (кнопка Options...). Задайте вывод описательной
статистики (флажок Descriptive) и проверку
на гомогенность дисперсий (флажок Homogeneity-of-variance).
- Чтобы выполнить
апостериорный тест, вернувшись в основное
диалоговое окно, щелкните на кнопке Post
Нос... Откроется диалоговое окно One-Way ANOVA:
Post Hoc Multiple Comparisons (Однофакторный дисперсионный
анализ: апостериорные множественные
сравнения) рис. 13.4.
- Выберите
тест Дункана (флажок Duncan). При значимом
результате дисперсионного анализа этот
тест показывает, какие именно возрастные
группы значимо отличаются друг от друга.
По умолчанию установлен уровень значимости
0,05; можно выбрать и другое значение.
- Запустите
тест, щелкнув на ОК.
Рис. 13.3:
Диалоговое окно One-Way ANOVA
Рис. 13.4:
Диалоговое окно One-Way AN OVA: Post Hoc Multiple Comparisons
В окне просмотра
появятся следующие результаты:
Descriptives
(Описательная статистика)
Рост
|
|
N |
Mean |
Std. Devi-ation
|
Std. Error
|
95 % Confidence
Interval for Mean (95 % доверительный интервал
среднего). |
Mini-mum
|
Maxi-mum
|
Lower Bound
|
Upper Bound |
до 55 лет
|
52 |
169,10 |
8,21 |
1,14 |
166,81 |
171,38 |
150 |
185 |
56ч
65 лет |
51 |
164,82 |
7,62 |
1,07 |
162,68 |
166,97 |
146 |
185 |
66ч75 лет
|
47 |
162,47 |
7,22 |
1,05 |
160,35 |
164,59 |
145 |
175 |
>75 лет
|
24 |
162,67 |
7,38 |
1,51 |
159,55 |
165,78 |
150 |
178 |
Total
|
174 |
165,17 |
8,08 |
61 |
16396 |
166,38 |
145 |
185 |
|
Test of Homogeneity
of Variances (Тест гомогенности
дисперсий)
Рост
|
Levene Statistic
(Статистика Левена) |
dfl |
df2 |
Sig. |
,639
|
3 |
170 |
591 |
|