Сравнение средних

Автор: Пользователь скрыл имя, 17 Января 2011 в 08:39, реферат

Описание работы

Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.

Скачать полностью (25.37 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

Сравнение средних.doc

— 150.50 Кб (Скачать)

Сравнение средних

При сравнении средних значений выборок предполагается, что обе выборки подчиняются нормальному распределению. Если это не так, то вычисляются медианы и для сравнения выборок используется непараметрический тест.

При сравнении средних значений выборок выделяют четыре различные тестовые ситуации:

сравнение двух независимых выборок
сравнение двух зависимых (спаренных) выборок
сравнение более двух независимых выборок
сравнение более двух зависимых выборок

В этих ситуациях соответственно применяются следующие статистические тесты:

t-тест для независимых выборок (тест Стьюдента)
t-тест для зависимых выборок
однофакторный дисперсионный анализ
однофакторный дисперсионный анализ с повторными измерениями

Первые три из этих тестов вызываются с помощью меню Analyze (Анализ) Compare Means (Сравнение средних)

Чтобы провести однофакторный дисперсионный анализ с повторными измерениями (очень часто встречающаяся тестовая ситуация) надо вызвать команду меню Analyze (Анализ) General Linear Model (Общая линейная модель) Repeated Measures... (Повторные измерения)

Сначала мы рассмотрим тесты, вызов которых происходит посредством пункта меню Compare Means. Для примера мы возьмем данные исследования гипертонии в файле hyper.sav (см. главу 9).

Загрузите файл hyper.sav.
Выберите в меню команды Analyze (Анализ) Compare Means (Сравнение средних)

В подменю содержатся, в частности, t-тест для независимых выборок (Independent-Samples Т Test), t-тест для парных выборок (Paired-Samples Т Test) и однофакторный дисперсионный анализ (ANOVA) для сравнения нескольких независимых выборок ( One-Way ANOVA).

Еще один тест, включенный в данное подменю, это t-тест случайной выборки, используемый для сравнения с заданным значением (One-Sample T Test), рассматривается в разделе 13.5. В подпункте меню Means... (Средние) вычисляются средние значения раздельно по категориям группирующей переменной; здесь также можно проверить существование значимого различия при помощи однофакторного дисперсионного анализа. В этом отношении данный подпункт предоставляет меньше возможностей, чем подпункт One-Way ANOVA..., и поэтому здесь не рассматривается.

13.1 Сравнение двух независимых выборок

Мы хотим проверить, значительно ли различается действие двух групп медикаментов на людей в зависимости от их возраста. Такое различие было бы, конечно, нежелательным, так как в этом случае разницу в действии лекарств можно было бы объяснить разным возрастным составом пациентов.

Выберите в подменю команду Independent-Samples T Test... (t-тест для независимых выборок)

Откроется диалоговое окно Independent-Samples T Test (см. рис. 13.1).

В списке исходных переменных щелкните на переменной а и щелчком на кнопке с треугольником перенесите ее в список тестируемых переменных (Test Variable(s)).
Таким же способом перенесите переменную med в поле Grouping Variable (Группирующая переменная).
Щелчком на кнопке Define Groups... (Определить группы) открывается окно, в котором можно ввести значения двух категорий для группирующей переменной. Мы будем сравнивать две группы, удовлетворяющие условиям соответственно med = 1 и med = 2. Поэтому внесите в поле Group 1 (Группа 1) значение 1, а в поле Group2 — значение 2.
Щелчком на кнопке Continue вернитесь в основное диалоговое окно.
Теперь следует выяснить, какие параметры установлены по умолчанию. Щелкните для этого на кнопке Options... (Параметры). Не изменяя настроек, щелкните на кнопке Continue и вернитесь в основное диалоговое окно.

Рис. 13.1: Диалоговое окно Independent-Samples T Test

Запустите t-тест, щелкнув на ОК. В окне просмотра появятся следующие результаты:

Group Statistics (Статистика групп)

	Лекарство	N	Mean (Среднее)	Std. Deviation (Стандартное отклонение)	Std. Error Mean (Стандартная ошибка среднего)
Возраст	Альфасан	87	62,24	11,19	1,20
Возраст	Бетасан	87	61,98	11,96	1,28

Independent Samples Test (Тест для независимых выборок)

		Levene's Test for Equality of Variancies (Тест Левена на равенство дисперсий)		t-test for Equality of Means (Тест Стьюдента на равенство средних)
		F	Sig. (Значи-мость)	Т	df	Sig. (2-tailed) (Значимость (двусто- ронняя))	Mean Diffe-rence (Разность средних)	Std. Error Differe-псе (Станда- ртная ошибка разницы)	95 % Confidence Interval of the Difference (Довери-тельный интервал разницы)
Lower (Нижняя граница)	Upper (Верхняя граница)
Возраст	Equal variances assumed (Дис-персии равны)	,54	,462	,151	172	,880	,26	1,76	-3,20	3,73
	Equal variances not assumed (Ди- сперсии не равны)			,15'	171,249	,880	,26	1,76	-3,20	3,73

Выведенные результаты содержат:

количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних в обеих группах,
результаты теста Левена на равенство дисперсий.

Как правило, гипотеза о равенстве (гомогенности) дисперсий не принимается, если тест Левена дает значение р < 0,05 (гетерогенность дисперсий). Для случаев как гомогенности (равенства), так и гетерогенности (неравенства) выводятся следующие характеристики:

результаты t-теста: значение распределения t, количество степеней свободы df, вероятность ошибки р (под обозначением "Значимость (2-сторонняя)"), а также
разница средних значений, ее стандартная ошибка и доверительный интервал.

В данном примере мы не получаем значимого различия воздействия двух группами лекарств по возрасту (р = 0,880).

В следующем t-тесте мы проверим, различается ли действие двух групп лекарств по так называемому индексу Брока. Этот индекс, разработанный одним парижским хирургом, предусматривает, что нормальный вес человека можно определить из следующего уравнения:

Нормальный вес (кг) = Рост (см) — 100

Если взять отношение фактического веса человека к нормальному весу по этой рормуле, то мы получим процентный показатель, который у людей с нормальным весом равен 100, у людей с избытком веса > 100 и т.д.

Индекс Брака =((Вес в кг)/(Рост в см - 100)) • 100

Определим на основе существующих переменных новую переменную, для чего выберем команды меню Transform (Преобразовать) Compute... (Вычислить)
В поле выходной переменной (Target Variable) задайте новое имя "broca", а в поле численного выражения (Numeric Expression) введите выражение gew I (gr- 100) * 100
Щелкните на кнопке ОК. Теперь можно командами меню Analyze (Анализ) Compare Means (Сравнение средних) Independent Samples T Test... (t-тест для независимых выборок) описанным выше способом провести t-тест для новой переменной broca.

И этот тест показывает, что между двумя труппами лекарств не наблюдается значимого различия по индексу Брока (р = 0,233).

13.3 Сравнение более двух независимых выборок

Далее мы исследуем, существует ли значимое различие веса (переменная gr) между четырьмя разными возрастными группами (переменная ak).

Выберите в подменю команду One-Way ANOVA... (Однофакторный дисперсионный анализ)

Подобная возможность есть и в первом пункте подменю (Means...), но она дает значительно более ограниченные возможности для анализа, и поэтому мы ее не рассматриваем. Появится диалоговое окно One-Way AN OVA.

Перенесите переменную gr в список зависимых переменных (Dependent List), a переменную ak — в поле Factor (Фактор).
Посмотрите, какие параметры можно задать для этого теста (кнопка Options...). Задайте вывод описательной статистики (флажок Descriptive) и проверку на гомогенность дисперсий (флажок Homogeneity-of-variance).
Чтобы выполнить апостериорный тест, вернувшись в основное диалоговое окно, щелкните на кнопке Post Нос... Откроется диалоговое окно One-Way ANOVA: Post Hoc Multiple Comparisons (Однофакторный дисперсионный анализ: апостериорные множественные сравнения) рис. 13.4.
Выберите тест Дункана (флажок Duncan). При значимом результате дисперсионного анализа этот тест показывает, какие именно возрастные группы значимо отличаются друг от друга. По умолчанию установлен уровень значимости 0,05; можно выбрать и другое значение.
Запустите тест, щелкнув на ОК.

Рис. 13.3: Диалоговое окно One-Way ANOVA

Рис. 13.4: Диалоговое окно One-Way AN OVA: Post Hoc Multiple Comparisons

В окне просмотра появятся следующие результаты:

Descriptives (Описательная статистика)

Рост
	N	Mean	Std. Devi-ation	Std. Error	95 % Confidence Interval for Mean (95 % доверительный интервал среднего).		Mini-mum	Maxi-mum
	N	Mean	Std. Devi-ation	Std. Error	Lower Bound	Upper Bound	Mini-mum	Maxi-mum
до 55 лет	52	169,10	8,21	1,14	166,81	171,38	150	185
56ч 65 лет	51	164,82	7,62	1,07	162,68	166,97	146	185
66ч75 лет	47	162,47	7,22	1,05	160,35	164,59	145	175
>75 лет	24	162,67	7,38	1,51	159,55	165,78	150	178
Total	174	165,17	8,08	61	16396	166,38	145	185

Test of Homogeneity of Variances (Тест гомогенности дисперсий)

Рост
Levene Statistic (Статистика Левена)	dfl	df2	Sig.
,639	3	170	591

Информация о работе Сравнение средних