Сравнение средних

Автор: Пользователь скрыл имя, 17 Января 2011 в 08:39, реферат

Описание работы

Сравнение средних значений различных выборок относится к наиболее часто применяемым методам статистического анализа. При этом всегда должен быть выяснен вопрос, можно ли объяснить имеющееся различие средних значений статистическими колебаниями или нет. В последнем случае говорят о значимом различии.

Работа содержит 1 файл

Сравнение средних.doc

— 150.50 Кб (Скачать)

ANOVA (Дисперсионный  анализ)

Рост 
  Sum of Squares (Сумма квадратов) Df Mean Square (Средний  квадрат)  F Sig. (Значимость)
Between Groups (Между группами) 1301,200 3 433,733 7,380 ,000
Within Groups (В группах)  9990,966 170 58,770    
Total 111292,167 173      

Апостериорные тесты Гомогенные подгруппы

Рост

Dunean"
Возрастной  класс  N Subset for alpha = ,05 (Подгруппа для альфа = ,05).
1 2
66-75 лет  47 162.47  
>75 лет  24 162,67  
56-65 лет  51 164,82  
до 55 лет  52   169,10
Sig. (Значимость)   ,201 1,000

Means for groups in homogeneous subsets are displayed (Показаны средние значения  для групп внутри гомогенных  подгрупп).

a. Uses Harmonic Mean Sample Size = 39,300 (Используется гармоническое  среднее для размера выборки  = 39,300).

b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. (Размеры групп неодинаковы. Используется гармоническое среднее размеров групп. Уровни ошибок типа I не гарантируются).

Выведенные результаты содержат:  

  • количество наблюдений, средние значения, стандартные отклонения и стандартные ошибки средних, 95 % доверительные интервалы, минимумы и максимумы для всех слоев фактора,  
  • результаты теста Левена на гомогенность дисперсий,  
  • типовую схему дисперсионного анализа, включая вероятность ошибки р (значимость) для оценки общей значимости,  
  • результаты многорангового теста Дункана.

В этом примере  дисперсионный анализ дает максимально  значимый результат (р < 0,001). Тест Дункана  выделяет две гомогенные подгруппы (со стандартным значением р = 0,05), одна из которых включает возрастной класс до 55 лет, а другая — три остальных класса. Это означает, что возрастной класс до 55 лет значимо отличается от трех других возрастных классов, которые, в свою очередь, не обнаруживают значимого различия между собой.

Уменьшение роста  с увеличением возраста может  быть связано с тем, что в старших  возрастных классах преобладают  женщины, рост которых мал по сравнению  с мужчинами, что и вызывает данный эффект. Повторим этот анализ для категорий пола. Окажется, что у мужчин факт уменьшения роста с увеличением возраста подтверждается, а для женщин — нет.

Далее мы подробно рассмотрим имеющиеся в диалоговом окне AN OVA кнопки Contrasts (Контрасты), Post Hoc... и Options..., а также возможности, которые они предоставляют.

13.4. Сравнение более  чем двух зависимых  выборок

На основе данных по гипертонии исследуем, значимо ли изменяется содержание холестерина  в течение четырёх промежутков  времени (такое сравнение для  первых двух промежутков времени мы уже провели в параграфе 13.2).

Для достижения этой цели подходит однофакторный дисперсионный  анализ с повторными измерениями. Пользователи SPSS, работавшие с этим пакетом на больших компьютерах, знают, что  выполнить эту весьма распространенную операцию можно было только с помощью процедуры MANOVA (многомерный дисперсионный анализ). Ясно, что эта процедура предназначена для разнообразных методов многомерного анализа, но может быть использована при одномерном дисперсионном анализе с повторными измерениями.

Начиная с версии 7 SPSS процедура MANOVA была заменена процедурой GLM (General Linear Model). Однако и в текущей  версии процедура MANOVA по прежнему остается доступной при использовании  программного синтаксиса.

Разнообразные возможности анализа, предоставляемые этими процедурами (GLM и MANOVA), обеспечиваются ценой уже практически необозримого количества команд, спецификаций, параметров и ключевых слов. Даже при решении такой простой задачи, как рассматриваемая, надо уметь ориентироваться в этом многообразии. Несколько подробнее процедура GLM рассматривается в главе 17; однако в рамках этой книги невозможно охватить всю широту диапазона возможностей, предоставляемых этой процедурой.  Теперь перейдем к решению нашей задачи при помощи однофакторного дисперсионного анализа с повторными измерениями.  

  • Загрузите файл hyper, sav.  
  • Выберите в меню команды Analyze (Анализ) General Linear Model (Общая линейная модель) Repeated Measures... (Повторные измерения)

Откроется диалоговое окно Repeated Measures Define Factors) (Определить фактор(ы) для повторных измерений).

В данном примере  мы подвергнем анализу четыре переменных: cho10, cho11, cho16 и chol12; следовательно, фактор повторных измерений будет задаваться четырьмя уровнями (слоями).  

  • Введите число 4 в поле Number of Levels (Количество уровней). По умолчанию принимается имя фактора faktorl; при желании можно задать для него любое другое i имя (например, "время").  
  • Щелкните на кнопке Add. Других факторов повторных измерений у нас нет, поэтому можно сразу закрыть этот диалог кнопкой Define (Определить). Появится диалоговое окно Repeated Measures (Повторные измерения) (см. рис. 13.7).  
  • Перенесите переменные cho10, choll, cho16 и chol12 в список Within-Subject Variables (Переменные внутри субъекта); далее кнопками, которые находятся внизу диалогового окна, можно установить дополнительные параметры но мы не будем их рассматривать.  
  • Запустите вычисления, щелкнув на ОК.
 

Рис. 13.6: Диалоговое окно Repeated Measures Define Factor(s)  

Рис. 13.7: Диалоговое окно Repeated Measures  

  • Проанализируйте результаты, появившиеся в окне просмотра.

Вы убедитесь, что для неподготовленного пользователя толкование полученных результатов расчёта может составить большие трудности. Подробнее о них мы поговорим в главе 17. Теперь же мы ограничимся указанием, что результаты обычного дисперсионного анализа содержатся в строке "Sphericity assumed" (Предположение о сферичности) таблицы вывода, приведенной ниже:

Tests of Within-Subjects Effects (Тест эффектов внутри субъекта)

Measure: MEASURE_1
Source (Источник) Type III Sum of Squares (Сумма квадратов типа III) df Mean Square (Среднее  квадратов)  F Sig. (Значи-мость) 
FACTOR1 Sphericity Assumed (Прини- мается гипотеза о сферич- ности) 3381,822 3 1127,274 2,653 ,048
Greenhouse- Geisser 3381,822 2,509 1347,779 2,653 ,058
Huynh-Feldt 3381 ,822 2,549 1326,675 2,653 ,058
Lower Bound 3381,822 1,000 3381,822 2,653 ,105
Error (FACTOR1) Sphericity Assumed (Прини-  мается гипотеза о сферич- ности)  220504,678 519 424,865    
Greenhouse- Geisser 220504,678 434,088 507,972    
Huynh-Feldt 220504,678 440,994 500,018    
Lower Bound 220504,678 173,000 1274,594    

Вероятность ошибки р составляет 0,048, что указывает  на значимое различие между отдельными моментами времени. К сожалению, даже в 10-й версии SPSS отсутствует  возможность провести апостериорный  тест для повторных измерений, чтобы  выяснить, какие именно промежутки времени значимо отличаются друг от друга. В случае, если выявлены значимые отличия, как в рассмотренном примере, пользователю не остается ничего другого, кроме выполнения парного t-теста.

13.5 t-тест  одной выборки

Этот тест позволяет  выяснить, отличается ли среднее значение, полученное на основе данной выборки, от предварительно заданного контрольного значения.

Мы проверим, отличается ли средний показатель холестерина, полученный при исследовании гипертонии, от значения 229, которое могло быть определено в каком-либо другом исследовании.  

  • Загрузите файл hyper.sav.  
  • Выберите в меню команды Analyze (Анализ) Compare Means (Сравнение средних) One-Sample T Test... (t-тест для одной выборки) Откроется диалоговое окно One-Sample T Test (см. рис. 13.8).  
  • Перенесите переменную cho10 в поле Test Variable(s) и введите в поле Test Value (Контрольное значение) значение 229.  
  • Запустите вычисления, щелкнув на ОК.

Результаты, показанные в окне просмотра, свидетельствуют  о том, что в данном исследовании средний исходный уровень холестерина составляет 237,27, что значимо (р = 0,029) отличается от контрольного значения 229.  

Рис. 13.8: Диалоговое окно One-Sample T Test

One-Sample Statistics (Статистика  одной выборки)

  N Mean Std. Deviation Std. Error Mean
Холестерин, исходный 174 237,27 49,42 3,75

One-Sample Test (Тест пои одной выборке)

  Test Value = 229
T df Sig. (2-tailed) Mean Difference 95 % Confidence Interval of the Difference
  Upper Lower
Холестерин, исходный 2,207 173 ,029 8,27 ,88 15,66

Кнопкой Options... (Параметры) можно задать вместо 95 % любой другой доверительный интервал. Значение доверительного интервала может принимать значения в промежутке от 1 до 99%.

Информация о работе Сравнение средних