Дисперсионный анализ

Автор: Пользователь скрыл имя, 15 Января 2012 в 23:23, лабораторная работа

Описание работы

Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого – либо признака.

Работа содержит 1 файл

Дисперсионный анализ.docx

— 85.89 Кб (Скачать)

Дисперсионный анализ.

Цель  работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого – либо признака.

Порядок выполнения работы:

  1. Установление основных источников варьирования и определение объемов вариации по источникам образования.
  2. Определение числа степеней свободы вариации.
  3. Вычисление дисперсий и анализ соотношений между ними.
  4. Интерпретация полученных результатов анализа.

При дисперсионном анализе  проводят расчет дисперсий:

- общей  (дисперсия комплекса)

- межгрупповой (факторная)

- внутригрупповой  (остаточная)

Общая дисперсия (   ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию 
 

Межгрупповая  дисперсия (      )  характеризует систематическую вариацию, т.е. различия  в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки 
 
 

Внутригрупповая дисперсия  (      ) отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки 
 
 
 

Средняя из внутригрупповых дисперсий определяется следующим образом 
 

Существует  закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий – правило сложения дисперсий 
 

Эмпирический  коэффициент детерминации – показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии 
 

Этот  коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.

Эмпирическое  корреляционное отношение (  ) характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака 
 

Эмпирическое  корреляционное отношение изменяется в пределах от 0 до 1. Если = 1, то результативный признак изменяется только в зависимости  от признака, положенного в основание  группировки, а влияние прочих факторных  признаков равно 0.

Критерий, используемый для оценки различий между  выборочными средними, назван в честь  Фишера критерием F – распределения. Критерий представляет собой отношение двух дисперсий 
 

Теоретическое значение критерия показывает случайную  величину отношения двух дисперсий  при данном уровне вероятности суждения и соответствующем числе степеней свободы анализируемых дисперсий.

При группировке  по одному признаку общий объем вариации можно разложить на вариацию, связанную  с действием группировочного признака, и вариацию внутригрупповую (остаточную) 

Общая сумма квадратов подразделяется на сумму квадратов отклонений вариантов  опыта (групповая), сумму квадратов  отклонений повторений и остаточную сумму квадратов 

При группировке  данных по двум признакам общая сумма  квадратов отклонений будет иметь  уже две групповые суммы квадратов  и сумму квадратов отклонений взаимодействия факторов и остаточную 

Если  формирование групп будет неслучайным, разложение сумм квадратов усложнится. В итоге при группировке по 2 –ум признакам и неслучайном  распределении повторностей  по группам дисперсионный анализ проводится по следующей схеме 
 

После того, как определены суммы квадратов, необходимо установить степени свободы  вариации, соответствующие каждой сумме  квадратов. При группировке по одному признаку и случайному распределению  повторностей в группах общее число степеней свободы составит                              , для групповой вариации                            , для остаточной вариации                                              .

После определения числа степеней свободы  и суммы квадратов отклонений рассчитываются групповая и остаточная дисперсии:

Дисперсия групповая (    ) характеризует в среднем вариацию, обусловленную влиянием группировочного признака 
 

Дисперсия остаточная (      ) измеряет вариацию, обусловленную случайными причинами, которые не учитывались при распределении данных  наблюдений на группы  
 

Если  групповая дисперсия значительно  больше остаточной, то фактор оказывает существенное влияние на величину признака. Средняя ошибка выборочных средних на основе остаточной дисперсии 
 

Средняя ошибка разности двух средних  

Возможная предельная ошибка этой разности 

Предельная  ошибка сопоставляется с разностью  двух сравниваемых средних 
 
 

  
 
 
 
 
 
 
 

Пример 1.

Известны  данные об объеме вложений в ценные бумаги 24 банков России, млрд.руб. Определить степень влияния прибыли на объемы вложений в ценные бумаги, если первые 15 банков имели прибыль до 50 млрд.руб., а остальные 9 – свыше 50 млрд.руб.

инвестиции
1,9
2,4
2,5
2,7
2,8
3,2
3,2
3,4
3,4
3,7
3,7
4
4
4
4
4,1
4,3
4,3
4,6
4,6
4,8
4,8
4,9
5,6
 

Для определить степени влияния прибыли на объемы вложений в ценные бумаги, определяем группировочный признак и строим таблицу. Результативным признаком является прибыль, а факторным – инвестиции населения.

до 50 млрд.руб. свыше 50 млрд.руб.
№ п/п вложения     № п/п вложения    
1 1,9 -1,36 1,8496 1 4,1 -0,56667 0,321111
2 2,4 -0,86 0,7396 2 4,3 -0,36667 0,134444
3 2,5 -0,76 0,5776 3 4,3 -0,36667 0,134444
4 2,7 -0,56 0,3136 4 4,6 -0,06667 0,004444
5 2,8 -0,46 0,2116 5 4,6 -0,06667 0,004444
6 3,2 -0,06 0,0036 6 4,8 0,133333 0,017778
7 3,2 -0,06 0,0036 7 4,8 0,133333 0,017778
8 3,4 0,14 0,0196 8 4,9 0,233333 0,054444
9 3,4 0,14 0,0196 9 5,6 0,933333 0,871111
10 3,7 0,44 0,1936        
11 3,7 0,44 0,1936        
12 4 0,74 0,5476        
13 4 0,74 0,5476        
14 4 0,74 0,5476        
15 4 0,74 0,5476        
итого: 48,9   6,316   42   1,56
 

Внутригрупповые дисперсии определим по формуле  

Среднюю из внутригрупповых дисперсий определим по формуле 

Межгрупповая  дисперсия исчисляется по формуле 

Определим общую среднюю по формуле средней арифметической простой 

Межгрупповая  дисперсия показывает вариацию инвестиций населения, обусловленную влиянием прибыли банков. Общую дисперсию  определяем на основании правила  сложения дисперсий 

Определим долю межгрупповой дисперсии в общей  с помощью эмпирического коэффициента  детерминации 

Эмпирическое  корреляционное отношение показывает тесноту связи между результативным и факторным признаком 
 
 
 

ср.зн.до 50 3,26
ср.зн свыше 4,666667
 
внутригрупповая дисперсия до 50 0,421067
внуригрупповая дисперсия свыше 50 0,173333
   
дисперсия по вложениям до 50 3,26
дисперсия по вложениям свыше 50 4,666667
   
ср. из внуригрупповых дисперсий 0,328167
межгрупповая  дисперсия до 50 3,9475
межгрупповая  дисперсия свыше 50 0,585
среднее вложение из общего числа 3,7875
общ. Средняя дисперсия 0,46376
общая дисперсия 0,791927
коэфиициент детерминации 0,58561
корреляционное  отношение 0,765252
 

 

 

ср.зн.до 50 =СРЗНАЧ(F4:F18)
ср.зн свыше =СРЗНАЧ(J4:J12)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Пример 2.

Дисперсионный анализ при группировке данных по одному признаку (неслучайное распределение  наблюдений в группах).

Необходимо  проанализировать производительность труда рабочих одного из цехов  НПО «Виктория». С этой целью была образована контрольная группа рабочих, имеющих стаж работы до 1 года, во вторую группу вошли рабочие со стажем от 1 до  3 лет и в третью группу объединили рабочих с большим  стажем. Для чистоты эксперимента были сформированы пять групп, приблизительно равноценных по показателям.

вариант опыта                         повторность
1 2 3 4 5
первая  группа 278 285 200 256 291
вторая  группа 330 319 344 336 327
третья  группа 378 388 391 387 399
 

Поведение исследования таково, что наблюдения в каждом варианте связаны общностью  условий, то есть распределение повторностей в группах неслучайное. Порядок построения опыта делает необходимым исключение из общей суммы квадратов отклонений вариации, определяемой стажем, повторностями и остаточной вариацией 

Требуется статистически оценить результаты исследований в целом и попарно  сравнить средние по стажу. Уровень  вероятности суждения 0,05.

  1. Выдвигаем гипотезу, что различия в средних стажа работы случайны, и рассчитаем показатели, необходимые для заключения выдвинутой гипотезы.
  2. Данные таблицы для удобства вычислений целесообразно уменьшить на постоянную величину А, близкую к значению средней.

Информация о работе Дисперсионный анализ