Автор: Пользователь скрыл имя, 15 Января 2012 в 23:23, лабораторная работа
Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого – либо признака.
Дисперсионный анализ.
Цель работы: получение практических навыков статистической обработки многовариантных, многофакторных экспериментов, когда анализируется влияние одного, двух, трех и большего числа факторов на изменение величины какого – либо признака.
Порядок выполнения работы:
При дисперсионном анализе проводят расчет дисперсий:
- общей (дисперсия комплекса)
- межгрупповой (факторная)
- внутригрупповой (остаточная)
Общая
дисперсия ( ) измеряет вариацию
признака во всей совокупности под влиянием
всех факторов, обусловивших эту вариацию
Межгрупповая
дисперсия ( ) характеризует
систематическую вариацию, т.е. различия
в величине изучаемого признака, возникающие
под влиянием признака-фактора, положенного
в основание группировки
Внутригрупповая
дисперсия ( ) отражает
случайную вариацию, т.е. часть вариации,
происходящую под влиянием неучтенных
факторов и не зависящую от признака-фактора,
положенного в основание группировки
Средняя
из внутригрупповых
дисперсий определяется следующим образом
Существует
закон, связывающий три вида дисперсии.
Общая дисперсия равна сумме средней из
внутригрупповых и межгрупповой дисперсий
– правило сложения
дисперсий
Эмпирический
коэффициент детерминации – показатель,
представляющий собой долю межгрупповой
дисперсии в общей дисперсии
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака.
Эмпирическое
корреляционное отношение ( ) характеризует
влияние признака, положенного в основание
группировки, на вариацию результативного
признака
Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно 0.
Критерий,
используемый для оценки различий между
выборочными средними, назван в честь
Фишера критерием
F – распределения. Критерий представляет
собой отношение двух дисперсий
Теоретическое
значение критерия показывает случайную
величину отношения двух дисперсий
при данном уровне вероятности суждения
и соответствующем числе
При группировке
по одному признаку общий объем вариации
можно разложить на вариацию, связанную
с действием группировочного признака,
и вариацию внутригрупповую (остаточную)
Общая
сумма квадратов подразделяется
на сумму квадратов отклонений вариантов
опыта (групповая), сумму квадратов
отклонений повторений и остаточную
сумму квадратов
При группировке
данных по двум признакам общая сумма
квадратов отклонений будет иметь
уже две групповые суммы
Если
формирование групп будет неслучайным,
разложение сумм квадратов усложнится.
В итоге при группировке по
2 –ум признакам и неслучайном
распределении повторностей по
группам дисперсионный анализ проводится
по следующей схеме
После
того, как определены суммы квадратов,
необходимо установить степени свободы
вариации, соответствующие каждой сумме
квадратов. При группировке по одному
признаку и случайному распределению
повторностей в группах общее число степеней
свободы составит
После определения числа степеней свободы и суммы квадратов отклонений рассчитываются групповая и остаточная дисперсии:
Дисперсия
групповая ( ) характеризует
в среднем вариацию, обусловленную влиянием
группировочного признака
Дисперсия
остаточная ( ) измеряет
вариацию, обусловленную случайными причинами,
которые не учитывались при распределении
данных наблюдений на группы
Если
групповая дисперсия
Средняя
ошибка разности двух средних
Возможная
предельная ошибка этой разности
Предельная
ошибка сопоставляется с разностью
двух сравниваемых средних
Пример 1.
Известны данные об объеме вложений в ценные бумаги 24 банков России, млрд.руб. Определить степень влияния прибыли на объемы вложений в ценные бумаги, если первые 15 банков имели прибыль до 50 млрд.руб., а остальные 9 – свыше 50 млрд.руб.
инвестиции |
1,9 |
2,4 |
2,5 |
2,7 |
2,8 |
3,2 |
3,2 |
3,4 |
3,4 |
3,7 |
3,7 |
4 |
4 |
4 |
4 |
4,1 |
4,3 |
4,3 |
4,6 |
4,6 |
4,8 |
4,8 |
4,9 |
5,6 |
Для определить степени влияния прибыли на объемы вложений в ценные бумаги, определяем группировочный признак и строим таблицу. Результативным признаком является прибыль, а факторным – инвестиции населения.
до 50 млрд.руб. | свыше 50 млрд.руб. | ||||||
№ п/п | вложения | № п/п | вложения | ||||
1 | 1,9 | -1,36 | 1,8496 | 1 | 4,1 | -0,56667 | 0,321111 |
2 | 2,4 | -0,86 | 0,7396 | 2 | 4,3 | -0,36667 | 0,134444 |
3 | 2,5 | -0,76 | 0,5776 | 3 | 4,3 | -0,36667 | 0,134444 |
4 | 2,7 | -0,56 | 0,3136 | 4 | 4,6 | -0,06667 | 0,004444 |
5 | 2,8 | -0,46 | 0,2116 | 5 | 4,6 | -0,06667 | 0,004444 |
6 | 3,2 | -0,06 | 0,0036 | 6 | 4,8 | 0,133333 | 0,017778 |
7 | 3,2 | -0,06 | 0,0036 | 7 | 4,8 | 0,133333 | 0,017778 |
8 | 3,4 | 0,14 | 0,0196 | 8 | 4,9 | 0,233333 | 0,054444 |
9 | 3,4 | 0,14 | 0,0196 | 9 | 5,6 | 0,933333 | 0,871111 |
10 | 3,7 | 0,44 | 0,1936 | ||||
11 | 3,7 | 0,44 | 0,1936 | ||||
12 | 4 | 0,74 | 0,5476 | ||||
13 | 4 | 0,74 | 0,5476 | ||||
14 | 4 | 0,74 | 0,5476 | ||||
15 | 4 | 0,74 | 0,5476 | ||||
итого: | 48,9 | 6,316 | 42 | 1,56 |
Внутригрупповые
дисперсии определим по формуле
Среднюю
из внутригрупповых дисперсий определим
по формуле
Межгрупповая
дисперсия исчисляется по формуле
Определим
общую среднюю по формуле средней арифметической
простой
Межгрупповая
дисперсия показывает вариацию инвестиций
населения, обусловленную влиянием
прибыли банков. Общую дисперсию
определяем на основании правила
сложения дисперсий
Определим
долю межгрупповой дисперсии в общей
с помощью эмпирического
Эмпирическое
корреляционное отношение показывает
тесноту связи между
ср.зн.до 50 | 3,26 |
ср.зн свыше | 4,666667 |
внутригрупповая дисперсия до 50 | 0,421067 |
внуригрупповая дисперсия свыше 50 | 0,173333 |
дисперсия по вложениям до 50 | 3,26 |
дисперсия по вложениям свыше 50 | 4,666667 |
ср. из внуригрупповых дисперсий | 0,328167 |
межгрупповая дисперсия до 50 | 3,9475 |
межгрупповая дисперсия свыше 50 | 0,585 |
среднее вложение из общего числа | 3,7875 |
общ. Средняя дисперсия | 0,46376 |
общая дисперсия | 0,791927 |
коэфиициент детерминации | 0,58561 |
корреляционное отношение | 0,765252 |
ср.зн.до 50 | =СРЗНАЧ(F4:F18) |
ср.зн свыше | =СРЗНАЧ(J4:J12) |
Пример 2.
Дисперсионный анализ при группировке данных по одному признаку (неслучайное распределение наблюдений в группах).
Необходимо проанализировать производительность труда рабочих одного из цехов НПО «Виктория». С этой целью была образована контрольная группа рабочих, имеющих стаж работы до 1 года, во вторую группу вошли рабочие со стажем от 1 до 3 лет и в третью группу объединили рабочих с большим стажем. Для чистоты эксперимента были сформированы пять групп, приблизительно равноценных по показателям.
вариант опыта | повторность | ||||
1 | 2 | 3 | 4 | 5 | |
первая группа | 278 | 285 | 200 | 256 | 291 |
вторая группа | 330 | 319 | 344 | 336 | 327 |
третья группа | 378 | 388 | 391 | 387 | 399 |
Поведение
исследования таково, что наблюдения
в каждом варианте связаны общностью
условий, то есть распределение повторностей
в группах неслучайное. Порядок построения
опыта делает необходимым исключение
из общей суммы квадратов отклонений вариации,
определяемой стажем, повторностями и
остаточной вариацией
Требуется
статистически оценить