Автор: Пользователь скрыл имя, 07 Ноября 2011 в 18:12, реферат
Дисперсионный анализ (от латинского Dispersio – рассеивание) – статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.
-
метод максимального правдоподобия,
минимальных остатков,
а-факторного анализа
Эти методы позволяют последовательно улучшить предварительно найденные решения на основе использования статистических приемов оценивания случайной величины или статистических критериев, предполагают большой объем трудоемких вычислений. Наиболее перспективным и удобным для работы в этой группе признается метод максимального правдоподобия.
Основной
задачей, которую решают разнообразными
методами факторного анализа, включая
и метод главных компонент, является
сжатие информации, переход от множества
значений по m элементарным признакам
с объемом информации n х m к ограниченному
множеству элементов матрицы факторного
отображения (m х r) или матрицы значений
латентных факторов для каждого наблюдаемого
объекта размерностью n х r, причем обычно
r < m.
Методы факторного анализа позволяют
также визуализировать структуру изучаемых
явлений и процессов, а это значит определять
их состояние и прогнозировать развитие.
Наконец, данные факторного анализа дают
основания для идентификации объекта,
т.е. решения задачи распознавания образа.
Методы факторного анализа обладают свойствами,
весьма привлекательными для их использования
в составе других статистических методов,
наиболее часто в корреляционно-регрессионном
анализе, кластерном анализе, многомерном
шкалировании и др. .
Парная регрессия. Вероятностная
природа регрессионных
моделей.
Если
рассмотреть задачу анализа расходов
на питание в группах с
где εi - случайная ошибка;
α и β - константы (теоретически), хотя могут меняться от модели к модели.
Предпосылки для парной регрессии:
- X и Y связаны линейно;
- Х - неслучайная переменная с фиксированными значениями;
- ε - ошибки нормально распределены N(0,σ2);
- ;
-
.
На
рисунке 3.1 представлена модель парной
регрессии.
Рисунок 3.1 – Модель
парной регрессии
Эти
предпосылки описывают
Если ошибка имеет ненулевое среднее, исходная модель будет эквивалентна новой модели и другим свободным членом, но с нулевым средним для ошибки.
Если
выполняются предпосылки, то МНК оценки
и
являются
эффективными линейными несмещенными
оценками
Если обозначить:
то что математическое ожидание и дисперсии коэффициентов и будут следующие:
Ковариация коэффициентов:
Если
то
и
распределены
тоже нормально:
Отсюда следует, что:
-
Вариация β полностью
-
Чем выше дисперсия X - тем лучше
оценка β.
Полная дисперсия определяется по формуле:
Дисперсия отклонений в таком виде - несмещенная оценка и называется стандартной ошибкой регрессии. N-2 - может быть интерпретировано как число степеней свободы.
Анализ отклонений от линии регрессии может представить полезную меру того, насколько оцененная регрессия отражает реальные данные. Хорошая регрессия та, которая объясняет значительную долю дисперсии Y и наоборот плохая регрессия не отслеживает большую часть колебаний исходных данных. Интуитивно ясно, что всякая дополнительная информация позволит улучшить модель, то есть уменьшить необъясненную долю вариации Y. Для анализа регрессионной модели проводят разложение дисперсии на составляющие, определяют коэффициент детерминации R2.
Отношение двух дисперсий распределено по F-распределению, т. е. если проверить на статистическую значимость отличия дисперсии модели от дисперсии остатков, можно сделать вывод о значимости R2.
Проверка
гипотезы о равенстве дисперсий этих двух
выборок:
Если гипотеза Н0 (о равенстве дисперсий нескольких выборок) верна, t имеет F-распределение с (m1,m2)=(n1-1,n2-1) степенями свободы.
Посчитав
F – отношение как отношение двух
дисперсий и сравнив его с табличным значением,
можно сделать вывод о статистической
значимости R2.
Заключение
Современные приложения дисперсионного анализа охватывают широкий круг задач экономики, биологии и техники и трактуются обычно в терминах статистической теории выявления систематических различий между результатами непосредственных измерений, выполненных при тех или иных меняющихся условиях.
Благодаря автоматизации дисперсионного анализа исследователь может проводить различные статистические исследования с применение ЭВМ, затрачивая при этом меньше времени и усилий на расчеты данных. В настоящее время существует множество пакетов прикладных программ, в которых реализован аппарат дисперсионного анализа. Наиболее распространенными являются такие программные продукты как:
- MS Excel;
- Statistica;
- Stadia;
- SPSS.
В
современных статистических программных
продуктах реализованы
Дисперсионный анализ является мощным современным статистическим методом обработки и анализа экспериментальных данных в психологии, биологии, медицине и других науках. Он очень тесно связан с конкретной методологией планирования и проведения экспериментальных исследований.
Дисперсионный
анализ применяется во всех областях
научных исследований, где необходимо
проанализировать влияние различных
факторов на исследуемую переменную.