Автор: Пользователь скрыл имя, 13 Мая 2012 в 18:32, контрольная работа
Цель темы – изучить оценку значимости линейного уравнения парной регрессии на основе F-критерии Фишера, описать, доказать, изучить, привести примеры и сделать заключение по изученной теме.
Источники – я использовала книгу Орлов А.И. и учебное пособие по эконометрике, для изучения данной темы, а также некоторые источники из интернета.
между переменными, экспериментальным данным и достаточно ли
включенных в уравнение объясняющих переменных (одной или
нескольких) для описания зависимой переменной.
Чтобы иметь общее суждение о качестве модели из относительных
отклонений по каждому наблюдению, определяют среднюю ошибку
аппроксимации:
Средняя ошибка аппроксимации не должна превышать 8–10%.
Оценка значимости уравнения регрессии в целом производится на
основе F -критерия Фишера, которому предшествует дисперсионный
анализ. В математической статистике дисперсионный анализ
рассматривается как самостоятельный инструмент статистического
анализа. В эконометрике
он применяется как
для изучения качества регрессионной модели.
Согласно основной идее дисперсионного анализа, общая сумма
квадратов отклонений переменной y от среднего значения y
раскладывается на две
части – «объясненную» и «
где
– общая сумма квадратов
сумма квадратов отклонений);
квадратов отклонений, характеризующая влияние неучтенных в модели факторов. Схема дисперсионного анализа имеет вид, представленный в таблице 1.1 (n – число наблюдений, m – число параметров при переменной x ).
Таблица 1.1
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
|||
Факторная |
|||
Остаточная |
3. F-критерии Фишера
Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F - критерия Фишера:
Фактическое значение F -критерия Фишера (1.9) сравнивается с табличным значением Fтабл (a ; k1; k2 ) при уровне значимости a и степенях свободы 1 k = m и 2 k = n - m -1. При этом, если фактическое значение F -критерия больше табличного, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m =1, поэтому
Величина F -критерия связана с коэффициентом детерминации ,
и ее можно рассчитать по следующей формуле:
В парной линейной регрессии оценивается значимость не только
уравнения в целом, но и отдельных его параметров. С этой целью по
каждому из параметров определяется его стандартная ошибка: и .
Стандартная ошибка коэффициента регрессии определяется по
формуле:
где
свободы. Величина стандартной ошибки совместно с t –распределением Стьюдента при n - 2 степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительного интервала. Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t -критерия Стьюдента:
которое затем сравнивается с табличным значением при определенном уровне значимости a и числе степеней свободы (n - 2). Доверительный интервал для коэффициента регрессии определяется как
Поскольку знак коэффициента регрессии указывает на рост результативного признака y прувеличении признака-фактора x (b > 0), уменьшение результативного признака при увеличении признака-фактора (b < 0) или его независимость от независимой переменной (b = 0) (см. рис. 1.3), то границы доверительного интервала для коэффициента регрессии не
должны содержать
Рис.1.3. Наклон линии регрессии в зависимости от значения параметра b.
Стандартная ошибка параметра a определяется по формуле:
Процедура оценивания существенности данного параметра не
отличается от рассмотренной выше для коэффициента регрессии.
Вычисляется t -критерий: ,его величина сравнивается с табличным значением при n - 2 степенях свободы. Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции :
Фактическое значение t -критерия Стьюдента определяется как
Существует связь между t -критерием Стьюдента и F -критерием
Фишера:
4.Критерий Фишера в парной регрессии
С помощью критерия Фишера оценивают качество регрессионной модели в целом и по параметрам.
Для этого выполняется сравнение полученного значения F и табличного F значения. F-критерия Фишера. F фактический определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:
где n - число наблюдений;
m - число параметров при факторе х.
F табличный - это максимальное значение критерия под влиянием случайных факторов при текущих степенях свободы и уровне значимости а.
Уровень значимости а - вероятность не принять гипотезу при условии, что она верна. Как правило а принимается равной 0,05 или 0,01.
Если Fтабл > Fфакт то признается статистическая незначимость модели, ненадежность уравнения регрессии.
Таблицы по нахождению критерия Фишера и Стьюдента
Таблицы значений F-критерия Фишера и t-критерия Стьюдента Вы можете посмотреть здесь. Табличное значение критерия Фишера вычисляют следующим образом:
1.Определяют k1, которое равно количеству факторов (Х). Например, в однофакторной модели (модели парной регрессии) k1=1, в двухфакторной k=2.
2.Определяют k2, которое определяется по формуле n - m - 1, где n - число наблюдений, m - количество факторов. Например, в однофакторной модели k2 = n - 2.
3.На пересечении столбца k1 и строки k2 находят значение критерия Фишера
Для нахождения табличного значения критерия Стьюдента определяют число степеней свободы, которое определяется по формуле n - m - 1 и находят его значение при определенном уровне значимости (0,10, 0,05, 0,01).
Критерии Стьюдента
Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента.
Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:
Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.
Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так
Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт.
ЗАКЛЮЧЕНИЕ
F-тестом или критерием Фишера (F-критерием, φ*-критерием) — называют любой статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).
Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на "степени свободы"). Чтобы статистика имела распределение Фишера необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.
Тест проводится путем сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если , то . Кроме того, квантили распределения Фишера обладают свойством . Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе - меньшая и сравнение осуществляется с "правой" квантилью распределения. Тем не менее тест может быть и двусторонним и односторонним. В первом случае при уровне значимости используется квантиль , а при одностороннем тесте.
Более удобный способ проверки гипотез - с помощью p-значения - вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если (для двустороннего теста - )) меньше уровня значимости , то нулевая гипотеза отвергается, в противном случае принимается.
Считаю, что данная тема полностью изучена, приведены примеры, формулы и определения.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ