Автор: Пользователь скрыл имя, 10 Марта 2013 в 16:35, задача
Провести полный регрессионный анализ:
- определить параметры линейной регрессии
- рассчитать значимость параметров регрессии и регрессии в целом
- определить доверительные границы для параметров, регрессии и прогноза.
Оглавление
Провести полный регрессионный анализ:
- определить параметры линейной регрессии
- рассчитать
значимость параметров
- определить доверительные границы для параметров, регрессии и прогноза.
Результаты проиллюстрировать графиками:
1.Исходные данные,
промежуточные и основные
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||
|
||||||||||||||||||||||||||
|
В строках Σ и Ср.знач. вычисления проводить там, где есть символ «-».
2.Ниже таблицы
расположить параметры
B1= ; B0= ; S2= ; S= ; Q= ; QR= ; F= ;Fa;1;n-2= ; Sb1 = ; tb1= ; tα;n-2 = ; rху= ; tr= ; R2= .
3.Дать выводы по значимости полученных результатов.
4. Для Yi, Ŷi , Нижн. гр φ, Верх. гр. φ, Нижн.гр Ў, Верх. гр. Ў построить график на отдельном листе книги Excel. В отчете представить общий вид графика.
РЕШЕНИЕ:
=
СТЬЮДРАСПОБР(0,05;12)
FРАСПОБР(0,05;1;12)
Нижн.гр φ =
Верх.гр φ =
=
Нижн.гр Ў=
Верх.гр Ў=
Для определения значимости уравнения регрессии используются методы дисперсионного анализа. Согласно основной идее дисперсионного анализа необходимо составить отношение оценок дисперсий с целью определения принадлежности их одной или разным генеральным совокупностям.
Определена общая сумма квадратов отклонений зависимой переменной от средней
.
В дисперсионном
анализе суммы квадратов
Q – имеет n-1 степеней свободы (из n значений убираем одну связь, требуемую для формирования ).
зависит лишь от параметра b1 – наклона регрессии по отношению к прямой , следовательно, здесь число степеней свободы равно 1.
имеет n – 2 число степеней свободы.
Вычислена F статистика для отношений приведенных к степеням свободы сумм квадратов.
.
Это отношение имеет F – распределение. Поэтому уравнение регрессии значимо на уровне α, если выполняется неравенство:
.
Здесь - квантиль F- распределения с k1 и k2 степенями свободы числителя и знаменателя соответственно.
Значение F показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.
В нашем примере F=47,30; =4,75
Следовательно неравенство выполняется, а регрессия значима в целом.
Значимость параметра b1 устанавливается с помощью – статистики
.
Параметр b1 считается значимым на уровне α если выполняется неравенство:
В нашем примере tb1=6,88; а t0,05;12=2,18
Следовательно неравенство выполняется, а параметр В1 значимо отличается от нуля.
При оценке значимости коэффициента корреляции исходят из того, что при отсутствии корреляционной связи статистика имеет распределение Стьюдента с n-2 степенями свободы. Коэффициент корреляции значим, если
.
В нашем примере tr=6,88. Как говорилось ранее t0,05;12=2,18
Следовательно, неравенство выполняется, а коэффициент корреляции значим.
Если известен коэффициент детерминации, то значимость регрессии, как и значимость самого коэффициента детерминации, может быть установлена из соотношения:
.
=48
=4,75
Следовательно
неравенство выполняется и
Произвести расчет параметров множественной регрессии. Дать оценку значимости регрессии и ее параметров.
Порядок расчетов
1. Получить матрицу Х (10 х 3), у которой первый столбец состоит из 1, остальные столбцы- иксы из задания.
2. Умножить XТ на Х - функция МУМНЖ()
3. Найти (XТX)-1 - функция МОБР()
4. Определить XТY - функция МУМНЖ()
5. Найти матрицу В = (XТX)-1XТY- функция МУМНЖ()
6.Рассчитать регрессию
7.Определить сумму квадратов остатков Qe=
8. По ковариационной матрице оценок параметров ∑В=s2(XТX)-1
рассчитать стандартные ошибки параметров регрессии
Sbi =
9. Дать оценку значимости
параметров регрессии по
tbi =Bi / Sbi ,
используя квантиль СТЬЮДРАСПОБР(0,05;7);
10. Построить корреляционную матрицу парных коэффициентов ||ryxi||. Использовать команду Excel Сервис \ Анализ данных…Корреляция.
Результат
11. Определить частные корреляции ryx1 • x2 ; ryx2•x1 ; rx2x1•y
;
12. Рассчитать частные уравнения регрессии:
yx1•x2=
, yx2•x1=
13.Определить коэффициент детерминации R2 (см. Задание1) и скорректированный коэффициент детерминации .
14.Рассчитать коэффициент эластичности по каждому параметру
и стандартизованные коэффициенты ,
где Sy, СТАНДОТКЛОНП(интервал значений у или х)
15. Рассчитать F статистику,
по ней определить значимость регрессии с помощью квантиля
FРАСПОБР(0,05;2;7).
РЕШЕНИЕ:
Результаты представлены в таблице в приложении №3.
Расчет произведен в Excel. Qе=78,41
S2=11,20
Рассчитаны стандартные ошибки параметров регрессии по формуле:
Sbi =
Расчет произведен в Excel. S=3,35.
Sb0=6,71
Sb1=0,78
Sb2=0,86
tb0=2,22<2,36 - B0 – не значим
tb1=-1,05<2,36 – B1 – не значим
tb2=-0,57<2,36 – B2 – не значим
Использована команда Excel Сервис \ Анализ данных…Корреляция. Матрица представлена в приложении №4.
ryx1=-0,49
ryx2=-0,40
rx1x2=0,49
Расчет произведен в Excel.
ryx1•x2=-0,37
ryx2•x1=-0,21
rx1x2•y=0,37
yx1•x2=
yx2•x1=
Результат приведен в таблице в приложении №3.
R2=0,27(расчет произведен в excel)
Скорректированный коэффициент детерминации
Ȓ2=0,07 (расчет произведен в excel)
расчет произведен в excel.
Е1=-1,85
Е2=-0,74
Рассчитаны
стандартизированные
где Sy, СТАНДОТКЛОНП(интервал значений у или х), расчет произведен в excel.
Bst1=-0,39
Bst2=-0,21
F=1,32
F0,05;2;7=4,74
1,32<4,74 – следовательно, множественная регрессия не значима.
Задание на гетероскедастичность.
1. Определить значимость гетероскедастичности по Голдфельду-Квандту.
2. Использовать тест Уайта для исключения гетероскедастичности.
3. Найти параметры регрессии взвешенным МНК.
Порядок расчета.
Для расчетов статистик регрессии используем функцию Excel ЛИНЕЙН(У;Х;;1)