Автор: Пользователь скрыл имя, 28 Мая 2012 в 10:35, контрольная работа
Но являются ли наилучшими полученные по МНК оценки коэффициентов регрессии? Свойства оценок существенным образом зависят от свойств случайной составляющей. Для того чтобы оценки коэффициентов регрессии были наилучшими, случайная компонента должна удовлетворять условиям, известным, как условия «Гаусса-Маркова»:
1) Математическое ожидание случайной компоненты в любом наблюдении должно быть равно 0:
Федеральное государственное образовательное учреждение
Высшего профессионального образования
«Южный Федеральный Университет»
Экономический факультет
Кафедра «Прикладной информатики в экономике»
Практическое задание
по эконометрике
№3
Выполнил: студент
3 курса 11 группы
Бондарь Максим
Ростов-на-Дону
2011 г.
В предыдущей практической работе я построил следующую модель множественной регрессии:
, где
y - стоимость домовладения, тыс. руб.;
x1 - размер участка, соток;
x2 - общая площадь, м2.
Исходные данные:
№ п/п | Стоимость домовладения, тыс. руб. | Размер участка, соток | Общая площадь, м2 |
1 | 1500 | 2 | 36 |
2 | 2000 | 1,5 | 45 |
3 | 2000 | 1,5 | 43 |
4 | 5000 | 6 | 122 |
5 | 2800 | 2 | 73 |
6 | 2600 | 2,5 | 45 |
7 | 2650 | 3 | 65 |
8 | 2800 | 3,3 | 68 |
9 | 3200 | 5,1 | 75 |
10 | 2600 | 1,2 | 40 |
11 | 3300 | 2,2 | 90 |
12 | 3000 | 4,5 | 70 |
13 | 2650 | 3,1 | 51 |
14 | 3000 | 5 | 65 |
15 | 3000 | 3 | 52 |
16 | 4000 | 5 | 77 |
17 | 4000 | 6 | 98 |
18 | 3500 | 4,5 | 70 |
19 | 3250 | 2,4 | 58 |
20 | 4500 | 4 | 100 |
21 | 3500 | 4,5 | 80 |
22 | 4000 | 4 | 92 |
23 | 5000 | 4 | 100 |
24 | 3000 | 5 | 60 |
25 | 5200 | 1,6 | 100 |
26 | 5500 | 2,5 | 175 |
27 | 5500 | 8 | 117 |
28 | 5700 | 2 | 110 |
29 | 5800 | 3,5 | 112 |
30 | 6000 | 3,5 | 112 |
31 | 6000 | 6 | 170 |
32 | 6000 | 6 | 180 |
33 | 6000 | 2,5 | 120 |
34 | 6000 | 4 | 220 |
35 | 6200 | 6 | 170 |
36 | 6500 | 3 | 180 |
37 | 6800 | 4 | 220 |
38 | 5000 | 6 | 110 |
39 | 7000 | 6 | 260 |
40 | 6000 | 3 | 150 |
41 | 7800 | 6 | 200 |
42 | 8000 | 6 | 200 |
43 | 8300 | 5 | 360 |
44 | 8500 | 4,5 | 360 |
45 | 10000 | 4,5 | 250 |
46 | 10500 | 6,5 | 309 |
47 | 14000 | 6 | 480 |
48 | 15500 | 5,8 | 260 |
49 | 23500 | 21 | 500 |
50 | 5500 | 7 | 100 |
Но являются ли наилучшими полученные по МНК оценки коэффициентов регрессии? Свойства оценок существенным образом зависят от свойств случайной составляющей. Для того чтобы оценки коэффициентов регрессии были наилучшими, случайная компонента должна удовлетворять условиям, известным, как условия «Гаусса-Маркова»:
1) Математическое ожидание случайной компоненты в любом наблюдении должно быть равно 0:
,
Иногда случайная компонента может быть положительной, иногда отрицательной, но не должно быть систематического смещения ни в одном из двух возможных направлений.
Составленное мной уравнение множественной регрессии включает константу. Фактически, если уравнение регрессии включает константу, то можно предположить, что это условие выполняется автоматически, т.к. роль константы состоит в определении любой систематической тенденции в поведении зависимой переменной, которую не учитывают объясняющие переменные в уравнении регрессии.
Проверим выполнение этого условия с помощью пакета STATISTIKA:
| Observed Value | Predicted Value | Residual | Standard Pred. v. | Standard Residual |
1 | 1500 | 1912,03 | -412,03 | -1,05 | -0,28 |
2 | 2000 | 1912,23 | 87,77 | -1,05 | 0,06 |
3 | 2000 | 1863,49 | 136,51 | -1,06 | 0,09 |
4 | 5000 | 5760,48 | -760,48 | 0,03 | -0,52 |
5 | 2800 | 2813,63 | -13,63 | -0,79 | -0,01 |
6 | 2600 | 2350,44 | 249,56 | -0,92 | 0,17 |
7 | 2650 | 3056,90 | -406,90 | -0,72 | -0,28 |
8 | 2000 | 3261,46 | -1261,46 | -0,67 | -0,87 |
9 | 3200 | 4220,82 | -1020,82 | -0,40 | -0,70 |
10 | 2600 | 1658,93 | 941,07 | -1,12 | 0,65 |
11 | 3300 | 3315,51 | -15,51 | -0,65 | -0,01 |
12 | 3000 | 3836,05 | -836,05 | -0,51 | -0,57 |
13 | 2650 | 2759,57 | -109,57 | -0,81 | -0,08 |
14 | 3000 | 3933,32 | -933,32 | -0,48 | -0,64 |
15 | 3000 | 2740,12 | 259,88 | -0,81 | 0,18 |
16 | 4000 | 4225,73 | -225,73 | -0,40 | -0,15 |
17 | 4000 | 5175,66 | -1175,66 | -0,13 | -0,81 |
18 | 3500 | 3836,05 | -336,05 | -0,51 | -0,23 |
19 | 3250 | 2623,40 | 626,60 | -0,85 | 0,43 |
20 | 4500 | 4347,97 | 152,03 | -0,36 | 0,10 |
21 | 3500 | 4079,73 | -579,73 | -0,44 | -0,40 |
22 | 4000 | 4153,03 | -153,03 | -0,42 | -0,11 |
23 | 5000 | 4347,97 | 652,03 | -0,36 | 0,45 |
24 | 3000 | 3811,49 | -811,49 | -0,51 | -0,56 |
25 | 5200 | 3296,26 | 1903,74 | -0,66 | 1,31 |
26 | 5500 | 5518,21 | -18,21 | -0,03 | -0,01 |
27 | 5500 | 6515,07 | -1015,07 | 0,25 | -0,70 |
28 | 5700 | 3715,22 | 1984,78 | -0,54 | 1,36 |
29 | 5800 | 4421,28 | 1378,72 | -0,34 | 0,95 |
30 | 6000 | 4421,28 | 1578,72 | -0,34 | 1,08 |
31 | 6000 | 6930,12 | -930,12 | 0,36 | -0,64 |
32 | 6000 | 7173,79 | -1173,79 | 0,43 | -0,81 |
33 | 6000 | 4178,00 | 1822,00 | -0,41 | 1,25 |
34 | 6000 | 7272,07 | -1272,07 | 0,46 | -0,87 |
35 | 6200 | 6930,12 | -730,12 | 0,36 | -0,50 |
36 | 6500 | 5859,16 | 640,84 | 0,06 | 0,44 |
37 | 6800 | 7272,07 | -472,07 | 0,46 | -0,32 |
38 | 5000 | 5468,07 | -468,07 | -0,05 | -0,32 |
39 | 7000 | 9123,19 | -2123,19 | 0,98 | -1,46 |
40 | 6000 | 5128,13 | 871,87 | -0,14 | 0,60 |
41 | 7000 | 7661,14 | -661,14 | 0,57 | -0,45 |
42 | 8000 | 7661,14 | 338,86 | 0,57 | 0,23 |
43 | 8300 | 11121,73 | -2821,73 | 1,54 | -1,94 |
44 | 8500 | 10902,62 | -2402,62 | 1,48 | -1,65 |
45 | 10000 | 8222,20 | 1777,80 | 0,72 | 1,22 |
46 | 10500 | 10536,30 | -36,30 | 1,37 | -0,02 |
47 | 14000 | 14484,04 | -484,04 | 2,48 | -0,33 |
48 | 15500 | 9035,55 | 6464,45 | 0,95 | 4,44 |
49 | 23500 | 21544,57 | 1955,43 | 4,46 | 1,34 |
50 | 5500 | 5662,61 | -162,61 | 0,01 | -0,11 |
Minimum | 1500 | 1658,93 | -2821,73 | -1,12 | -1,94 |
Maximum | 23500 | 21544,57 | 6464,45 | 4,46 | 4,44 |
Mean | 5641 | 5641,00 | 0,00 | 0,00 | 0,00 |
Median | 5100 | 4384,62 | -157,82 | -0,35 | -0,11 |
Согласно полученным результатам, математическое ожидание случайной компоненты равно 0, т.е. первое условие Гаусса-Маркова выполняется.
2) Далее проверим выполнение 5 (дополнительного) условия Гаусса-Маркова. Согласно этому условию случайная компонента должна иметь нормальное распределение.
Построим график распределения остатков
Глядя на этот график, можно сделать вывод о том, что случайная компонента имеет ненормальное распределение.
Для проверки утверждения о ненормальности распределения случайной компоненты воспользуемся критерием -Пирсона.
С помощь пакета STATISTIKA получили:
т.е. 8,8375
df = 2
По таблицам посмотрим значение 0,0506
Условие не выполняется, следовательно можно сказать, что случайная компонента действительно имеет ненормальное распределение и, следовательно, не выполняется данное условие Гаусса-Маркова.
3) Согласно второму условию теоремы Гаусса-Маркова, дисперсия случайной компоненты должна быть постоянной для всех наблюдений:
,
Если это условие выполняется, то говорят, что дисперсия ошибки гомоскедастична, если же условие нарушается, то говорят о гетероскедастичности ошибки.
Для выявления гетероскедастичности используются различные тесты:
-тест Голдфелда-Квандта (но этот тест применяется в том случае, если ошибки регрессии можно считать нормально распределенными случайными величинами)
-тест Уайта.
Для проверки своей модели на гетероскидастичность я использую тест Уайта:
| EI2 | X1 | X2 | X1X1 | X2X2 | X1X2 |
1 | 169767,7 | 2 | 36 | 4 | 1296 | 72 |
2 | 7703,619 | 1,5 | 45 | 2,25 | 2025 | 67,5 |
3 | 18633,67 | 1,5 | 43 | 2,25 | 1849 | 64,5 |
4 | 578332 | 6 | 122 | 36 | 14884 | 732 |
5 | 185,6472 | 2 | 73 | 4 | 5329 | 146 |
6 | 62279 | 2,5 | 45 | 6,25 | 2025 | 112,5 |
7 | 165565,9 | 3 | 65 | 9 | 4225 | 195 |
8 | 1591291 | 3,3 | 68 | 10,89 | 4624 | 224,4 |
9 | 1042071 | 5,1 | 75 | 26,01 | 5625 | 382,5 |
10 | 885615,4 | 1,2 | 40 | 1,44 | 1600 | 48 |
11 | 240,7044 | 2,2 | 90 | 4,84 | 8100 | 198 |
12 | 698986,6 | 4,5 | 70 | 20,25 | 4900 | 315 |
13 | 12006,61 | 3,1 | 51 | 9,61 | 2601 | 158,1 |
14 | 871092,2 | 5 | 65 | 25 | 4225 | 325 |
15 | 67537,2 | 3 | 52 | 9 | 2704 | 156 |
16 | 50955,34 | 5 | 77 | 25 | 5929 | 385 |
17 | 1382181 | 6 | 98 | 36 | 9604 | 588 |
18 | 112932,4 | 4,5 | 70 | 20,25 | 4900 | 315 |
19 | 392629,8 | 2,4 | 58 | 5,76 | 3364 | 139,2 |
20 | 23112,45 | 4 | 100 | 16 | 10000 | 400 |
21 | 336085,7 | 4,5 | 80 | 20,25 | 6400 | 360 |
22 | 23418,85 | 4 | 92 | 16 | 8464 | 368 |
23 | 425140,3 | 4 | 100 | 16 | 10000 | 400 |
24 | 658509,2 | 5 | 60 | 25 | 3600 | 300 |
25 | 3624218 | 1,6 | 100 | 2,56 | 10000 | 160 |
26 | 331,7272 | 2,5 | 175 | 6,25 | 30625 | 437,5 |
27 | 1030365 | 8 | 117 | 64 | 13689 | 936 |
28 | 3939344 | 2 | 110 | 4 | 12100 | 220 |
29 | 1900883 | 3,5 | 112 | 12,25 | 12544 | 392 |
30 | 2492373 | 3,5 | 112 | 12,25 | 12544 | 392 |
31 | 865123,4 | 6 | 170 | 36 | 28900 | 1020 |
32 | 1377795 | 6 | 180 | 36 | 32400 | 1080 |
33 | 3319677 | 2,5 | 120 | 6,25 | 14400 | 300 |
34 | 1618160 | 4 | 220 | 16 | 48400 | 880 |
35 | 533075,4 | 6 | 170 | 36 | 28900 | 1020 |
36 | 410679,5 | 3 | 180 | 9 | 32400 | 540 |
37 | 222849 | 4 | 220 | 16 | 48400 | 880 |
38 | 219091,2 | 6 | 110 | 36 | 12100 | 660 |
39 | 4507944 | 6 | 260 | 36 | 67600 | 1560 |
40 | 760151,5 | 3 | 150 | 9 | 22500 | 450 |
41 | 437112 | 6 | 200 | 36 | 40000 | 1200 |
42 | 114823 | 6 | 200 | 36 | 40000 | 1200 |
43 | 7962149 | 5 | 360 | 25 | 129600 | 1800 |
44 | 5772588 | 4,5 | 360 | 20,25 | 129600 | 1620 |
45 | 3160576 | 4,5 | 250 | 20,25 | 62500 | 1125 |
46 | 1318,031 | 6,5 | 309 | 42,25 | 95481 | 2008,5 |
47 | 234290,9 | 6 | 480 | 36 | 230400 | 2880 |
48 | 41789114 | 5,8 | 260 | 33,64 | 67600 | 1508 |
49 | 3823691 | 21 | 500 | 441 | 250000 | 10500 |
50 | 26441,98 | 7 | 100 | 49 | 10000 | 700 |
Для этого нужно построить уравнение регрессии вида:
,
где - остатки регрессии.
Сформируем две гипотезы:
H0: (отсутствие гетероскедастичности)
H1: (гетероскедастичность присутствует)
Если построенное уравнение регрессии будет не значимо, то принимаем гипотезу H0, если же уравнение будет значимо, то принимаем гипотезу H1.
Для проверки значимости уравнения воспользуемся пакетом STATISTIKA:
Мы видим, что данное уравнение регрессии не значимо (F = 1,490595 < df = 5,44 и p = 0,21232 > 0,05) следовательно, принимаем гипотезу о гомоскедастичности дисперсии ошибки. То есть второе условие Гаусса-Маркова выполняется.
Т.к. ошибки регрессии имеют ненормальное распределение (это было проверено во 2 пункте) тест Голдфелда-Квандта использовать не будем.
4) Теперь проверим третье условие Гаусса-Маркова.
Предполагается, что отсутствует систематическая связь между значениями случайной компоненты в двух любых наблюдениях.
Если это условие выполняется, то говорят, что автокорреляция ошибок отсутствует, если условие не выполняется – автокорреляция существует. Для выявления автокорреляции используются различные тесты. Используем критерий Дарбина Уотсона.
Для нахождения DW воспользуемся пакетом STATISTIKA:
DW = 1,87067
По таблицам находим:
dн = 1,46, dв = 1,63
Так как 1,63 < DW < 2,37, то принимаем гипотезу об отсутствии автокорреляции (H0).
То есть, согласно критерию Дарбина Уотсона, третье условие Гаусса-Маркова выполняется.
5) Четвертое условие Гаусса – Маркова гласит, что случайная компонента должна быть распределена независимо от объясняющих переменных.
Данное условие мы можем визуально пронаблюдать:
Здесь мы видим, что нет никакой зависимости между остатками и независимой переменной Х1.
В данном случае также отсутствует какая – либо связь между остатками и независимой переменной Х2.
Т. е. четвертое условие Гаусса – Маркова выполняется.
Вывод: можно сказать, что выполняются практически все условия теоремы Гаусса-Маркова. Но случайная величина имеет ненормальное распределение (5 условие), что было проверено во 2 пункте. Следовательно, можно сказать, что полученные по МНК оценки коэффициентов регрессии не являются наилучшими.
7