Автор: Пользователь скрыл имя, 28 Октября 2013 в 19:25, лабораторная работа
Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравн
Средняя ошибка аппроксимации показывает среднее отклонение расчетных значений от фактических и рассчитывается по формуле:
Средняя ошибка аппроксимации составляет 0,14 %. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так как в норме средняя ошибка аппроксимации колеблется в пределах до 10%
б) Анализ степенной модели.
Степенная модель имеет вид ŷ=a0 * x1a1 * x2a2 * x3a3 * x4a4.
Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения: lg у = lg a0 + a1 * lg x1 + a2 * lg x2 + a3*lg x3 + a4 * lg x4 .
Обозначим Y = lg у, A = lg a0, X1 = lg x1, X2 = lg x2, X3 = lg x3, X4 = lg x4, тогда уравнение примет вид: Y = A + a1X1 + a2X2+ a3X3+а4Х4 – линейное уравнение регрессии.
В результате расчета с помощью программы MS Excel (Сервис / Анализ данных / Регрессия) получим следующие данные:
Таблица 7. Регрессионная статистика степенной модели
Множественный R |
0,924627747 |
R-квадрат |
0,85493647 |
Нормированный R-квадрат |
0,833445576 |
Стандартная ошибка |
0,022562404 |
Наблюдения |
32 |
Таблица 8. Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
4 |
0,08100468 |
0,0202512 |
39,781337 |
6,01715E-11 |
Остаток |
27 |
0,01374468 |
0,0005091 |
||
Итого |
31 |
0,09474936 |
Таблица 9. Параметры модели
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пере-сечение |
2,044955308 |
0,0748935 |
27,3048436 |
3,35575E-21 |
1,891286539 |
2,198624077 |
Х1 |
0,039872797 |
0,025319181 |
1,574805987 |
0,126947459 |
-0,01207787 |
0,091823465 |
Х2 |
-0,142084117 |
0,091591229 |
-1,551285193 |
0,132477225 |
-0,330013796 |
0,045845561 |
Х3 |
0,143717583 |
0,078962484 |
1,820074241 |
0,079851614 |
-0,018300051 |
0,305735218 |
Х4 |
-0,176037311 |
0,037274634 |
-4,72271072 |
6,41733E-05 |
-0,252518542 |
-0,099556081 |
Получили уравнение: Ŷ = 2,044 + 0,039Х1 - 0,142Х2 + 0,1437Х3 - 0,176Х4, переходим к исходным данным с помощью потенцирования:
ŷ = 110,9060678 ∙ х10,039∙ х2-0,142∙ х30,143 ∙ х4-0,176
Таблица 10. Расчет относительной ошибки аппроксимации
№ |
У |
y предск |
e(t)-e(t-1) |
ост/у |
1 |
47 |
49,91636789 |
2,916367892 |
0,062050381 |
2 |
49 |
51,50883886 |
-0,40752903 |
-0,008316919 |
3 |
48 |
49,89690398 |
-0,611934881 |
-0,012748643 |
4 |
55 |
52,89945208 |
-3,9974519 |
-0,072680944 |
5 |
49 |
49,52912775 |
2,629675665 |
0,05366685 |
6 |
52 |
52,20987349 |
-0,319254254 |
-0,006139505 |
7 |
58 |
55,29068064 |
-2,919192854 |
-0,050330911 |
8 |
57 |
53,64571289 |
-0,644967744 |
-0,011315224 |
9 |
50 |
48,45650487 |
1,810791973 |
0,036215839 |
10 |
53 |
54,26888939 |
2,812384524 |
0,053063859 |
11 |
58 |
58,00208501 |
-1,266804379 |
-0,021841455 |
12 |
56 |
52,96361481 |
-3,038470203 |
-0,054258396 |
13 |
62 |
57,26741199 |
-1,69620282 |
-0,02735811 |
14 |
50 |
52,56623309 |
7,298821097 |
0,145976422 |
15 |
68 |
63,62363889 |
-6,942594198 |
-0,102096973 |
16 |
59 |
56,24192349 |
1,618284602 |
0,027428553 |
17 |
47 |
49,93497198 |
5,693048496 |
0,121128691 |
18 |
60 |
55,77018491 |
-7,164787075 |
-0,119413118 |
19 |
51 |
53,90065683 |
7,130471925 |
0,139813175 |
20 |
57 |
58,70402255 |
-1,196634287 |
-0,020993584 |
21 |
67 |
63,55626832 |
-5,147754226 |
-0,076832153 |
22 |
69 |
65,55879861 |
0,002530291 |
3,66709E-05 |
23 |
57 |
59,93730327 |
6,37850466 |
0,111903591 |
24 |
51 |
53,70265634 |
-0,234646933 |
-0,00460092 |
25 |
72 |
80,0262945 |
5,323638163 |
0,073939419 |
26 |
63 |
63,44200854 |
-7,584285962 |
-0,120385491 |
27 |
64 |
65,82192734 |
1,379918794 |
0,021561231 |
28 |
66 |
65,93137282 |
-1,890554519 |
-0,028644765 |
29 |
65 |
62,95811348 |
-1,973259334 |
-0,030357836 |
30 |
57 |
58,29609038 |
3,337976899 |
0,058560998 |
31 |
66 |
64,82415015 |
-2,471940229 |
-0,03745364 |
32 |
69 |
69,58366911 |
1,759518954 |
0,025500275 |
сумма |
0,125077367 | |||
аппроксим |
0,39% |
Вывод по степенной модели:
По данным регрессионного и дисперсионного анализа, линейный коэффициент множественной корреляции составляет 0,924627747, что характеризует тесную связь между показателями, а коэффициент детерминации составляет 0,85493647 и показывает, что на результатирующий признак факторные признаки влияют на 85,4%. Ошибка регрессии составляет 14,6%.
По данным расчетов получим теоретическое уравнение прямой:
ŷ = 110,9060678 ∙ х10,039∙ х2-0,142∙ х30,143 ∙ х4-0,176
Коэффициент Фишера, равный 39,781337 значительно превышает критическое значение, коэффициенты регрессии значимы (по критерию Стьюдента).
3. Проверка модели на отсутствие автокорреляции.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями.
Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле:
Таблица 7. Расчет критерия d - Дарбина-Уотсона для линейной модели
№ |
Yтеор |
e=Yтеор-Yпракт |
e(t)-e(t-1) |
{e(t)-e(t-1)}^2 |
e^2 | |||||
1 |
48,77949967 |
-1,779499674 |
-1,779499674 |
3,166619089 |
3,166619089 | |||||
2 |
53,01478996 |
-4,014789956 |
-2,235290282 |
4,996522646 |
16,11853839 | |||||
3 |
49,18198995 |
-1,181989945 |
2,832800011 |
8,024755901 |
1,39710023 | |||||
4 |
53,3607328 |
1,639267204 |
2,821257149 |
7,9594919 |
2,687196965 | |||||
5 |
48,54684569 |
0,453154314 |
-1,186112889 |
1,406863786 |
0,205348833 | |||||
6 |
53,60860672 |
-1,608606719 |
-2,061761034 |
4,25085856 |
2,587615577 | |||||
7 |
57,06401969 |
0,935980312 |
2,544587031 |
6,47492316 |
0,876059145 | |||||
8 |
56,28697253 |
0,713027472 |
-0,22295284 |
0,049707969 |
0,508408176 | |||||
9 |
46,66462263 |
3,335377371 |
2,622349899 |
6,876718991 |
11,12474221 | |||||
10 |
54,92905998 |
-1,929059977 |
-5,264437349 |
27,7143006 |
3,721272396 | |||||
11 |
59,61431405 |
-1,61431405 |
0,314745927 |
0,099064999 |
2,606009852 | |||||
12 |
52,87249773 |
3,12750227 |
4,74181632 |
22,48482201 |
9,781270449 | |||||
13 |
59,76554125 |
2,234458745 |
-0,893043525 |
0,797526737 |
4,992805884 | |||||
14 |
50,69348517 |
-0,693485173 |
-2,927943918 |
8,572855589 |
0,480921685 | |||||
15 |
65,9522251 |
2,047774896 |
2,74126007 |
7,514506769 |
4,193382027 | |||||
16 |
56,29473789 |
2,705262111 |
0,657487214 |
0,432289437 |
7,318443087 | |||||
17 |
45,76593714 |
1,234062857 |
-1,471199253 |
2,164427243 |
1,522911136 | |||||
18 |
55,67456575 |
4,325434252 |
3,091371394 |
9,556577099 |
18,70938147 | |||||
19 |
53,98857813 |
-2,988578125 |
-7,314012377 |
53,49477705 |
8,931599212 | |||||
20 |
59,44650777 |
-2,446507769 |
0,542070357 |
0,293840271 |
5,985400263 | |||||
21 |
65,72656364 |
1,273436362 |
3,719944131 |
13,83798434 |
1,621640169 | |||||
22 |
65,60333287 |
3,396667127 |
2,123230765 |
4,508108879 |
11,53734757 | |||||
23 |
60,78661821 |
-3,78661821 |
-7,183285337 |
51,59958824 |
14,33847747 | |||||
24 |
52,10495678 |
-1,104956783 |
2,681661427 |
7,191308011 |
1,220929492 | |||||
25 |
72,21136184 |
-0,211361835 |
0,893594948 |
0,798511931 |
0,044673825 | |||||
26 |
64,26985732 |
-1,26985732 |
-1,058495485 |
1,120412692 |
1,612537614 | |||||
27 |
66,60702857 |
-2,607028574 |
-1,337171253 |
1,788026961 |
6,796597984 | |||||
28 |
66,10891523 |
-0,108915227 |
2,498113347 |
6,240570294 |
0,011862527 | |||||
29 |
63,94063452 |
1,059365483 |
1,16828071 |
1,364879818 |
1,122255227 | |||||
30 |
58,94683587 |
-1,946835865 |
-3,006201348 |
9,037246548 |
3,790169886 | |||||
31 |
64,98966674 |
1,010333259 |
2,957169124 |
8,744849229 |
1,020773294 | |||||
32 |
69,19869883 |
-0,198698833 |
-1,209032092 |
1,4617586 |
0,039481226 | |||||
284,0246953 |
150,0717724 | |||||||||
DW |
1,892592397 |
если r = 0, DW=2 - отсутствие корреляции;
В нашем расчете значение d-критерия попадает в интервал до 2, автокорреляция отсутствует.
Таблица 7. Расчет критерия d - Дарбина-Уотсона для степенной модели
У |
ŷ |
y предск |
e=Yтеор-Yпракт |
e(t)-e(t-1) |
{e(t)-e(t-1)}^2 |
e^2 |
47 |
1,698242977 |
49,91636789 |
2,916367892 |
2,916367892 |
8,505201681 |
8,505201681 |
49 |
1,71188176 |
51,50883886 |
2,508838862 |
-0,40752903 |
0,16607991 |
6,294272437 |
48 |
1,698073599 |
49,89690398 |
1,896903981 |
-0,611934881 |
0,374464299 |
3,598244713 |
55 |
1,723451174 |
52,89945208 |
-2,100547919 |
-3,9974519 |
15,97962169 |
4,41230156 |
49 |
1,69486068 |
49,52912775 |
0,529127746 |
2,629675665 |
6,915194105 |
0,279976172 |
52 |
1,717752641 |
52,20987349 |
0,209873493 |
-0,319254254 |
0,101923279 |
0,044046883 |
58 |
1,742651936 |
55,29068064 |
-2,709319362 |
-2,919192854 |
8,521686921 |
7,340411405 |
57 |
1,729535021 |
53,64571289 |
-3,354287106 |
-0,644967744 |
0,415983391 |
11,25124199 |
50 |
1,685352086 |
48,45650487 |
-1,543495133 |
1,810791973 |
3,27896757 |
2,382377225 |
53 |
1,734550934 |
54,26888939 |
1,268889391 |
2,812384524 |
7,909506711 |
1,610080287 |
58 |
1,763443606 |
58,00208501 |
0,002085012 |
-1,266804379 |
1,604793335 |
4,34728E-06 |
56 |
1,723977618 |
52,96361481 |
-3,036385191 |
-3,038470203 |
9,232301176 |
9,219635028 |
62 |
1,757907557 |
57,26741199 |
-4,732588011 |
-1,69620282 |
2,877104008 |
22,39738929 |
50 |
1,720706856 |
52,56623309 |
2,566233085 |
7,298821097 |
53,2727894 |
6,585552248 |
68 |
1,803618504 |
63,62363889 |
-4,376361113 |
-6,942594198 |
48,1996142 |
19,15253659 |
59 |
1,750060165 |
56,24192349 |
-2,758076511 |
1,618284602 |
2,618845053 |
7,606986039 |
47 |
1,698404811 |
49,93497198 |
2,934971985 |
5,693048496 |
32,41080117 |
8,614060552 |
60 |
1,746402084 |
55,77018491 |
-4,22981509 |
-7,164787075 |
51,33417383 |
17,8913357 |
51 |
1,731594058 |
53,90065683 |
2,900656835 |
7,130471925 |
50,84362988 |
8,413810074 |
57 |
1,768667861 |
58,70402255 |
1,704022548 |
-1,196634287 |
1,431933616 |
2,903692845 |
67 |
1,80315839 |
63,55626832 |
-3,443731677 |
-5,147754226 |
26,49937357 |
11,85928787 |
69 |
1,816630986 |
65,55879861 |
-3,441201386 |
0,002530291 |
6,40237E-06 |
11,84186698 |
57 |
1,777697199 |
59,93730327 |
2,937303274 |
6,37850466 |
40,6853217 |
8,627750522 |
51 |
1,729995768 |
53,70265634 |
2,702656341 |
-0,234646933 |
0,055059183 |
7,304351296 |
72 |
1,903232708 |
80,0262945 |
8,026294503 |
5,323638163 |
28,34112329 |
64,42140345 |
63 |
1,802376924 |
63,44200854 |
0,442008541 |
-7,584285962 |
57,52139355 |
0,195371551 |
64 |
1,818370595 |
65,82192734 |
1,821927335 |
1,379918794 |
1,904175877 |
3,319419215 |
66 |
1,819092119 |
65,93137282 |
-0,068627184 |
-1,890554519 |
3,574196391 |
0,00470969 |
65 |
1,799051706 |
62,95811348 |
-2,041886518 |
-1,973259334 |
3,893752398 |
4,169300552 |
57 |
1,76563943 |
58,29609038 |
1,296090381 |
3,337976899 |
11,14208978 |
1,679850277 |
66 |
1,811736832 |
64,82415015 |
-1,175849848 |
-2,471940229 |
6,110488497 |
1,382622865 |
69 |
1,842507325 |
69,58366911 |
0,583669107 |
1,759518954 |
3,095906951 |
0,340669626 |
Итого |
488,8175028 |
263,6497609 | ||||
DW |
1,854041138 |
Вследствие: отсутствие корреляции
4.
Проверка на
Визуальный анализ графика остатков показывает, что их разброс растет по мере увеличения фактора Х, что может свидетельствовать о гетероскедастичности возмущений. Проверим это предположение методом Голдфельда–Квандта.
а) Линейная модель
Из рассмотрения графиков остатков можно предположить наличие гетероскедастичности (обратно пропорциональной) остатков относительно фактора X2.
Выбираем k=n/3=32/3=11 первых и последних остатков. По каждой из групп определяем сумму квадратов остатков:
Сумма группы первых остатков SS1=44,99891086
Сумма группы последних остатков SS2= 41,53510612
Так как SS1>SS2 , то F-статистику рассчитываем по формуле
F=SS1/SS2 = 1,083394628
Для уровня значимости α = 0,05 и при степенях свободы 4, 27 табличное значение критерия Фишера Fтаб = 2.71.
Так как F=1,08<F=2.2,71, статистическая гипотеза об одинаковой дисперсии возмущений отклоняется на уровне значимости a=0,05. Факт наличия гетероскедастичности возмущений считается не установленным.
б) Степенная модель
Из рассмотрения графиков остатков можно предположить наличие гетероскедастичности остатков относительно фактора X2
Выбираем k=n/3=32/3=11 первых и последних остатков. По каждой из групп определяем сумму квадратов остатков:
Сумма группы первых остатков SS1=0,0031644
Сумма группы последних остатков SS2= 0,0040995
Так как SS2>SS1 , то F-статистику рассчитываем по формуле
F=SS2/SS1 = 1,295477
Для уровня значимости α = 0,05 и при степенях свободы 4, 27 табличное значение критерия Фишера Fтаб = 2.71.
Так как F= 1,295477<F=2.62, статистическая гипотеза об одинаковой дисперсии возмущений отклоняется на уровне значимости a=0,05. Факт наличия гетероскедастичности возмущений считается не установленным.
5. Выбор лучшей модели
Сравним обе модели по основным параметрам
Сравнение моделей
№ |
Параметры сравнения |
Линейная |
Степенная |
1 |
Коэффициент детерминации |
0,91 |
0,85 |
2 |
Коэффициент корреляции |
0,9544 |
0,9244 |
3 |
Остаточная ошибка, % |
2,35 |
0,02 |
4 |
Коэффициент аппроксимации |
0,14 |
0,39 |
5 |
Коэффициент Фишера |
69,06 |
39,78 |
6 |
Критерий автокорреляции остатков |
1,89 |
1,85 |
7 |
Гетероскедастичность остатков |
Нет |
Нет |