Автор: Пользователь скрыл имя, 28 Октября 2013 в 19:25, лабораторная работа
Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравн
Министерство образования и
науки Российской Федерации
Государственное образовательное учреждение
высшего профессионального образования
«Челябинский Государственный университет»
Институт экономики отраслей бизнеса
и администрирования
Таможенное дело
Анализ данных демографических показателей разных стан мира при помощи изученных эконометрических моделей.
Выполнила:
Студентка 21 ТВ 201
Кудрявцева Е. С.
Проверил:
Шатин И.А.
Челябинск 2012
Задача
Работа выполняется на листах формата А4, с титульным листом и обязательными выводами по работе.
Решение:
Сбор данных из интернет – источников получены данные средней продолжительности жизни, ВВП в паритетах покупательной способности, темпы прироста населения по сравнению с предыдущим годом, %; темпы прироста рабочей силы по сравнению с предыдущим годом, %; коэффициент младенческой смертности. Изучим зависимость продолжительности жизни от нескольких факторов по данным за 2005 г., представленным в табл.1.
Таблица 1. Обзор социальных показателей стран третьего мира.
Страна |
У |
Х1 |
Х2 |
Х3 |
Х4 |
Мозамбик |
47 |
3 |
2,6 |
2,4 |
113 |
Бурунди |
49 |
2,3 |
2,6 |
2,7 |
98 |
Чад |
48 |
2,6 |
2,5 |
2,5 |
117 |
Непал |
55 |
4,3 |
2,5 |
2,4 |
91 |
Буркина-Фасо |
49 |
2,9 |
2,8 |
2,1 |
99 |
Мадагаскар |
52 |
2,4 |
3,1 |
3,1 |
89 |
Бангладеш |
58 |
5,1 |
2 |
2,1 |
79 |
Гаити |
57 |
3,4 |
2 |
1,7 |
72 |
Мали |
50 |
2 |
2,9 |
2,7 |
123 |
Нигерия |
53 |
4,5 |
2,9 |
2,8 |
80 |
Кения |
58 |
5,1 |
2,7 |
2,7 |
58 |
Того |
56 |
4,2 |
3 |
2,8 |
88 |
Индия |
62 |
5,2 |
1,8 |
2 |
68 |
Бенин |
50 |
6,5 |
2,9 |
2,5 |
95 |
Пакистан |
68 |
7,4 |
3,1 |
4 |
46 |
Мавритания |
59 |
7,4 |
2,8 |
2,7 |
73 |
Зимбабве |
47 |
4,9 |
3,1 |
2,8 |
124 |
Гондурас |
60 |
8,3 |
2,9 |
3,3 |
90 |
Китай |
51 |
5,7 |
2,5 |
2,7 |
96 |
Камерун |
57 |
7,5 |
2,4 |
2,2 |
55 |
Конго |
67 |
7 |
3 |
3,8 |
45 |
Шри-Ланка |
69 |
10,8 |
1,1 |
1,1 |
34 |
Египет |
57 |
7,8 |
2,9 |
3,1 |
56 |
Индонезия |
51 |
7,6 |
2,9 |
2,6 |
90 |
Филиппины |
72 |
12,1 |
1,3 |
2 |
16 |
Марокко |
63 |
14,2 |
2 |
2,7 |
56 |
Папуа - Новая |
64 |
14,1 |
1,6 |
2,5 |
51 |
Гвинея |
66 |
10,6 |
2,2 |
2,7 |
39 |
Гватемала |
65 |
12,4 |
2 |
2,6 |
55 |
Эквадор |
57 |
9 |
2,3 |
2,3 |
64 |
Доминиканская Республика |
66 |
12,4 |
2,9 |
3,5 |
44 |
Ямайка |
69 |
15,6 |
2,2 |
3,2 |
36 |
Принятые в таблице обозначения:
у — средняя продолжительность жизни, лет;
х1 - ВВП в паритетах покупательной способности, млрд. долл.;
х2 - темпы прироста населения по сравнению с предыдущим годом, %;
х3 - темпы прироста рабочей силы по сравнению с предыдущим годом;
х4 - коэффициент младенческой смертности, %.
1. Корреляционный анализ
Корреляционный анализ проводился с использованием компьютерной программы EXCEL с помощью пакета анализа данных
Таблица 2. Корреляционная зависимость продолжительности жизни от различных факторов.
У |
Х1 |
Х2 |
Х3 |
Х4 | |
У |
1 |
||||
Х1 |
0,778216 |
1 |
|||
Х2 |
-0,52417 |
-0,4926 |
1 |
||
Х3 |
0,112326 |
0,096044 |
0,695031 |
1 |
|
Х4 |
-0,92781 |
-0,76337 |
0,523244 |
-0,0323 |
1 |
На основании полученных данных можно сделать вывод, что наибольшее влияние на продолжительность жизни оказывает фактор Х1- ВВП в паритетах покупательной способности, у остальных факторов наблюдается слабый корреляционный отклик.
2. Анализ линейной и нелинейной моделей.
а) Анализ линейной модели регрессии.
Для выбора наилучшей регрессионной функции необходимо ее проанализировать по набору критериев: коэффициенты попарной корреляции, коэффициенты множественной корреляции, критерий Фишера, статистики Стьюдента.
Строим регрессионную функцию по всем регрессорам, используя при этом пакет анализа данных MS Excel «Регрессия»
Таблица 3. Регрессионная статистика
Множественный R |
0,954443845 |
R-квадрат |
0,910963054 |
Нормированный R-квадрат |
0,897772395 |
Стандартная ошибка |
2,357586433 |
Наблюдения |
32 |
Пояснения к таблице 3. Регрессионная статистика содержит строки, характеризующие построенное уравнение регрессии:
Для парной регрессии Множественный R равен коэффициенту корреляции (rxу). Множественный коэффициент корреляции R определяется как коэффициент корреляции между наблюдаемыми значениями Yi и расчетными, прогнозируемыми значениями. По его значению 0,9544 можно сказать, что между X и Y существует сильная линейная зависимость.
Строка R–квадрат отражает коэффициент детерминации (равен коэффициенту корреляции в квадрате), он описывает, на сколько х описывает наш y. Коэффициент детерминации = 0,91 означает, что изменение y на 91% зависит от вариаций х. На долю прочих факторов, не учитываемых в регрессии, приходится 9%.
Нормированный R-квадрат учитывает количество объясняющих переменных х.
Последняя строка содержит количество выборочных данных (n).
Значимость уравнения в целом оценивается с помощью F-критерия Фишера
Если найденное значение F больше табличного для уровня значимости α и степеней свободы (n-m-1) и m, то с вероятность 1 - α делаем заключение о статистической значимости уравнения в целом.
Таблица 4. Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
4 |
1535,428 |
383,8570569 |
69,06122566 |
8,7697E-14 |
Остаток |
27 |
150,0718 |
5,558213791 |
||
Итого |
31 |
1685,5 |
Пояснения к таблице дисперсионного анализа: число регрессоров m = 4 число n-m-1 = 27, где n – число наблюдений.
Для уровня значимости α = 0,05 и при степенях свободы 4, 27 табличное значение критерия Фишера Fтаб = 2.71.
Значение F =69,0612 существенно превышает табличное, что говорит о статистической значимости уравнения в целом.
Таблица 5. Коэффициенты регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% | |
Y-пере-сечение |
72,88011688 |
3,485095957 |
20,91193981 |
3,27974E-18 |
65,72929064 |
80,03094312 |
Х1 |
-0,000218863 |
0,193828494 |
-0,001129159 |
0,999107364 |
-0,397922082 |
0,397484356 |
Х2 |
-6,138337701 |
1,929323444 |
-3,181601156 |
0,00366448 |
-10,09698242 |
-2,179692981 |
Х3 |
5,099660242 |
1,509308865 |
3,378804934 |
0,002227497 |
2,002814253 |
8,196506231 |
Х4 |
-0,180349267 |
0,025734016 |
-7,00820538 |
1,55967E-07 |
-0,233151106 |
-0,127547428 |
В столбце «Коэффициенты» получены коэффициенты уравнения регрессии.
Коэффициент b0= 72,88 в Таблице анализа – это Y-пересечение. Таким образом, получили уравнение регрессии:
У=72,88-0,0002Х1-6,138Х2+5,
Коэффициент b1=-0,0002 показывает, что при увеличении ВВП на 1 млр. дол. средняя продолжительность жизни уменьшается в среднем на 0,0002 лет, увеличение темпов прироста населения на 1%,. приводит в среднем уменьшению продолжительности жизни на 6,138 лет, увеличение темпов прироста рабочей силы на 1% приводит к увеличению продолжительности жизни на 5,099 лет, а увеличение коэффициента младенческой смертности, на 1% ведет к уменьшению средней продолжительности жизни на 0,18 лет.
Табличные t–критерии Стьюдента
зависят от принятого уровня значимости
и от числа степеней свободы (n-m-1).
Если вычисленные значения t–критерия
превышают табличные, то говорят, что
соответствующий коэффициент
Более того, используя табличное значение t-критерия и стандартную ошибку mi коэффициента регрессии bi можно с вероятностью 1 - α сделать вывод о том, что истинное значение коэффициента регрессии попадет в интервал (bi – tтаб*mi , bi + tтаб*mi).
Они составляют:
m(X1) =0.193, m(X2) =1,929, m(X3) =1,509, m(X4) =0.025, m(y) =3.485
t(X1) =-0.0011, t(X2) =-3.1816, t(X3) =3.3788, t(X4) =-7,008, t(y) =20.91
Табличное значение t–критерия Стьюдента при уровне значимости α = 0,05 и числе степеней свободы 27 tтаб =2,051. Коэффициенты t- статистики при регрессорах Х1 , Х2 и Х4 меньше t таб., и согласно t–критерию не являются статистически значимыми.
По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности значимости мало (меньше 0,05), и можно считать, что коэффициент регрессии значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 – коэффициент считается незначимым.
Для коэффициентов b2, b3, b4 значения вероятности меньше 0,05, следовательно, эти показатели можно считать значимыми, b1 – больше, чем 0,05 - коэффициент не значим.
Далее представлены доверительные интервалы (нижняя и верхняя границы) для рассчитанных коэффициентов. Доверительная или интервальная оценка позволяет по данным выборки указать интервал, в котором с высокой вероятностью следует писать истинное, но не известное значение параметра распределения генеральной совокупности.
Таблица 6 Расчет относительной
ошибки аппроксимации
Наблюдение |
Предсказанное У |
Остатки |
У |
Eостатки/у |
1 |
48,77949967 |
-1,779499674 |
47 |
-0,037861695 |
2 |
53,01478996 |
-4,014789956 |
49 |
-0,081934489 |
3 |
49,18198995 |
-1,181989945 |
48 |
-0,024624791 |
4 |
53,3607328 |
1,639267204 |
55 |
0,029804858 |
5 |
48,54684569 |
0,453154314 |
49 |
0,009248047 |
6 |
53,60860672 |
-1,608606719 |
52 |
-0,030934745 |
7 |
57,06401969 |
0,935980312 |
58 |
0,016137592 |
8 |
56,28697253 |
0,713027472 |
57 |
0,012509254 |
9 |
46,66462263 |
3,335377371 |
50 |
0,066707547 |
10 |
54,92905998 |
-1,929059977 |
53 |
-0,036397358 |
11 |
59,61431405 |
-1,61431405 |
58 |
-0,027833001 |
12 |
52,87249773 |
3,12750227 |
56 |
0,055848255 |
13 |
59,76554125 |
2,234458745 |
62 |
0,036039657 |
14 |
50,69348517 |
-0,693485173 |
50 |
-0,013869703 |
15 |
65,9522251 |
2,047774896 |
68 |
0,030114337 |
16 |
56,29473789 |
2,705262111 |
59 |
0,0458519 |
17 |
45,76593714 |
1,234062857 |
47 |
0,026256657 |
18 |
55,67456575 |
4,325434252 |
60 |
0,072090571 |
19 |
53,98857813 |
-2,988578125 |
51 |
-0,058599571 |
20 |
59,44650777 |
-2,446507769 |
57 |
-0,042921189 |
21 |
65,72656364 |
1,273436362 |
67 |
0,019006513 |
22 |
65,60333287 |
3,396667127 |
69 |
0,04922706 |
23 |
60,78661821 |
-3,78661821 |
57 |
-0,066431898 |
24 |
52,10495678 |
-1,104956783 |
51 |
-0,021665819 |
25 |
72,21136184 |
-0,211361835 |
72 |
-0,002935581 |
26 |
64,26985732 |
-1,26985732 |
63 |
-0,020156465 |
27 |
66,60702857 |
-2,607028574 |
64 |
-0,040734821 |
28 |
66,10891523 |
-0,108915227 |
66 |
-0,001650231 |
29 |
63,94063452 |
1,059365483 |
65 |
0,016297931 |
30 |
58,94683587 |
-1,946835865 |
57 |
-0,034155015 |
31 |
64,98966674 |
1,010333259 |
66 |
0,01530808 |
32 |
69,19869883 |
-0,198698833 |
69 |
-0,002879693 |
средняя ошибка аппроксимации |
0,14% |