Анализ данных демографических показателей разных стан мира при помощи изученных эконометрических моделей

Автор: Пользователь скрыл имя, 28 Октября 2013 в 19:25, лабораторная работа

Описание работы

Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравн

Работа содержит 1 файл

Женя Эконометрика.docx

— 71.55 Кб (Скачать)

Министерство образования и  науки Российской Федерации 
Государственное образовательное учреждение высшего профессионального образования 
«Челябинский Государственный университет» 
Институт экономики отраслей бизнеса и администрирования 
Таможенное дело

 

 

 

 

 

 

Практическая работа по дисциплине «Эконометрика»

Анализ  данных демографических показателей разных стан мира при помощи изученных эконометрических моделей.

 

 

 

 

 

Выполнила:

Студентка 21 ТВ 201

Кудрявцева Е. С.

 

Проверил:

Шатин И.А.

 

 

 

 

 

 

 

 

Челябинск 2012

 

Задача

  1. Рассчитайте корреляцию между,  экономическими показателями (не менее 5) из статистических данных по выборке не менее 30 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
  2. Постройте линейную и не линейную (на свой выбор) множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику.
  3. Проверьте модели  на отсутствие автокорреляции.
  4. Проверка на гетероскедастичность моделей.
  5. Сравните модели между собой выберете лучшую

Работа выполняется на листах формата А4, с титульным листом и обязательными выводами по работе.

Решение:

Сбор данных из интернет – источников получены данные средней продолжительности жизни, ВВП в паритетах покупательной способности, темпы прироста населения по сравнению с предыдущим годом, %; темпы прироста рабочей силы по сравнению с предыдущим годом, %; коэффициент младенческой смертности. Изучим зависимость продолжительности жизни от нескольких факторов по данным за 2005 г., представленным в табл.1.

Таблица 1. Обзор социальных показателей стран третьего мира.

Страна

У

Х1

Х2

Х3

Х4

Мозамбик

47

3

2,6

2,4

113

Бурунди

49

2,3

2,6

2,7

98

Чад

48

2,6

2,5

2,5

117

Непал

55

4,3

2,5

2,4

91

Буркина-Фасо

49

2,9

2,8

2,1

99

Мадагаскар

52

2,4

3,1

3,1

89

Бангладеш

58

5,1

2

2,1

79

Гаити

57

3,4

2

1,7

72

Мали

50

2

2,9

2,7

123

Нигерия

53

4,5

2,9

2,8

80

Кения

58

5,1

2,7

2,7

58

Того

56

4,2

3

2,8

88

Индия

62

5,2

1,8

2

68

Бенин

50

6,5

2,9

2,5

95

Пакистан

68

7,4

3,1

4

46

Мавритания

59

7,4

2,8

2,7

73

Зимбабве

47

4,9

3,1

2,8

124

Гондурас

60

8,3

2,9

3,3

90

Китай

51

5,7

2,5

2,7

96

Камерун

57

7,5

2,4

2,2

55

Конго

67

7

3

3,8

45

Шри-Ланка

69

10,8

1,1

1,1

34

Египет

57

7,8

2,9

3,1

56

Индонезия

51

7,6

2,9

2,6

90

Филиппины

72

12,1

1,3

2

16

Марокко

63

14,2

2

2,7

56

Папуа - Новая

64

14,1

1,6

2,5

51

Гвинея

66

10,6

2,2

2,7

39

Гватемала

65

12,4

2

2,6

55

Эквадор

57

9

2,3

2,3

64

Доминиканская Республика

66

12,4

2,9

3,5

44

Ямайка

69

15,6

2,2

3,2

36


Принятые в таблице  обозначения:

у — средняя продолжительность  жизни, лет;

х1 - ВВП в паритетах покупательной способности, млрд. долл.;

х2 - темпы прироста населения по сравнению с предыдущим годом, %;

х3 - темпы прироста рабочей  силы по сравнению с предыдущим годом;

х4 - коэффициент младенческой смертности, %.

1. Корреляционный  анализ

Корреляционный анализ проводился с использованием компьютерной программы EXCEL с помощью пакета анализа данных

 

Таблица 2. Корреляционная зависимость  продолжительности жизни от различных  факторов.

 

У

Х1

Х2

Х3

Х4

У

1

       

Х1

0,778216

1

     

Х2

-0,52417

-0,4926

1

   

Х3

0,112326

0,096044

0,695031

1

 

Х4

-0,92781

-0,76337

0,523244

-0,0323

1


 

На основании полученных данных можно сделать вывод, что  наибольшее влияние на продолжительность  жизни оказывает фактор Х1- ВВП в паритетах покупательной способности, у остальных факторов наблюдается слабый корреляционный отклик.

2. Анализ линейной и нелинейной моделей.

а) Анализ линейной модели регрессии.

Для выбора наилучшей регрессионной  функции необходимо ее проанализировать по набору критериев: коэффициенты попарной корреляции, коэффициенты множественной  корреляции, критерий Фишера, статистики Стьюдента.

Строим регрессионную  функцию по всем регрессорам, используя при этом пакет анализа данных MS Excel «Регрессия»

Таблица 3. Регрессионная  статистика

Множественный R

0,954443845

R-квадрат

0,910963054

Нормированный R-квадрат

0,897772395

Стандартная ошибка

2,357586433

Наблюдения

32


Пояснения к таблице 3. Регрессионная статистика содержит строки, характеризующие построенное уравнение регрессии:

Для парной регрессии Множественный R равен коэффициенту корреляции (r). Множественный коэффициент корреляции R определяется как коэффициент корреляции между наблюдаемыми значениями Yi и расчетными, прогнозируемыми значениями. По его значению 0,9544 можно сказать, что между X и Y существует сильная линейная зависимость.

Строка R–квадрат отражает коэффициент детерминации (равен коэффициенту корреляции в квадрате), он описывает,  на сколько х описывает наш y. Коэффициент детерминации = 0,91 означает, что изменение y на 91% зависит от вариаций х. На долю прочих факторов, не учитываемых в регрессии, приходится 9%.

Нормированный R-квадрат учитывает количество объясняющих переменных х.

Последняя строка содержит количество выборочных данных (n).

 

Значимость уравнения  в целом оценивается с помощью F-критерия Фишера

Если найденное значение F больше табличного для уровня значимости α и степеней свободы (n-m-1) и m, то с вероятность 1 - α делаем заключение о статистической значимости уравнения в целом.

Таблица 4. Дисперсионный  анализ

 

df

SS

MS

F

Значимость F

Регрессия

4

1535,428

383,8570569

69,06122566

8,7697E-14

Остаток

27

150,0718

5,558213791

   

Итого

31

1685,5

     

Пояснения к таблице дисперсионного анализа: число регрессоров m = 4 число n-m-1 = 27, где n – число наблюдений.

Для уровня значимости α = 0,05 и при степенях свободы 4, 27 табличное значение критерия Фишера Fтаб = 2.71.

Значение F =69,0612 существенно превышает табличное, что говорит о статистической значимости уравнения в целом.

Таблица 5.  Коэффициенты регрессии

 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пере-сечение

72,88011688

3,485095957

20,91193981

3,27974E-18

65,72929064

80,03094312

Х1

-0,000218863

0,193828494

-0,001129159

0,999107364

-0,397922082

0,397484356

Х2

-6,138337701

1,929323444

-3,181601156

0,00366448

-10,09698242

-2,179692981

Х3

5,099660242

1,509308865

3,378804934

0,002227497

2,002814253

8,196506231

Х4

-0,180349267

0,025734016

-7,00820538

1,55967E-07

-0,233151106

-0,127547428


 

В столбце «Коэффициенты» получены коэффициенты уравнения регрессии.

Коэффициент b0= 72,88 в Таблице анализа – это Y-пересечение. Таким образом, получили уравнение регрессии:

У=72,88-0,0002Х1-6,138Х2+5,099Х3-0,18Х4

Коэффициент b1=-0,0002 показывает, что при увеличении ВВП на 1 млр. дол. средняя продолжительность жизни уменьшается в среднем на 0,0002 лет, увеличение темпов прироста населения на 1%,. приводит в среднем уменьшению продолжительности жизни на 6,138 лет, увеличение темпов прироста рабочей силы на 1% приводит к увеличению продолжительности жизни на 5,099 лет, а увеличение коэффициента младенческой смертности, на 1% ведет к уменьшению средней продолжительности жизни на 0,18 лет.

Табличные t–критерии Стьюдента  зависят от принятого уровня значимости и от числа степеней свободы (n-m-1). Если вычисленные значения t–критерия  превышают табличные, то говорят, что  соответствующий коэффициент регрессии  является статистически значимым и  на него можно опираться в анализе  и прогнозе.

Более того, используя табличное  значение t-критерия и стандартную  ошибку mi коэффициента регрессии bi можно с вероятностью 1 - α сделать вывод о том, что истинное значение коэффициента регрессии попадет в интервал (bi – tтаб*mi , bi + tтаб*mi).

Они составляют:

m(X1) =0.193, m(X2) =1,929, m(X3) =1,509, m(X4) =0.025, m(y) =3.485

t(X1) =-0.0011, t(X2) =-3.1816, t(X3) =3.3788, t(X4) =-7,008, t(y) =20.91

Табличное значение t–критерия  Стьюдента при уровне значимости α = 0,05 и числе степеней свободы 27 tтаб =2,051. Коэффициенты t- статистики при регрессорах Х1 , Х2 и Х4 меньше t таб., и согласно t–критерию не являются статистически значимыми.

По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности  значимости мало (меньше 0,05), и можно  считать, что коэффициент регрессии  значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 – коэффициент считается  незначимым.

Для коэффициентов b2, b3, b4 значения вероятности меньше 0,05, следовательно, эти показатели можно считать значимыми, b1 – больше, чем 0,05 -  коэффициент не значим.

Далее представлены доверительные  интервалы (нижняя и верхняя границы) для рассчитанных коэффициентов.  Доверительная или интервальная оценка позволяет по данным выборки указать интервал, в котором с высокой вероятностью следует писать истинное, но не известное значение параметра распределения генеральной совокупности.

 
Таблица 6 Расчет относительной  ошибки аппроксимации

Наблюдение

Предсказанное У

Остатки

У

Eостатки/у

1

48,77949967

-1,779499674

47

-0,037861695

2

53,01478996

-4,014789956

49

-0,081934489

3

49,18198995

-1,181989945

48

-0,024624791

4

53,3607328

1,639267204

55

0,029804858

5

48,54684569

0,453154314

49

0,009248047

6

53,60860672

-1,608606719

52

-0,030934745

7

57,06401969

0,935980312

58

0,016137592

8

56,28697253

0,713027472

57

0,012509254

9

46,66462263

3,335377371

50

0,066707547

10

54,92905998

-1,929059977

53

-0,036397358

11

59,61431405

-1,61431405

58

-0,027833001

12

52,87249773

3,12750227

56

0,055848255

13

59,76554125

2,234458745

62

0,036039657

14

50,69348517

-0,693485173

50

-0,013869703

15

65,9522251

2,047774896

68

0,030114337

16

56,29473789

2,705262111

59

0,0458519

17

45,76593714

1,234062857

47

0,026256657

18

55,67456575

4,325434252

60

0,072090571

19

53,98857813

-2,988578125

51

-0,058599571

20

59,44650777

-2,446507769

57

-0,042921189

21

65,72656364

1,273436362

67

0,019006513

22

65,60333287

3,396667127

69

0,04922706

23

60,78661821

-3,78661821

57

-0,066431898

24

52,10495678

-1,104956783

51

-0,021665819

25

72,21136184

-0,211361835

72

-0,002935581

26

64,26985732

-1,26985732

63

-0,020156465

27

66,60702857

-2,607028574

64

-0,040734821

28

66,10891523

-0,108915227

66

-0,001650231

29

63,94063452

1,059365483

65

0,016297931

30

58,94683587

-1,946835865

57

-0,034155015

31

64,98966674

1,010333259

66

0,01530808

32

69,19869883

-0,198698833

69

-0,002879693

средняя ошибка аппроксимации

0,14%

Информация о работе Анализ данных демографических показателей разных стан мира при помощи изученных эконометрических моделей