Многомерный корреляционный анализ

Автор: Пользователь скрыл имя, 11 Января 2011 в 20:39, реферат

Описание работы

Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи между ними. В естественных науках часто речь идет о функциональной связи, когда каждому значению одной переменной соответствует вполне определенной значение другой. В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Такая зависимость получила название стохастической.

Содержание

Вступление................................................................................................................................... 2
Теоретическая часть..................................................................................................................... 3
Многомерный корреляционный анализ................................................................................... 3
Многошаговый регрессионный анализ.................................................................................... 4
Многомерный регрессионный анализ...................................................................................... 5
Метод отсева факторов по t-критерию.................................................................................... 9
Практическая часть.................................................................................................................... 10
Вариационные характеристики.............................................................................................. 10
Корреляционный анализ........................................................................................................... 14
Многомерный регрессионный анализ.................................................................................... 15
Многошаговый регрессионный анализ.................................................................................. 16
Начальный корреляционный анализ................................................................................................................................. 17
Приложение: Олимп курсовая итог...................................................................... 21
Использованная литература:................................................................................... 30

Работа содержит 1 файл

Содержание.doc

— 269.00 Кб (Скачать)

 Далее осуществляется  проверка значимости отдельных  коэффициентов регрессии на основе t-критерия Стьюдента. Для определения  , используем таблицу распределения Стьюдента: =2,093 (α=0,05 и ν=n-k-1=25-5-1=19).    
 

По нижеприведенной  таблице (гр.5 t-значения) статистически  существенными оказались только два коэффициента регрессии при  переменных  и  (|t|>). 
 
 
 
 
 
 
 
 

Оценки коэффициентов  линейной регрессии 

 ┌───┬──────────┬───────────┬───────────────┬───────────┬────────┬─────────┐ 

 │ N │ Значение  │ Дисперсия │       Средне- │      t -  │ Нижняя  │ Верхняя │ 

 │   │          │           │  квадатическое │ значение  │  оценка │  оценка │ 

 │   │          │           │    отклонение │           │        │         │ 

 ├───┼──────────┼───────────┼───────────────┼───────────┼────────┼─────────┤ 

 │ │    57.70 │     59.12 │          7.69 │      7.50 │  44.37 │   71.03 │ 

 │ │     0.00 │      0.00 │          0.00 │      0.36 │ -0.00 │    0.00 │ 

 │ │     0.06 │      0.01 │          0.08 │      0.66 │  -0.09 │    0.20 │ 

 │ │     0.17 │      0.01 │          0.08 │      2.21 │   0.04 │    0.31 │ 

 │ │    -0.18 │      0.00 │          0.06 │     -2.96 │  -0.29 │   -0.08 │ 

 │ │     0.01 │      0.00 │          0.06 │      0.12 │  -0.09 │    0.11 │ 

 └───┴──────────┴───────────┴───────────────┴───────────┴────────┴─────────┘ 
 

Среди незначимых коэффициентов регрессии наименее существенно по значению t-критерия является коэффициент регрессии при переменной  (среднегодовой индекс роста производства продовольствия), t=0.12. Этот фактор и подлежит исключению из модели в первую очередь.  

Исключив указанный  фактор, на втором шаге получаем уравнение  регрессии следующего вида:  
 

ŷ= 58.478+0.000*x1+0.057*x2+0.173*x3-0.184*x4 . 
 

Величина коэффициента детерминации на этом шаге не изменилась и составляет 0,625, гипотеза о значимости уравнения также не отвергается  с вероятностью 0,95 (см. приложение 3.2).  

Т.к. значение степеней свободы на каждом этапе построения модели изменяется (в связи с уменьшением числа объясняющих переменных), то  также меняется. Тогда при α=0,05 и  

ν=n-k-1=25-4-1=20, =2,086. Таким образом, значимыми являются коэффициенты регрессии при факторах  и , а среди оставшихся незначимых наименьшее значение t-критерия, которое равно  0,35,  принадлежит коэффициенту регрессии при переменной . Поэтому фактор   (численность населения) из дальнейшего процесса исключается.   
 
 

На третьем шаге уравнение регрессии имеет следующий вид: 
 

ŷ= 59.036+0.066*x2+0.168*x3-0.191*x4 . 

  

Воздействием  включенных в модель переменных объясняется 62,2% вариации средней продолжительности  жизни. Проверка на значимость уравнения  регрессии показала, что оно значимо (на уровне значимости α=0,05). На этом шаге  =2,080 (α=0,05 и ν=n-k-1=25-3-1=21), таким образом, статистически существенными оказались все коэффициенты регрессии, кроме коэффициента при объясняющей переменной , который и подлежит исключению по t-критерию из уравнения регрессии (t=0,87). 
 

На последнем  шаге регрессионного анализа получено значимое уравнение следующего вида: 

  

Y=59.951+0.215x3-0.192x4. 

  

Все коэффициенты регрессии значимы (см. приложение). 

В результате моделирования  зависимости средней продолжительности жизни в странах Африки можно сделать следующие выводы. 

Уровень множественного коэффициента детерминации 0,609 свидетельствует  о том, что 60,9% вариации зависимой  переменной объясняется вариацией  двух факторов:  

x3 - число медицинских работников на 10 тыс. населения,  

x4 - доля неграмотных. 

Указанный уровень  влияния достаточно высок, поэтому  можно сделать вывод, что все  факторы, оказывающие существенной влияние на среднюю продолжительность  жизни, включены в модель, поскольку уровень остаточной вариации составляет 39.1%, объясняется воздействием случайных и неучтенных в модели факторов. 

В рассматриваемом  уравнении регрессии с изменением каждого фактора на одну единицу  собственного измерения (при постоянном значении остальных факторов, вошедших в модель) зависимая переменная изменяется на соответствующий коэффициент регрессии βj  отражает среднее приращение функции за счет единичного приращения j-го аргумента, независимое от изменения остальных учтенных в модели аргументов. Интерпретируемый таким образом коэффициент регрессии используется в экономико-статистическом анализе как средняя оценка эффективности влияния j-го аргумента на функцию. 

Значение коэффициента регрессии  βj зависит от принятых единиц измерения величин у и  хj. Если единица измерения хj велика, то увеличение хj  на единицу соответствует меньшее изменение среднего значения у,  то есть βj мало. Если единица измерения у велика,  то соответствующее изменение у выражается большим количеством единиц хj, следовательно, βj велико. 

Анализируя полученную модель, можно сказать, что при  увеличении числа медицинских работников на 1 человека средняя продолжительность  жизни жителей стран Африки повышается в среднем на 0.215 лет; при увеличении доли неграмотных на 1%  средняя продолжительность жизни  уменьшится на 0.192 лет (обратная зависимость). 

Однако с помощью  коэффициентов регрессии нельзя сопоставить факторы по степени  их влияния на зависимую переменную из-за различия единиц измерения и  разной степени колеблемости. Поэтому для устранения таких различий при интерпретации применяется целая система показателей: средние частные коэффициенты эластичности, бета-коэффициенты или коэффициенты регрессии в стандартизированном масштабе и дельта-коэффициенты. 
 

Средний частный  коэффициенты эластичности рассчитывается по формуле: 

             _   _ 

Эj = bj*xj / y. 

                                                                                                                _ 

В рассматриваемой  модели при изменении  на 1% числа  медицинских работников на 10 тысяч населения и доли неграмотных среди жителей исследуемых стран Африки средняя продолжительность жизни изменяется следующим образом: увеличивается на 0.094% и уменьшается на 0.241% соответственно (частные коэффициенты эластичности). - см. приложение. 

Однако средний  частный коэффициент эластичности не учитывает степени колеблемости факторов, которая может значительно  различаться у отдельных факторов. Поэтому для устранения различий в измерении и степени колеблемости факторов используется другой показатель - коэффициент регрессии в стандартизированном масштабе (бета-коэффициент). Он показывает,  на какую часть величины среднего квадратического отклонения изменяется среднее значение зависимой переменной с изменением соответствующей независимой переменной на одно среднее квадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. 

Бета-коэффициенты, рассчитанные для нашей модели, показывают, что при увеличении на одно среднее  квадратическое отклонение числа медработников на 10 тысяч населения и доли неграмотных, средняя продолжительность жизни в среднем увеличивается на 0.587 и уменьшается на 0.495 средних квадратических отклонений соответственно. - см. приложение. 

С помощью частных  коэффициентов эластичности и с помощью бета-коэффициентов можно проранжировать факторы по степени их влияния на зависимую переменную, то есть сопоставить их между собой по величине этого влияния. Но с помощью бета-коэффициентов нельзя непосредственно оценить долю влияния каждого фактора в суммарном влиянии всех факторов. Для этой цели используются дельта-кэффициенты.  

В практических задачах при корректно проведенном  анализе величины дельта-коэффициентов  положительны, то есть все коэффициенты регрессии имеют тот же знак, что и соответствующие парные коэффициенты корреляции. В этих случаях сумма величин вкладов независимых переменных равна коэффициенту множественной детерминации.  Вместе с тем, в некоторых исследованиях отдельные коэффициенты регрессии имеют знак, противоположный знаку соответствующего коэффициента парной корреляции, вследствие чего величина дельта-коэффициента будет отрицательной. Не менее важно, что случаи с отрицательными вкладами могут иметь место только при значительной коррелированности объясняющих переменных. 

В нашей модели наибольшее влияние на среднюю продолжительность  жизни оказывает число медработников  на 10 тысяч населения - 58.2%,  а доля неграмотных оказывает влияние  в размере 41.8%. 
 
 
 

В настоящей  курсовой работе был рассмотрен один из наиболее популярных в настоящее время методов математико-статистического моделирования экономических процессов, который позволяет строить достаточно адекватные и легко экономически интерпретируемые модели.  Но легко заметить, что все вышеприведенные вычисление очень трудоемки и занимают немало времени. Поэтому, кроме вычислений вручную, а также для упрощения исследования, была проведена работа в пакете прикладных программ «ОЛИМП» - совокупность программных средств, ориентированных на решение задач экономического анализа и прогнозирования с помощью различных методов математической статистики. Полученные результаты приведены в Приложении.  
 

           
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Приложение. 
 

           

                         Просмотр начальных данных                          

 ┌────┬────────┬───────────┬────────┬────────┬────────┬─────────┐ 

 │  N │      y │        x1 │     x2 │     x3 │     x4 │      x5 │ 

 ├────┼────────┼───────────┼────────┼────────┼────────┼─────────┤ 

 │  1 │  63.00 │  23102.00 │ 60.85 │ 32.70 │ 55.30 │   87.00 │ 

 │  2 │  44.50 │   9226.00 │  21.00 │  12.70 │  97.00 │   58.00 │ 

 │  3 │  46.00 │   4304.00 │  30.80 │   7.50 │  75.20 │  108.00 │ 

 │  4 │  56.50 │   1169.00 │  29.50 │  35.80 │  59.30 │   71.00 │ 

 │  5 │  48.50 │   5001.00 │   2.29 │   3.80 │ 77.40 │ 101.00 │ 

 │  6 │  47.20 │   8305.00 │   8.48 │   8.10 │  91.20 │   92.00 │ 

 │  7 │  51.00 │   1058.00 │  35.80 │  22.30 │  87.60 │   98.00 │ 

 │  8 │  37.00 │    670.00 │  18.50 │  15.10 │  85.20 │   62.00 │ 

 │  9 │ 54.00 │ 13704.00 │ 35.86 │ 37.60 │ 69.80 │   73.00 │ 

 │ 10 │  42.20 │   6380.00 │  19.07 │   4.20 │  80.00 │   91.00 │ 

 │ 11 │  45.00 │    925.00 │  23.80 │  38.60 │  71.60 │   83.00 │ 

 │ 12 │  64.50 │    372.00 │  73.95 │  72.20 │  80.00 │   75.00 │ 

 │ 13 │  60.60 │  50740.00 │  45.37 │  47.90 │  56.50 │   89.00 │ 

 │ 14 │  52.00 │  32461.00 │  39.50 │  12.60 │  42.10 │   86.00 │ 

 │ 15 │  53.30 │   7563.00 │  40.40 │  18.50 │  56.00 │   91.00 │ 

 │ 16 │  57.80 │   8640.00 │  19.60 │  16.60 │  29.20 │   94.00 │ 

 │ 17 │  53.00 │  10822.00 │  34.60 │  14.40 │  59.50 │  102.00 │ 

 │ 18 │  61.50 │    348.00 │   5.80 │  18.80 │  63.10 │   83.00 │ 

 │ 19 │  53.30 │  22936.00 │  14.17 │  11.20 │  50.40 │   93.00 │ 

 │ 20 │  52.00 │    472.00 │  11.53 │ 15.30 │ 41.60 │   91.00 │ 

 │ 21 │  48.50 │   1837.00 │  37.27 │  31.70 │  84.40 │   83.00 │ 

 │ 22 │  52.30 │  11142.00 │  37.62 │  13.50 │  58.80 │  102.00 │ 

 │ 23 │  50.60 │   1619.00 │   4.52 │   0.50 │  48.00 │   78.00 │ 

 │ 24 │  51.00 │   2349.00 │ 32.94 │ 11.30 │ 74.60 │   91.00 │ 

Информация о работе Многомерный корреляционный анализ