Парные корреляции

Автор: Пользователь скрыл имя, 17 Мая 2012 в 06:52, лабораторная работа

Описание работы

На основе таблицы данных (см. Приложение) для соответствующего варианта :
1. Вычислить линейные коэффициенты парной корреляции для всех пар (x,y).
2. Выбрать два наибольших коэффициента по абсолютному значению среди положительных и отрицательных корреляций, а также соответствующие пары экономических показателей (x,y).

Работа содержит 1 файл

Отчет по лаборат работе №1 .docx

— 412.58 Кб (Скачать)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ  ФЕДЕРАЦИИ 

ФЕДЕРАЛЬНОЕ  ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ

ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ 
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«КРАСНОЯРСКИЙ ГОСУДАРСТВЕННЫЙ

ТОРГОВО-ЭКОНОМИЧЕСКИЙ  ИНСТИТУТ» 
 
 
 
 
 

Отчет по лабораторной работе №1

«Парные корреляции»

Вариант №4 
 
 
 

     Выполнили:       Проверил:

     Студентки 3 курса      Шишов В.В.

     Группы  М(б) 09-6       

     Полубояринова М.Н.

     Афонина К.А. 
 
 

                  Красноярск 2012

На основе таблицы  данных (см. Приложение) для соответствующего варианта :

1. Вычислить  линейные коэффициенты парной  корреляции для всех пар (x,y).

2. Выбрать два  наибольших коэффициента по абсолютному  значению среди положительных  и отрицательных корреляций, а  также соответствующие пары экономических  показателей (x,y).

3. Построить  графики корреляционных полей  (на основе точечной диаграммы).

4. Проверить  значимость выбранных коэффициентов  парной корреляции.

5. Построить  доверительный интервал для линейного  коэффициента парной корреляции. 

Решение: 

1. Для  того  чтобы рассчитать коэффициент  линейной корреляции Пирсона  мы будем использовать два  способа: 

1) Через  встроенную функцию Корреляция. Мы к исходной таблице данных  добавляем новую строчку –  "Корреляция между у и х", которая  заполняется путем  расчета значений корреляции  между зависимой переменной y и соответствующей независимой переменной х. Расчет проводится последовательно для всех пар (у, xi).

После чего мы получили:

 

Рис. 1.1 Расчет коэффициентов корреляции между  результативным признаком y и независимыми переменными х 

2) При помощи пакета анализа данных MS Excel на основе расчета матрицы линейных корреляций Пирсона (см. Рис. 1.2). Для этого, в главном меню выбирается: СервисÞАнализ данныхÞКорреляция. В качестве входного интервала указывается весь диапазон данных исходной таблицы (Рис. 1.2.). В полученной матрице корреляций рассматривается последняя строка, где указываются искомые значений корреляций между у и всеми независимыми переменными.

Рис 1.2 Расчет матрицы коэффициентов корреляции на основе пакета анализа данных MS Excel

Получили следующие  результаты: 

 

В данной матрице корреляций рассматриваем  последнюю строчку.

В обоих  случаях получились одинаковые значения. 

2. Из  полученного набора значений  выбираем мы два наибольших  значения среди положительных  корреляций. Далее указываем, те  независимые переменные, которые  наиболее сильно коррелированы с зависимой у. Получается, что наибольшее значение корреляции 0,990461 и 0,987146457. А это значит, что наиболее сильно коррелирована суммарные активы и численность работающих с чистой прибылью. 

3. Построим  для начала первую зависимость.

График  корреляционного поля будем строить  с помощью мастера диаграмм, там  выберем точечную диаграмму. Ось  абсцисс - это значения соответствующей  независимой переменной x, а именно суммарные активы. Ось ординат – значения у, т.е. чистая прибыль.

Далее построим вторую зависимость, где в  качестве оси абсцисс значение численности  работающих, а оси ординат также  чистая прибыль. 

4. Для проверки значимости коэффициентов корреляции применяем t-критерий Стьюдента и получаем

tрасч.        22,27034307   25,91697

Для того чтобы получить значение tтабл используем таблицу значений Стьюдента, приведенная в приложении для уровней значимости a=0,05 и 0,01. Вычислив, мы получили

t табл. 0,01 3,012276
t табл.0,05 2,160369

Так как  tрасч.> tтабл., то вероятность P=1-a=1-0,05=0,95 можно утверждать, что полученный коэффициент корреляции между суммарными активами и чистой прибылью отличны от 0, т.е суммарные активы и чистая прибыль значимо положительно коррелированы.

Аналогичная ситуация и с численностью работающих и чистой прибыли. Так как tрасч.> tтабл., то вероятность P=1-a=1-0,05=0,95 можно утверждать, что полученный коэффициент корреляции между численностью работающих и чистой прибылью отличны от 0, т.е. численность работающих и чистая прибыль значимо положительно коррелированы. 

5. Рассчитаем  доверительные интервалы для  коэффициентов корреляции по  формулам, а, именно: 

1. Рассчитаем  новую величину z по формуле:

Zфакт.=1/2*(LN((1+Rxy)/(1-Rxy))) 

Получаем 

Z факт 2,52041774   2,670374

 

2. Рассчитаем  среднюю ошибку z:

Получаем 

m   0,288675  

 

3. Построим  доверительный интервал для z:

Zлевая ≤ Z ≤ Zправая

Но для  начала посчитаем:

Zлевая = Zфакт.-tтабл.*m

Zправая = Zфакт.+tтабл.*m 

Получим:

       
Zлев 1,271391115   1,421348
Z правая 3,144071501   3,294028
       

Теперь  можно построить доверительный  интервал

1,271391115 ≤ 2,52041774 ≤ 3,144071501 

1,421348 ≤ 2,670374 ≤ 3,294028 

4. Находим  левую и правую границу этого  интервала:

Rлевая = (EXP(2*Zлевая)-1)/ (EXP(2*Zлевая)+1)

Rправая = (EXP(2*Zправая)-1)/ (EXP(2*Zправая)+1)

Получаем 

       
R лев 0,854174239   0,88988
R прав 0,996290478   0,99725
       

6. Вывод:  с вероятностью P=1-a=0,95 можно утверждать, что истинное значение коэффициента корреляции  между суммарными активами и чистой прибыли лежит в пределах от 0,854174239 до 0,996290478.

     С вероятностью P=1-a=0,95 можно утверждать, что истинное значение коэффициента корреляции  между численностью работающих и чистой прибыли лежит в пределах от 0,88988 до 0,99725.  

7. Теперь  рассчитаем доверительные интервалы  для Z, с вероятность Р=0,01, т.е. t табл = 3,0123 

Zлевая ≤ Z ≤ Zправая

Но для  начала посчитаем:

Zлевая = Zфакт.-tтабл.*m

Zправая = Zфакт.+tтабл.*m 

Получим

Zлев 1,650841633   1,800798
Zправ 3,389993848   3,53995

 

Теперь  можно построить доверительный  интервал

1,650841633 ≤ 2,52041774 ≤ 3,389993848 

1,800798 ≤ 2,670374 ≤ 3,53995

8. Находим левую и правую границу этого интервала:

Rлевая = (EXP(2*Zлевая)-1)/ (EXP(2*Zлевая)+1)

Rправая = (EXP(2*Zправая)-1)/ (EXP(2*Zправая)+1)

Получаем 

Rлев 0,928973023   0,946889
Rправ 0,997730002   0,998318

 

9. Вывод: с вероятностью P=1-a=0,99 можно утверждать, что истинное значение коэффициента корреляции  между суммарными активами и чистой прибыли лежит в пределах от 0,928973023 до 0,997730002.

     С вероятностью P=1-a=0,99 можно утверждать, что истинное значение коэффициента корреляции  между численностью работающих и чистой прибыли лежит в пределах от 0,946889 до 0,998318.  
 
 
 
 


Информация о работе Парные корреляции