Автор: Пользователь скрыл имя, 17 Мая 2012 в 06:52, лабораторная работа
На основе таблицы данных (см. Приложение) для соответствующего варианта :
1. Вычислить линейные коэффициенты парной корреляции для всех пар (x,y).
2. Выбрать два наибольших коэффициента по абсолютному значению среди положительных и отрицательных корреляций, а также соответствующие пары экономических показателей (x,y).
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ
ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ
УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«КРАСНОЯРСКИЙ ГОСУДАРСТВЕННЫЙ
ТОРГОВО-ЭКОНОМИЧЕСКИЙ
ИНСТИТУТ»
Отчет по лабораторной работе №1
«Парные корреляции»
Вариант
№4
Выполнили:
Студентки 3 курса Шишов В.В.
Группы М(б) 09-6
Полубояринова М.Н.
Афонина
К.А.
Красноярск 2012
На основе таблицы данных (см. Приложение) для соответствующего варианта :
1. Вычислить линейные коэффициенты парной корреляции для всех пар (x,y).
2. Выбрать два
наибольших коэффициента по
3. Построить
графики корреляционных полей
(на основе точечной диаграммы)
4. Проверить
значимость выбранных
5. Построить
доверительный интервал для
Решение:
1. Для того
чтобы рассчитать коэффициент
линейной корреляции Пирсона
мы будем использовать два
способа:
1) Через встроенную функцию Корреляция. Мы к исходной таблице данных добавляем новую строчку – "Корреляция между у и х", которая заполняется путем расчета значений корреляции между зависимой переменной y и соответствующей независимой переменной х. Расчет проводится последовательно для всех пар (у, xi).
После чего мы получили:
Рис. 1.1
Расчет коэффициентов корреляции между
результативным признаком y и независимыми
переменными х
2) При помощи пакета анализа данных MS Excel на основе расчета матрицы линейных корреляций Пирсона (см. Рис. 1.2). Для этого, в главном меню выбирается: СервисÞАнализ данныхÞКорреляция. В качестве входного интервала указывается весь диапазон данных исходной таблицы (Рис. 1.2.). В полученной матрице корреляций рассматривается последняя строка, где указываются искомые значений корреляций между у и всеми независимыми переменными.
Рис 1.2 Расчет матрицы коэффициентов корреляции на основе пакета анализа данных MS Excel
Получили следующие
результаты:
В данной матрице корреляций рассматриваем последнюю строчку.
В обоих
случаях получились одинаковые значения.
2. Из
полученного набора значений
выбираем мы два наибольших
значения среди положительных
корреляций. Далее указываем, те
независимые переменные, которые
наиболее сильно коррелированы с
зависимой у. Получается, что наибольшее
значение корреляции 0,990461 и 0,987146457. А это значит, что наиболее
сильно коррелирована суммарные активы
и численность работающих с чистой прибылью.
3. Построим для начала первую зависимость.
График корреляционного поля будем строить с помощью мастера диаграмм, там выберем точечную диаграмму. Ось абсцисс - это значения соответствующей независимой переменной x, а именно суммарные активы. Ось ординат – значения у, т.е. чистая прибыль.
Далее
построим вторую зависимость, где в
качестве оси абсцисс значение численности
работающих, а оси ординат также
чистая прибыль.
4. Для проверки значимости коэффициентов корреляции применяем t-критерий Стьюдента и получаем
tрасч. | 22,27034307 | 25,91697 |
Для того чтобы получить значение tтабл используем таблицу значений Стьюдента, приведенная в приложении для уровней значимости a=0,05 и 0,01. Вычислив, мы получили
t табл. 0,01 | 3,012276 |
t табл.0,05 | 2,160369 |
Так как tрасч.> tтабл., то вероятность P=1-a=1-0,05=0,95 можно утверждать, что полученный коэффициент корреляции между суммарными активами и чистой прибылью отличны от 0, т.е суммарные активы и чистая прибыль значимо положительно коррелированы.
Аналогичная
ситуация и с численностью работающих
и чистой прибыли. Так как tрасч.>
tтабл., то вероятность P=1-a=1-0,05=0,95
можно утверждать, что полученный коэффициент
корреляции между численностью работающих
и чистой прибылью отличны от 0, т.е. численность
работающих и чистая прибыль значимо положительно
коррелированы.
5. Рассчитаем
доверительные интервалы для
коэффициентов корреляции по
формулам, а, именно:
1. Рассчитаем новую величину z по формуле:
Zфакт.=1/2*(LN((1+Rxy)/(1-Rxy)
Получаем
Z факт | 2,52041774 | 2,670374 |
2. Рассчитаем среднюю ошибку z:
Получаем
m | 0,288675 |
3. Построим доверительный интервал для z:
Zлевая ≤ Z ≤ Zправая
Но для начала посчитаем:
Zлевая = Zфакт.-tтабл.*m
Zправая
= Zфакт.+tтабл.*m
Получим:
Zлев | 1,271391115 | 1,421348 | |
Z правая | 3,144071501 | 3,294028 | |
Теперь можно построить доверительный интервал
1,271391115 ≤ 2,52041774 ≤ 3,144071501
1,421348 ≤
2,670374 ≤ 3,294028
4. Находим левую и правую границу этого интервала:
Rлевая = (EXP(2*Zлевая)-1)/ (EXP(2*Zлевая)+1)
Rправая = (EXP(2*Zправая)-1)/ (EXP(2*Zправая)+1)
Получаем
R лев | 0,854174239 | 0,88988 | |
R прав | 0,996290478 | 0,99725 | |
6. Вывод: с вероятностью P=1-a=0,95 можно утверждать, что истинное значение коэффициента корреляции между суммарными активами и чистой прибыли лежит в пределах от 0,854174239 до 0,996290478.
С
вероятностью P=1-a=0,95 можно утверждать,
что истинное значение коэффициента корреляции
между численностью работающих и чистой
прибыли лежит в пределах от 0,88988 до 0,99725.
7. Теперь
рассчитаем доверительные
Zлевая ≤ Z ≤ Zправая
Но для начала посчитаем:
Zлевая = Zфакт.-tтабл.*m
Zправая
= Zфакт.+tтабл.*m
Получим
Zлев | 1,650841633 | 1,800798 | |
Zправ | 3,389993848 | 3,53995 |
Теперь можно построить доверительный интервал
1,650841633 ≤ 2,52041774 ≤ 3,389993848
1,800798 ≤ 2,670374 ≤ 3,53995
8. Находим левую и правую границу этого интервала:
Rлевая = (EXP(2*Zлевая)-1)/ (EXP(2*Zлевая)+1)
Rправая = (EXP(2*Zправая)-1)/ (EXP(2*Zправая)+1)
Получаем
Rлев | 0,928973023 | 0,946889 | |
Rправ | 0,997730002 | 0,998318 |
9. Вывод: с вероятностью P=1-a=0,99 можно утверждать, что истинное значение коэффициента корреляции между суммарными активами и чистой прибыли лежит в пределах от 0,928973023 до 0,997730002.
С
вероятностью P=1-a=0,99 можно утверждать,
что истинное значение коэффициента корреляции
между численностью работающих и чистой
прибыли лежит в пределах от 0,946889 до 0,998318.