Автор: Пользователь скрыл имя, 24 Ноября 2012 в 16:50, лабораторная работа
Задания:
Рассчитать параметры линейного уравнения парной (множественной) регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США.
Дать сравнительную оценку силы связи факторов с результатом с помощью сравнительных (общих) коэффициентов эластичности.
Оценить с помощью F-критерия Фишера – Снедекора значимость уравнения линейной регрессии и показатель тесноты связи.
Оценить статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента.
Оценить качество уравнения через среднюю ошибку аппроксимации.
Рассчитать матрицу парных коэффициентов корреляции и отобрать информативные факторы в модели. Указать коллинеарные факторы.
Методом пошаговой регрессии построить модель только с информативными факторами и оценить ее параметры.
Построить модель в стандартизированном масштабе и проинтерпретировать ее параметры.
Рассчитать прогнозное значение результата, если прогнозное значение факторов составляет 80% от их максимального значения.
Рассчитать ошибки и доверительный интервал прогноза для уравнения значимости
По полученным результатам сделать экономические выводы.
Задания:
Задание 1
Рассчитать
параметры линейного уравнения
множественной регрессии с
Уравнение множественной регрессии имеет следующий вид:
Коэффициенты уравнения
множественной регрессии
…
Используя приложение 2 рассчитаем параметры уравнения регрессии, представленные в приложении 2. Уравнение регрессии примет следующий вид:
=39,158+ 0,009х1+0,004х2+0,211х3+0,041х
Исходя из этого уравнения, можно определить среднее влияние каждого факторного признака на результативный при неизменном влиянии остальных, фиксированы на своем среднем значении:
Таким образом, наибольшее влияние на величину прибыли, согласно данной регрессионной модели, оказала численность служащих.
Задание 2
Дать сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности
Вычислим коэффициенты эластичности по формуле:
Определим средние значения каждого признака:
Средние значение прибыли = 41,86 млрд. долл.
Средний оборот капитала = 58,516 млрд. долл.
Средний использованный капитал = 13,192 млрд. долл.
Средняя численность служащих = 2,536 тыс. человек
Средняя рыночная капитализация = 25,9 млрд. долл.
Средний объем заработных плат служащих = 12,136 млрд. долл.
Используя данные приложения 2, определим, на сколько процентов от среднего значения результативного признака измениться результат, при изменении факторного признака на 1% от своего среднего значения:
Для влияния оборотного капитала:
=0,013
Коэффициент показывает, что при увеличении среднего оборота капитала на 1% средний доход увеличится на 1,3% при фиксированном значении остальных факторов на их среднем уровне.
Для влияния суммы использованного капитала:
=0,001
Коэффициент показывает, что при увеличении среднего использованного капитала на 1% средний доход увеличится на 0,1% при фиксированном значении остальных факторов на их среднем уровне.
Для влияния численности служащих:
=0,013
Коэффициент показывает, что при увеличении средней численности служащих на 1% средний доход увеличится на 1,3% при фиксированном значении остальных факторов на их среднем уровне.
Для влияния рыночной капитализации компании:
=0,025
Коэффициент показывает, что при увеличении средней рыночной капитализации на 1% средний доход увеличится на 2,5% при фиксированном значении остальных факторов на их среднем уровне.
Для влияния средней з/п служащих
=0,012
Коэффициент показывает, что при увеличении средней з/п служащих на 1% средний доход увеличится на 1,2% при фиксированном значении остальных факторов на их среднем уровне.
Задание 3
Для того чтобы оценить значимость полученного уравнения регрессии необходимо воспользоваться F-критерием Фишера-Снедекора.
Он рассчитывается по формуле:
Определим табличное значение критерия при числе степеней свободы к1=5 и к2=19. Fтабл = 2,74
Н0: «Связь между факторным признаком и результативным признаком отсутствует»
Н1: «Связь между факторным признаком и результативным признаком существенна»
По данным приложения 2 Fфакт = 12,242, Fтабл < Fфакт значит с вероятностью 95% можно судить о значимости уравнения регрессии.
Для оценки тесноты связи используем полученный в результате дисперсионного анализа множественный R= 0,874. Согласно этому показателю связь между факторами и результатом достаточно тесная.
Задание 4
Теперь необходимо оценить статистическую значимость параметров уравнения регрессии с помощью t- критерия Стьюдента
- о незначимом отличии от нуля параметра регрессии
- о неравенстве нулю параметра регрессии
Табличное значение критерия Стьюдента при количестве степеней свободы к=18 и уровне значимости а=0,05 равняется tтабл = 2,1
Фактические значения критерия Стьюдента определили при анализе исходных данных (см. приложение 2):
tа факт = 29,80467
t1факт = 0,3139
t2факт = 0,3655
t3факт = 1,5284
t4факт = 1,0332
t5факт = 0,9057
Таким образом, все фактические значения t- статистики Стьюдента при коэффициентах регрессии не превосходят табличное значение, и только константа а имеет фактическое значение статистики Стьюдента выше табличного. Следовательно, из всех параметров уравнения множественной регрессии значим только параметр а.
Задание 5
Для оценки значимости
уравнения регрессии
% - с точки зрения величины ошибки аппроксимации модель адекватная.
Задание 6
С помощью средств Microsoft Excel найдем матрицу парных коэффициентов корреляции. Результаты представлены в Приложении 3. Значения парных коэффициентов корреляции указывают на весьма тесную связь чистой прибыли с величиной оборотных средств, использованного капитала и численностью рабочих. Коэффициенты составили , , .
Необходимо исключить из модели взаимосвязанные между собой факторы. Для этого рассмотрим межфакторные коэффициенты корреляции представленные в той же таблице. Наблюдается сильная взаимосвязь между величиной оборотных средств, используемым капиталом и численностью рабочих: , , . Мы можем видеть, что степень связи первого фактора со вторым и третьим превышает тесноту связи с результативным признаком, поэтому его следует исключить из модели. Факторы «величина рыночной капитализации» и «заработная плата служащим» в итоговую модель включены не будут из-за недостаточной степени связи с чистой прибылью компании и своей статистической незначимости, выявленной нами ранее в ходе лабораторной работы №1. Таким образом, в итоговую модель будут включены второй и третий факторы, хоть и находящиеся в некоторой связи между собой, но все же только эти факторы в достаточной степени связанны с результатом и статистически значимы.
Задание 7.
Проведем регрессионный анализ варианта модели с включением только 2ого и 3го фактора, результаты которого представим в приложении 4.
коэффициент детерминации равен =0,86, а нормированный коэффициент детерминации равен =0,716.
Добавим в модель фактор х1.
Проведем регрессионный анализ (Приложение 5)
Коэффициент детерминации равен R-квадрат=0,743
Нормированный коэффициент детерминации равен R-квадрат скорректированное=0,706.
Мы видим, что при добавлении в модель фактора х1 уменьшается не только R-квадрат скорректированное, но и обычный коэффициент детерминации, другими словами, снижается доля объясненной вариации. Следовательно, включение в модель дополнительных факторов необоснованно.
Задание 8.
После приведения модели к стандартизированному масштабу уравнение примет вид:
Для построенной
нами модели стандартизированные
Получаем уравнение:
При увеличении использованного капитала на величину его математического отклонения чистый доход возрастет на 321 величину своего математического отклонения, при увеличении численности служащих на одно ее математическое отклонение чистый доход возрастет на 640 своих величин математического отклонения.
Задание 9.
Необходимо рассчитать прогнозное значение чистой прибыли компании, если используемый капитал и численность рабочих составят 80% от их максимального значения.
Используя данные приложения 1 рассчитаем 80% от максимальных x:
Xt=0,8 * 95.3=76.24 xt= 0,8* 16.6=13.28
Получили стандартизированное значение валовой прибыли. Переведем его в исходное, используя соотношение между исходными и стандартизированными значениями.
43,311
Таким образом, при заданных значениях использованного капитала и численности рабочих, чистая прибыль предприятия составила 43,311 млрд. долл.
Задание 10.
Необходимо рассчитать ошибки и доверительный интервал для полученной модели:
Х – матрица фактических значений объясняющей переменной размерностью 3×26
ХТ – транспонированная матрица фактических значений объясняющей переменной, размерностью 26×3.
ХТ*Х – матрица размерностью 3×3, состоящая из коэффициентов при параметрах регрессии в системе нормальных уравнений.
- матрица обратная ХТ*Х, состоящая из алгебраических дополнений.
Используя средства Microsoft Excel получили матрицу ХТ*Х следующего вида:
25 |
329,8 |
63,4 |
329,8 |
14357,32 |
1999,17 |
63,4 |
1999,17 |
426,72 |
И матрицу :
0,0651 |
-0,0004 |
-0,00767 |
-0,0004 |
0,0002 |
-0,00089 |
-0,0077 |
-0,0009 |
0,00764 |
Матрицы Х0 и Х0т содержат значения объясняющих переменных, которые мы использовали при прогнозе
Х01=76,24
Х02=13,28
1
Х0= 76,24
13,28
Х0т = (1 76,24 13,28)
=0,963
Построим доверительный интервал:
43,311-2,1*0,963≤у≤43,311+2,1*
43,311-2,02≤у≤43,311+2,02
41,291≤у≤45,333
Таким образом, искомое значение чистой прибыли находиться в пределах
[41,291; 45,333].
3адание 11.
Наиболее сильное влияние на величину прибыли в данной совокупности предприятий оказывает численность служащих. Согласно критерию Фигера-Снедеккора связь между величиной чистой прибыли и комплексом факторных показателей достаточно существенна. Полученные в результате анализа коэффициенты регрессии и соответствующую регрессионную модель нельзя использовать при построении прогнозов, при уровне значимости а=0,05 так как все коэффициенты регрессии на нем статистически незначимы. С точки зрения ошибки аппроксимации модель адекватна используемым данным.Исходя из анализа матрицы парных коэффициентов корреляции наиболее сильная связь с чистой прибылью компании у величины оборотного капитала, используемого капитала и численности служащих. Но у оборотного капитала наблюдается сильная взаимосвязь с используемым капиталом и численностью служащих, ввиду которой модель с участием всех трех факторов нельзя использовать при прогнозировании. С помощью метода пошаговой регрессии определили, что наиболее оптимальна двухфакторная регрессионная модель, где в качестве факторов выступают количество использованного капитала и число служащих. При увеличении использованного капитала на величину его математического отклонения чистый доход возрастет на 0,321 величины своего математического отклонения, при увеличении численности служащих на одно ее математическое отклонение чистый доход возрастет на 0,64 своего математического отклонения. В стандартизированном масштабе уравнение двухфакторной регрессии примет вид . Расчетное значение чистой прибыли находиться в пределах [41,291; 45,333].