Математические методы в экономике

Автор: Пользователь скрыл имя, 20 Ноября 2011 в 13:51, контрольная работа

Описание работы

1.Построить модель парной регрессии, определяющую зависимость между объемом выпуска продукции Y (в тыс. р.) и затратами труда X (в чел./днях);
2.Оценить качество построенной модели;
3.Построить точечный и интервальный прогноз для X = Х0.

Работа содержит 1 файл

готовая работа мат.методы.docx

— 220.52 Кб (Скачать)
Y X1 X2
76 74 32
78 72 34
81 70 41
80 66 38
84 62 40
 

   2. Выбираем Данные -> Анализ данных. На экране появится окно, в котором выбираем пункт Регрессия.

   В результате получаем Таблицу №5 - Вывод итогов со следующими значениями: 
 
 
 
 
 
 
 
 
 

Вывод этогов

Регрессионная статистика
Множественный R 0,971965887
R-квадрат 0,944717686
Нормированный R-квадрат 0,889435373
Стандартная ошибка 1,008560643
Наблюдения 5
 
Дисперсионный анализ  
  df SS MS F Значимость F
Регрессия 2 34,76561086 17,38280543 17,08896797 0,055282314
Остаток 2 2,03438914 1,01719457    
Итого 4 36,8      
 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 89,4733032 16,22695552 5,513868762 0,031353087 19,6543487 159,2922576 19,6543487 159,2922576
X1 -0,34841629 0,151701852 -2,29671745 0,148482209 -1,00113668 0,304304097 -1,0011367 0,304304097
X2 0,38642534 0,18866409 2,048218819 0,177096944 -0,42533072 1,198181401 -0,4253307 1,198181401
 
 
 
 
 
 
 
 
 
 
 

   Дадим расшифровку результатам моделирования.

   Рассмотрим  регрессионную статистику (Таблица  №5.1)

   1. R–квадрат или квадрат коэффициента множественной корреляции (Множественный R)

   

   R2=0.972 свидетельствует о том, что изменения зависимой переменной Y на 97.2% можно объяснить изменениями включенных в модель объясняющих переменных. То есть 97.2% вариации результирующего признака Y объясняется вариацией регрессоров X1 и X2. Другими словами, 97.2% изменений признака Y описывается регрессионным уравнением, а 2.8% – другими причинами.

   2. Нормированный R–квадрат скорректированный коэффициент детерминации

   

   Недостатком коэффициента детерминации R2 является то, что он увеличивается при добавлении новых регрессоров, потому что при этом всегда увеличивается сумма ESS. Но это не обязательно означает улучшение качества регрессионной модели. Коэффициент нового регрессора может оказаться незначимым, слишком широк его доверительный интервал..

   В этом смысле предпочтительнее использовать Нормированный R–квадрат. Добавление нового регрессора увеличивает ESS и как следствие R2. В тоже время увеличивается знаменатель дроби для "нормированного R-квадрата" (к увеличивается на 1). Формула устроена так, что увеличивается, если только достаточно значимо возрастает сумма ESS. При добавлении или исключении из уравнения очередного регрессора нужно сравнивать с предыдущим значением.

   В нашем случае R2kor=0.889 что отличается от R2 на 8.5%. Так как отличие незначительное, можно говорить о высоком доверии коэффициенту R2 .

   3. Стандартная ошибка регрессии  S=1.009

       ;

   Исходя  из формулы видно, что нельзя вычислить  выборочное остаточное стандартное  отклонение, когда число исходных точек равно числу коэффициентов  уравнения регрессии, или меньше.

   Стандартная ошибка оценки регрессии  является показателем качества аппроксимации результатов наблюдений. Ее квадрат интерпретируется как дисперсия остатков, представляющая ошибку измерения, с которой любое измеренное значение Y предсказывается для данного значения X по известному уравнению. При поиске лучшей модели стоит минимизировать "Стандартную ошибку".

   Дисперсионный анализ (Таблица №5.2)

   Столбец df содержит число степеней свободы k. Для регрессии это число регрессоров крег=m=2. Для остатка это кост=N−(m+1) , число исходных точек минус число коэффициентов     уравнения регрессии и минус свободный член. Для выборочной общей дисперсии, строка «Итого», число степеней свободы кобщ=N−1. Одна степень свободы «украдена» свободным членом регрессионного уравнения. Степени свободы связаны соотношением: кобщ= крег + кост

   Столбец SS содержит суммы квадратов отклонений от среднего значения результирующего признака.

   ESS -  регрессионная или факторная, сумма квадратов уклонений от среднего значения результирующего признака теоретических значений, рассчитанных по регрессионному уравнению.

   RSS - остаточная, сумма квадратов уклонений исходных значений от теоретических значений.

   TSS - общая, сумма квадратов уклонений исходных значений от среднего значения результирующего признака. Она записана в строке «Итого».

   Суммы связаны основным соотношением дисперсионного анализа: TSS = ESS + RSS.

   Чем больше ESS (или чем меньше RSS), тем лучше регрессионное уравнение аппроксимирует облако исходных точек. В нашем случае RSS мала по сравнению с TSS (RSS=2.03; TSS=36.8   т.о. RSS составляет всего 5.5% от TSS) Следовательно уравнение регрессии хорошо аппроксимирует облако исходных точек.   

   Столбец MS содержит несмещенные выборочные дисперсии, регрессионную и остаточную, степени свободы взяты из столбца df.

     

   F и значимость F позволяют проверить значимость уравнения регрессии. По эмпирическому значению статистики F проверяется гипотеза равенства нулю одновременно всех коэффициентов модели.  Уравнение регрессии значимо на уровне α, если F>Fкр, где Fкр - табличное значение F-критерия Фишера. В нашем случае F=17.09, что больше Fкр=19.00, значит уравнение регрессии значимо.

   Значимость  F < 0.05, следовательно, уравнение регрессии статически значимо с вероятностью 95%.

   Таблица №5.3 содержит коэффициенты для регрессоров и их оценки.

   Названия  строк показывают, с каким регрессором  связаны рассчитанные значения.

   Строка  Y-пересечение не связана ни с одним регрессором, это свободный коэффициент.

   Столбец Коэффициенты cодержит значения коэффициентов уравнения регрессии. Таким  образом, получилось уравнение: Y=89.47-0.35X1+0.39X2.

   Регрессионное уравнение должно проходить через  центр облака исходных точек.

       19.65≤M(b)≤159.29

   Столбец Стандартная ошибка содержит выборочные стандартные отклонения по каждому коэффициенту уравнения регрессии, стандартные ошибки коэффициентов. Если стандартная ошибка больше абсолютной величины коэффициента, это коэффициент незначимый.

   В нашем случае стандартная ошибка превышает абсолютное значение коэффициента лишь для регрессора X2, поэтому его следует исключить из уравнения регрессии. Но это грубый анализ. Столбец t-статистика дает более точную оценку значимости коэффициентов.

   Общая причина большой стандартной  ошибки – большое значение остаточной суммы квадратов уклонений RSS, малое число исходных точек n и малое значение дисперсии по X. Для отдельных регрессоров это может быть компенсировано большой дисперсией по X (она в знаменателе стандартной ошибки). Регрессоры с малыми единицами измерения – первые кандидаты на удаление. Положение может поправить нормализация исходных данных.

   Столбец t-статистика содержит значения t-критерия, рассчитанные по формуле:

   tр= (Коэффициент) / (Стандартная ошибка)

   Этот  критерий имеет закон распределения  Стьюдента с числом степеней свободы  n−(k+1): число исходных точек, минус число регрессоров, минус свободный член (если есть).

   В нашем случае α=0.05; n-k-1=5-2-1=2; следовательно tтабл=4.303   .

   Сравнивая  tтабл  с  tр  можно сделать выводы, что  в данном случае коэффициенты регрессоров X1 и X2 статистически незначимы.

   Столбец p-значение представляет вероятность того, что критическое значение статистики используемого критерия (в данном случае t-статистики Стьюдента) превысит значение, вычисленное по выборке. Решение о принятии или отклонении нулевой гипотезы принимается в результате сравнения p-значения с выбранным уровнем значимости α (в нашем случае α=0.05).

   В данном случае незначимыми можно  считать коэффициенты регрессоров  X1 и X2, так как P(X1)=0.15>0.05; P(X2)=0.18>0.05   .

   Столбцы Нижние 95% и Верхние 95% содержат границы 95%-го доверительного интервала.

   Для каждого коэффициента – свои границы: Коэффициент ± tтабл  × Стандартная ошибка, где tтабл =4.303 общая для всех коэффициентов.

   Доверительные интервалы строятся только для статистически  значимых величин. Таким образом, для  свободного члена доверительный  интервал будет находится в диапазоне: т.е. с надежностью 95% истинное значение параметра лежит в указанном интервале. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

   Задание №3

   Значения  показателя Y в задании №1 являются уровнями временного ряда.

    1. Проверить наличие тренда в этом ряду.
    2. Выбрать и построить трендовую модель.
    3. Провести оценку ее качества.

      Таблица №6 – Исходные данные.

t 1 2 3 4 5 6 7 8 9
Y 41 38 34 29 25 26 24 21 18
U   0 0 0 0 0 0 0 0
V   1 1 1 1 0 1 1 1

Информация о работе Математические методы в экономике