Автор: Пользователь скрыл имя, 03 Ноября 2011 в 11:59, контрольная работа
Имеются статистические данные зависимости расходов на питании(y, тыс. руб.) от душевого дохода(x, тыс. руб.) для восьми групп семей. Требуется построить и проанализировать линейную модель парной регрессии.
Владимир Дмитриевич Черномордик
Задача 1:
Имеются статистические
данные зависимости расходов на питании(y,
тыс. руб.) от душевого дохода(x, тыс. руб.)
для восьми групп семей. Требуется построить
и проанализировать линейную модель парной
регрессии.
N
n|n |
x | Y | yx | X2 | Y2 | Y^ | Еi | Е2i | Аотн | |||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |||||||||
1 | 1.2 | 0.9 | 1,08 | 1,44 | 0,81 | 1,03 | -0,13 | 0,02 | 14.06 | |||||||||
2 | 3.1 | 1.3 | 1,35 | -0,15 | 0,02 | 12.33 | ||||||||||||
3 | 5.3 | 1.8 | 1,72 | -0,08 | 0,01 | 4.44 | ||||||||||||
4 | 7.4 | 2.2 | 2,08 | 0,13 | 0,02 | 5.67 | ||||||||||||
5 | 9.6 | 2.6 | 2,45 | 0,15 | 0,02 | 5.87 | ||||||||||||
6 | 11.8 | 2.9 | 2,82 | 0,08 | 0,01 | 2.77 | ||||||||||||
7 | 14.5 | 3.3 | 3,28 | 0,02 | 0,0 | 0.72 | ||||||||||||
8 | 18.7 | 3.8 | 71,06 | 349,69 | 14,44 | 3,99 | -0,19 | 0,04 | 4.92 | |||||||||
∑ | 71,6 | 18,7 | 208,71 | 885,23 | 50,83 | 18,7 | 0,00 | 0,125 | 50.77 | |||||||||
Ср. знач | 8,95 | 2,34 | 26,09 | 110,66 | 6,35 | 2,34 | 0,016 | 6.35 |
Основные понятия эконометрики
Эконометрика (экономика+метрика – измерение в экономике)
Определение:
Эконометрика - это наука исследующая количественные закономерности и взаимосвязи в экономике с помощью методов математической статистики.
Основной метод исследования социальных экономических систем – метод регулирования.
Классификация
эконометрических моделей
Выделяют три класса моделей:
Регрессионная модель с одним уравнением:
Выделяют 2 вида моделей:
А) Модели парной регрессии(однофакторные модели) => { y^= f(x)}
Б) Множественной регрессии = > { y^ = f(x, x1, x2, x3….xn} (многофакторные модели); xi – независимая, объясняемая переменная, фактор-аргумент.
y- зависимая, объясняемая переменная, результирующий показатель, полученная переменная из модели.
Существуют следующие виды модели парной регрессии:
Пример линейной двухфакторной модели
Y^ = a+b1*x1 + b2*x2
2) Системы эконометрических уравнений: модель спроса и предложения
3) Модель тождества
Одним из факторов, учитываемых при моделировании является время.
Парная регрессия и корреляция
Линейная
модель парной регрессии
Парная регрессия представляет собой регрессию между двумя переменными y и x. Поскольку между переменными y и x нет строгой функциональной зависимости, то в каждом отдельном случае величина у может быть представлена ввиде суммы двух слагаемых.
Yi= y^I + ЕI, где Yi – фактическое значение результирующего показателя.
Уi – теоретическое значение результирующего показателя, полученного по модели (неслучайная величина), Еi - случайная величина, ошибка модели, количественно степень несоответствия фактических и модельных значений выражений остаточной дисперсией.
Дост= ơ2ост = 1/n∑ Е2= 1/n ∑(yi-yi^)2
Построение модели парной регресси сводится к оценке параметров а и b, которая осуществляется с помощью метода наименьших квадратов(ММК). ММК - позволяет получить такие оценки параметров а и b, при которых сумма квадратов отклонений фактических значений результирующего показателя “y” от модельных минимальна. { S=∑Е2i= ∑(yi-yi^)2= ∑(yi-(a+b*xi))2 -> min (1)
(S= f(a,b))
Используя выражение (1) можно получить формулы для расчета параметров а и b.
B= (y*x-----) – (y---* x----)/ x----2 – (x--)2 (2)
A= y-- - b*x---
// В нашем случае: b = (26,09 – 2,34*8,95)/ 110,66 – (8,95)2= 0,169
A = 2,34 – 0,169* 8,95 = 0,824
Y^ = 0,824 + 0,169*x
Подставляем в полученную модель исходные данные по доходу(переменная х), получим модельные значения расходов на питание “Y” модельное, смотри столбец (7). Анализ остатков см. ст. 8 и ст.9
Уравнение регрессии в таком виде строить нельзя:
Yг = α+βх
Yв = а+bx
1)Параметр В называется коэффициентом регрессии. Его знак определяет направление связи между переменными. Если b>0 то связь прямая, если b<0 то связь обратная.
Экономический смысл коэффициента регрессии:
Его величина показывает, насколько единиц в среднем изменится результирующий показатель Y при изменении данного фактора на одну единицу ( измерения)
2) В нашем случае B>0 то есть связь между расходами на питание и душевым доходом прямая.
При увеличении дохода на 1000 рублей, расходы на питание возрастают в среднем на 169 рублей
Частоту связи оценивает линейный коэффициент парной корреляции ,он изменяется от -1 до 1. Если модуль равен единице, то связь между переменными функциональная , если модуль находится в интервале от 0.7 до 1,то связь между переменными сильная, если интервал от 0.5 до 0.7 то связь средняя умеренная, если от 0.3 до 0.5, то слабая, от 0 до 0.3,то связь практически отсутствует. Коэффициент корреляции рассчитывается по одной из формул:
Dx = 110.66+ (8.95)^2 = 30.55
Dy= 6.35-(2.34)^2 = 0.89
Sigma x =корень из (31.55) = 5.53
Sigma y = корень (0.89)= 0.94
То есть связь между расходами на питание и душевыми доходами очень тесна. Для оценки качества подбора линейной функции рассчитывается коэффициент детерминации. Он изменяется от 0 до 1. Чем больше величина его, тем лучше качественнее модель, Также он характеризует долю дисперсии.
В нашем случае
коэффициент детерминации равен
R^2 yx(0.091)^ =0.982
Элементы
дисперсионного анализа.
ГЛАВНАЯ ФОРМУЛА КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ!!!!!
Оценка значимости уравнения регрессии. Производится оценка значимости уравнения регрессии в целом и отдельных его параметров. Проверить значимость уравнения регрессии означает установить соответствует ли математическая модель экспериментальным данным ( адекватность модели) и достаточно ли включённых в уравнение регрессии объясняющих переменных ( одной или нескольких) для описания зависимой переменной. Для оценки качества модели из относительных отклонений по каждому наблюдению ,определяют среднюю ошибку аппроксимации.
Показатель
не должен превышать 8-10 %
А отн среднее = 6.35%,что говорит о достаточно хорошем качестве уравнения регрессии.
Оценка значимости уравнения регрессии в целом производится на основе F-критерия Фишера ,фактическое значение данного критерия рассчитывается по формуле :
n- количество наблюдений,
m – количество факторов, включенных в модель
Уровень значимости- альфа – вероятность отвергнуть правильную гипотезу ( модель) при условии что она верна.
Обычно альфа выбирается из следующего множества значений:
0.01, , 0.1
Α= 0.05 Если модель из 100 наблюдений не объяснит 5
Гамма = 1- Альфа
= 0.95
К1 и к2 – степени свободы
К1=m
k2= n-m-1
В случае линейной однофакторной модели, m= 1 ,тогда n-2
Если F факт > F табл , То уравнение регрессии в целом признается статистически значимым.
F факт = (0.982/ ( 1- 0.982))(8-2)= 335.6
F табл выбирается из таблицы распределения Фишера
F табл ( 0.05 ;1; 6) = 5.99
Поскольку фактическое значение больше чем табличное, то с вероятностью 0.95 уравнение регрессии признаётся в целом статистически значимым и надёжным.
m количество
коэффициентов при неизвестных
Оценка значимости отдельных параметров уравнения регрессии.
Осуществляется
с использованием t критерия стьюдента
Стандартизованное уравнение регрессии.
Средние коэффициенты эластичности.
Эi - его величина показывает, насколько процентов изменится результирующий показатель при изменении данного фактора на 1%,при неизменном среднем уровне других показателей.
Т статистики стьюдента коэффициентов регрессии Tbi
Частные критерии Фишера Fxi
Значимость качества уравнения регрессии оценивают с помощью множественного коэффициента корреляции (индекс корреляции) и коэффициента индекса детерминации.
R Отражает силу совместного влияния факторов на результирующий показатель.
Элементы дисперсионного анализа
R^2 = 0.81
81% объясняется увеличением уровня организации работ,а на долю прочих факторов приходится 19%
R= 0.901 то есть связь объема добычи угля с мощностью пласта и уровнем механизации достаточно тесная.