Автор: Пользователь скрыл имя, 15 Декабря 2010 в 09:41, контрольная работа
Приведен алгоритм расчета линейной регрессии.
Расчет параметров уравнения парной линейной регрессии с помощью электронной таблицы
Исходные данные для построения модели парной регрессии приведены в таблице 1
Таблица 1
Исходные данные
Расходы на продукты питания, y | Доходы семьи, х |
1,05 | 2,1 |
1,3 | 3,2 |
1,4 | 3,4 |
1,45 | 3,6 |
1,7 | 4,2 |
1,8 | 5,1 |
2,1 | 5,6 |
2,2 | 5,8 |
3 | 6,4 |
3,4 | 6,6 |
Линейное уравнение парной регрессии имеет вид:
где — оценка условного математического ожидания y;
b0, b1 — эмпирические коэффициенты регрессии, подлежащие определению.
Эмпирические коэффициенты регрессии b0, b1 будем определять с помощью инструмента Регрессия надстройки Анализ данных табличного процессора MS Excel.
Алгоритм определения
коэффициентов состоит в
Рисунок 1
ВЫВОД ИТОГОВ | ||||||||
Регрессионная статистика | ||||||||
Множественный R | 0,926627057 | |||||||
R-квадрат | 0,858637703 | |||||||
Нормированный R-квадрат | 0,840967416 | |||||||
Стандартная ошибка | 0,301928818 | |||||||
Наблюдения | 10 | |||||||
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значимость F | ||||
Регрессия | 1 | 4,429711909 | 4,429711909 | 48,592176 | 0,000115974 | |||
Остаток | 8 | 0,729288091 | 0,091161011 | |||||
Итого | 9 | 5,159 | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | -0,185891996 | 0,31956719 | -0,581699255 | 0,57678874 | -0,922815257 | 0,551031265 | -0,922815257 | 0,551031265 |
Переменная X 1 | 0,462150434 | 0,066297964 | 6,97080885 | 0,00011597 | 0,309267055 | 0,615033813 | 0,309267055 | 0,615033813 |
Из рис. 1 видно, что эмпирические коэффициенты регрессии соответственно равны:
b0 = -0,1859,
b1 = 0,4622.
Тогда уравнение парной линейной регрессии, связывающей величину расходов на питание y с доходом семьи x, имеет вид:
= -0,1859+0,4622х
Расчет тесноты статистической связи между результатом и фактором
Далее, в соответствии с заданием, необходимо оценить тесноту статистической связи между величиной дохода семьи x и расходы на продукты питания y. Эту оценку можно сделать с помощью коэффициента корреляцииrxy. Величина этого коэффициента на рис.1 обозначена как множественный R и равна 0,927. Поскольку теоретически величина данного коэффициента находится в пределах от –1 до +1, то можно сделать вывод о несущественности статистической связи между доходами на семью x и расходами на питание y.
Параметр R-квадрат, представленный на рис. 1, представляет собой квадрат коэффициента корреляции rxy2 и называется коэффициентом детерминации. Величина данного коэффициента характеризует долю дисперсии зависимой переменной y, объясненную регрессией (объясняющей переменной x). Соответственно величина 1 - rxy2 характеризует долю дисперсии переменной y, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных. Из рис. 1 видно, что доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет: 1 - 0,8586 = 0,1414, или 14,1%.
На следующем этапе в соответствии с заданием необходимо определить степень связи объясняющей переменной x с зависимой переменной y, используя коэффициент эластичности. Коэффициент эластичности для модели парной линейной регрессии определяется в виде:
Тогда
Эyx=0,4622*(4.6/1.94)=1.096%
Следовательно, при изменении прожиточного минимума на 1% величина ежемесячной пенсии изменяется на 1.096%.
2.3.Расчет средней ошибки аппроксимации
Далее определяем среднюю ошибку аппроксимации по зависимости:
Для этого исходную таблицу 1 дополняем двумя колонками (табл. 2), в которых определяем значения , рассчитанные с использованием зависимости и значения разности .
Таблица 2
Расчет средней ошибки аппроксимации
Расходы на продукты питания, y | Доходы семьи, x | ||
1,05 | 2,1 | 0,785 | 0,252 |
1,3 | 3,2 | 1,293 | 0,005 |
1,4 | 3,4 | 1,386 | 0,010 |
1,45 | 3,6 | 1,478 | 0,019 |
1,7 | 4,2 | 1,755 | 0,032 |
1,8 | 5,1 | 2,171 | 0,206 |
2,1 | 5,6 | 2,402 | 0,143 |
2,2 | 5,8 | 2,495 | 0,134 |
3 | 6,4 | 2,772 | 0,076 |
3,4 | 6,6 | 2,865 | 0,157 |
Σ = 1,034 |
Тогда средняя ошибка аппроксимации равна
А= 1,034/10*100%=10,34%
Практически полагают, что значение средней ошибки аппроксимации не должно превышать 12—15% для грубого приближения регрессии к реальной зависимости.
На последнем
этапе выполним более строгую
оценку статистической надежности моделирования
с помощью F-критерия Фишера.
Для этого проверим нулевую гипотезу
H0 о статистической незначимости
полученного уравнения регрессии по условию:
если при заданном уровне значимости α
= 0,05 теоретическое (расчетное) значение
F-критерия (FT) больше
его критического значения (FКРИТ)
(табличного), то нулевая гипотеза отвергается
и полученное уравнение регрессии принимается
значимым.
2.4.Проверка значимости уравнения регрессии по критерию Фишера
Из рис. 1 следует, что FT = 48,59. Критическое значение F-критерия (FКРИТ) определяем с помощью использования статистической функции FРАСПОБР. Входными параметрами функции является уровень значимости (вероятность) и число степеней свободы 1 и 2. Для модели парной регрессии число степеней свободы соответственно равно 1 (одна объясняющая переменная) и n - 2 = 10 – 2 = 8.
FКРИТ = 5,318
Поскольку FT>FКРИТ, то нулевая гипотеза отвергается, полученное регрессионное уравнение статистически значима