Автор: Пользователь скрыл имя, 27 Апреля 2012 в 18:14, контрольная работа
Задание:
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры а1 и а0 парной линейной функции и линейно-логарифмической функции
В силу того, что , нулевую гипотезу о статистической незначимости выявленной зависимости валового регионального продукта от инвестиций в основной капитал и её параметрах можно отклонить с фактической вероятностью допустить ошибку значительно меньшей, чем традиционные 5%.
для логарифмической функции:
Рис. 2. Теоретическая линия регрессии и фактические значения.
Определим среднюю ошибку аппроксимации - ε'ср.
Результаты расчетов для линейной зависимости приведены в таблице №3, для линейно-логарифмической – в таблице №4.
Сравнивая полученные результаты, видно, что средняя ошибка аппроксимации для линейно-логарифмической зависимости больше, чем для линейной (48,35%>35,03%), что еще раз подтверждает правильность выбора модели. Тем не менее результат, полученный даже для линейной модели (35,03%) указывает на невысокое качество построенной модели и ограничивает ее использование для выполнения точных прогнозных расчетов даже при условии сравнительно небольшого изменения фактора X (относительно его среднего значения ).
Если предположить, что прогнозное значение
инвестиций в основной капитал составит
1,062 от среднего уровня , то есть
Xпрогнозн.= 6,8642*1,062=7,289, тогда
прогнозное значение результата сформируется
на уровне:
Yпрогнозн. =-0,16569+3,015954*7,289=21,
Рассчитаем интегральную
В нашем случае , где k- число факторов в уравнении, которое в данной задаче равно 1.
Ошибка положения регрессии составит: =
= = 0,0664 (млрд. руб.).
Интегральная ошибка прогноза составит: = =11,05272 (млрд. руб.).
Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,26*11,05272 = 24,97 ≈ 25 (млрд. руб.). Табличное значение t-критерия для уровня значимости α=0,05 и для степеней свободы n-k-1 = 11-1-1=9 составит 2,26. Следовательно, ошибка большинства реализаций прогноза не превысит млрд. руб.
В данном случае полученная ошибка больше, чем среднее значение, поэтому сложно говорить о какой-либо точности прогноза.
Причиной небольшой точности прогноза является повышенная ошибка аппроксимации из-за недостаточно высокой типичности линейной регрессии, которая проявляется в присутствии единиц с высокой индивидуальной ошибкой. Если удалить территории с предельно высокой ошибкой (например, Республика Калмыкия с ), тогда качество линейной модели и точность прогноза по ней заметно повысятся.
Задача №2.
Проводится анализ значений социально-экономических показателей по территориям Северо-Западного федерального округа РФ за 2000 год.
Y – Валовой региональный продукт, млрд. руб.;
X1 – Инвестиции 2000 года в основной капитал, млрд. руб.;
X2 – Среднегодовая стоимость основных фондов в экономике, млрд. руб.;
X3 – Кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам, млрд. руб.
Требуется
изучить влияние указанных
Предварительный анализ исходных данных по 10 территориям выявил наличие одной территории (г. Санкт-Петербург) с аномальными значениями признаков. Эта единица должна быть исключена из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанной аномальной единицы.
При обработке исходных данных получены следующие значения:
А) - линейных коэффициентов парной корреляции, средних и среднеквадратических отклонений -σ:
N=9.
Y | X1 | X2 | X3 | |
Y | 1 | 0,7677 | 0,8653 | 0,4237 |
X1 | 0,7677 | 1 | 0,8897 | 0,0157 |
X2 | 0,8653 | 0,8897 | 1 | -0,0179 |
X3 | 0,4237 | 0,0157 | -0,0179 | 1 |
Средняя | 31,92 | 8,87 | 121,18 | 0,5683 |
σ | 14,61 | 5,198 | 48,19 | 0,6942 |
Б) - коэффициентов частной корреляции
Y | X1 | X2 | X3 | |
Y | 1 | -0,1462 | 0,8737 | 0,8791 |
X1 | -0,1462 | 1 | 0,5562 | 0,1612 |
X2 | 0,8737 | 0,5562 | 1 | -0,7842 |
X3 | 0,8791 | 0,1612 | -0,7842 | 1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Проведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (b) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (b) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям b-коэффициентов рассчитайте параметры уравнения в естественной форме (a1, a2 и a0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности - .
4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи - через F-критерий Фишера (для уровня значимости a=0,05).
5. Рассчитайте
прогнозное значение результата,
предполагая, что прогнозные
6. Основные выводы
оформите аналитической
Решение:
Полученные результаты позволяют отбросить пару факторов X1 и X2, поскольку они тесно связаны между собой, а связь X1 с результатом незначительна. Выбрать между парами факторов X2 и X3 и X1 и X3 достаточно сложно, т.к. обе пары показывают как достаточно сильную связь с результатом, так и между собой. Руководствуясь требованиями МНК к исходным данным и, в частности, к отсутствию межфакторного взаимодействия, можно было выбрать пару X1 и X3, т.к. они меньше связаны между собой, но пара X2 и X3 показывает большую связь с результатом. Для большей надежности проведем построение двухфакторной регрессионной модели для обеих пар признаков.
;
;
Для второй пары факторов расчеты будем проводить аналогичным образом, например:
В результате получено уравнение в стандартизованном масштабе:
и
.
В конечном счёте, имеем уравнение: .
.
В конечном счёте, имеем уравнение: .
;
;
.
.
По полученным данным видно, что факторы Х2 и Х3 теснее связаны с Y (0,97>0,87), они же описывают большей процент вариации валового регионального продукта ( 94% ). Поэтому в дальнейшем будем рассматривать именно эту пару факторов.