Автор: Пользователь скрыл имя, 28 Марта 2012 в 05:51, курсовая работа
При анализе взаимосвязей социально-экономических явлений, как правило, выясняется, что на результат влияет ряд факторных признаков, основные из которых следует включить в регрессионную модель. При этом следует помнить, что все факторы учесть в модели невозможно по ряду причин: часть факторов просто неизвестна современной науке, по части известных факторов нет достоверной информации или количество включаемых в модель факторов может быть ограничено объемом выборки (количество факторных признаков должно быть на порядок меньше численности изучаемой совокупности).
1 Введение
2 Анализ и методы
2.1 Корреляционный анализ
2.2 Построение и анализ уравнения регрессии
2.3 Проверка наличия автокорреляции
2.4 Проверка наличия гетероскедастичности
3 Выводы и резюме
4 Список использованных источников
Приложение 1
Тогда статистика , будет удовлетворять F-распределению с ((n-v-2k)/2; (n-v-2k)/2) степенями свободы (k – число объясняющих переменных).
Получаем:
Вычислим F-статистику.
;
Поскольку Q < F, гипотеза об однородности выборочной дисперсии должна быть принята, т.е. гетероскедастичность отсутствует.
Сделаем аналогичные расчеты для переменной x1.
Опустим v = 8 наблюдений, оказавшихся в центре (v должно быть примерно равно четверти общего количества наблюдений n = 32).
Оценим отдельно регрессии на первых (n – v)/2 наблюдениях и на последних
(n – v)/2 наблюдениях при условии, что (n - v)/2 больше числа оцениваемых параметров k.
С помощью функции Excel ЛИНЕЙН() получаем следующие модели:
1)
2)
Пусть e1 и e2 – суммы квадратов остатков от первой и второй регрессий соответственно. Для их расчета составим таблицу.
№ | x2 | y | y* | e |
| № | x2 | y | y* | e |
1 | 3,8 | 57,611 | 57,622 | 0,0001 |
| 21 | 1,5 | 47,489 | 47,495 | 0,00004 |
2 | 3,8 | 56,764 | 57,622 | 0,7362 |
| 22 | 1,3 | 46,98 | 46,977 | 0,00001 |
3 | 3,5 | 60,348 | 56,740 | 13,0177 |
| 23 | 1,0 | 49,504 | 46,2 | 10,91642 |
4 | 3,5 | 56,853 | 56,740 | 0,0128 |
| 24 | 1,0 | 49,219 | 46,2 | 9,11436 |
5 | 3,3 | 62,217 | 56,152 | 36,7842 |
| 25 | 1,0 | 43,955 | 46,2 | 5,04003 |
6 | 3,0 | 48,181 | 55,270 | 50,2539 |
| 26 | 1,0 | 46,435 | 46,2 | 0,05522 |
7 | 3,0 | 50,052 | 55,270 | 27,2275 |
| 27 | 1,0 | 45,929 | 46,2 | 0,07344 |
8 | 3,0 | 55,534 | 55,270 | 0,0697 |
| 28 | 1,0 | 45,787 | 46,2 | 0,17057 |
9 | 2,8 | 55,327 | 54,682 | 0,4160 |
| 29 | 1,0 | 45,664 | 46,2 | 0,28730 |
10 | 2,8 | 49,325 | 54,682 | 28,6974 |
| 30 | 1,0 | 45,496 | 46,2 | 0,49562 |
11 | 2,5 | 63,807 | 53,800 | 100,1400 |
| 31 | 1,0 | 45,278 | 46,2 | 0,85008 |
12 | 2,5 | 51,643 | 53,800 | 4,6526 |
| 32 | 1,0 | 44,698 | 46,2 | 2,25600 |
|
|
| Сумма | 262,0081 |
|
|
|
| Сумма | 29,259 |
Тогда статистика , будет удовлетворять F-распределению с ((n-v-2k)/2; (n-v-2k)/2) степенями свободы (k – число объясняющих переменных).
Получаем:
Вычислим F-статистику.
;
Поскольку Q > F, гипотеза об однородности выборочной дисперсии должна быть отвергнута, т.е. имеет место гетероскедастичность остатков.
Проверим для этой переменной наличие гетероскедастичности, применив тест Парка.
Построим уравнение регрессии y = b0 + b1x2 + .
Используя функцию Excel ЛИНЕЙН(), получаем:
Для каждого наблюдения определяем
Оценим коэффициенты регрессии для уравнения
Используем для этой цели инструмент Excel Анализ данных–Регрессия. Получим следующие результаты:
Регрессионная статистика | |
Множественный R | 0,18531 |
R-квадрат | 0,03434 |
Нормированный R-квадрат | 0,00215 |
Стандартная ошибка | 2,10748 |
Наблюдения | 32 |
Дисперсионный анализ | |||||
| df | SS | MS | F | Значимость F |
Регрессия | 1 | 4,7384 | 4,7384 | 1,0669 | 0,3099 |
Остаток | 30 | 133,2436 | 4,4415 |
|
|
Итого | 31 | 137,9820 |
|
|
|
| Коэффициенты | Стандартная ошибка | t-статистика | P-Значение |
Y-пересечение | 0,39160 | 0,60260 | 0,64986 | 0,52073 |
X1 | 0,78941 | 0,76428 | 1,03289 | 0,30991 |
X2 | 0,39160 | 0,60260 | 0,64986 | 0,52073 |
Найдем табличное значение tтабл по таблице распределения Стьюдента для
= 0,05 и числе степеней свободы k = n – m – 1 = 32 – 2 – 1 = 29.
tтабл(0,05; 29) = 2,045.
Как видим, t-статистики коэффициентов регрессии не превышают критическое значение, поэтому коэффициенты уравнения регрессии не являются значимыми.
Это означает, что связь между ln(e2) и ln(x) отсутствует, т.е. гетероскедастичности в эконометрических данных не наблюдается.
3 Выводы и резюме
Проведенный анализ связи влияния уровня доходов домашних хозяйств и процентной ставки по депозитам, на динамику депозитов на срок до 2 лет позволяет сделать следующие выводы:
Парный коэффициент корреляции = -0,6523 показывает, что между уровнем доходов домашних хозяйств и размером депозитов существует заметная обратная корреляционная зависимость, т.е. с увеличением доходов домашних хозяйств размер депозитов снижается. Парный коэффициент корреляции , равный 0,7932 указывает на то, что между процентной ставкой по депозитам и размером депозитов существует тесная прямая корреляционная зависимость, т.е. с увеличением ставки по депозитам размер депозитов снижается.
Оценка значимости данных коэффициентов с помощью критерия Фишера указывает на то, что оба коэффициента являются значимыми.
Следует отметить, что сами факторные признаки x1 и x2 связаны между собой слабой обратной корреляционной зависимостью, на что указывает коэффициент корреляции , равный -0,2472.
С помощью метода наименьших квадратов было получено уравнение линейной регрессии:
Параметр а1 = -0,027 данного уравнения показывает, что размер депозитов при изменении первого факторного признака (уровни доходов домашних хозяйств) на единицу – снижается на 0,027 млрд. евро; параметр а2 = 3,695 показывает, что размер депозитов при изменении второго факторного признака (процентная ставка по депозитам) на единицу – увеличивается примерно на 3,695 млрд. евро.
Для измерения тесноты корреляционной связи между результативным признаком и факторными признаками был рассчитан множественный коэффициент корреляции: = 0,9224. Данный коэффициент показывает, что теснота корреляционной связи между размером депозитов, уровнем доходов домашних хозяйств и ставкой по депозитам является существенной.
Множественный коэффициент детерминации, равный 0,8509 указывает на то, что вариация результата y (размера депозитов) примерно на 85,1% объясняется вариацией факторов x1 (уровней доходов домашних хозяйств) и x2 (ставки по депозитам).
Оценка статистической значимости параметров регрессии с помощью t-критерия Стьюдента показала, что коэффициенты уравнения регрессии можно признать значимыми.
Проверка наличия автокорреляции по критерию Дарбина-Уотсона показала, что в остатках имеет место отрицательная автокорреляция.