Автор: Пользователь скрыл имя, 16 Сентября 2011 в 17:04, контрольная работа
1. Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
2. Постройте поле корреляции результативного признака и наиболее тесно связанного с ним фактора.
3. Рассчитайте параметры линейной парной регрессии для всех факторов X.
4. Оцените качество каждой модели через коэффициент детерминации, среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.
b Зависимая переменная: цена квартиры, тыс. долл.
В таблице Дисперсионный анализ (таблица 5) приведен критерий Фишера (95,313), который значим на уровне 0,000. Уравнение значимо, модель адекватна.
Таблица
5 - Дисперсионный анализ(b)
Модель | Сумма квадратов | ст.св. | Средний квадрат | F | Знч. | |
1 | Регрессия | 73931.138 | 1 | 73931.138 | 95.313 | .000(a) |
Остаток | 29475.273 | 38 | 775.665 | |||
Итого | 103406.411 | 39 |
a Предикторы: (константа) общая площадь квартиры (м2);
b Зависимая переменная: цена квартиры, тыс. долл.
Средняя ошибка аппроксимации рассчитывается с помощью столбца остатков RES_1 (рисунок 9), появившегося при расчете модели. Рассчитывается дополнительно столбец относительной ошибки и находится ее среднее значение:
Вызываем меню
Преобразовать->Вычислить. В появившемся
окне вводим выражение (рисунок 10).
Рисунок
9
Рисунок 10
В листе появляется столбец отн_ошибка1. Вызываем меню Анализ->Отчеты->Итоги по наблюдениям. В соответствии с формулой, по переменной отн_ошибка1 будет найдено среднее значение, для чего заполним появившееся окно (рисунок 11). В окне Статистики надо указать Среднее (рисунок 12).
Рисунок 11
Рисунок 12
В окне Вывод появится таблица Сводка для наблюдений, в последней строке – средняя относительная ошибка (таблица 6).
Таблица 6
|
a Ограничено первыми 100 наблюдениями
Таким образом, средняя относительная ошибка равна 27,87%, модель не точна.
Таблица
7
Модель | Коэффициент детерминации R-квадрат | Коэффициент Фишера | Средняя относительная ошибка, % |
Y = -13,109 + 1,543x3 | 0,715 | 95,313 | 27,87 |
Y = 80,343 +1,888x5 | 0,021 | 0,832 | 45,78 |
Y = 33,373 +5,995x6 | 0,077 | 3,165 | 48,63 |
Как и предполагалась ранее, наиболее качественная и значимая модель Y(x3), хотя и недостаточно точная.
Рисунок 13
Построим модель, вызвав меню Анализ->Регрессия->Линейная. В появившемся окне в качестве зависимой переменной указываем Y, в качестве независимой X3 (рисунок 14).
Рисунок 14
В окне Сохранить указываются предсказанные значения и интервал прогноза с вероятностью 0,9 (рисунок 15).
Рисунок 15
В нижней части таблице появились прогнозные значения (рисунок 16).
Рисунок 16
Прогнозируемое значение цены квартиры (PRE_1) 196,0669 тыс. у.е., нижняя граница интервала прогноза (LICI_1) 145,34499 тыс. у.е., верхняя граница интервала прогноза (UICI_1) 247,78881 тыс. у.е. c вероятностью 90%.
Для построения графика выбирается диалоговое окно в меню Графика-> Рассеяние/Точки (использовалась для построения поля корреляции). Выбираем простую диаграмму рассеивания, как делали выше. В окне Вывод находится ранее построенная диаграмма поля корреляции (рисунок 17).
Двойным щелчком по диаграмме или через контекстное меню правой клавиши мыши включается Редактор диаграмм. Правой клавишей мыши вызывается окно с контекстным меню редактора. Выбирается пункт Добавить:Линия аппроксимации для итога. В новом окне Линия аппрокисмации указываются условия задачи: линейная регрессия, доверительный интервал прогноза отдельных значений 90% (рисунок 18).
После
нажатия кнопки Применить редактор
закрывается, в окне Вывод появляется
диаграмма с моделью и
Рисунок 17
Рисунок 18
Рисунок 19
Рисунок 20
В новом регрессионном отчете в окне Вывод показан процесс незначимой переменной x5. Оставшиеся переменные обладают высокой t-статистикой (по модулю больше табличных значений) и значимы на достаточно маленьком уровне (таблица 8). Уравнение модели:
Y=14,040+1,696 X3 -3,759 X6.
Таблица
8 - Коэффициенты(a)
Модель | Нестандартизованные коэффициенты | Стандартизованные коэффициенты | t | Знч. | |||
| B |
Стд. ошибка | Бета |
| |||
1 |
(Константа) | 14.038 | 19.150 | .733 | .468 | ||
| общая площадь квартиры (м2); |
1.696 | .178 | .930 | 9.525 | .000 | |
| этаж квартиры; |
.084 | 1.208 | .006 | .069 | .945 | |
| площадь кухни (м2). |
-3.815 | 2.256 | -.176 | -1.691 | .099 | |
2 | (Константа) | 14.040 | 18.891 | .743 | .462 | ||
| общая площадь квартиры (м2); |
1.696 | .176 | .930 | 9.664 | .000 | |
| площадь кухни (м2). |
-3.759 | 2.080 | -.174 | -1.807 | .079 |
a Зависимая переменная: цена квартиры, тыс. долл.
Каждый метр общей площади оценивается, в среднем, за 1,696 тыс.у.е. Каждый дополнительный квадратный метр площади кухни уменьшает стоимость квартиры в среднем на 3,759 тас.у.е.
Таблица
9 - Сводка для модели(c)
Модель | R | R квадрат | Скорректированный R квадрат | Стд. ошибка оценки |
1 | .859(a) | .738 | .716 | 27.42724 |
2 | .859(b) | .738 | .724 | 27.05586 |
a Предикторы: (константа) площадь кухни (м2)., этаж квартиры;, общая площадь квартиры (м2);
b Предикторы: (константа) площадь кухни (м2)., общая площадь квартиры (м2);
c Зависимая переменная: цена квартиры, тыс. долл.
Степень влияния факторов наиболее легко оценивается по коэффициентам β, приведенным в предыдущей таблице.
где
Фактор х3 влияет сильнее (0,930 >|-0,174|), чем х6 при расчете в единицах среднеквадратических отклонений (таблица 8). Эластичность рассчитывается по средним величинам переменных
Через меню Анализ-> Отчеты-> Итоги по наблюдениям получаем средние значения переменных (коэффициенты уравнения были приведены выше в таблице 8, рисунок 21).
Рисунок 21
Таблица
10 - Сводка для наблюдений(a)
цена квартиры, тыс. долл. | общая площадь квартиры (м2); | площадь кухни (м2). | ||
1 | 115.00 | 70.40 | 7.00 | |
2 | 85.00 | 82.80 | 10.00 | |
3 | 69.00 | 64.50 | 10.00 | |
4 | 57.00 | 55.10 | 9.00 | |
… | ||||
38 | 64.50 | 64.50 | 8.60 | |
39 | 125.00 | 54.00 | 9.00 | |
40 | 152.30 | 89.00 | 13.00 | |
41 | . | 135.60 | . | |
Итого | Среднее | 93.6503 | 70.8268 | 10.0550 |