Автор: Пользователь скрыл имя, 23 Сентября 2011 в 15:30, реферат
Регрессионная модель описывает объективно существующие между явлениями корреляционные связи. По своему характеру корреляционные связи необычно сложны и разнообразны. Отследить все эти взаимосвязи и установить точный функциональный вид практически невозможно. Поэтому при выборе функции идет речь только об аппроксимации относительно простыми функциями несравненно более сложных по своей природе взаимосвязей.
Так как наибольшее значение Х (площадь объекта, численность населения) намного превосходит минимальное (коэффициенты значимости, описывающие качественные признаки объектов), требуется преобразование исходных факторов Хi. Устранение приоритета относительных отклонений над абсолютными производим путем логарифмического шкалирования данных.
Формула регрессии при этом принимает вид:
y = exp(a
+ b1
*ln x1 + b2
* ln x2 …. bn *ln xn
+ e)
Преобразованные факторы приведены в таблице:
Таблица 1.3. Логарифмированные значения характеристик сопоставимых объектов
№ пп | Цена | Площадь | Тип здания | Район города | Оживленность улицы | Парковка | Охрана | Состояние | Численность населения |
ln(Y) | ln(X1) | ln(X2) | ln(X3) | ln(X4) | ln(X5) | ln(Х6) | ln(X7) | ln(X8) | |
1 | 11,287 | 4,127 | 0,000 | 1,099 | 1,099 | 0,693 | 0,693 | 1,099 | 6,359 |
2 | 11,213 | 4,007 | 0,000 | 1,099 | 0,693 | 0,693 | 0,693 | 1,099 | 6,359 |
3 | 11,211 | 3,738 | 0,000 | 1,099 | 1,099 | 0,693 | 0,693 | 1,099 | 6,359 |
4 | 11,099 | 4,007 | 0,000 | 1,099 | 1,099 | 0,693 | 0,000 | 0,693 | 6,364 |
5 | 11,052 | 5,394 | 0,693 | 1,099 | 0,000 | 0,693 | 0,000 | 0,000 | 6,364 |
6 | 11,052 | 5,247 | 0,693 | 1,099 | 1,099 | 0,000 | 0,000 | 1,099 | 6,364 |
7 | 11,020 | 4,905 | 0,000 | 1,099 | 1,099 | 0,693 | 0,693 | 1,099 | 6,359 |
8 | 10,981 | 3,951 | 0,000 | 1,099 | 1,099 | 0,000 | 0,000 | 1,099 | 6,364 |
9 | 10,977 | 4,220 | 0,000 | 1,099 | 1,099 | 0,693 | 0,693 | 1,099 | 6,359 |
10 | 10,969 | 4,624 | 0,693 | 1,099 | 1,099 | 0,693 | 0,000 | 1,099 | 6,364 |
11 | 10,929 | 6,700 | 0,693 | 0,693 | 0,693 | 0,693 | 0,000 | 0,693 | 6,364 |
12 | 10,917 | 3,784 | 0,693 | 0,693 | 0,693 | 0,000 | 0,693 | 0,693 | 6,359 |
13 | 10,901 | 2,833 | 0,000 | 0,693 | 0,693 | 0,693 | 0,000 | 0,693 | 6,364 |
14 | 10,885 | 6,250 | 0,693 | 1,099 | 1,099 | 0,000 | 0,000 | 0,693 | 6,364 |
15 | 10,885 | 4,787 | 0,693 | 0,693 | 0,693 | 0,693 | 0,693 | 0,693 | 6,364 |
16 | 10,838 | 4,382 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 0,693 | 6,359 |
17 | 10,835 | 5,561 | 0,000 | 1,099 | 0,693 | 0,693 | 0,693 | 0,693 | 6,364 |
18 | 10,820 | 4,159 | 0,000 | 0,693 | 0,693 | 0,693 | 0,693 | 0,693 | 6,359 |
19 | 10,762 | 4,527 | 0,693 | 1,099 | 0,693 | 0,000 | 0,000 | 0,693 | 6,364 |
20 | 10,712 | 4,682 | 0,693 | 0,693 | 0,000 | 0,000 | 0,000 | 0,693 | 6,359 |
21 | 10,703 | 4,691 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 1,099 | 6,359 |
22 | 10,684 | 6,551 | 0,693 | 0,693 | 0,693 | 0,693 | 0,693 | 1,099 | 6,359 |
23 | 10,683 | 5,075 | 0,000 | 0,693 | 0,693 | 0,693 | 0,000 | 1,099 | 5,136 |
24 | 10,600 | 4,934 | 0,000 | 0,693 | 0,693 | 0,693 | 0,000 | 0,693 | 5,136 |
25 | 10,583 | 4,511 | 0,000 | 0,693 | 0,693 | 0,693 | 0,693 | 0,000 | 6,359 |
26 | 10,575 | 4,700 | 0,000 | 0,693 | 0,693 | 0,693 | 0,693 | 0,000 | 6,364 |
27 | 10,571 | 4,718 | 0,000 | 0,693 | 0,693 | 0,693 | 0,693 | 0,000 | 6,359 |
28 | 10,553 | 4,426 | 0,000 | 1,099 | 1,099 | 0,693 | 0,693 | 0,000 | 6,359 |
29 | 10,540 | 4,344 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 0,000 | 6,364 |
30 | 10,533 | 3,738 | 0,000 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 6,364 |
31 | 10,492 | 3,555 | 0,000 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 6,364 |
32 | 10,479 | 5,832 | 0,693 | 0,693 | 0,693 | 0,693 | 0,000 | 0,000 | 6,364 |
33 | 10,422 | 4,500 | 0,693 | 0,693 | 0,693 | 0,000 | 0,693 | 0,000 | 5,136 |
34 | 10,417 | 4,620 | 0,000 | 1,099 | 0,693 | 0,000 | 0,000 | 1,099 | 3,381 |
35 | 10,378 | 4,970 | 0,000 | 1,099 | 1,099 | 0,000 | 0,000 | 1,099 | 3,381 |
36 | 10,292 | 5,652 | 0,000 | 1,099 | 0,693 | 0,000 | 0,000 | 1,099 | 3,381 |
37 | 10,290 | 6,190 | 0,693 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 6,364 |
38 | 10,202 | 6,802 | 0,693 | 0,000 | 0,000 | 0,000 | 0,000 | 0,000 | 6,359 |
39 | 10,193 | 4,731 | 0,000 | 1,099 | 0,693 | 0,000 | 0,000 | 0,693 | 3,381 |
40 | 10,173 | 6,780 | 0,000 | 0,000 | 0,000 | 0,000 | 0,693 | 0,693 | 6,364 |
41 | 10,152 | 5,220 | 0,693 | 0,000 | 0,000 | 0,000 | 0,693 | 0,693 | 5,136 |
42 | 10,151 | 4,474 | 0,000 | 1,099 | 1,099 | 0,000 | 0,000 | 1,099 | 3,381 |
43 | 10,146 | 5,226 | 0,000 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 5,136 |
44 | 10,127 | 4,465 | 0,000 | 1,099 | 0,693 | 0,000 | 0,000 | 0,693 | 3,381 |
45 | 10,126 | 2,918 | 0,000 | 1,099 | 0,693 | 0,000 | 0,000 | 0,693 | 3,381 |
46 | 10,119 | 4,317 | 0,000 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 5,136 |
47 | 10,070 | 4,143 | 0,693 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 5,136 |
48 | 9,968 | 4,317 | 0,000 | 0,000 | 0,000 | 0,000 | 0,000 | 0,000 | 6,364 |
49 | 9,872 | 4,787 | 0,693 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 5,136 |
Объект оценки | ? | 5,508 | 0,693 | 0,000 | 0,000 | 0,693 | 0,000 | 0,000 | 3,381 |
Для исключения явления мультиколлинеарности (включение в модель независимых переменных, являющихся выражением одного и того же свойства объекта), на первом этапе проведен корреляционный анализ, позволяющий выявить наличие связанных признаков.
Корреляционная матрица приведена в таблице:
Таблица 1.4. Корреляционная матрица
ln(Y) | ln(X1) | ln(X2) | ln(X3) | ln(X4) | ln(X5) | ln(Х6) | ln(X7) | ln(X8) | |
ln(Y) | 1 | ||||||||
ln(X1) | -0,1460332 | 1 | |||||||
ln(X2) | 0,045457 | 0,3846835 | 1 | ||||||
ln(X3) | 0,6029753 | -0,2701358 | -0,2484665 | 1 | |||||
ln(X4) | 0,5926346 | -0,2813713 | -0,2736948 | 0,8323963 | 1 | ||||
ln(X5) | 0,2969205 | -0,0652602 | -0,2037719 | -0,0742019 | 0,027726 | 1 | |||
ln(Х6) | 0,3131538 | -0,0080227 | -0,1691259 | 0,071755 | 0,179986 | 0,2846674 | 1 | ||
ln(X7) | 0,4736085 | -0,032524 | -0,1469288 | 0,5761718 | 0,5610351 | -0,2293963 | 0,0898334 | 1 | |
ln(X8) | 0,5743893 | 0,0902628 | 0,2986733 | -0,1357548 | 0,0050905 | 0,3957969 | 0,3303313 | -0,1990939 | 1 |
Сразу бросается в глаза наличие высокой корреляционной связи (коэффициент корреляции = 93%) между параметрами ln(Х3) – Район города и ln(Х4) – Оживленность улицы. В самом деле, данные признаки тесно взаимосвязаны, центральная часть города характеризуется большей оживленностью улиц, чем окраины. Для исключения явления мультиколлинеарности, в модели необходимо оставить только один признак. Поскольку для офисов наиболее значимым фактором, оказывающим влияние на стоимость объекта, является признак расположение в определенной части города (признак «оживленность улиц» более применим к характеристикам торговых объектов), то дальнейший анализ производим без учета признака «оживленность улиц» (ln(Х4).
Регрессионная
модель реализована с применение
программы «Пакет анализа» в EXCEL.
Результаты регрессионного анализа, выполненного
при уровне надежности 95%, представлены
в утилите из EXCEL, там же приводятся также
результаты дисперсионного анализа, коэффициенты
регрессии, стандартная погрешность вычисления
стоимости, среднеквадратичные отклонения,
стандартные погрешности для коэффициентов.
Последние четыре столбца нижней таблицы содержат границы доверительных интервалов для регрессионных коэффициентов, построенные для стандартного (95%) и выбранного пользователем (95%) уровней надежности.
Проверка адекватности модели
Далее необходимо произвести проверку значимости регрессии.
Точность и надежность полученного результата оценивается с помощью ряда статистических критериев. Приведенные статистические оценки получены и справедливы в предположении нормальности распределения случайной величины Y, а также независимости и нормальности распределения погрешностей ei.
1)
Для интерпретации итоговых
В
таблице анализа дисперсии
Значение F в таблице равно 52 если нулевая гипотеза верна, то F- отношение удовлетворяет F-распределению с равным 7 числителем степеней свободы и равным 41 знаменателем степеней свободы.
Проверка значимости уравнения регрессии с помощью F-критерия Фишера основана на вычислении статистики F.
Значение коэффициента Фишера сравнивают с критическим значением Fкр, представляющее собой значение F-распределения (распределение Фишера-Снедекора) со степенями свободы (n-k-1), k и уровнем значимости a=1-g. Если неравенство F > Fкр выполнено, то регрессионная зависимость статистически значима, с надежностью g (в расчетах принято g = 0,95), описывает известные рыночные данные.
Критическое значение Fкр вычислено с помощью функции FРАСПОБР(0,05;7;41) в программе Excel, первым аргументом этой функции является уровень значимости, вторым – число степеней свободы регрессионного уравнения, третьим – количество факторов (число степеней свободы знаменателя). Fкр = 2,24 < F = 52, т.е. неравенство выполнено, следовательно, регрессия прошла проверку. Построенная регрессионная зависимость значима со статистической надежностью (доверительной вероятностью) 95% (g=0,95).
2) Коэффициент детерминации R2 позволяет судить о том, какой процент дисперсии известных рыночных данных объясняется с помощью регрессионной зависимости. Иными словами, значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). При применении множественной регрессии, предпочтительнее пользоваться нормированным R2.
В данном случае, нормированный R2 = 0,88, это означает, что 88% изменчивости цены за 1 кв.м. площади объектов-аналогов, объясняется разнообразием значений признаков (предикторов), а оставшиеся проценты объясняются случайными отклонениями.
Связь
между рыночными ценами объектов-аналогов
и примененными в расчетах коэффициентами
значимости считается достаточной при
нормированном R2 > 0,7, то есть, найденная
связь удовлетворяет критерию достаточности.
(шкала
Чеддока, http://www.statsoft.ru/home/
3) Далее следует проверка значимости отдельных регрессионных коэффициентов. Значения t-статистики указаны в утилите из EXCEL.
Критическое значение для уровня значимости 0,05 возвращается функцией СТЬЮДРАСПОБР(0,05;41) и равно 2,02. Таким образом, значимость регрессионных коэффициентов при факторах ln(X1), ln(X2), ln(X6) со статистической надежностью 95% не подтверждается. В силу незначимости регрессионных коэффициентов исключаем их из анализа и строим модель, исходя из меньшего числа влияющих факторов.
В итоге получены следующие результаты:
1)
Проверка значимости уравнения
регрессии с помощью
2)
Критическое значение для
Прежде
чем производить расчет стоимости
по полученному уравнению
Оценка меры достоверности (D) анализируемого уравнения регрессии производится с помощью процентного соотношения стандартной ошибки уравнения, умноженной на tкр и среднеарифметического значения по результативному признаку Y. В случае, если максимальное значение D не превышает 10%, анализируемое уравнение регрессии достаточно корректно отображает корреляционную связь и может быть использовано для расчета стоимости объекта оценки.
Стандартная ошибка составляет 0,129.
Матожидание цен аналогов, рассчитанное по столбцу «ln(Цена)» таблицы 1.3, составляет 10,601.
D = 0,129*2,02/10,601 * 100 % ≈ 2,5% .
Высокое значение достоверности (2,5%<10%) свидетельствует о возможности использования линейной зависимости вида = exp(a + b1 *ln x1 + b2 * ln x2 …. b7 *ln x7 + έ) для расчета стоимости 1 кв. м. площади оцениваемого объекта.
Информация о работе Сравнительный подход множественная регрессия