Автор: Пользователь скрыл имя, 20 Ноября 2011 в 20:04, реферат
Для застосування МНК при оцінюванні параметрів моделі раніше було сформульовано основні припущення, які на практиці можуть порушуватись.
У попередньому розділі розглядався особливий випадок багатофакторного регресійного аналізу, пов'язаний з проблемою мультиколінеарності. Тепер розглянемо інший особливий випадок, що стосується сталості дисперсії кожної випадкової величини щ (гомоскедастичність залишків).
де k = const (тобто дисперсія залишків зростає пропорційно до х). Із припущення випливає
Отже, трансформована модель має вигляд
Розглянемо
Отже, для трансформованої моделі випадкова величина у= гомоскедастична зі сталою дисперсією k2. Це означає, що, виконавши зазначене вище перетворення, ми виключили гетероскедастичність. Випадок 3. Припустимо, що гетероскедастичність має форму
(дисперсія зростає
Допустима
трансформація полягає в
Отже, трансформована модель має вигляд
Розглянемо
Отже, нова випадкова величина є гомоскедастичною із сталою дисперсією k2.
Загальний випадок. Припустимо, що гетероскедастичність має форму
Зазначимо, що така трансформація еквівалентна застосуванню зваженого методу найменших квадратів (ЗМНК), який є особливим випадком узагальненого методу найменших квадратів (УМНК). Суть ЗМНК полягає в мінімізації зваженої суми квадратичних відхилень:
Зазначимо також, що ЗМНК, застосований до початкової моделі, дає такі самі результати, що й МНК, застосований до трансформованої моделі.
Твердження. Оцінки трансформованої моделі мають меншу дисперсію (ефективніші), ніж оцінки, отримані із застосуванням МНК до початкової моделі.
Нарешті, потрібно пам’ятати, що гетероскедастичність може існувати за рахунок неврахованих факторів (поганої специфікації моделі). У цьому разі можливим рішенням є включення неврахованих факторів у модель. Сліпе застосування трансформації (без аналізу причин гетероскедастичності) зробить гомоскедастичною випадкову змінну, однак оцінки параметрів залишаться неправильними через неврахування важливих факторів.
Оцінювання параметрів багатофакторної регресійної моделі на основі узагальненого методу найменших квадратів
Розглянемо детальніше загальний випадок оцінювання параметрів моделі з гетероскедастичними залишками.
Запишемо узагальнену багатофакторну регресійну модель у мат-ричному вигляді де у вектор-стовпець залежної змінної розмірності (n х 1);
X - матриця незалежних змінних розмірності (nх(m + 1));
a
- вектор-стовпець невідомих
u
вектор-стовпець випадкових
Нехай виконуються всі припущення класичної лінійної багатофакторної моделі, за винятком припущення про гомоскедастичність похибок. Якщо до моделі (5.16) застосувати звичайний МНК, отримана оцінка параметрів буде незміщеною, обгрунтованою, однак не ефективною (не має найменшої дисперсії серед незміщених оці-нок).
За наявності гетероскедастичності для оцінювання параметрів моделі доцільно застосувати узагальнений метод найменших квадратів (метод Ейткена), вектор оцінювання якого має вигляд
Вектор
a містить незміщену лінійну
Зауваження. Для отримання УМНК-оцінок необхідно знати коваріаційну матрицю S вектора похибок, яка на практиці дуже рідко відома. Тому природно спершу оцінити матрицю S, а потім застосувати її оцінку у формулі. Цей підхід є суть узагальненого методу найменших квадратів.
Визначення матриці S. Оскільки явище гетероскедастичності пов’язане лише з тим, що змінюються дисперсії залишків, а коваріація між ними відсутня, то матриця S має бути діагональною, а саме
Зазначимо, що матриця S залежить від специфічної форми гетероскедастичності й може бути розрахована виходячи з припущень про залежність похибок від однієї із незалежних змінних (випадки 1-3).
Оскільки матриця S симетрична і додатно визначена, то при S = PP - 1 матриця Р має вигляд
Зауваження. Коефіцієнт детермінації не може бути задовільною мірою якості моделі в разі застосування УМНК (на відміну від класичної моделі). У загальному випадку значення коефіцієнта детермінації навіть не повинно перебувати в інтервалі [0,1], а додавання чи вилучення незалежної змінної (фактора) не обов’язково зумовлює його збільшення або зменшення.
Основні висновки щодо наявності гетероскедастичності в регресійній моделі
1.
Якщо виявлено
2.
Якщо а2щ відомі (що, взагалі, рідкість),
то невідомі параметри
3. Якщо а2щ невідомі, але відомий вигляд залежності між а2щ та однією із незалежних змінних %., то параметри регресійної моделі розраховуються за УМНК.
4.
Важливим є припущення про
нормальний закон розподілу