Автор: Пользователь скрыл имя, 29 Марта 2012 в 16:15, контрольная работа
1. Расположите территории по возрастанию фактора X. Сформулируйте рабочую гипотезу о возможной связи Y и X.
2. Постройте поле корреляции и сформулируйте гипотезу о возможной форме и направлении связи.
3. Рассчитайте параметры a1 и а0 парной линейной функции ух = а0 + a1х и линейно-логарифмической функции уln x = а0 + a1lnх
4. Оцените тесноту связи с помощью показателей корреляции (ryx и ηylnx) и детерминации (r2yx и η2ylnx), проанализируйте их значения.
5. Надёжность уравнений в целом оцените через F-критерий Фишера для уровня значимости α = 0,05.
1. Задача № 1…………………………………………………………………3
2. Задача № 2………………………………………………………………..10
3. Задача № 4………………………………………………………………. 17
4. Задача № 6………………………………………………………………..20
Литература ……………………………………………………………… 23
Требуется изучить влияние указанных факторов на стоимость валового регионального продукта.
Предварительный анализ исходных данных по 12 территориям не выявил территорий с аномальными значениями признаков. Поэтому значения приводимых показателей рассчитаны по полному перечню территорий федерального округа.
При обработке исходных данных получены следующие значения:
а) – линейных коэффициентов парной корреляции, средних и средних квадратических отклонений σ:
N=12.
| Y | X1 | Х2 | X3 |
Y | 1 | 0,9493 | 0,9541 | 0,9287 |
X1 | 0,9493 | 1 | 0,152 | 0,9660 |
Х2 | 0,9541 | 0,9152 | 1 | 0,9582 |
X3 | 0,9287 | 0,9152 | 0,9582 | 1 |
Средняя | 42,43 | 7,758 | 168,6 | 5,208 |
σ | 36,03 | 6,642 | 114,7 | 3,865 |
б) – коэффициентов частной корреляции
| Y | X1 | Х2 | X3 |
Y | 1 | 0,7990 | 0,8217 | - 0,6465 |
X1 | 0,7990 | 1 | - 0,7054 | 0,8710 |
Х2 | 0,8217 | - 0,7054 | 1 | 0,8407 |
X3 | - 0,6465 | - 0,8710 | 0,8407 | 1 |
Задание:
1. По значениям линейных коэффициентов парной и частной корреляции r выберите неколлинеарные факторы и рассчитайте для них коэффициенты частной корреляции. Произведите окончательный отбор информативных факторов во множественную регрессионную модель.
2. Выполните расчёт бета коэффициентов (β) и постройте с их помощью уравнение множественной регрессии в стандартизованном масштабе. Проанализируйте с помощью бета коэффициентов (β) силу связи каждого фактора с результатом и выявите сильно и слабо влияющие факторы.
3. По значениям β-коэффициентов рассчитайте параметры уравнения в естественной форме (то есть а1, а2 и а0). Проанализируйте их значения. Сравнительную оценку силы связи факторов дайте с помощью общих (средних) коэффициентов эластичности – Эух.
4. Оцените тесноту множественной связи с помощью R и R2, а статистическую значимость уравнения и тесноту выявленной связи через F-критерий Фишера (для уровня значимости α = 0,05).
5. Рассчитайте прогнозное значение результата Ỹxj, предполагая, что прогнозные значения факторов (хj) составят 107,7 процента от их среднего уровня.
6. Основные выводы оформите аналитической запиской.
Решение.
1. Представленные в условии задачи значения линейных коэффициентов парной корреляции позволяют установить, что валовой региональный продукт – Y более тесно связан со среднегодовой стоимостью основных фондов в экономике – Х2 (ryx2 = 0,9541) и с инвестициями 2000 года в основной капитал – X1 (ryx1 = 0,9493); наименее тесно результат Y связан с инвестициями 1999 года в основной капитал – X3. Поэтому, в силу небольшой информативности фактора Х3, предполагаем, что его можно исключить из дальнейшего анализа, оставляя для рассмотрения только Х1 и Х2. Проверим наши предположения с помощью анализа матрицы коэффициентов частной корреляции. Очевидно, что наиболее тесная связь результата Y со среднегодовой стоимостью основных фондов в экономике (ryx2*х1х3 = 0,8217) и примерно одинаково тесно связан результат с инвестициями 2000 года в основной капитал (ryx1**х2х3 = 0,7990). Поэтому для уточнения окончательного вывода выполним расчет серии коэффициентов частной корреляции Y с двумя возможными комбинациями факторных признаков: для Y с X1 и с Х2
2. Расчёты частных коэффициентов корреляции выполним по следующим формулам:
ryx1*х2 = ryx1 - ryx2 * rx1х2/√¯(1 - r2yx2)*(1 - r2 x1x2) = 0,9493 – 0,9541*0,9152/√¯(1 – 0,95412)*(1 – 0, 91522) = 0,643
ryx2*х1 = ryx2 - ryx1 * rx1х2/√¯(1 - r2yx1)*(1 - r2 x1x2) = 0,9541 – 0,9493*0,9152/√¯(1 – 0,94932)*(1 – 0,91522) = 0,672
rx1х2*y = rx1x2 - ryx1 * ryх2/√¯(1 - r2yx1)*(1 - r2yx2) = 0,9152 – 0,9493*0,9541/√¯(1 – 0,94932)*(1 – 0,95412) = 0,101
Как видим, факторы Х1 и Х2, действительно, тесно связаны с результатом, а между собой взаимодействуют, но слабее, чем каждый из них – с результатом. Эти обстоятельства позволяют использовать Х1 и Х2 в качестве факторов уравнения множественной регрессии.
3. При построении двухфакторной регрессионной модели Y = а0 + а1х1 + а2х2 воспользуемся для упрощения расчётов методом стандартизованных переменных. В этом случае, исходное уравнение приобретает вид: ty = βyx1* tx1 + βyx2* tx2. Выполним расчёт β-коэффициентов, используя значения известных по условию линейных коэффициентов парной корреляции.
βyx1 = ryx1 - ryx2 * rx1х2/1 - r2 x1x2 = 0,9493 – 0,9541*0,9152/1 – 0,91522 = 0,469
βyx2 = ryx2 - ryx1 * rx1х2/1 - r2 x1x2 = 0,9541 – 0,9493*0,9152/1 – 0,91522 = 0,525
В результате получено уравнение в стандартизованном масштабе:
ty = 0,469*tx1 + 0,525*tx2
Параметры данного уравнения представляют собой относительные оценки силы влияния каждого из факторов на результат. При увеличении инвестиций 2000 года в основной капитал на одну сигму - σх1 (от своей средней) валовый региональный продукт увеличится на 0,469 своей сигмы σу); с увеличением среднегодовой стоимости основных фондов в экономике на σх2 результат увеличится на 0,525σу. Сравнивая β-коэффициенты, определяем, какой из признаков влияет на результат сильнее, а какой - слабее. В данном случае, увеличение валового регионального продукта происходит, прежде всего, под влиянием увеличения среднегодовой стоимости основных фондов в экономике и в меньшей степени - в результате увеличения инвестиций 2000 года в основной капитал.
4. Используя значения β-коэффициентов, можно рассчитать параметры уравнения в естественной форме:
а1 = βyx1 * σу/σх1 = 0,469*36,03/6,642 = 2,544
а2 = βyx2 * σу/σх2 = 0,525*36,03/114,7 = 0,165
а0 = у – а1*х1 – а2*х2 = 42,43 – 2,544*7,758 – 0,165*168,6 = - 5,125.
В конечном счёте, имеем уравнение: Ŷх1х2 = - 5,125 + 2,544 * х1 + 0,165 * х2 . По значениям коэффициентов регрессии можно судить о том, на какую абсолютную величину изменяется результат при изменении каждого фактора на единицу (от своей средней).
С увеличением инвестиций 2000 года в основной капитал на 1 млрд. руб. валовой региональный продукт увеличивается на 2,544 млрд. руб., с увеличением среднегодовой стоимости основных фондов в экономике на 1 млрд. руб. валовой региональный продукт возрастает на 0,165 млрд. руб.
Но так как признаки-факторы измеряются в разных единицах, сравнивать значения их коэффициентов регрессии не следует. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β- коэффициенты.
5. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае, расчёт показал, что влияние среднегодовой стоимости основных фондов в экономике на валовой региональный продукт оказалось более сильным по сравнению с влиянием инвестиций 2000 года в основной капитал: с ростом среднегодовой стоимости основных фондов в экономике на 1% валовой региональный продукт увеличивается на 0,656%, а при увеличении инвестиций 2000 года в основной капитал на 1% валовой региональный продукт возрастает на 0,465%. Различия в силе влияния весьма значительны: первый фактор влияет на результат почти в полтора раза сильнее, чем второй. Поэтому регулирование величины валового регионального продукта через среднегодовую стоимость основных фондов в экономике будет более результативным, чем через рост инвестиций 2000 года в основной капитал.
Эух1 = а1 * х1/у = 2,544*7,758/42,43 = 0,465;
Эух2 = а2 * х2/у = 0,165*168,6/42,43 = 0,656.
6. Тесноту выявленной зависимости валового регионального продукта от среднегодовой стоимости основных фондов в экономике и от инвестиций 2000 года в основной капитал оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β-коэффициентов. Ryxj = √¯∑ryxj* βyxj. В нашем случае 2-х факторной зависимости расчёт строится следующим образом:
Ryx1х2 = √¯ryx1* βyx1 + ryx2* βyx2 = √¯0,9493*0,469 + 0,9541*0,525 = √¯0,946 = 0,973
R2yx1х2 = 0,947
Как показали расчеты, установлена весьма тесная зависимость валового регионального продукта от среднегодовой стоимости основных фондов в экономике и от инвестиций 2000 года в основной капитал. Это означает, что 94,7% вариации валового регионального продукта определены вариацией данных факторов. Оставшиеся 5,3% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.
7. Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть, Н0/а0 = а1 = а3 = R2yx1х2 = 0.
Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: df1 = k и df2 = n-k-1; где: n - число изучаемых единиц; k - число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k = 2.
Fфакт = R2yxj/1- R2yxj: k/n-k-1
В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:
Fфакт = R2yx1х2/1- R2yx1х2: k/n-k-1 = 0,947/0,053:2/12-2-1≈80,41.
Фактическое значение критерия показывает, что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 80 раз больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может, а является результатом влияния существенных, систематических факторов.
Для принятия обоснованного решения Fфакт сравнивается с Fтабл, которое формируется случайно и зависит степеней свободы факторной (df1 = k) и остаточной (df2 = n-k-1) дисперсий, а также от уровня значимости α = 0,05 Fтабл= 4,26. В силу того, что Fфакт = 80,41 > Fтабл = 4,26, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы - согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.