Статистическое исследование уровня доходов в РФ

Автор: Пользователь скрыл имя, 12 Января 2012 в 09:07, курсовая работа

Описание работы

Цель данной работы – выявить наличие влияния и тесноту взаимосвязи между определенными факторами и уровнем среднедушевого дохода в РФ.
Цель работы определила следующие задачи:
- изучить теоретико-методологические аспекты статистического исследования влияния факторных признаков на уровень дохода в РФ;
- провести корреляционно - регрессионный анализа взаимосвязи факторных признаков и уровня дохода в РФ;
- спрогнозировать показатели;

Содержание

Введение 3

1. Общие теоретические сведения. 5
1.1. Состав и показатели доходов 5
1.2. Факторы, влияющие на уровень доходов 7
1.3 Уровень доходов за рубежом, в России и Красноярском крае 14

2. Корреляционно - регрессионный анализ. 18
2.1. Теоретические интерпретации и формулы для подготовки к проведению корреляционно-регрессионного анализа. 18
2.2. Статистическое моделирование связи методом корреляционного и регрессионного анализа. 19
2.3. Анализ зависимости среднедушевого дохода в РФ от различных факторов. 29

Заключение 38

Список литературы 40

Работа содержит 1 файл

КУРСОВАЯ по стат.методам.docx

— 702.17 Кб (Скачать)

Проверка адекватности регрессионной модели.

     Для практического использования моделей  регрессии большое значение имеет  их адекватность, т.е. соответствие фактическим  статистическим данным.

     Корреляционный  и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для  ограниченной по объёму совокупности. Поэтому показатели регрессии и  корреляции – параметры уравнения  регрессии, коэффициенты корреляции и  детерминации могут быть искажены действием  случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных  статистических моделей.

     При численности объектов анализа до 30 единиц возникает необходимость  проверки значимости (существенности) каждого коэффициента регрессии. При  этом выясняют насколько вычисленные  параметры характерны для отображения  комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.оизводительность труда).

      Значимость коэффициентов простой  линейной регрессии (применительно  к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия

для параметра b0 :

 для параметра b1 :          

   где n - объём выборки;

- среднее  квадратическое отклонение результативного признака от выравненных значений ŷ ;

    или   

- среднее  квадратическое отклонение факторного признака x от общей средней .

     Вычисленные по вышеприведенным формулам значения сравнивают с критическими t , которые  определяют по таблице Стьюдента  с учетом принятого уровня значимости  α  и числом степеней свободы вариации . В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч> tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. такой вывод.

     Проверка  адекватности регрессионной модели  может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту   корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением ηэ, когда δ2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней: . 

     Говоря  о корреляционном отношении как  о показателе измерения тесноты  зависимости, следует отличать от эмпирического  корреляционного отношения –  теоретическое. Теоретическое корреляционное отношение η представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака  δ, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака σ:

  ,

где ;       .

Тогда .

Изменение значения η объясняется влиянием факторного признака. Благ

     В основе расчёта корреляционного  отношения лежит правило сложения дисперсий, то есть , где    -   отражает вариацию у за счёт всех остальных факторов, кроме х , то есть являются остаточной дисперсией:

.

Тогда формула теоретического корреляционного  отношения примет вид:

,

или        .

     Подкоренное выражение корреляционного выражения  представляет собой коэффициент  детерминации (мера определенности, причинности).

     Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора. труда).

     Теоретическое корреляционное выражение применяется  для измерения тесноты связи  при линейной и криволинейной  зависимостях между результативным и факторным признаком.

     Как видно из вышеприведенных формул корреляционное отношение может  находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между  признаками теснее.

     Кроме того, при линейной форме уравнения  применяется другой показатель тесноты  связи – линейный коэффициент  корреляции:

,

где n –  число наблюдений.

     Для практических вычислений при малом  числе наблюдений (n≤20÷30) линейный коэффициент  корреляции удобнее исчислять по следующей формуле:

      .

     Значение  линейного коэффициента корреляции важно для исследования социально-экономических  явлений и процессов, распределение  которых близко к нормальному. Он принимает значения в интервале: -1≤ r ≤ 1.

     Отрицательные значения указывают на обратную связь, положительные – на прямую. При r = 0 линейная связь отсутствует. Чем  ближе коэффициент корреляции по абсолютной величине к единице, тем  теснее связь между признаками. И, наконец, при r = ±1 – связь функциональная. Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0 ≤ r2 ≤ 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции. Факт совпадений и несовпадений значений теоретического корреляционного отношения η и линейного коэффициента корреляции r используется для оценки формы связи.

     Выше  отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а  с помощью линейного коэффициента корреляции – только прямолинейной. Следовательно, значения η и r совпадают  только при наличии прямолинейной  связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов  η и r не превышает 0,1 , то гипотезу о  прямолинейной форме связи можно  считать подтвержденной. В моем случае наблюдается примерное совпадение линейного коэффициента детерминации и теоретического корреляционного отношения, что дает мне основание считать связь между капиталом банков и их работающими активами прямолинейной.

Коэффициент автокорреляции и его оценка

     Для полной характеристики случайного процесса недостаточно его математического  ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых  наблюдений понятие «связанного  ряда»: вероятность возникновения  на определенном месте тех или  иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет  получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации – g (k) = E[(x(t) - m)(x(t + k) - m)] – и автокорреляции r (k) = E[(x(t) - m)(x(t + k) - m)] / D , где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t1),x(t2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t1, t2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как r (k) = g (k) /g (0), откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t.

     В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический  коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):

     

Наиболее  важным из различных коэффициентов  автокорреляции является первый - r1, измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).

     Распределение коэффициентов автокорреляции неизвестно, поэтому для оценки их достоверности  иногда используют непараметрическую  теорию Андерсона (1976), предложившего статистику t = r1 (n -1)0.5 , которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице.

     Последовательность  коэффициентов корреляции rk, где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).

Критерий  Дарбина-Уотсона

     Критерий  Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.

     Численное значение коэффициента равно

     d = [(e(2)-e(1))2 + ... + (e(n)-e(n -1))2]/[e(1)2 + ... + e(n)2],

     где e(t) - остатки.

     Возможные значения критерия находятся в интервале  от 0 до 4, причем табулированы его табличные  пороговые значения для разных уровней значимости.

     Значение d близко к величине 2*(1 - r1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие – отрицательной.

2.3 Анализ зависимости среднедушевого дохода в РФ от различных факторов.

     1) Проверка выборок на однородность  и нормальность:

     - Среднедушевой доход:

ȳ = 297,21;

Sy2 = 8608,13;

Sy = 92,78;

V = Sy / ȳ * 100% = 31 %< 33% - выборка однородная, отсев грубых погрешностей не требуется;

As = ∑(yi - ȳ)3/ (n*Sy3) = 0,6 – правосторонняя асимметрия;

Ex = ∑(yi - ȳ)4/ (n*Sy4) – 3 = -1,004 – наблюдается плосковершинность;

G1 = As = 0,675 – несмещённая оценка для коэф. асимметрии;

SG1 = = 0,597 – среднеквадратическая ошибка;

| G1 | ≤ 3 SG1 – распределение случайной величины y близко к симметричному;

G2 = Ex(n+1)) = -0,89 – несмещённая оценка для коэф. эксцесса;

SG2 = = 1,154 – среднеквадратическая ошибка;

| G2 | ≤ 5 SG2 – положение вершины случайной величины y близко к нормальному;

     - Валовой внутренний продукт:

ȳ =6962397436; Sy2 = 22205202375463500000; Sy = 4712039634,77;

V = 26,68 % 33% - выборка однородная, отсев грубых погрешностей не требуется;

As = 0,388 – правосторонняя асимметрия;

Ex = - 1,303 – наблюдается плосковершинность;

G1 =0,44 – несмещённая оценка для коэф. асимметрии;

SG1 = 0,616 – среднеквадратическая ошибка;

| G1 | ≤ 3 SG1 – распределение случайной величины y близко к симметричному;

G2 = - 1,335 – несмещённая оценка для коэф. эксцесса;

SG2 = 1,191 - среднеквадратическая ошибка;

| G2 | ≤ 5 SG2 – положение вершины случайной величины y близко к нормальному;

     - Уровень безработицы:

ȳ =8,61; Sy2 = 4,89; Sy = 2,21;

V = 25,67 % 33% - выборка однородная, отсев грубых погрешностей не требуется;

As = 1,081 – правосторонняя асимметрия;

Ex = - 0,067 – наблюдается плосковершинность;

G1 =1,227 – несмещённая оценка для коэф. асимметрии;

Информация о работе Статистическое исследование уровня доходов в РФ