Статистические методы изучения взаимосвязей экономических явлений

Автор: Пользователь скрыл имя, 17 Марта 2011 в 22:10, курсовая работа

Описание работы

Предметом исследования статистики являются массовые явления социально-экономической жизни; она изучает количественную сторону этих явлений в неразрывной связи с их качественным содержанием в конкретных условиях места и времени.

Содержание

Введение

1. Теоретическая часть………………………………………………………….5

1.Основные понятия корреляционного и регриссионного анализа……….7
2.Парная корреляция и парная линейная регрессия……………………...10
3.Оценка значимости параметров взаимосвязи…………………………...15
4.Непараметрические методы оценки связи………………………………17
5.Дисперсионный анализ связи…………………………………………….20
2. Расчетная часть……………………………………………………………...21

3. Аналтическая часть…………………………………………………………29

Заключение……………………………………………………………………...33

Литература………………………………………………………………………35

Скачать полностью (236.13 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

Курсовая статистика.doc

— 597.50 Кб (Скачать)

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.

Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.

Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.

Непараметрические методы не накладывают ограничений на закон распределения изучаемых величин. Их преимуществом является и простота вычислений.

1.2. Парная корреляция и парная линейная регрессия

Удобная форма изложения данных - корреляционная таблица (табл.1).

Таблица 1

Корреляционная таблица

Часовая выработка ткани, м	Количество станков, обслуживаемых одной работницей, шт.
Часовая выработка ткани, м	5-7	7-9	9-11	11-13	13-15	15-17	17-19	Итого
10 - 15	7	4		2	1			14
15 - 20	3	8	5	4				20
20 - 25		2	11	8		2		23
25 - 30			5	13	7	1		26
30 - 35				1	16	3		20
35 - 40				2	6	19	3	30
40 - 45					3	7	18	28
Итого:	10	14	21	30	33	32	21	161

Таблица показывает, что частоты концентрируются у диагонали, идущей из левого верхнего угла в правый нижний. Это указывает на то, что связь между количеством обслуживаемых работницей станков и ее часовой выработкой ткани прямая (с увеличением числа обслуживаемых станков увеличивается выработка) или близкая к прямой (концентрация частот идет почти по прямой линии).

По данным таблицы можно рассчитать среднюю выработку по каждой из семи групп работниц, выделенных по числу обслуживаемых станков. Обозначив эти средние значения через и произведя расчеты, получаем: = 14,0; = 16,79; = 22,51; = 24,67; = 32,65; = 36,88; = 41,79.

Данные таблицы и результаты расчетов можно изобразить графически с помощью поля корреляции. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи. Ломаная линия на графике (линия значений ) называется эмпирической линией регрессии.

По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции:

r =

а при криволинейной зависимости с помощью корреляционного отношения:

h =

Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.

Для оценки тесноты связи с помощью корреляционного отношения можно воспользоваться шкалой Чеддока:

от 0.1 до 0.3 – слабая связь;

0.3 – 0.5 – умеренная;

0.5 – 0.7 – заметная;

0.7 – 0.9 – тесная;

0.9 – 0.99 – весьма тесная.

Традиционные методы корреляционно-регрессионного анализа позволяют не только оценить тесноту связи, но и выразить эту связь аналитически. Применению корреляционно-регрессионного анализа должен предшествовать качественный, теоретический анализ исследуемого социально-экономического явления или процесса.

Связь между двумя факторами аналитически выражается уравнениями:

прямой = a₀ + a₁x;

гиперболы = a₀ + ;

параболы = a₀ + a₁x + a₂x² (или другой ее степени);

степенной функции .

Параметр a₀ показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов. Параметр a₁ - коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. На основе этого параметра вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%:

Э = a₁∙

Для определения параметров уравнений используется метод наименьших квадратов, на основании которого строится соответствующая система уравнений.

Расчет коэффициентов регрессии несколько осложняется, если ряды по исследуемым факторам сгруппированы, а связь криволинейная.

Если зависимость между двумя факторами выражается уравнением гиперболы

= a₀ + ,

то система уравнений для определения параметров a₀ и a₁ такова:

na₀ + a₁∑

= ∑y;

a₀∑

+ a₁∑ = ∑y.

Для определения параметров уравнения регрессии, выраженного степенной функцией , приводят функцию к линейному виду: lg= lga₀ + a₁lgx, отсюда система уравнений для определения параметров запишется:

n∙lga₀ + a₁∑lgx = ∑lgy;

lga₀∑lgx + a₁∑(lgx)² = ∑lgy∙lgx.

Зависимость между тремя и более факторами называется множественной или многофакторной корреляционной зависимостью. Линейная связь между тремя факторами выражается уравнением:

= a₀ + a₁x + a₂z,

а система нормальных уравнений для определения неизвестных параметров a₀, a₁, a₂ будет следующей:

na₀ + a₁∑x + a₂∑z = ∑y;

a₀∑x + a₁∑x² + a₂∑zx = ∑yx;

a₀∑z + a₁∑xz + a₂∑z² = ∑yz.

Теснота связи между тремя факторами измеряется с помощью множественного (совокупного) коэффициента корреляции:

R =

где r_ij - парные коэффициенты корреляции между соответствующими факторами.

Для более углубленного анализа вычисляются частные коэффициенты корреляции

1.3 Оценка значимости параметров взаимосвязи

Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.

Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции:

В первом приближении нужно, чтобы . Значимость r_xy проверяется его сопоставлением с , при этом получают

где t_расч – так называемое расчетное значение t-критерия.

Если t_расч больше теоретического (табличного) значения критерия Стьюдента (t_табл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что r_xy значимо.

Подобным же образом на основе соответствующих формул рассчитывают стандартные ошибки параметров уравнения регрессии, а затем и t-критерии для каждого параметра. Важно опять-таки проверить, чтобы соблюдалось условие t_расч > t_табл. В противном случае доверять полученной оценке параметра нет оснований.

Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение:

где n – число наблюдений;
m – число параметров уравнения регрессии.

F_расч также должно быть больше F_теор при v₁= (m-1) и v₂ = (n-m) степенях свободы. В противном случае следует пересмотреть форму уравнения, перечень переменных и т.д.

1.4 Непараметрические методы оценки связи

Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов.

Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.

Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности.

Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.

Занятия родителей	Число детей, занятых в				Всего
Занятия родителей	Промышлен- ности и стро- ительстве	сельском хозяйстве	сфере обслужи- вания	сфере интел- лектуального труда	Всего
1. Промышленность и строительство 2. Сельское хозяйство 3. Сфера обслуживания 4. Сфера интеллектульного труда	40 34 16 24	5 29 6 5	7 13 15 9	39 12 19 72	91 88 56 110
Всего	114	45	44	142	345

Информация о работе Статистические методы изучения взаимосвязей экономических явлений