Автор: Пользователь скрыл имя, 17 Марта 2011 в 22:10, курсовая работа
Предметом исследования статистики являются массовые явления социально-экономической жизни; она изучает количественную сторону этих явлений в неразрывной связи с их качественным содержанием в конкретных условиях места и времени.
Введение
1. Теоретическая часть………………………………………………………….5
1.Основные понятия корреляционного и регриссионного анализа……….7
2.Парная корреляция и парная линейная регрессия……………………...10
3.Оценка значимости параметров взаимосвязи…………………………...15
4.Непараметрические методы оценки связи………………………………17
5.Дисперсионный анализ связи…………………………………………….20
2. Расчетная часть……………………………………………………………...21
3. Аналтическая часть…………………………………………………………29
Заключение……………………………………………………………………...33
Литература………………………………………………………………………35
Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.
Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.
Методы оценки тесноты связи подразделяются на корреляционные (параметрические) и непараметрические. Параметрические методы основаны на использовании, как правило, оценок нормального распределения и применяются в случаях, когда изучаемая совокупность состоит из величин, которые подчиняются закону нормального распределения. На практике это положение чаще всего принимается априори. Собственно, эти методы – параметрические – и принято называть корреляционными.
Непараметрические
методы не накладывают ограничений
на закон распределения изучаемых
величин. Их преимуществом является
и простота вычислений.
1.2. Парная корреляция и парная линейная регрессия
Удобная форма изложения данных - корреляционная таблица (табл.1).
Таблица 1
Корреляционная таблица
Часовая выработка ткани, м | Количество
станков, обслуживаемых одной | |||||||
5-7 | 7-9 | 9-11 | 11-13 | 13-15 | 15-17 | 17-19 | Итого | |
10 - 15 | 7 | 4 | 2 | 1 | 14 | |||
15 - 20 | 3 | 8 | 5 | 4 | 20 | |||
20 - 25 | 2 | 11 | 8 | 2 | 23 | |||
25 - 30 | 5 | 13 | 7 | 1 | 26 | |||
30 - 35 | 1 | 16 | 3 | 20 | ||||
35 - 40 | 2 | 6 | 19 | 3 | 30 | |||
40 - 45 | 3 | 7 | 18 | 28 | ||||
Итого: | 10 | 14 | 21 | 30 | 33 | 32 | 21 | 161 |
Таблица показывает, что частоты концентрируются у диагонали, идущей из левого верхнего угла в правый нижний. Это указывает на то, что связь между количеством обслуживаемых работницей станков и ее часовой выработкой ткани прямая (с увеличением числа обслуживаемых станков увеличивается выработка) или близкая к прямой (концентрация частот идет почти по прямой линии).
По данным таблицы можно рассчитать среднюю выработку по каждой из семи групп работниц, выделенных по числу обслуживаемых станков. Обозначив эти средние значения через и произведя расчеты, получаем: = 14,0; = 16,79; = 22,51; = 24,67; = 32,65; = 36,88; = 41,79.
Данные таблицы и результаты расчетов можно изобразить графически с помощью поля корреляции. Оно представляет собой график, где на оси абсцисс откладывают значения Х, по оси ординат – У, а точками показывается сочетание Х и У. По расположению точек, их концентрации в определенном направлении можно судить о наличии связи. Ломаная линия на графике (линия значений ) называется эмпирической линией регрессии.
По существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и результативный признаки и требуется сформулировать предположения о форме и направленности связи. В то же время количественная оценка тесноты связи требует дополнительных расчетов.
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции:
r
=
а
при криволинейной зависимости
с помощью корреляционного
h =
Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3÷0,7) – средняя; при |r| > 0,70 – сильная, или тесная. Когда |r| = 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между У и X. Однако в этом случае возможно нелинейное взаимодействие. что требует дополнительной проверки и других измерителей, рассматриваемых ниже.
Для
оценки тесноты связи с помощью
корреляционного отношения
от 0.1 до 0.3 – слабая связь;
0.3 – 0.5 – умеренная;
0.5 – 0.7 – заметная;
0.7 – 0.9 – тесная;
0.9 – 0.99 – весьма тесная.
Традиционные методы корреляционно-регрессионного анализа позволяют не только оценить тесноту связи, но и выразить эту связь аналитически. Применению корреляционно-регрессионного анализа должен предшествовать качественный, теоретический анализ исследуемого социально-экономического явления или процесса.
Связь
между двумя факторами
прямой = a0 + a1x;
гиперболы = a0 + ;
параболы = a0 + a1x + a2x2 (или другой ее степени);
степенной функции .
Параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов. Параметр a1 - коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу. На основе этого параметра вычисляются коэффициенты эластичности, которые показывают изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%:
Э
= a1∙
Для определения параметров уравнений используется метод наименьших квадратов, на основании которого строится соответствующая система уравнений.
Расчет коэффициентов регрессии несколько осложняется, если ряды по исследуемым факторам сгруппированы, а связь криволинейная.
Если
зависимость между двумя
то
система уравнений для
na0
+ a1∑
a0∑
Для определения параметров уравнения регрессии, выраженного степенной функцией , приводят функцию к линейному виду: lg = lga0 + a1lgx, отсюда система уравнений для определения параметров запишется:
n∙lga0 + a1∑lgx = ∑lgy;
lga0∑lgx + a1∑(lgx)2 = ∑lgy∙lgx.
Зависимость между тремя и более факторами называется множественной или многофакторной корреляционной зависимостью. Линейная связь между тремя факторами выражается уравнением:
а
система нормальных уравнений для
определения неизвестных
na0 + a1∑x + a2∑z = ∑y;
a0∑x + a1∑x2 + a2∑zx = ∑yx;
a0∑z + a1∑xz + a2∑z2 = ∑yz.
Теснота связи между тремя факторами измеряется с помощью множественного (совокупного) коэффициента корреляции:
R
=
где rij - парные коэффициенты корреляции между соответствующими факторами.
Для более углубленного
1.3 Оценка значимости параметров взаимосвязи
Получив оценки корреляции и регрессии, необходимо проверить их на соответствие истинным параметрам взаимосвязи.
Существующие программы для ЭВМ включают, как правило, несколько наиболее распространенных критериев. Для оценки значимости коэффициента парной корреляции рассчитывают стандартную ошибку коэффициента корреляции:
В первом приближении нужно, чтобы . Значимость rxy проверяется его сопоставлением с , при этом получают
где tрасч – так называемое расчетное значение t-критерия.
Если tрасч больше теоретического (табличного) значения критерия Стьюдента (tтабл) для заданного уровня вероятности и (n-2) степеней свободы, то можно утверждать, что rxy значимо.
Подобным же образом на основе соответствующих формул рассчитывают стандартные ошибки параметров уравнения регрессии, а затем и t-критерии для каждого параметра. Важно опять-таки проверить, чтобы соблюдалось условие tрасч > tтабл. В противном случае доверять полученной оценке параметра нет оснований.
Вывод о правильности выбора вида взаимосвязи и характеристику значимости всего уравнения регрессии получают с помощью F-критерия, вычисляя его расчетное значение:
где
n – число наблюдений;
m – число параметров уравнения регрессии.
Fрасч
также должно быть больше Fтеор при
v1 = (m-1) и v2 = (n-m) степенях свободы.
В противном случае следует пересмотреть
форму уравнения, перечень переменных
и т.д.
1.4 Непараметрические методы оценки связи
Методы
корреляционного и
Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.
Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности.
Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.
|
Информация о работе Статистические методы изучения взаимосвязей экономических явлений