Статистическое изучение взаимосвязей:корреляционный анализ

Автор: Пользователь скрыл имя, 13 Декабря 2011 в 17:59, курсовая работа

Описание работы

В основе первого этапа статистического изучения связи лежит качественный анализ изучаемого явления, связанный с анализом природы социального или экономического явления методами экономической теории, социологии, конкретной экономики. Второй этап – построение модели связи. Он базируется на методах статистики: группировках, средних величинах, таблицах и т. д. Третий, последний этап – интерпретация результатов – вновь связан с качественными особенностями изучаемого явления.

Содержание

Глава 1. Статистическое изучение взаимосвязей: корреляционный анализ.
1.1) Измерение взаимосвязей между социально-экономическими явлениями……………………………………………………………………...
1.2) Статистические методы изучения связей………………………
1.3) Выбор формы связи………………………………………………
1.4) Основные понятия корреляционно-регрессионного анализа….
Глава 2. Расчетная часть………………………………………………….

Работа содержит 1 файл

Курсовая по статистике.docx

— 37.77 Кб (Скачать)

                                 
 

                            
 
 
 
 

                          1.3 Выбор формы связи

     Определяющая  роль в выборе формы связи между  явлениями принадлежит теоретическому анализу. Так, например, чем больше размер основного капитала предприятия (факторный  признак), тем больше при прочих равных условиях оно выпускает продукции (результативный признак).

     С ростом факторного признака здесь, как  правило, равномерно растет и результативный, поэтому зависимость между ними может быть выражена уравнением прямой Y=a+b*x, которое называется линейным уравнением регрессии.

     Параметр b называется коэффициентом регрессии  и показывает, насколько в среднем  отклоняется величина результативного  признака у, при отклонении величины факторного признаках на одну единицу. При x = 0 a = Y. Увеличение количества внесенных удобрений приводит, при прочих равных условиях, к росту урожайности, но чрезмерное внесение их без изменения других элементов к дальнейшему повышению урожайности не приводит, а, наоборот, снижает ее.

     Такая зависимость может быть выражена уравнением параболы  

     Параметр c характеризует степень ускорения или замедления кривизны параболы, и при c>0 парабола имеет минимум, а при c<0 - максимум. Параметр b, характеризует угол наклона кривой, а параметр a - начало кривой.

     Однако  с помощью теоретического анализа  не всегда удается установить форму  связи. В таких случаях приходится только предполагать о наличии определенной формы связи. Проверить эти предположения  можно при помощи графического анализа, который используется для выбора формы связи между явлениями, хотя графический метод изучения связи применяется и самостоятельно.

     Применение  методов корреляционного анализа  дает возможность выражать связь  между признаками аналитически - в  виде уравнения - и придавать ей количественное выражение. Чтобы измерить тесноту  прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается r.

     Коэффициент корреляции r применяется только в  тех случаях, когда между явлениями  существует прямолинейная связь. Если же связь криволинейная, то пользуются индексом корреляции, который рассчитывается по формуле:

     Коэффициент корреляции является мерой тесноты  связи только для линейной формы  связи, а индекс корреляции - и для  линейной, и для криволинейной. При прямолинейной связи коэффициент корреляции по своей абсолютной величине равен индексу корреляции:

     |r|=R.

     Если  индекс корреляции возвести в квадрат, то получим коэффициент детерминации. Коэффициент детерминации является наиболее конкретным показателем, так  как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного  в основание группировки.

     Индекс  корреляции принимает значения в  интервале от -1 до + 1. Принято считать, что если |r| < 0,30, то связь слабая; при |r| = (0,3-0,7) - средняя; при |r| > 0,70 - сильная, или тесная. Когда |r| = 1 - связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии связи между У и X. 
 
 
 
 
 
 
 
 
 
 

         1.4. Основные понятия корреляционно-регрессионного анализа.

     Понятие корреляции появилось в середине XIX века в работах английских статистиков  Ф. Гальтона и К. Пирсона. Этот термин произошел от латинского "correlatio" - соотношение, взаимосвязь. Понятие регрессии (латинское "regressio" - движение назад) также введено Ф. Гальтоном, который, изучая связь между ростом родителей и их детей, обнаружил явление "регрессии к среднему" - рост детей очень высоких родителей имел тенденцию быть ближе к средней величине.

     Теория  и методы корреляционного анализа  используются для выявления связи  между случайными переменными и  оценки ее тесноты.

     Основная  задача корреляционного анализа - ответить на вопрос - существует ли между признаками зависимость. В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления (прямая или обратная связь), а также  характеристике силы (слабая, средняя  или тесная связь) и формы влияния  одних факторов на другие.

     Задачи  собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

     По  существу, и корреляционная таблица, и корреляционное поле, и эмпирическая линия регрессии предварительно уже характеризуют взаимосвязь, когда выбраны факторный и  результативный признаки и требуется  сформулировать предположения о  форме и направленности связи. В  то же время количественная оценка тесноты связи требует дополнительных расчетов.

     При исследовании корреляционных зависимостей между признаками решению подлежит широкий круг вопросов, к которым  следует отнести:

     · предварительный анализ свойств  моделируемой совокупности единиц;

     · установление факта наличия связи, определение ее направления и  формы;

     · измерение степени тесноты связи  между признаками;

     · построение регрессионной модели, т.е. нахождение аналитического выражения  связи;

     · оценка адекватности модели, ее экономическая  интерпретация и практическое использование.

     Для того чтобы результаты корреляционного  анализа нашли практическое применение и дали желаемый результат, должны выполняться  определенные требования в отношении  отбора объекта исследования и признаков-факторов. Одним из важнейших условий правильного  применения методов корреляционного  анализа является требование однородности тех единиц, которые подвергаются изучению методами корреляционного  анализа. Например, при корреляционном анализе зависимостей тех или  иных технико-экономических показателей  работы предприятий от определенных факторов должны быть отобраны предприятия, выпускающие однотипную продукцию, имеющие одинаковый характер технологического процесса и тип используемого  оборудования, для предприятий добывающей промышленности определенную роль играет и географическое размещение предприятий.

     При выполнении указанных общих требований далее необходима количественная оценка однородности исследуемой совокупности по комплексу признаков. Одним из возможных вариантов такой оценки является расчет относительных показателей  вариации. Традиционно широкое распространение  для этих целей получил коэффициент  вариации (усли коэффициент вариации менее 33%, то исследуемую совокупность можно считать однородной и пригодной для исследования). Если совокупность неоднородна, то следует откинуть аномальные значения, то есть значения с максимальными и минимальными значениями признака.

     Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

     Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.

     Следует заметить, что традиционные методы корреляции и регрессии широко представлены в разного рода статистических пакетах программ для ЭВМ. Исследователю остается только правильно подготовить информацию, выбрать удовлетворяющий требованиям анализа пакет программ и быть готовым к интерпретации полученных результатов. Алгоритмов вычисления параметров связи существует множество, и в настоящее время вряд ли целесообразно проводить такой сложный вид анализа вручную. Вычислительные процедуры представляют самостоятельный интерес, но знание принципов изучения взаимосвязей, возможностей и ограничений тех или иных методов интерпретации результатов является обязательным условием исследования.

     Другим  важным требованием, обеспечивающим надежность выводов корреляционного анализа, является требование достаточного числа  наблюдений. Как уже указывалось, влияние существенных причин может  быть затушевано действием случайных  факторов, "взаимопогашение" влияния которых на результативный показатель в известной мере происходит при выведении средней результативного показателя для массы случаев.

     Определенные  требования существуют и в отношении  факторов, вводимых в исследование. Все множество факторов, оказывающих  влияние на величину результативного  показателя, к действительности не может быть введено в рассмотрение, да практически в этом и нет  необходимости, так как их роль и  значение в формировании величины результативного  показателя могут иметь существенные различия. Поэтому при ограничении  числа факторов, включаемых в изучение, наряду с качественным анализом целесообразно  использовать и определенные количественные оценки, позволяющие конкретно охарактеризовать влияние факторов на результативный показатель (к оценкам можно отнести  парные коэффициенты корреляции, ранговые коэффициенты при экспертной оценке влияния факторов и др.). Включаемые в исследование факторы должны быть независимыми друг от друга, так как  наличие тесной связи между ними свидетельствует о том, что они  характеризуют одни и те же стороны  изучаемого явления и в значительной мере дублируют друг друга.

     В общем случае две величины могут  быть связаны функциональной зависимостью, либо зависимостью другого рода, называемой статистической, либо быть независимыми.

     Статистической  называется зависимость, при которой  изменение одной из величин влечет изменение распределения другой.

     Статистическая  зависимость, при которой изменение  одной из величин влечет изменение  среднего значения другой, называется корреляционной.

     Корреляционные  зависимости занимают промежуточное  положение между функциональной зависимостью и полной независимостью переменных.

     Между величинами, характеризующими экономические  явления, в большинстве случаев  существуют зависимости, отличные от функциональных. Действительно, в экономике закономерности не проявляются также точно и неизменно, как, например, в физике, химии или астрономии.

     Пусть, например, мы рассматриваем зависимость  величины Y от величины x – y(x).

     Невозможность выявления строгой связи между  двумя переменными объясняется  тем, что значение зависимой переменной Y определяется не только значением  переменной x, но и другими (неконтролируемыми  или неучтенными) факторами, а также  тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.

     Вследствие  этого корреляционный анализ широко используется при установлении взаимосвязи  экономических показателей.

     Итак, если с увеличением x значение зависимой  переменной Y в среднем увеличивается, то такая зависимость называется прямой или положительной.

     Если  среднее значение Y при увеличении x уменьшается, имеет место отрицательная  или обратная корреляция.

     Если  с изменением x значения Y в среднем  не изменяются, то говорят, что корреляция – нулевая.

     Часто при исследовании взаимосвязи между  какими-либо показателями, представляют изучаемый объект в виде так называемого "черного (кибернетического) ящика".

     Самый простой случай – изучение связи  между одной переменной x, которую  называют фактором (входной переменной, независимой переменной), и переменной Y, которую называют откликом (реакцией, зависимой переменной). 
 

Информация о работе Статистическое изучение взаимосвязей:корреляционный анализ