Сущность коэффициента корреляции. Корреляционный анализ

Автор: Пользователь скрыл имя, 01 Апреля 2013 в 20:17, контрольная работа

Описание работы

Статистические методы применяются при обработке материалов психологических исследований для того, чтобы извлечь из тех количественных данных, которые получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации. Одним самых из распространенных методов статистики является корреляционный анализ.

Содержание

Введение
Сущность коэффициента корреляции
Корреляционный анализ
Заключение
Список литературы

Работа содержит 1 файл

контрольная работа.docx

— 108.50 Кб (Скачать)

Российский государственный  социальный университет

 

                 Филиал в г. Чебоксары

 

 

 

 

 

 

 

 

 

 

Факультет психологии

 

 

 

 

 

 

 

Контрольная работа

 

По математическим  методам

 

 

Тема: « Сущность коэффициента корреляции. Корреляционный анализ»

 

 

 

 

 

 

 

 

 

 

 

 

                                            Выполнила: студентка

                                                                                           2 курса заочного отделения

                                                                                          

                                                                                           специальности «психолог»

                                                                                          

                                                                                           Проверил:

 

 

                                               

 

                                                        2010 г.

 

План


 

 

  1. Введение
  2. Сущность коэффициента корреляции
  3. Корреляционный анализ
  4. Заключение
  5. Список литературы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение


Статистические методы применяются  при обработке материалов психологических  исследований для того, чтобы извлечь  из тех количественных данных, которые  получены в экспериментах, при опросе и наблюдениях, возможно больше полезной информации. Одним самых из распространенных методов статистики является корреляционный анализ.

 

Термин "корреляция" впервые  применил французский палеонтолог  Ж. Кювье, который вывел "закон  корреляции частей и органов животных" (этот закон позволяет восстанавливать  по найденным частям тела облик всего  животного). В статистику указанный  термин ввел английский биолог и статистик  Ф. Гальтон (не просто связь – relation, а "как бы связь " – corelation).

 

Корреляционный анализ – это  проверка гипотез о связях между  переменными с использованием коэффициентов  корреляции. Коэффициент корреляции – двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных. Таким  образом, корреляционный анализ это  совокупность методов обнаружения  корреляционной зависимости между  случайными величинами или признаками. Корреляционный анализ для двух случайных  величин заключает в себе:

 

1.     построение корреляционного  поля и составление корреляционной  таблицы; 

 

2.     вычисление выборочных  коэффициентов корреляции и корреляционных  отношений; 

 

3.     проверка статистической  гипотезы значимости связи.

 

Основное назначение корреляционного  анализа – выявление корреляционной связи между двумя или более  изучаемыми переменными. Корреляционная связь это совместное согласованное  изменение двух изучаемых характеристик. Данная изменчивость обладает тремя  основными характеристиками: формой, направлением и силой.

 

 

 

 

 

 

 

 

 

 

 

 

Корреляция. Сущность коэффициента корреляции.


 

(correlation) — такой тип ассоциации  одной переменной с другой,  при котором изменение  одной  величины сопровождается изменением  другой, то есть имеется сопутствующая  вариация.  Корреляция  бывает  положительной или отрицательной.  Первая описывает ситуацию, в  которой при увеличении одной  переменной увеличивается и другая, а вторая — в которой переменные  изменяются обратно пропорционально:  одна увеличивается, а другая  уменьшается. Корреляция может  измеряться статистически, коэффициентом  корреляции или коэффициентом  ассоциации, подобных форм существует  множество. Большинство из них  сосредоточено на линейной связи  (изменение одной переменной прямо  пропорционально изменению другой). В виде графика идеальная связь  означает прямую линию, соединяющую  все точки. Коэффициенты корреляции  изобретены по существу как  меры отклонения от этой линии.  Криволинейная корреляция  означает  нелинейное изменение переменных  — темпы изменения одной быстрее,  чем у другой. При отсутствии  ассоциации говорят, что переменные  имеют статистическую независимость.  Методика  корреляционного анализа  используется главным образом  для данных интервального уровня (см. Критерии и уровни измерения), но тесты  существуют и для  других уровней (см. Коэффициент  ранговой корреляции Спирмена). Нахождение  корреляции не подразумевает  причинность. Между переменными  иногда обнаруживаются фальшивые  связи, поэтому нужны другие  доказательства для обоснования  вывода о влиянии одной переменной  на другую. Нужно также помнить,  что кажущаяся ассоциация  способна  вызываться третьим фактором, систематически  воздействующим на обе переменные. Если задействованы три или  более переменных, применяются методы  многомерного анализа. См. также  Регрессия; Причинное моделирование;  Линейный анализ.

Коэффициент корреляции — это мера взаимосвязи измеренных явлений.

Коэффициент корреляции (обозначается «r») рассчитывается по специальной  формуле и изменяется от -1 до +1. Показатели близкие к +1 говорят о том, что  при увеличении значения одной переменной увеличивается значение другой переменной. Показатели близкие к -1 свидетельствуют  об обратной связи, т.е. При увеличении значений одной переменной, значения другой уменьшаются.

 

 

Пример. На большой выборке был  проведён тест FPI. Проанализируем взаимосвязи  шкал Общительность, Застенчивость, Депрессивность.

Начнем с Застенчивости и  Депрессивности. Для наглядности, задаём систему координат, на которой по X будет застенчивость, а по Y —  депрессивность. Таким образом, каждый человек из выборки исследования может быть изображен точкой на этой системе координат. В результате расчетов, коэффициент корреляции между  ними r=0,6992.

 

Как видим, точки (испытуемые) расположены  не хаотично, а выстраиваются вокруг одной линии, причём, глядя на эту  линию можно сказать, что чем  выше у человека выражена застенчивость, тем больше депрессивность, т. е. эти  явления взаимосвязаны.

Построим аналогичный график для  Застенчивости и Общительности.

Мы видим, что с увеличением  застенчивости общительность уменьшается. Их коэффициент корреляции -0,43.

Таким образом, коэффициент корреляции больший от 0 до 1 говорит о прямопропорциональной  связи (чем больше… тем больше…), а коэффициент от -1 до 0 о обратнопропорциональной (чем больше… тем меньше…)

Если бы точки были расположены  хаотично, коэффициент корреляции приближался  бы к 0.

 Коэффициент корреляции отражает  степень приближенности точек  на графике к прямой.

Приведём примеры графиков, отражающих различную степень взаимосвязи (корреляции) переменных исследования.

Сильная положительная корреляция:

 

 

 

 

 

 

 

 

 

Слабая положительная корреляция:

Нулевая корреляция:

В подписи у каждого графика  кроме значения r есть значение p. p –  это вероятность ошибки, о которой  будет рассказано отдельно.

 

 

 

 

Виды взаимосвязи

 

1. Прямая положительная и отрицательная взаимосвязь. Два явления непосредственно совпадают, поэтому взаимосвязаны. Интеллект и успеваемость в школе, общительность и застенчивость — яркие примеры прямой взаимосвязи.

2. Косвеная взаимосвязь. Два явления сильно коррелируют с  третьим, поэтому между собой так же имеют корреляцию. К примеру, стиль общения ребенка взаимосвязан со стилем воспитания в семье за счет третьей переменной — установок личности. Очевидно, что воспитание в семье формирует установки ребенка, в свою очередь установки влияют на поведение.

3. Нулевая корреляция. Предполагает отсутствие закономерной взаимосвязи между переменными.

4. Случайная взаимосвязь. Корреляция может быть случайной! Очень многие процессы происходят одновременно и совпадают. Здесь уместно сказать, что если много-много коррелировать — что нибудь обязательно скоррелируется.

Важно. Взаимосвязь должна интерпретироваться в оба направления. Формально, корреляция не обозначает причинно-следственной связи! Это ВЗАИМОсвязь, ВЗАИМОсовпадение, явлений. Возвращаясь к примеру: застенчивость взаимосвязана с  депрессивностью. Логично подумать, что депрессивный человек более  застенчив, чем не депрессивный, но почему не наоборот? С чего начинать рассуждение? Мы интерпретируем корреляцию в оба направления и не констатируем причинно-следственную связь. Пишем  «кореляция», «взаимосвязь», подразумеваем  – совпадение. Причем сильная корреляция обозначает неслучайное совпадение.

Есть случаи, когда корреляция может  говорить о причинно следственной связи. Это случаи, когда одна из переменых  общективна, а вторая субъективна. К  объективным переменным относятся  возраст, стаж, рост, которые просто не могут зависеть от субъективных переменных: настроения, особенностей личности, мотивации и т.д. Однако, такие объективные переменные, как  вес, количество детей в семье, частота  смены места работы, количество контактов  и т.п. могут и часто зависят  от субъективных психологических показателей.

К примеру, профессионализм рабочего повышается со стажем. Стаж и профессионализм  коррелируют и мы можем быть уверены, что для повышения профессионализма стаж является объективной причиной. Объективные переменные, основанные на времени всегда являются причиной при наличии корреляции с субъективными  характеристиками. В остальных случаях  нужно очень осторожно относиться к причинно-следственным интерпретациям коэффициента корреляции.

Если причинно-следственная связь  обоснована в теоретической части  работы и подтверждается многими  авторами, то корреляцию так же можно  интерпретировать как причинно-следственную связь.

Существуют различные формулы  расчета коэффициента корреляции для  различных типов шкал (см. статью «Понятие переменной и шкалы измерения»). Результатом расчета по любой  формуле будет число от -1 до +1.

 

 

В следующей таблице написаны названия коэффициентов корреляции для различных  типов шкал.

 

Дихотомическая шкала (1/0)

Ранговая (порядковая) шкала

Интервальная и абсолютная шкала

Дихотомическая шкала (1/0)

Коэфициент ассоциации Пирсона, коэффициент  четырехклеточной сопряженности Пирсона.

Рангово-бисериальная корреляция.

Бисериальная корреляция

Ранговая (порядковая) шкала

Рангово-бисериальная корреляция.

Ранговый коэффициент корреляции Спирмена или Кендалла.

Значения интервальной шкалы переводятся  в ранги и используется ранговый коэффициент

Интервальная и абсолютная шкала

Бисериальная корреляция

Значения интервальной шкалы переводятся  в ранги и используется ранговый коэффициент

Коэффициент корреляции Пирсона 

 

(коэффициент линейной корреляции)


 

Основные принципы интерпретации  различных коэффициентов корреляции одинаковы. В случае дихотомической шкалы мы говорим о вероятности  совпадения (прямого или обратного) ответов типа да/нет, в случае рангов о вероятности совпадения порядка, в случае коэффициента линейной корреляции мы говорим о степени совместного  изменения переменных или о их взаимосвязи.

Полученный коэффициент нужно  проверить на значимость, которая  зависит от вероятности ошибки и  количества человек. Коэффициент корреляции может быть формально небольшим, к примеру r=0,17, но  если исследование проведено на 500 человек и вероятность  ошибки (р) менее 0,05, то мы признаём значимым даже такой небольшой коэффициент. С другой стороны, при выборке  в 5 человек очень большой коэффициент  мы признаем незначимым, т.к. из-за малого количества человек мы можем совершить  ошибочный вывод об этой корреляции.

Таким образом, для нас главное  узнать какой должна быть вероятность  ошибки и количество человек, чтобы  признать полученный коэффициент действительно  значимым.

Расчет значения  р (вероятности  ошибки) – сложная процедура, поэтому  компьютерные программы, в которых  можно считать коэффициент корреляции, расчитывают вероятность ошибки самостоятельно. Если же расчет производился вручную или по другим причинам конкретное значение р неизвестно, то используем уже рассчитанные таблицы критических  значений.

Таблицы критических значений предназначены  чтобы можно было найти критическое  значение коэффициента корреляции, т.е. такое, после которого взаимосвязь  можно считать значимой и неслучайной. При этом значение вероятности ошибки задаётся исследователем. В таблицах обычно есть критические значения коэффициентов  корреляции для р≤0,001, р≤0,01, р≤0,05, иногда пишут соответственно 0,1%, 1%, 5%. Таким  образом, пользуясь таблицами мы отвечаем на вопрос: какое критическое  значение коэффициента корреляции при  данном количестве людей и вероятности  ошибки менее или равно 0,1% (1%, 5%)?

Обычно в психологических исследованиях  вероятность ошибки выбирают на уровне p≤0,05, но если в исследовании принимают  участие более 100 человек, то можно  выбирать и р≤0,01. В первой колонке  таблицы критических значений находится  значение  df (Degrees of Freedom — степени  свободы), которое расчитывается  очень просто: df = n-1, где n – количество человек. На пересечении нужного df и  выбранной вероятности ошибок находим  критический коэффициент корреляции. Если рассчитанное значение больше критического — коэффициент значимый, в обратном случае взаимосвязь является случайной.

В примерах, приведённых выше для  количества человек n=89 и p≤0,05 критический  коэффициент корреляции r=0,20. А вот  если бы количество человек было 45 (при  том же p≤0,05) то критическим значением  было бы r=0,29, при количестве человек 10 критическое значение r=0,63.

Информация о работе Сущность коэффициента корреляции. Корреляционный анализ