Автор: Пользователь скрыл имя, 04 Декабря 2011 в 11:43, реферат
Каково бы ни было определение математической вероятности (классическое, комбинаторное, статистическое или субъективное), это понятие призвано отражать некоторые объективные свойства изучаемых явлений, и каждое определение отражает свою сторону общего объективного свойства. Само утверждение о наличии вероятности требует обоснования или проверки для каждого отдельного случая практики, и никогда предельное и теоретическое понятие математической вероятности не совпадает прямо с чисто житейским (обусловленным речевой практикой) пониманием ее как степени субъективной уверенности в чем-то.
Е 4 5 0,2 -1,3 -0,26 0,04 1,69
Ж 5 8 1,2 1,7 2,04 1,44 2,89
З 2 7 -1,8 0,7 -1,26 3,24 0,49
И 3 5 -0,8 -1,3 1,04 0,64 1,69
К
5
6
1,2 -0,3
-0,36 1,44
0,09
38
63
-
- 4,6
9,6 24,1
Хар = 38/10 = 3,8 Уар = 63/10 = 6,3.
Р = ХY / Х2 Y2 = 4,6 / 9,6*24,1 = 4,4 / 231,36 = 0,3.
По данным табл. IV приложения, р0,05(10) = 0,632, поэтому корреляция между двумя показателями эффективности памяти данной группы испытуемых не является статистически значимой.
Выявлению корреляционной зависимости способствуют и определенные табличные и графические методы. Последние могут оказаться полезными не только сами по себе, но и как приемы, предваряющие непосредственное вычисление коэффициента корреляции, как выявление общего направления рассматриваемой связи двух признаков.
10-3. Групповая таблица (или корреляционная решетка) - результат совместной группировки двух варьирующих рядов, которые исследуются на корреляцию. В клетках таблицы проставляется число вариант с данными параметрами.
Для примеров №6 и 7 (по данным предшествующей табл. 14) групповая таблица имеет следующий вид:
Таблица 15
xi
yi
2
3
4
5
Хар
4
5
6
7
1
8
9
Yар
7
4,7
7,3
6,7
Как видно из табл. 15, рассматриваемые показатели не обнаруживают какой-либо системы в расположении; стало быть, мы не вправе предполагать корреляции между ними.
Полезным дополнением корреляционной решетки является вычисление средних арифметических значений одного из варьирующих признаков при неизменности другого (и наоборот).
В табл. 15 такие средние значения представлены в нижней строке и в крайнем правом столбце. Столбец величин Хар представляет собой средние арифметические значения признака xi, соответствующие каждому значению yi: 4, 5, 6 и т.д. Строка величин Yар в табл. 15 - это средние величины признака yi в их соответствии значениям xi.
Корреляционное поле - совокупность точек на плоскости, у которой оси абсцисс и ординат есть значения двух сопоставляемых статистических признаков.
Скажем,
для предшествующих примеров № 6 и 7
по данным табл. 15 на рис. 22 построено
корреляционное поле, где по оси
абсцисс отложены величины - объем
запоминания после первого
yi
9
8
7
6
5
4
3
2
1
Рис.
22. Корреляционное поле для примеров
№ 5 и № 6.1 - линия регрессии yi
в зависимости от условного аргумента
xi , 2 - линия регрессии xi
в зависимости от условного аргумента
yi.
Линия 1 на рис. 22 построена по данным строки уар табл. 15, линия 2 - по данным столбца Хар этой же таблицы. Эти линии называют линиями регрессии - линиями, отображающими зависимости каждого статистического признака от средней величины другого статистического признака.
Сама по себе форма расположения точек на корреляционном поле и контур соответствующих линий регрессии выступают наглядными показателями тесноты связи, существующей между двумя сопоставляемыми признаками.
Ведь если бы увеличение xi всегда влекло за собой увеличение yi , то точки поля располагались бы по линии 1 на рис. 23, для которой коэффициент корреляции р = 1.
Линия 2 на рис. 23 соответствует обратно пропорциональной связи между признаками xi и yi когда величина р = -1.
Факт отсутствия корреляции (р = 0) соответствует на корреляционном поле линиями 3 и 4 (рис. 23). Мы видим, что линии регрессии 1 и 2 на рис. 22 стремятся именно к контурам линий 3 и 4 на рис. 23, и уже одно это свидетельствует об отсутствии “тесной” связи (до вычисления коэффициента р).
уi
10
9
8
7
6
5
4
3
2
1
1 2 3 4 5 6 7 8 9 10 xi
Рис.
23. Линии регрессии в случаях
крайних значений коэффициента линейной
корреляции двух признаков (х и у): 1- коэффициент
корреляции р = 1, 2 - коэффициент корреляции
р = -1, 3, 4 - коэффициент корреляции р = 0
При сопоставлении двух переменных величин часто предполагают, что одна из них является аргументом (изменяется независимо), другая - функцией (меняется в зависимости от аргумента). Например, уменьшение времени выполнения какого-либо задания при выработке навыка может рассматриваться как функция от числа проб (упражнений). В таком случае варьирующие значения функции целесообразно представить в виде некоторого аналитического выражения (уравнения регрессии), т.е. выравнять статистические вариации функции, дав им в соответствии значение аргумента.
Чаще всего между аргументом х и функцией у предполагается линейная связь, т.е. у = ах + в, где а и в есть соответствующие коэффициенты. Выравнивающая линия, отвечающая такому уравнению, строиться обычно по методу наименьших квадратов. Это изначает, что сумма квадратов расстояний всех исходных (выравниваемых) точек до линии у = ах + в является наименьшей.
Для случая равноотстоящих значений xi величины коэффициентов а и в в управлении регрессии вычисляются по следующим формулам:
a = yi*xi / xi2 , b = yi / N.
При этом исходному xi по новой условной шкале с началом отсчета в середине ряда xi, и необходимые арифметические выкладки (связанные с построением системы нормальных уравнений) значительно упрощаются.
Пример № 8. В эксперименте по выработке двигательного навыка (работа № 14 в гл. II) средние арифметические значения времени для 30 испытуемых составили по отдельным пробам (гл. II, рис. 12, кривая 2):
№ пробы xi 1 2 3 4 5 6 7
Время
в сек
yi 16,0
14,5 13,5 12,5 12,5
12,0 11,0
Вычисление параметров выравнивающей прямой ведется в особой таблице.
Таблица 16
xi | xi | yi | xi | yi xi |
1 | -3 | 16,0 | 9 | -48,0 |
2 | -2 | 14,5 | 4 | -29,0 |
3 | -1 | 13,5 | 1 | 13,5 |
4 | 0 | 12,5 | 0 | 0 |
5 | 1 | 12,5 | 1 | 12,5 |
6 | 2 | 12,0 | 4 | 24,0 |
7 | 3 | 11,0 | 9 | 33,0 |
- | 92,0 | 28 | -21,0 |
N = 7;
xi = xi - 4;
a = -21/28 = 0,75;
b = 92 / 7 = 13,1
y = 13,1 - 0,75x` = 13,1 - 0,75 (x-44) = 13,1 - 0,75x + 3;
y = 16,1 - 0,75x
Так что в результате получено уравнение, по которому можно вычислить некоторое выравненное (линейно) значение времени yi для каждого номера пробы от 1 до 7 включительно. Величина а (коэффициент регрессии) выступает показателем “крутости” изменений функции (угол наклона выравнивающей прямой к оси абсцисс).
При выравнивании рядов может предполагаться и квадратичная зависимость между х и у, и вообще любая степенная. В этом случае выравнивание сводится к построению полинома некоторой n-й степени. Однако проведению таких вычислений следует предварять некоторый качественный анализ, т.е. предполагаемое объяснение степенной связи признаков и возможностей ее практического использования.
Наконец, выравнивание как устранение случайных вариаций признака (а не как получение уравнения регрессии) может быть проведено способом скользящей средней. При этом выравниваемая кривая разбивается на отдельные отрезки, в которых осуществляется линейное выравнивание. Причем эти отрезки перекрывают друг друга.
Пример № 8. Применяем способ скользящей средней, взяв за отрезок три каждых смежных значения yi так что
у2 = у1 +у2 +у3 / 3 = 16,0 + 14,5 + 13,5 / 3 = 14,7;
у3 = у2 + у3 + у4 / 3 = 14,5 + 13,5 + 12,5 / 3 = 13,5 и т.д.
xi 1 2 3 4 5 6 7
yi 16,0 14,5 13,5 12,5 12,5 12,0 11,0
yi 15,95 14,7 13,5 12,8 12,3 11,8 11,05
Крайние
средние значения у1 и у7
находятся при выравнивании этим способом
по пути линейной экстраполяции, т.е. путем
вычисления двух линий регрессии: для
xi = 1, 2, 3 и xi = 5, 6, 7 по исходным
величинам yi. Последнее осуществляется
так, как показано выше, в табл. 16.