Автор: Пользователь скрыл имя, 04 Декабря 2011 в 11:43, реферат
Каково бы ни было определение математической вероятности (классическое, комбинаторное, статистическое или субъективное), это понятие призвано отражать некоторые объективные свойства изучаемых явлений, и каждое определение отражает свою сторону общего объективного свойства. Само утверждение о наличии вероятности требует обоснования или проверки для каждого отдельного случая практики, и никогда предельное и теоретическое понятие математической вероятности не совпадает прямо с чисто житейским (обусловленным речевой практикой) пониманием ее как степени субъективной уверенности в чем-то.
В практике статистических измерений наиболее распространены два уровня - пятипроцентный Р0,05 и однопроцентный Р0,01 (см. табл. 12). Принято считать различия достоверными, если уровень значимости меньше одного процента, т.е. если Р<0,01. Если величина вероятности ошибки гипотезы находится между пяти- и однопроцентными уровнями 0,05> Р> 0,01, то факт проверяемого различия сомнителен, другими словами, тождества нет, но и различия еще не доказаны достоверно, нет убеждения в их существенности (значимости). Если же Р > 0,05, то факт отсутствия реальных различий между сопоставляемыми величинами следует считать полностью доказанным статистически.
Это
общее правило проверки результатов
на статистическую значимость неоднократно
иллюстрируется в последующих параграфах
данной главы.
8. ПРОВЕРКА ПРИНАДЛЕЖНОСТИ КРАЙНИХ ЧЛЕНОВ К ДАННОЙ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ
Возможны выборки, в которых даже при беглом рассмотрении вариант выделяются некоторые крайние (много меньшие или много большие всех остальных) варианты, которые сомнительны как значения данной (качественно однородной) выборки. Математическая статистика располагает приемами проверки таких сомнительных крайних членов на их принадлежность к совокупности.
8-1.
Простейшим приемом такой
т = xn - xn-1/ xn - x2 - для проверки последней варианты (с номером n ), если она сомнительна;
т = x2 - x1 / xn-1 - x1 - для проверки первой варианты (с номером 1), где все индексы при х означают порядковый номер варианты в их упорядоченном ряду.
Полученное значение т сравнивается затем со значением табличным (см. табл. I приложения) - тт , высчитанным для однопроцентного уровня значимости. Если эмпирическое значение т > тт, то исследуемая варианта исключается из данной совокупности, т.е. не используется при дальнейшей обработке.
Пример № 3. В эксперименте по измерению (ВР) времени реакции (см. работу № 16 в гл. II) результаты испытуемого (в сек) по одной и той же задаче составили после упорядочения такой ряд: 0,12; 0,13; 0,15; 0,18; 0,20; 0,22; 0,25; 0,28; 0,41; n = 10.
Пpоверим варианту xn = 0,41:
т = 0,41 - 0,28 / 0,41 - 0,13 = 0,464.
Так как тт (табличное) = 0,597, проверяемую варианту нельзя отбросить, т.е. не следует считать данное значение времени реакции случайным.
8-2.
Значительно более строгим (и
трудоемким) приемом проверки
а
Рис.
21. Схематическая иллюстрация
Одной
из распространеннейших задач
Критерий Стьюдента (Госсета) предполагает нормальные распределения в выборках, различия средних значений которых поверяются на статистическую значимость. Этот критерий основан как бы на оценке общих частей двух статистических совокупностей (см. рис. 21), т.е. включает в себя “измерение” и разницы средних значений и мер их разброса.
T = X`ap - X``ap / m`2 - m``2
где m = o / N есть так называемая ошибка средней, происходящая от представления Хар в качестве средней М некоторой генеральной совокупности;
Х`ap и X``ap - средние арифметические, различия между которыми проверяются;
m` - m`` - соответствующие ошибки средних.
Пример вычисления t - критерия. Сопоставим данные примера № 2 (по табл. 10) с данными примера № 4 (вторая проба при выработке двигательного навыка - работа № 14 в гл. II).
N` = 30;
X`ap = 9,1;
o` = 1,83 ;
m`
= 1,83 / 30 = 0,334;
t = 9,1 - 8,5 / 0,3342+0,2822 = 0,6/0,437 = 1,37.
Далее, это значение t = 1,37 следует сравнить с табличным значением (табл. II приложения), вычисленным для соответствующей “степени свободы” f, за которую принимается сумма объемов сравниваемых выборок, уменьшенная на две единицы:
f = N` + N`` -2.
Итак, в нашем случае f = 30+30-2 = 58. По табл. II приложения находим, что значение t для пятипроцентного уровня значимости (даже для f = 60) есть t0,05 = 2,0. Так как 1,37< t0,05, различия между средними значениями примеров № 2 и 4 не являются статистически значимыми, т.е. убыстрение среднего времени выполнения во второй пробе (по сравнению с первой пробой) не является достоверным.
Это не равносильно, конечно, утверждению от статистической однородности двух сопоставляемых выборок. К тому же применение критерия Стьюдента в случае данных скошенных выборок (см. рис. 16) не вполне корректно математически и, бесспорно, сказывается на конечном выводе о недостоверности различий X`ap = 9,1 и X``ap = 8,5. Вообще этот критерий оценивает не степень близости двух средних как таковую, а рассматривает эту близость с точки зрения отнесения или неотнесения ее к случайной (при заданном уровне значимости).
ЛИНИИ РЕГРЕССИИ
В практике экспериментальных исследований нередки случаи, когда предполагается наличие связанных изменений каких-либо двух статистических признаков. Например, представляются взаимозависимыми вариации величины роста и веса тела людей (прямая связь), силы мышц и их подвижности (обратная связь) и т.д. Как указывалось в разд. 1, такого рода связи и закономерности не являются строго однозначными или функциональными; они, так же как и сами вариации признаков, являются статистическими, или корреляционными. Корреляция - это связь между статистическими вариациями (выборками) по различным признакам, между влияниями каких-либо двух факторов, формирующих данное статистическое распределение.
Коэффициент корреляции - это математический показатель силы (тесноты) связи между двумя сопоставляемыми статистическими признаками.
По какой бы формуле ни вычислялся коэффициент корреляции, его величина колеблется в пределах от -1 до +1. Смысл крайних значений коэффициента состоит в следующем:
Всякое вычисленное (эмпирическое) значение коэффициента корреляции должно быть проверено на статистическую значимость (таблицы III или IV приложения).
Если эмпирическое значение меньше или равно является значимой. Если вычисленное значение коэффициента корреляции больше табличного для Р = 0,01, корреляция статистически значима (существенна, реальна). В случае, когда величина коэффициента заключена между двумя табличными, на практике говорят о значимости корреляции для Р = 0,05. Однако строго вероятностная трактовка этого факта несколько иная: мы не можем утверждать отсутствия корреляции, но ее статистически доказанного наличия также еще нет (см. разд. 7).
10-1. Простейшей формой коэффициента корреляции является коэффициент ранговой корреляции r (коэффициент Спирмена), который измеряет связь между рангами (местами) данной варианты по разным признакам, но не между собственными величинами варианты. Здесь исследуется связь качественная, чем строго количественная, хотя ранг сам по себе - это уже и количественный признак.
r = 1- 6d2 / n3 - n,
где n - объем совокупности, длина одного статистического ряда;
d - разность между рангами каждой варианты по двум коррелируемым признакам.
Пример
№ 5. Десять испытуемых (А, Б, В и т.д.)
расположились в порядке
Таблица 13
Испытуемые | Ранг по возрасту | Ранг по пространств. порогу | d | d2 |
А | 1 | 6 | -5 | 25 |
Б | 2 | 5 | -3 | 9 |
В | 3 | 2 | 1 | 1 |
Г | 4 | 1 | 3 | 9 |
Д | 5 | 10 | -5 | 25 |
Е | 6 | 4 | 2 | 4 |
Ж | 7 | 9 | -2 | 4 |
З | 8 | 7 | 1 | 1 |
И | 9 | 8 | 1 | 1 |
К | 10 | 3 | 7 | 49 |
N = 10
r = 1 - 6*18 / 1000 - 10 = 1 - 768/990 = 0,22
r = 0,22.
Так как по данным табл. III (приложение к гл. III) r0,05 = 0,64, и эмпирическое значение r < r0,05, корреляция между местами испытуемых по величине порогов и по возрасту не является статистически значимой.
10-2. Другой очень распространенной формой коэффициента линейной корреляции является следующая:
p = XY / X2 Y2, где Х = xi - Xap, Y = yi - Yap.
Эта формула сопоставляет сами величины признаков и в конечном счете основана на вычислении “совместной дисперсии” o2 xy двух переменных xi и yi и на делении ее на произведение отдельных среднеквадратических отклонений, т.е.
p = o2xy/ox oy.
Пример вычисления Десять испытуемых (А, Б, В, и т.д.) в эксперименте по заучиванию двузначных чисел (работа № 10 в гл. II) дали по первой пробе такие результаты: 3, 4, 4. 5, 3, 4, 5, 2, 3, 5 (пример № 6). Эти же испытуемые при непроизвольном запоминании слов (работа № 8 в гл. II) имели такие показатели: 5, 9, 8, 6, 4, 5, 8, 7, 5, 6 (пример № 7). Посмотрим, коррелируют ли между собой два этих показателя эффективности запоминания.
Вычисления удобнее вести в специальной таблице.
Таблица 14
Испытуемые Работа № 10 Работа № 8 X = xi-Xap Y = yi-yap XY X2 Y2
xi yi
А 3 5 - 0,8 -1,3 1,04 0,64 1,69
Б 4 9 0,2 2,7 0,54 0,04 7,29
В 4 8 0,2 1,7 0,34 0,04 2,89
Г 5 6 1,2 -0,3 -0,36 1,44 0,09
Д 3 4 -0,8 -2,3 1,84 0,64 5,29