Автор: Пользователь скрыл имя, 04 Декабря 2011 в 11:43, реферат
Каково бы ни было определение математической вероятности (классическое, комбинаторное, статистическое или субъективное), это понятие призвано отражать некоторые объективные свойства изучаемых явлений, и каждое определение отражает свою сторону общего объективного свойства. Само утверждение о наличии вероятности требует обоснования или проверки для каждого отдельного случая практики, и никогда предельное и теоретическое понятие математической вероятности не совпадает прямо с чисто житейским (обусловленным речевой практикой) пониманием ее как степени субъективной уверенности в чем-то.
13 4 0,4 5,2
7 5 1,4 9,8
Пример № 2
Таблица 8
fi xi \xi - Xap\ fi\xi - Xap\
1 5 4,1 4,1
2 6 3,1 6,2
4 7 2,1 8,4 N = 30
7 8 1,1 7,7 Xap = 9,1
5 9 0,1 0,5
3 10 0,9 2,7
3 11 1,9 5,7 d = 53,8/30 = 1,79.
2 12 2,9 5,8
2 13 3,9 7,8
1 14 4,9 4,9
5-3.Среднее квартильное отклонение (или семиинтерквартильный размах) - это мера разброса в распределениях, которые имеют параметром средней величины медиану. Квартильное отклонение Q - это половина расстояния между двумя квартилями: верхним Qв и нижним Qн, т.е. Q = Qв - Qн / 2.
Известно, что медиана делит выборку на две равные по количеству вариант части (половины). Верхний квартиль Qв - это медиана половины выборки со значениями больше медианы, нижний квартиль Qн - это медиана другой половины выборки. Посчитаем квартили и квартильное отклонение для примера № 1 (удобнее работать с упорядоченной выборкой на с. 101 или данными табл. 3 на с. 113), применяя сразу формулу интерполяционного вычисления (см. разд. 4 о медиане):
Qн = 3+1 * 9-5 / 15-5 = 3,4;
Qв = 4+1 * 9-0 / 10-0 = 4,9
Q = 4,9-3,4 / 2 = 0,75.
5-4. Среднее квадратическое отклонение (ошибка), или стандартное отклонение о, вычисляется по следующей формуле:
o = fi (fi (Xi - Xap)2 / N-1.
Причем деление (под радикалом) не на объем выборки, а на величину (N - 1) является некоторой практической поправкой для измерений не слишком репрезентативных (N < 100).
Стандартное отклонение является классической мерой разброса симметрического распределения. Величина D = o2 носит название дисперсии (флуктуации, девиаты). Чем больше дисперсия, тем больше разброс данных, как, например, для кривых на рис. 19 D3>D2> D1, где индексы соответствуют номеру кривой.
Пример № 1 (по данным табл. 3)
Таблица 9
fi xi xi - xap ( xi - xap)2 fi ( xi - xap)2
1 1 - 2,6 6,76 6,76
4 2 - 1,6 2,56 10,24 N = 35
10 3 - 0,6 0,36 3,6
13 4 0,4 0,15 2,08 Xap = 3,6
7 5 1,4 1,96 13,72
о
36,4 / 35-1 = 1,07 = 1,03.
Пример 2 (по данным табл. 4)
Таблица 10
fi xi xi - xap ( xi - xap)2 fi ( xi - xap)2
1 5 -4,1 16,81 16,81
2 6 -3,1 9,61 19,22 N = 30
4 7 -2,1 4,41 17,64 xap = 9,1
7 8 -1,1 1,21 8,47
5 9 -0,1 0,01 0,05
3 10 -0,9 0,81 2,43
3 11 1,9 3,61 10,83
2 12 2,9 8,41 16,82
2 13 3,9 15,21 30,42
1 14 4,9 24,01 24,01
o = 96,70 / 30-1 = 3,34 = 1,83.
5-5. Коэффициент вариации V - это выражение в процентах отношение стандартного отклонения к среднему арифметическому значению. Значит, эта мера дает возможность сравнить в абсолютных единицах вариативность выборок независимо от их среднего значения.
V = о/хар 100%.
Для наших примеров № 1 и 2 имеем:
Таблица 11
Пример № 1 1,03 28,6%
Пример № 2 1,83 20,1%
При рассмотрении классических распределений (см. разд. 3 гл. III) указывалось, что каждое из них математически описывается своей системой параметров, которая всегда сводима к двум исходным: среднему значению и стандартному отклонению. Однако при описании эмпирических распределений зачастую необходимо введение дополнительных параметров, наиболее распространенными из которых являются коэффициент асимметрии и показатель эксцесса.
Коэффициент асимметрии А дает численную меру скошенности статистических распределений и вычисляется по формуле:
А = fi (xi - xap)3 / N * o3.
Для распределений симметричных этот коэффициент равен нулю, значение А положительно при правосторонней скошенности и отрицательно - при левосторонней.
Эксцесс - Е - это количественная мера “горбатости” симметричного распределения, т.е. некоторой плавности (крутости, остро- или туповершинности) верхней части распределения:
Е = fi (xi - xap)4 / N *о4 - 3.
Величина эксцесса в нормальном распределении равняется нулю, при положительном значении Е кривые называются островершинными, при отрицательном - туповершинными.
Значения коэффициентов а и Е (в зависимости от объема распределения N и от уровня значимости (см. ниже), при которых данное эмпирическое распределение еще может считаться нормальным (или просто симметричным), даются в специальных статистических таблицах, имеющихся в соответствующих учебниках.
Всякий результат, полученный статистическим методом, относителен, а значит, относителен и вывод на основании этого результата. Такая относительность исходит из самой философии и методологии статистического исследования (см. разд. 1 гл. III), наконец, из того, что на основании некоторого вполне конечного числа наблюдений (объема выборки N) мы делаем выводы о некоторой генеральной совокупности (в которой N ). Конечно, закономерности, выявляемые в статистическом измерении, есть сами по себе факты, но науке всегда нужны более глубокие обобщения, нужна уверенность в определенной повторяемости закономерностей.
Исходя из этого, всякое утверждение, всякая цифра, полученные методами математической статистики, непременно должны быть обоснованы с точки зрения их достоверности. Последнее исходит из понятия математической вероятности (см. разд. 1 гл. II). Достоверно то, что описывается тем или иным законом распределения вероятностей, при этом более всего разработан и популярен (как указывалось ранее в данной главе) нормальный закон распределения.
Итак, всякое утверждение (статистическая гипотеза) характеризуется количественной мерой вероятности ее справедливости. Другой стороной этой характеристики выступает уровень значимости (существенности), под которым понимается вероятность отвергания гипотезы в случае ее справедливости.
Поясним это на примере нормального закона распределения (рис. 20). Площадь под нормальной кривой (или общий объем статистической совокупности) с данными параметрами может быть точно представлена и описана.
Положим, на рис. 20 представлена некая генеральная совокупность с параметрами М и о. Из теории известно, что значения вариант в пределах М -+ о, т.е. от варианты величиной (М - о) до варианты (М + о), составят точно 68,3% всех наблюдений, или 0,683 всей площади под нормальной кривой. Интересно, что именно в точках (М + о) и (М - о) нормальная кривая имеет наибольший наклон к оси абсцисс. Допустим, что распределение на рис. 20 - это распределение людей по величине роста, где М = 168 см, а о = 6 см. Тогда сказанное выше означает: если мы спросим каждого человека о величине его рост, то окажется, что рост 68,3% людей будет в пределах 162-174 см (М+-о). Если мы перед этим утверждали, что все люди имеют рост между 162 и 174 см., то вероятность такого утверждения равна 0,683, а уровень значимости составляет 0,317 (= 1-0,683). Величина же (М+-о) будет в данном случае границей доверительного интервала, или интервала уровня значимости.
Обобщим
сказанное для некоторых
Таблица 12
Границы доверитель-ного интервала М+- ко | Вероятности (довери- тельный уровень) | Уровень значимости (в различных обозначе-ниях) |
М+- 1*о | 0,68 | 0,32 32% |
М+-1,645*о | 0,90 | 0,10 10% |
М+-1,96*о | 0,95 | 0,05 5% |
М+-2,33*о | 0,98 | 0,02 2% |
М+-2,58*о | 0,99 | 0,01 1% |
М+- 3*о | 0,997 | 0,003 0,3% |
Итак, чем шире выбран интервал уровня значимости или чем меньше абсолютная величина уровня значимости, тем более строгим является утверждение данной статистической гипотезы, тем достовернее суждение и меньше количество явлений относится нами в категорию случайных. Если речь идет о проверке значимости различий между статистическими параметрами (средние значения, показатели формы распределения и т.д.), то достоверными признаются только те различия (отклонения), которые выходят за пределы принятого интервала уровня значимости.