Автор: Пользователь скрыл имя, 04 Ноября 2012 в 18:24, доклад
Математическая статистика - это раздел математики, посвященный методам сбора, анализа и обработки статистических данных для научных и практических целей.
Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений; следовательно, математическая статистика имеет дело с массовыми явлениями.
1. Предмет математической статистики и ее роль в задачах физической культуры и спорта
2. Генеральная совокупность и выборка
3. Статистическая совокупность и статистические признаки
4. Образование вариационных рядов
5. Числовые характеристики выборки
5.1 Среднее арифметическое
5.2 Характеристики рассеяния
6. Достоверность различий между двумя независимыми результатами
7. Определение меры связи между явлениями
7.1 Определение коэффициента корреляции при количественных измерениях
7.2 Вычисление рангового коэффициента корреляции
Полученная группа чисел называется вариационным рядом.
Вариационный ряд – это двойной столбец ранжированных чисел, где слева стоит собственно показатель – вариант, а справа – его количество – частота.
Сумма частот называется объемом совокупности, т.е. общим числом исходных данных. Сумма всех частот и представляет собой объем совокупности.
Теперь обратимся к символам вариационного ряда. Собственно показатель принято обозначать какой-либо буквой (чаще всего буквой латинского алфавита), а находящийся при ней индекс i указывает на множество показателей данной группы, каждый из которых в соответствии с произведенным ранжированием занимает определенное место. Так, вариант 1,25 в вариационном ряду стоит на первом месте и потому может быть обозначен как x1 вариант 1,30 - х2, вариант 1,32 - х3 и т.д., последний вариант в ряду - 1,45, соответствующий х8, также может быть обозначен как xn т. е. как вариант, стоящий на последнем месте. Таким образом, в столбце xi находятся числа, каждое из которых имеет определенный порядковый номер i. В целом в этом столбце находятся показатели, отличающиеся порядковыми номерами, - xi.
Если рассматривать вариационный ряд с другим смысловым значением, отличным от вышеприведенного, следует обозначить его, например, буквой yi. У нового вариационного ряда также будут порядковые номера вариантов. Таким образом, столбцы варианта различных рядов могут быть представлены как xi yi zi и т.д.
Столбец вариационного ряда, содержащий частоты, обозначается как ni и отражает наличие частот, стоящих в соответствии с ранжированием: на первом месте n1 = 3, на втором - п2 = 5 и т.д. до n8 = 3, который может быть представлен как пn, т. е. как показатель, стоящий в данном ряду на последнем месте.
Объем совокупности приведенного ряда n = 43 обозначается без индекса одной буквой, так как для ряда характерно единственное число объема совокупности, не имеющее никакого перечисления.
Для найденного вариационного ряда характерно то, что в отличие от группы первоначально измеренных показателей ряд представляет собой математическую систему, т.е. группу чисел, связанных между собой.
Выборки большого объема разбивают на интервалы. В простейшем случае их может быть два. Например когда необходимо отобрать лучших и худших спортсменов. Однако для получения достаточно точных результатов число интервалов (его обозначают буквой k) должно быть больше.
Таблица 3.2
Рекомендуемое число интервалов для выборок разного объема
Объем выборки (n) |
20 - 40 |
40 - 60 |
60 - 100 |
100 - 200 |
Более 200 |
Число интервалов (k) |
5 - 6 |
6 - 8 |
7 - 10 |
8 - 12 |
10 - 15 |
Тогда величина, или шаг интервала определяется как:
При установлении границ разрядов необязательно, чтобы нижняя граница первого разряда была равна наименьшему наблюдению, а верхняя граница последнего разряда - наибольшему. Рекомендуется выбрать границы разрядов таким образом, чтобы наименьшее наблюдение оказалось примерно в середине первого, а наибольшее - в середине последнего разряда.
Нижнюю границу первого разряда (хн) можно приближенно определить по формуле:
Начало первого разряда определим по формуле:
Для подобного преобразования достаточно к началу первого разряда прибавить величину интервала чтобы получить первый интервал 1,24 + 0,03 = 1,27. Затем к полученному числу последовательно прибавляется величина интервала до тех пор пока последний интервал не будет включать в себя последний вариант.
Таблица 3.3
Интервальный ряд при h = 0,03
№ |
||
1 2 3 4 5 6 7 |
1,24…….1,27 1,27…….1,30 1,30…….1,33 1,33….…1,36 1,36……..1,39 1,39…..…1,42 1,42…..…1,46 |
3 5 6 9 8 9 3 |
Всего |
43 |
Для повышения наглядности результаты исследования могут быть представлены в графической форме. Обычно используют две формы: гистограмма (рис 3.1) и полигон распределения (рис 3.2)
Рис.3.1. Гистограмма
Рис. 3.2. Полигон распределения
5. Числовые характеристики выборки
Вариационные ряды и графики эмпирических распре делений дают наглядное представление о том, как варьирует признак в выборочной совокупности. Но они недостаточны для полной характеристики выборки, поскольку содержат много деталей, охватить которые невозможно без применения обобщающих числовых характеристик.
Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой. Наибольшее практическое значение имеют характеристики положения, рассеяния и асимметрии эмпирических распределений.
Мы рассмотрим характеристики положения, определяющие положение центра эмпирического распределения. Чаще всего употребляются такие характеристики положения, как среднее арифметическое, медиана и мода.
5.1 Среднее арифметическое
Среднее арифметическое, или просто среднее, - одна из основных характеристик выборки. Средняя арифметическая величина - показатель среднего уровня, самого типичного и характерного для всего ряда.
Среднее принято обозначать той же буквой, что и варианты выборки, с той лишь разницей, что над буквой ставится символ усреднения - черта. Например, если обозначить исследуемый признак через X, а его числовые значения - через хi„ то среднее арифметическое имеет обозначение .
Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных. Точность вычисления по необработанным данным всегда выше, но процесс вычисления оказывается трудоемким при большом объеме выборки.
Для несгруппированных данных среднее арифметическое определяется по следующей формуле:
где xi – вариант выборки, n – объем выборки
Для сгруппированных данных среднее арифметическое определяется по следующей формуле:
где xi - вариант выборки; пi, - частота ряда; п - объем выборки.
Суммой принято обозначать суммирование тех данных, которые стоят справа от него. Нижние и верхние показатели указывают, с какого числа следует начать сложение и какими показателями его закончить. Так, обозначает, что необходимо сложить все х, имеющие порядковые номера от 1 до 7. Знак показывает суммирование всех х от первого до последнего показателя.
Таким образом, вычисления по формуле предполагаю следующий порядок действий.
1. Умножают каждый вариант х,- на соответствующую частоту ni
2. Суммируют все полученные
3. Найденную сумму делят на объем совокупности п.
Для удобства и наглядности работы с показателями действия необходимо составить таблицу, так как сложению подлежат хiпi перебираемые от первого до последнего числа.
Используя данные примера составим табл. 3.4
Таблица 3.4
Определение средней арифметической
№ п/п |
xi |
ni |
xini |
1 2 3 4 5 6 7 8 |
1,25 1,30 1,32 1,36 1,38 1,40 1,42 1,45 |
3 5 6 9 8 5 4 3 |
3,75 6,50 7,92 12,14 11,04 7,00 5,68 4,35 |
Всего |
43 |
58,48 |
Средняя арифметическая определяется по формуле:
Обратим внимание на то, что точность вычислений и точность измерений должны совпадать: если измеренные величины имеют точность до сотых, то и промежуточные вычисления и конечный результат должны быть представлены с точностью до сотых.
Таким образом, полученные показатели, представленные вариационным рядом, имеют типичную характерную для всего ряда величину = 1,36 с.
Медиана
Медианой (Me) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина - больше.
Собственно, этим и ограничивается смысловое значение медианы. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных.
Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей п членов, ранг R (порядковый номер) медианы определяется как
Пусть, например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12,14, 14, 18, 20, 22, 22, 26, 28. Тогда ранг медианы
и медиана, обозначаемая символом Me, совпадает с пятым членом ряда: Me = 20.
Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 членов: 6 8 10 12 14 16 18 10 22 24.
Ранг медианы оказывается равным
Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.
Мода
Модой (обозначается символом Мо) называют результат выборки или совокупности, наиболее часто встречающейся в этой выборке. Для интервального вариационного ряда модальный интервал выбирается по наибольшей частоте.
5.2 Характеристики рассеяния
Средние значения не дают полной информации о варьирующем признаке. Нетрудно представить себе два лирических распределения, у которых средние одинаковы, но при этом у одного из них значения признака рассеяны в узком диапазоне вокруг среднего, а у другого - в широком. Поэтому наряду со средними значениями вычисляют и характеристики рассеяния выборки. Рассмотрим наиболее употребительные из них.
Размах вариации
Размах вариации вычисляется, как разность между максимальной и минимальной вариантами выборки:
Как видим, размах вычисляется очень просто, и в этом его главное и единственное достоинство. Информативность этого показателя невелика. Можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. Не будем здесь подробно останавливаться на особенностях применения данного показателя, укажем лишь, что размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки. Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо относиться с осторожностью.
Дисперсия и стандартное отклонение
Дисперсия и стандартное отклонение являются важнейшими характеристиками рассеивания.
Дисперсией ( ) - называется средний квадрат отклонения значений признака от среднего арифметического
Дисперсия для сгруппированных данных определяется по формуле:
Информация о работе Методы статической обработки результатов измерений