Автор: Пользователь скрыл имя, 05 Мая 2012 в 16:35, лекция
Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.
Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.
Вариационные ряды бывают двух типов: интервальные и безынтервальными.
В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.
В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.
Превышение разрешенной скорости движения (км/ч) | Кол-во нарушений |
| Зрение | Кол-во человек |
| Экзаменационная оценка | Кол-во студентов |
20-30 | 10 |
| -10:-6 | 1 |
| 5 | 5 |
30-40 | 20 |
| -6:-3 | 5 |
| 4 | 8 |
40-45 | 15 |
| -3:-1 | 8 |
| 3 | 12 |
45-60 | 10 |
| -1:+1 | 11 |
| 2 | 5 |
Больше 60 | 5 |
| +1:+5 | 3 |
|
|
|
|
|
| +5:+10 | 2 |
|
|
|
Признак – непрерывный |
| Признак дискретный, сильно варьирующийся. |
| Признак дискретный, |
Как правило, необработанные (первичные) экспериментальные данные представлены в виде неупорядоченного набора чисел, записанных исследователем в порядке их поступления. Этот набор данных трудно обозрим, и сделать по ним какие-то выводы невозможно. Поэтому первичные данные нуждаются в обработке, которая всегда начинается с их группировки.
Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.
Группировки заключается в распределении вариант выборки по группам, или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака.
Первая задача, которую необходимо решить при группировке, состоит в том, чтобы разбить весь диапазон варьирования признака в выборке (между минимальной и максимальной вариантами выборки) на интервалы группировки. Эта задача требует определения числа интервалов группировки и ширины каждого из них. Обычно предпочтительны интервалы одинаковой ширины, а при выборе числа интервалов исходят из следующих соображений.
Группировка производится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.
При увеличении числа интервалов группировки и, следовательно, при сужении каждого из них уменьшается число экспериментальных данных, попадающих в каждый интервал. Поскольку выборочные значения случайны, они случайным образом распределяются по интервалам группировки, поэтому картина эмпирического распределения будет содержать много случайных деталей, что мешает установить общие закономерности варьирования признака.
И наоборот, при чрезмерно широких интервалах группировки нельзя получить детальной картины распределения, поэтому возникает опасность упустить важные закономерные подробности формы распределения.
Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:
1) по формуле Стерджеса:
2) с помощью табл. 2.2,
Таблица 2.1
Выбор числа интервалов группировки
Объем | Число интервалов, k |
25—40 | 5—6 |
40—60 | 6—8 |
60—100 | 7—10 |
100—200 | 8—12 |
Больше 200 | 10—15 |
Находим ширину каждого из интервалов (при этом все они будут одинаковой ширины) по следующей формуле:
где h – ширина интервалов; xмакс и хмин — максимальная и минимальная варианты выборки (xмакс и хмин находятся непосредственно по таблице исходных данных).
Наметим границы интервалов группировки. Нижняя граница первого интервала выбирается так, чтобы минимальная варианта выборки хмин попадала примерно в середину этого интервала. Отсюда нижняя граница первого интервала определяется как
Прибавив к этой величине ширину интервала, найдем нижнюю границу второго интервала . Это будет одновременно и верхняя граница xВ1 предыдущего (первого) интервала.
Аналогично походим и т.д для всех интервалов.
После того, как намечены границы всех интервалов, остается распределить по этим интервалам выборочные варианты. Однако при этом возникает следующий вопрос: как поступать в тех случаях, если какая-либо из вариант попадает точно на границу соседних интервалов группировки, т.е. варианта совпадает с нижней границей одного и верхней границей соседнего с ним интервалам. Такие варианты могут быть с одинаковыми основаниями отнесены к любому из соседних интервалов. Этот выбор оставляется на усмотрение экспериментатора.
Вычислим срединные значения интервалов группировки xi, которые отстоят от нижних границ на величину, равную половине ширины интервалов, т. е.
где хHi — нижняя граница i-го интервала.
На основании первичных данных распределяем варианты выборки по интервалам группировки, то есть, подсчитываем повторяемость вариант в каждом интервале. Получившиеся числа имеют в статистике определенное название. Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.
Обозначим частоты символом ni. Общая сумма всех частот всегда равна объему выборки n, что можно использовать для проверки правильности подсчетов.
Вычисляем накопленную частоту интервала — это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота. Накопленные частоты обозначим nxi.
Вычисляем относительную частоту интервала (отношение частоты к объему выборки). Обозначим частости символом wi.
Они показывают (выражают) доли (удельные веса) членов совокупности с одинаковым значением признака (для дискретных рядов) или попадающие в один интервал (для непрерывных).
Вычисляем относительные частости. Накопленной относительной частотой (частостью) называется отношение накопленной частоты к объему выборки.
Обозначив накопленную частность как Fi, получаем:
Сумма всех частостей всегда равна 1.
Таблица 2.2
Табличное представление данных о результатах
Номер интервала i | Границы интервалов | Срединные значения xi | Частоты ni | Накопл. частоты nxi | Частости fi | Накопл. относит.частоты Fi | |
|
|
|
|
|
|
| |
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|