Вариационные ряды
Лекция, 05 Мая 2012, автор: пользователь скрыл имя
Описание работы
Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.
Работа содержит 1 файл
формула медианы.doc
— 155.00 Кб (Скачать)
2.2. Вариационные ряды
Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.
Вариационные ряды бывают двух типов: интервальные и безынтервальными.
В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.
В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.
Пример:
Превышение разрешенной скорости движения (км/ч) | Кол-во нарушений |
| Зрение | Кол-во человек |
| Экзаменационная оценка | Кол-во студентов |
20-30 | 10 |
| -10:-6 | 1 |
| 5 | 5 |
30-40 | 20 |
| -6:-3 | 5 |
| 4 | 8 |
40-45 | 15 |
| -3:-1 | 8 |
| 3 | 12 |
45-60 | 10 |
| -1:+1 | 11 |
| 2 | 5 |
Больше 60 | 5 |
| +1:+5 | 3 |
|
|
|
|
|
| +5:+10 | 2 |
|
|
|
Признак – непрерывный |
| Признак дискретный, сильно варьирующийся. |
| Признак дискретный, | |||
2.3. Табличное представление экспериментальных данных.
Как правило, необработанные (первичные) экспериментальные данные представлены в виде неупорядоченного набора чисел, записанных исследователем в порядке их поступления. Этот набор данных трудно обозрим, и сделать по ним какие-то выводы невозможно. Поэтому первичные данные нуждаются в обработке, которая всегда начинается с их группировки.
Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.
Группировки заключается в распределении вариант выборки по группам, или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака.
Шаг 1
Первая задача, которую необходимо решить при группировке, состоит в том, чтобы разбить весь диапазон варьирования признака в выборке (между минимальной и максимальной вариантами выборки) на интервалы группировки. Эта задача требует определения числа интервалов группировки и ширины каждого из них. Обычно предпочтительны интервалы одинаковой ширины, а при выборе числа интервалов исходят из следующих соображений.
Группировка производится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.
При увеличении числа интервалов группировки и, следовательно, при сужении каждого из них уменьшается число экспериментальных данных, попадающих в каждый интервал. Поскольку выборочные значения случайны, они случайным образом распределяются по интервалам группировки, поэтому картина эмпирического распределения будет содержать много случайных деталей, что мешает установить общие закономерности варьирования признака.
И наоборот, при чрезмерно широких интервалах группировки нельзя получить детальной картины распределения, поэтому возникает опасность упустить важные закономерные подробности формы распределения.
Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:
1) по формуле Стерджеса:
2) с помощью табл. 2.2,
Таблица 2.1
Выбор числа интервалов группировки
Объем | Число интервалов, k |
25—40 | 5—6 |
40—60 | 6—8 |
60—100 | 7—10 |
100—200 | 8—12 |
Больше 200 | 10—15 |
Шаг 2
Находим ширину каждого из интервалов (при этом все они будут одинаковой ширины) по следующей формуле:
где h – ширина интервалов; xмакс и хмин — максимальная и минимальная варианты выборки (xмакс и хмин находятся непосредственно по таблице исходных данных).
Шаг 3
Наметим границы интервалов группировки. Нижняя граница первого интервала выбирается так, чтобы минимальная варианта выборки хмин попадала примерно в середину этого интервала. Отсюда нижняя граница первого интервала определяется как
Прибавив к этой величине ширину интервала, найдем нижнюю границу второго интервала . Это будет одновременно и верхняя граница xВ1 предыдущего (первого) интервала.
Аналогично походим и т.д для всех интервалов.
После того, как намечены границы всех интервалов, остается распределить по этим интервалам выборочные варианты. Однако при этом возникает следующий вопрос: как поступать в тех случаях, если какая-либо из вариант попадает точно на границу соседних интервалов группировки, т.е. варианта совпадает с нижней границей одного и верхней границей соседнего с ним интервалам. Такие варианты могут быть с одинаковыми основаниями отнесены к любому из соседних интервалов. Этот выбор оставляется на усмотрение экспериментатора.
Шаг 4
Вычислим срединные значения интервалов группировки xi, которые отстоят от нижних границ на величину, равную половине ширины интервалов, т. е.
где хHi — нижняя граница i-го интервала.
Шаг 5
На основании первичных данных распределяем варианты выборки по интервалам группировки, то есть, подсчитываем повторяемость вариант в каждом интервале. Получившиеся числа имеют в статистике определенное название. Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.
Обозначим частоты символом ni. Общая сумма всех частот всегда равна объему выборки n, что можно использовать для проверки правильности подсчетов.
Шаг 6.1
Вычисляем накопленную частоту интервала — это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота. Накопленные частоты обозначим nxi.
Шаг 6.2
Вычисляем относительную частоту интервала (отношение частоты к объему выборки). Обозначим частости символом wi.
Они показывают (выражают) доли (удельные веса) членов совокупности с одинаковым значением признака (для дискретных рядов) или попадающие в один интервал (для непрерывных).
Шаг 6.3
Вычисляем относительные частости. Накопленной относительной частотой (частостью) называется отношение накопленной частоты к объему выборки.
Обозначив накопленную частность как Fi, получаем:
Сумма всех частостей всегда равна 1.
Таблица 2.2
Табличное представление данных о результатах
Номер интервала i | Границы интервалов | Срединные значения xi | Частоты ni | Накопл. частоты nxi | Частости fi | Накопл. относит.частоты Fi | |
|
|
|
|
|
|
| |
|
|
|
|
|
|
| |
|
|
|
|
|
|
|
|