Вариационные ряды

Автор: Пользователь скрыл имя, 05 Мая 2012 в 16:35, лекция

Описание работы

Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.

Скачать полностью (36.49 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

формула медианы.doc

— 155.00 Кб (Скачать)

2.2. Вариационные ряды

Вариационные ряды бывают двух типов: интервальные и безынтервальными.

В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.

В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.

Пример:

Превышение разрешенной скорости движения (км/ч)	Кол-во нарушений	Зрение (диоптрии)	Кол-во человек	Экзаменационная оценка	Кол-во студентов
20-30	10	-10:-6	1	5	5
30-40	20	-6:-3	5	4	8
40-45	15	-3:-1	8	3	12
45-60	10	-1:+1	11	2	5
Больше 60	5	+1:+5	3
		+5:+10	2
Признак – непрерывный		Признак дискретный, сильно варьирующийся.		Признак дискретный, слабо варьирующийся.

2.3. Табличное представление экспериментальных данных.

Как правило, необработанные (первичные) экспериментальные данные представлены в виде неупорядоченного набора чисел, записанных исследователем в порядке их поступления. Этот набор данных трудно обозрим, и сделать по ним какие-то выводы невозможно. Поэтому первичные данные нуждаются в обработке, которая всегда начинается с их группировки.

Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.

Группировки заключается в распределении вариант выборки по группам, или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака.

Шаг 1

Первая задача, которую необходимо решить при группировке, состоит в том, чтобы разбить весь диапазон варьирования признака в выборке (между минимальной и максимальной вариантами выборки) на интервалы группировки. Эта задача требует определения числа интервалов группировки и ширины каждого из них. Обычно предпочтительны интервалы одинаковой ширины, а при выборе числа интервалов исходят из следующих соображений.

Группировка производится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.

При увеличении числа интервалов группировки и, следовательно, при сужении каждого из них уменьшается число экспериментальных данных, попадающих в каждый интервал. Поскольку выборочные значения случайны, они случайным образом распределяются по интервалам группировки, поэтому картина эмпирического распределения будет содержать много случайных деталей, что мешает установить общие закономерности варьирования признака.

И наоборот, при чрезмерно широких интервалах группировки нельзя получить детальной картины распределения, поэтому возникает опасность упустить важные закономерные подробности формы распределения.

Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:

1) по формуле Стерджеса:

2) с помощью табл. 2.2,

Таблица 2.1

Выбор числа интервалов группировки

Объем выборки, n	Число интервалов, k
25—40	5—6
40—60	6—8
60—100	7—10
100—200	8—12
Больше 200	10—15

Шаг 2

Находим ширину каждого из интервалов (при этом все они будут одинаковой ширины) по следующей формуле:

, (2.1)

где h – ширина интервалов; xмакс и хмин — максимальная и минимальная варианты выборки (xмакс и хмин находятся непосредственно по таблице исходных данных).

Шаг 3

Наметим границы интервалов группировки. Нижняя граница первого интервала выбирается так, чтобы минимальная варианта выборки хмин попадала примерно в середину этого интервала. Отсюда нижняя граница первого интервала определяется как

(2.2)

Прибавив к этой величине ширину интервала, найдем нижнюю границу второго интервала . Это будет одновременно и верхняя граница xВ1 предыдущего (первого) интервала.

Аналогично походим и т.д для всех интервалов.

После того, как намечены границы всех интервалов, остается распределить по этим интервалам выборочные варианты. Однако при этом возникает следующий вопрос: как поступать в тех случаях, если какая-либо из вариант попадает точно на границу соседних интервалов группировки, т.е. варианта совпадает с нижней границей одного и верхней границей соседнего с ним интервалам. Такие варианты могут быть с одинаковыми основаниями отнесены к любому из соседних интервалов. Этот выбор оставляется на усмотрение экспериментатора.

Шаг 4

Вычислим срединные значения интервалов группировки xi, которые отстоят от нижних границ на величину, равную половине ширины интервалов, т. е.

(2.3)

где хHi — нижняя граница i-го интервала.

Шаг 5

На основании первичных данных распределяем варианты выборки по интервалам группировки, то есть, подсчитываем повторяемость вариант в каждом интервале. Получившиеся числа имеют в статистике определенное название. Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.

Обозначим частоты символом ni. Общая сумма всех частот всегда равна объему выборки n, что можно использовать для проверки правильности подсчетов.

Шаг 6.1

Вычисляем накопленную частоту интервала — это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота. Накопленные частоты обозначим nxi.

Шаг 6.2

Вычисляем относительную частоту интервала (отношение частоты к объему выборки). Обозначим частости символом wi.

. (2.4)

Они показывают (выражают) доли (удельные веса) членов совокупности с одинаковым значением признака (для дискретных рядов) или попадающие в один интервал (для непрерывных).

Шаг 6.3

Вычисляем относительные частости. Накопленной относительной частотой (частостью) называется отношение накопленной частоты к объему выборки.

Обозначив накопленную частность как Fi, получаем:

(2.5)

Сумма всех частостей всегда равна 1.

Таблица 2.2

Табличное представление данных о результатах

Номер интервала i	Границы интервалов	Срединные значения xi	Частоты ni	Накопл. частоты nxi	Частости fi	Накопл. относит.частоты Fi
Номер интервала i		Срединные значения xi	Частоты ni	Накопл. частоты nxi	Частости fi	Накопл. относит.частоты Fi

Информация о работе Вариационные ряды