Вариационные ряды

Автор: Пользователь скрыл имя, 05 Мая 2012 в 16:35, лекция

Описание работы

Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.

Работа содержит 1 файл

формула медианы.doc

— 155.00 Кб (Скачать)


 

      2.2. Вариационные ряды

Вариационный ряд – ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотой, частостью …). То есть вариационный ряд – двойной числовой ряд, показывающий, каким образом численные значения изучаемого признака связаны с их повторяемостью в выборке. Вариационные ряды имеют большое значение при статистической обработке экспериментальных данных, поскольку дают наглядное представление о характерных особенностях варьирования признака.

      Вариационные ряды бывают двух типов: интервальные и безынтервальными.

      В интервальном вариационном ряду частоты (или частости), характеризующие повторяемость вариант в выборке, распределяются по интервалам группировки. Интервальный вариационный ряд строится, если изучаемый признак варьирует непрерывно, но используется и для дискретно варьирующих признаков в тех случаях, когда признак варьирует в широких пределах.

      В безынтервальном вариационном ряду частоты (или частости) распределяются непосредственно по значениям варьирующего признака. Для построения безынтервального вариационного ряда необходимо варианты выборки расположить в порядке возрастания или убывания (проранжировать) и затем подсчитать, сколько раз каждая из них встречается в выборке. Безынтервальный вариационный ряд применяется в тех случаях, когда исследуемый признак варьирует дискретно и слабо.

      Пример:

Превышение разрешенной скорости движения (км/ч)

Кол-во нарушений

 

Зрение
(диоптрии)

Кол-во человек

 

Экзамена­ционная оценка

Кол-во студентов

20-30

10

 

-10:-6

1

 

5

5

30-40

20

 

-6:-3

5

 

4

8

40-45

15

 

-3:-1

8

 

3

12

45-60

10

 

-1:+1

11

 

2

5

Больше 60

5

 

+1:+5

3

 

 

 

 

 

 

+5:+10

2

 

 

 

Признак – непрерывный

 

Признак дискретный, сильно варьирующийся.

 

Признак дискретный,
слабо варьирующийся.

      2.3. Табличное представление экспериментальных данных.

Как правило, необработанные (первичные) экспериментальные данные представлены в виде неупорядоченного набора чисел, записанных исследователем в порядке их поступления. Этот набор данных трудно обозрим, и сделать по ним какие-то выводы невозможно. Поэтому первичные данные нуждаются в обработке, которая всегда начинается с их группировки.

      Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.

      Группировки заключается в распределении вариант выборки по группам, или интервалам группировки, каждый из которых содержит некоторый диапазон значений изучаемого признака.

      Шаг 1

Первая задача, которую необходимо решить при группировке, состоит в том, чтобы разбить весь диапазон варьирования признака в выборке (между минимальной и максимальной вариантами выборки) на интервалы группировки. Эта задача требует определения числа интервалов группировки и ширины каждого из них. Обычно предпочтительны интервалы одинаковой ширины, а при выборе числа интервалов исходят из следующих соображений.

      Группировка производится для того, чтобы построить эмпирическое распределение и сформировать с его помощью предположения о форме распределения изучаемого признака в генеральной совокупности, из которой взята выборка.

      При увеличении числа интервалов группировки и, следовательно, при сужении каждого из них уменьшается число экспериментальных данных, попадающих в каждый интервал. Поскольку выборочные значения случайны, они случайным образом распределяются по интервалам группировки, поэтому картина эмпирического распределения будет содержать много случайных деталей, что мешает установить общие закономерности варьирования признака.

      И наоборот, при чрезмерно широких интервалах группировки нельзя получить детальной картины распределения, поэтому возникает опасность упустить важные закономерные подробности формы распределения.

      Поэтому вопрос о выборе числа и ширины интервалов группировки приходится решать в каждом конкретном случае исходя из целей исследования, объема выборки и степени варьирования признака в выборке. Однако приближенно число интервалов k можно оценить исходя только из объема выборки n. Делается это одним из следующих способов:

      1) по формуле Стерджеса:

      2) с помощью табл. 2.2,

      Таблица 2.1

Выбор числа интервалов группировки

Объем
выборки, n

Число интервалов, k

25—40

5—6

40—60

6—8

60—100

7—10

100—200

8—12

Больше 200

10—15

Шаг 2

Находим ширину каждого из интервалов (при этом все они будут одинаковой ширины) по следующей формуле:

                                                             ,                                                             (2.1)

где h – ширина интервалов; xмакс и хмин — максимальная и минимальная варианты выборки (xмакс и хмин находятся непосредственно по таблице исходных данных).

Шаг 3

Наметим границы интервалов группировки. Нижняя граница первого интервала выбирается так, чтобы минимальная варианта выборки хмин попадала примерно в середину этого интервала. Отсюда нижняя граница первого интервала определяется как

                                                                                                                             (2.2)

Прибавив к этой величине ширину интервала, найдем нижнюю границу второго интервала . Это будет одновременно и верхняя граница xВ1 предыдущего (первого) интервала.

      Аналогично походим  и т.д для всех интервалов.

      После того, как намечены границы всех интервалов, остается распределить по этим интервалам выборочные варианты. Однако при этом возникает следующий вопрос: как поступать в тех случаях, если какая-либо из вариант попадает точно на границу соседних интервалов группировки, т.е. варианта совпадает с нижней границей одного и верхней границей соседнего с ним интервалам. Такие варианты могут быть с одинаковыми основаниями отнесены к любому из соседних интервалов. Этот выбор оставляется на усмотрение экспериментатора.

      Шаг 4

Вычислим срединные значения интервалов группировки xi, которые отстоят от нижних границ на величину, равную половине ширины интервалов, т. е.

                                                                                                                                 (2.3)

где хHi — нижняя граница i-го интервала.

Шаг 5

На основании первичных данных распределяем варианты выборки по интервалам группировки, то есть, подсчитываем повторяемость вариант в каждом интервале. Получившиеся числа имеют в статистике определенное название. Числа, показывающие, сколько раз варианты, относящиеся к каждому интервалу группировки, встречаются в выборке, называются частотами интервалов.

      Обозначим частоты символом ni. Общая сумма всех частот всегда равна объему выборки n, что можно использовать для проверки правильности подсчетов.

      Шаг 6.1

Вычисляем накопленную частоту интервала — это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота. Накопленные частоты обозначим nxi.

      Шаг 6.2

Вычисляем относительную частоту интервала (отношение частоты к объему выборки). Обозначим частости символом wi.

                                                                     .                                                                    (2.4)

Они показывают (выражают) доли (удельные веса) членов совокупности с одинаковым значением признака (для дискретных рядов) или попадающие в один интервал (для непрерывных).

      Шаг 6.3

Вычисляем относительные частости. Накопленной относительной частотой (частостью) называется отношение накопленной частоты к объему выборки.

      Обозначив накопленную частность как Fi, получаем:

                                                                                                                                        (2.5)

Сумма всех частостей всегда равна 1.

      Таблица 2.2

Табличное представление данных о результатах

Номер интервала

i

Границы интервалов

Срединные значения

xi

Частоты

ni

Накопл. частоты

nxi

Частости

fi

Накопл. относит.частоты

Fi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Информация о работе Вариационные ряды