Автор: Пользователь скрыл имя, 09 Марта 2013 в 12:20, лекция
В статистике используется ряд мер вариабельности (колеблемости).
Определим интерквартильный размах как разницу между третьим и первым квартилями.
Другая подобная мера – размах вариации.
Размах вариации в ряду – разность между наибольшим и наименьшим значениями признака.
Тема 6. Меры вариации
6.1. Справочные материалы
Пример 6.1. Рассмотрим два вариационных ряда:
Ряд I: 1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11.
Ряд II: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8.
В чем отличие между рядами, если ?
Рис. 6.1. Сравнение вариации рядов I и II
Рисунок 6.1 графически изображает ряд I и ряд II. Ряд I более вариабелен, чем ряд II.
В статистике используется ряд мер вариабельности (колеблемости).
Определим интерквартильный размах как разницу между третьим и первым квартилями.
Другая подобная мера – размах вариации.
Размах вариации в ряду – разность между наибольшим и наименьшим значениями признака.
(6.2)
По данным примера 6.1 имеем IQRI =5,5; IQRII =2; RI =10; RII =4.
Существуют и другие более часто используемые меры вариации. Это среднее линейное отклонение, дисперсия и стандартное отклонение (или среднее квадратическое отклонение).
Вариацию можно определить как
меру отклонений значений признаков
вариационного ряда от центра ряда
распределения – средней
Среднее линейное отклонение есть средняя арифметическая абсолютных значений отклонений значений признаков ряда от их средней арифметической.
– простое
– взвешенное
Дисперсия вариационного ряда есть средняя арифметическая квадрата отклонения (средний квадрат отклонения) значений признаков ряда от их средней арифметической.
– простая
– взвешенная
Стандартное отклонение вариационного ряда есть арифметическое значение корня квадратного из дисперсии.
– простое
– взвешенное
Для ручного счета лучше пользоваться формулой дисперсии следующего вида.
Для оценки интенсивности вариации и сравнения ее в разных совокупностях и различных признаков применяются относительные показатели вариации, которые вычисляются как отношение абсолютных показателей силы вариации к средней арифметической. Существуют следующие показатели, выраженные в процентах: относительный размах вариации, относительное линейное отклонение и коэффициент вариации.
Относительный размах вариации (коэффициент осцилляции) отражает относительную меру колеблемости крайних значений признака вокруг средней.
Относительное линейное отклонение отражает долю усредненного значения абсолютных отклонений от средней величины.
Коэффициент вариации позволяет представить дисперсию как долю от средней величины.
,
Чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя.1
Для более ясного представления
и использования в экономико-
Меры вариации для сгруппированных данных.
Правило сложения дисперсий
При изучении вариации для сгруппированных данных выделяют три вида дисперсий: общую дисперсию, внутригрупповую (частную) дисперсию, межгрупповую дисперсию.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов.
.
Схема 6.1
Статистическое изучение вариации
Внутригрупповая (частная) дисперсия измеряет вариацию признака внутри группы.
,
где xi – значения признаков внутри j-й группы; – средняя арифметическая j-й группы; fi – частоты вариантов в j-й группе; – объем j-й группы. Суммирование и в числителе, и в знаменателе осуществляется только по тем признакам, которые попали в j-ю группу.
Средняя из внутригрупповых (частных) дисперсий.
,
где Nj – объем j-й группы, j=1,2,…,l (l – число групп), – общее число признаков ряда.
Межгрупповая дисперсия измеряет колеблемость групповых средних вокруг общей средней и отражает вариацию, обусловленную признаком, положенным в основу группировки.
, (6.15)
где – общая средняя вариационного ряда.
Существует закон, связывающий три вида дисперсии.
Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.
Зная любые два вида дисперсий, всегда можно найти или проверить правильность расчета третьего вида.
Правило сложения дисперсий позволяет
оценить степень влияния
Для этого применяется коэффициент детерминации, который показывает степень колеблемости в процентах результативного признака в зависимости от степени колеблемости факторного и рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака.
Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением (ЭКО), которое показывает степень тесноты связи.
Это показатель принимает значения в интервале [0,1]. Если связь отсутствует, то h=0. В этом случае дисперсия групповых средних равна нулю ( ), то есть все групповые средние равны между собой и межгрупповой вариации нет. Если связь функциональная, то h=1. В этом случае дисперсия групповых средних равна общей дисперсии ( ). Промежуточные значения h оцениваются по степени их близости к предельным.
Пример 6.2. Опрос 8 биржевых брокеров дал следующие результаты:
Брокер |
Проходил ли переобучение В последние три года |
Число контрактов, заключенных в день опроса |
1 |
Да |
9 |
2 |
Нет |
8 |
3 |
Нет |
6 |
4 |
Да |
7 |
5 |
Нет |
7 |
6 |
Да |
8 |
7 |
Да |
8 |
8 |
Нет |
7 |
Среднее число контрактов, заключенных брокерами:
.
В данном примере переподготовка – факторный признак, а число заключаемых контрактов – результативный.
Сгруппируем эти данные по признаку переобучения и рассчитаем средние по каждой группе.
Группы брокеров |
Число брокеров |
Число контрактов |
Групповые средние |
Прошли переобучение |
4 |
9, 8, 8, 7 |
8 |
Не прошли переобучение |
4 |
8, 7, 7, 6 |
7 |
, где n1 – число признаков в первой группе.
Или по формуле для взвешенных вариант
, где fi – частоты ряда.
, где n2 – число признаков во второй группе.
Или по формуле для взвешенных вариант
, где fi – частоты ряда.
Рассчитаем дисперсии в каждой группе.
Дисперсия числа заключенных контрактов у брокеров, прошедших переобучение:
Число контрактов Х |
Частота f |
|||
9 8 7 |
1 2 1 |
1 0 -1 |
1 0 1 |
1 0 1 |
Итого |
4 |
- |
- |
2 |
Дисперсия числа заключенных контрактов у брокеров, не прошедших переобучение:
Число контрактов Х |
Частота f |
|||
8 7 6 |
1 2 1 |
1 0 -1 |
1 0 1 |
1 0 1 |
Итого |
4 |
- |
- |
2 |
Рассчитаем среднюю из внутригрупповых дисперсий:
Этот показатель характеризует влияние на результативный признак всех прочих факторных признаков за исключением признака, положенного в основу группировки. Очевидно, что различие в числе заключенных контрактов в двух группах вызвано тем, что брокеры первой группы прошли переобучение, а брокеры второй группы не прошли.
Найдем дисперсию между
Этот показатель характеризует влияние на результативный признак факторного признака, положенного в основу группировки.
Рассчитаем общую дисперсию числа заключенных контрактов.
Число контрактов Х |
Частота f |
|||
9 8 7 6 |
1 3 3 1 |
1,5 0,5 -0,5 -1,5 |
2,25 0,25 0,25 2,25 |
2,25 0,75 0,75 2,25 |
Итого |
8 |
- |
- |
6,0 |
Итак, по данным примера имеем , , . Тогда по правилу сложения дисперсий получаем 0,75 = 0,5 + 0,25.
Рассчитаем коэффициент детерминации: , или 33%. То есть вариация числа заключенных контрактов на 33% объясняется фактором переобучения, 67% – то влияние прочих факторов.
Эмпирическое корреляционное отношение: . Следовательно, фактор, положенный в основу группировки, существенно влияет на число заключаемых брокерами контрактов, но существуют и другие факторы, влияние которых тоже значительно.
Вариация альтернативного (качественного) признака.
Правило сложения дисперсий для доли признака
При статистическом выражении колеблемости альтернативных признаков наличие изучаемого признака обозначается 1, а его отсутствие – 0. Доля вариантов, обладающих изучаемым признаком, обозначается р, а доля вариантов, не обладающих признаком, q. Следовательно, р+q=1.
Найдем их среднее значение и дисперсию: