Автор: Пользователь скрыл имя, 09 Марта 2013 в 12:20, лекция
В статистике используется ряд мер вариабельности (колеблемости).
Определим интерквартильный размах как разницу между третьим и первым квартилями.
Другая подобная мера – размах вариации.
Размах вариации в ряду – разность между наибольшим и наименьшим значениями признака.
(6.20)
Дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.
Пример 6.3. На 10000 населения приходится 4000 мужчин и 6000 женщин. Определить среднее квадратическое отклонение по полу.
Решение: Доля мужчин в населении p=4000/10000=0,4; доля женщин q=6000/10000=0,6. Тогда дисперсия , а среднее квадратическое отклонение .
Пример 6.4. Налоговой инспекцией одного из районов города проведено 86 проверок коммерческих фирм и в 37 обнаружены финансовые нарушения. Определить среднее квадратическое отклонение числа нарушений.
Решение: По условию n=86, m=37, тогда доля фирм, в которых обнаружены нарушения, составит p=37/86=0,43; q=1-0,43=0,57. Дисперсия - а среднее квадратическое отклонение
Правило сложения дисперсий распространяется и на дисперсии доли признака, то есть доли единиц с определенным признаком в совокупности, разбитой на части (группы).
Внутригрупповая дисперсия доли определяется по формуле:
Средняя
из внутригрупповых дисперсий
,
где ni – численность единиц в отдельных группах.
Формула межгрупповой дисперсии имеет следующий вид:
,
– доля изучаемого признака во всей совокупности, которая определяется по формуле:
.
Общая дисперсия определяется по формуле:
.
Три вида дисперсий объединены между собой следующим образом:
.
Это правило сложения дисперсии доли признака.
Пример 6.5. Имеются следующие данные об удельном весе основных рабочих в трех цехах фирмы:
Цех |
Удельный вес основных рабочих в % (pi) |
Численность всех рабочих в % |
1 2 3 |
80 75 90 |
100 200 150 |
Итого |
- |
450 |
Определить общую дисперсию доли основных рабочих по всей фирме, используя правило сложения дисперсий.
Решение: 1) Определим долю рабочих в целом по фирме (формула 6.24).
.
2) Общая дисперсия
доли основных рабочих по
.
3) Внутрицеховые дисперсии рассчитаем, применив формулу 6.21.
4) Средняя из внутригрупповых
дисперсий будет равна (
.
5) Межгрупповую дисперсию определ
.
Проверка вычислений показывает: 0,154 = 0,15 + 0,004.
Анализ вариации в
рядах распределения
Для оценки дифференциации значений признака ряда используются децильный коэффициент дифференциации и коэффициент фондов.
Децильный коэффициент равен отношению девятой децили к первой децили. Децильный коэффициент широко применяют при измерении соотношения уровней дохода 10% наиболее обеспеченного и 10% наименее обеспеченного населения (в разах).
Коэффициент фондов равен отношению среднего уровня 10-й децили к среднему уровню 1-й децили. Он дает более точный уровень дифференциации.
Государственная статистика регулярно публикует коэффициент фондов для характеристики дифференциации доходов. Однако в исследовательской работе чаще используется децильный коэффициент дифференциации. Его применение особенно эффективно в случае, если, например, в распределении доходов в начале первого дециля присутствуют крайне низкие доходы, а десятый дециль завершается аномально высокими доходами, которые существенно влияют на сумму доходов в этих децилях. В такой ситуации правильнее применять децильный коэффициент дифференциации, а не коэффициент фондов.
К показателям дифференциации близки по значению показатели концентрации: коэффициент Джини и коэффициент Герфиндаля.
Коэффициент концентрации Джини рассчитывается по формуле:
,
где pi – накопленная доля (частость) численности единиц ряда
qi – накопленная доля значений признака, приходящаяся на все единицы ряда со значеними признака не более xi.2
Коэффициент Джини может принимать значения от 0 до 1, поэтому результат следует разделить либо на 100, если pi или qi выражен в процентах, либо на 10000, если оба показателя выражены в процентах. Чем больше концентрация признака, тем ближе коэффициент Джини к 1. Коэффициент Джини используют для характеристики степени неравномерности распределения совокупности (например, населения) по уровню признака (например, доходов).
Коэффициент Герфиндаля вычисляется на основе данных о доле изучаемого признака в i-той группе в совокупном объеме признака:
или , (6.28)
где – доля выручки i-той группы в общем объеме всех значений признака;
– объём значений признака в i-той группе.
Показатель Н зависит от числа единиц в группах.
Пример 6.6. Имеются данные о полученной балансовой прибыли 50 крупнейших банков России (по состоянию на 01.01.1998 г.) (в млн. руб.):
1 |
- |
974,2 |
11 |
- |
188,8 |
21 |
- |
143,9 |
31 |
- |
85,4 |
41 |
- |
69,3 |
2 |
- |
609,2 |
12 |
- |
187,3 |
22 |
- |
134,6 |
32 |
- |
84,5 |
42 |
- |
66,4 |
3 |
- |
588,3 |
13 |
- |
186,8 |
23 |
- |
120,9 |
33 |
- |
82,4 |
43 |
- |
66,2 |
4 |
- |
562,9 |
14 |
- |
171,1 |
24 |
- |
112,2 |
34 |
- |
79,6 |
44 |
- |
59,7 |
5 |
- |
436,3 |
15 |
- |
167,9 |
25 |
- |
108,5 |
35 |
- |
74,3 |
45 |
- |
59,1 |
6 |
- |
432,5 |
16 |
- |
164,3 |
26 |
- |
101,6 |
36 |
- |
74,0 |
46 |
- |
58,3 |
7 |
- |
283,6 |
17 |
- |
160,3 |
27 |
- |
101,3 |
37 |
- |
73,5 |
47 |
- |
57,4 |
8 |
- |
265,8 |
18 |
- |
159,9 |
28 |
- |
97,4 |
38 |
- |
73,2 |
48 |
- |
53,8 |
9 |
- |
231,5 |
19 |
- |
157,5 |
29 |
- |
97,4 |
39 |
- |
73,0 |
49 |
- |
51,4 |
10 |
- |
211,7 |
20 |
- |
147,6 |
30 |
- |
92,0 |
40 |
- |
71,5 |
50 |
- |
51,2 |
Величина балансовой прибыли Сбербанка России на 01.07.97 – 4353,283 млн. руб.
Решение:
1. Распределение 50 банков
РФ по размеру балансовой
БП, млн. руб. xk-1-xk |
Коли-чество банков |
Сере-дина интер- вала xi |
xifi |
На-копл. час-тоты Vi, % |
На-копл. час-тос- ти pi |
Доля БП групп банков в общем объеме БП |
| |||
fi |
в % к ито- гу |
на- раст. ито- гом, qi | ||||||||
А |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
50-60 |
7 |
14 |
55 |
385 |
7 |
14 |
0,042 |
0,042 |
0,02 |
116487 |
60-80 |
10 |
20 |
70 |
700 |
17 |
34 |
0,076 |
0,118 |
0,006 |
129960 |
80-100 |
6 |
12 |
90 |
540 |
23 |
46 |
0,059 |
0,177 |
0,003 |
53016 |
100-150 |
8 |
16 |
125 |
1000 |
31 |
62 |
0,109 |
0,286 |
0,012 |
27848 |
150-300 |
13 |
26 |
225 |
2925 |
44 |
88 |
0,318 |
0,604 |
0,101 |
21853 |
300-500 |
2 |
4 |
400 |
800 |
46 |
92 |
0,087 |
0,691 |
0,008 |
93312 |
500-800 |
3 |
6 |
650 |
1950 |
49 |
98 |
0,212 |
0,902 |
0,045 |
651468 |
800-1000 |
1 |
2 |
900 |
900 |
50 |
100 |
0,098 |
1,0 |
0,010 |
512656 |
Итого |
50 |
100 |
- |
9200 |
- |
- |
1 |
- |
0,187 |
1606600 |
2. Средние показатели:
а) средний размер балансовой прибыли на один банк рассчитаем по средней арифметической взвешенной:
б) моду рассчитаем по формуле (5.6):
.
Модальный интервал – 150-300, т.к. частота этого интервала, равная 13, является максимальной.
;
в) медиану рассчитаем по формуле (5.5):
.
Медианный интервал – 100-150, т.к. накопленная частота этого интервала, равная 31, - первая накопленная частота, превышающая половину суммы частот ряда.
3. Показатели вариации:
а) дисперсия (по формуле 6.6):
= ;
б) среднее квадратическое отклонение (по формуле 6.7):
;
в) коэффициент вариации (по формуле 6.11):
V>35%, что свидетельствует о неоднородности совокупности.
4. Показатели дифференциации:
а) для нахождения децильного коэффициента определим вначале первый и девятый децили по формуле 5.4:
.
Интервал, соответствующий первому децилю, – 50-60, т.к. накопленная частота этого интервала, равная 7, первая накопленная частота, превышающая 0,1 суммы частот.
Интервал, соответствующий девятому децилю, – 300-500, т.к. накопленная частота этого интервала, равная 14, первая накопленная частота, превышающая 0,9 суммы частот.
Тогда децильный коэффициент составит: ;
б) т.к. 10% самых крупных и 10% самых мелких банков составляют одну и ту же величину (в нашем примере ), то фондовый коэффициент составит (по данным исходной таблицы):
.
5. Показатели концентрации:
а) коэффициент Джини рассчитаем по формуле 6.27, произведя предварительные расчеты
1,652 |
1,428 |
6,018 |
5,428 |
13,156 |
10,974 |
37,448 |
25,168 |
60,808 |
55,568 |
82,984 |
67,718 |
98 |
90,02 |