Теория статистики

Автор: Пользователь скрыл имя, 09 Марта 2013 в 12:20, лекция

Описание работы

В статистике используется ряд мер вариабельности (колеблемости).
Определим интерквартильный размах как разницу между третьим и первым квартилями.
Другая подобная мера – размах вариации.
Размах вариации в ряду – разность между наибольшим и наименьшим значениями признака.

Работа содержит 1 файл

Tema_6.doc

— 441.50 Кб (Скачать)

 

                                      (6.19)

 

      (6.20)

 

Дисперсия альтернативного  признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.

 

Пример 6.3. На 10000 населения приходится 4000 мужчин и 6000 женщин. Определить среднее квадратическое отклонение по полу.

Решение: Доля мужчин в населении p=4000/10000=0,4; доля женщин q=6000/10000=0,6. Тогда дисперсия , а среднее квадратическое отклонение .

 

Пример 6.4. Налоговой инспекцией одного из районов города проведено 86 проверок коммерческих фирм и в 37 обнаружены финансовые нарушения. Определить среднее квадратическое отклонение числа нарушений.

Решение: По условию n=86, m=37, тогда доля фирм, в которых обнаружены нарушения, составит p=37/86=0,43; q=1-0,43=0,57. Дисперсия - а среднее квадратическое отклонение

Правило сложения дисперсий  распространяется и на дисперсии  доли признака, то есть доли единиц с  определенным признаком в совокупности, разбитой на части (группы).

 

Внутригрупповая дисперсия доли определяется по формуле:

 

                                               (6.21)

 

Средняя из внутригрупповых дисперсий рассчитывается так:

 

,                               (6.22)

 

где ni – численность единиц в отдельных группах.

Формула межгрупповой дисперсии имеет следующий  вид:

 

,                                         (6.23)

 

– доля изучаемого признака во всей совокупности, которая определяется по формуле:

 

.                                                   (6.24)

 

Общая дисперсия определяется по формуле:

 

.                                               (6.25)

 

Три вида дисперсий объединены между собой следующим образом:

 

.                                             (6.26)

 

Это правило сложения дисперсии доли признака.

 

Пример 6.5. Имеются следующие данные об удельном весе основных рабочих в трех цехах фирмы:

 

Цех

Удельный вес основных рабочих  в % (pi)

Численность всех рабочих в %

1

2

3

80

75

90

100

200

150

Итого

-

450


 

Определить общую дисперсию доли основных рабочих по всей фирме, используя правило сложения дисперсий.

Решение: 1) Определим долю рабочих в целом по фирме (формула 6.24).

.

2) Общая дисперсия  доли основных рабочих по фирме  в целом будет равна (формула 6.25):

.

3) Внутрицеховые дисперсии  рассчитаем, применив формулу 6.21.

4) Средняя из внутригрупповых  дисперсий будет равна (формула  6.22.)

.

5) Межгрупповую дисперсию определим по формуле 6.23.

.

Проверка вычислений показывает: 0,154 = 0,15 + 0,004.

Показатели дифференциации и концентрации

 

Анализ вариации в  рядах распределения целесообразно  дополнить показателями дифференциации.

Для оценки дифференциации значений признака ряда используются децильный коэффициент дифференциации и коэффициент фондов.

Децильный коэффициент равен отношению девятой децили к первой децили. Децильный коэффициент широко применяют при измерении соотношения уровней дохода 10% наиболее обеспеченного и 10% наименее обеспеченного населения (в разах).

Коэффициент фондов равен отношению среднего уровня 10-й децили к среднему уровню 1-й децили. Он дает более точный уровень дифференциации.

Государственная статистика регулярно публикует коэффициент фондов для характеристики дифференциации доходов. Однако в исследовательской работе чаще используется децильный коэффициент дифференциации. Его применение особенно эффективно в случае, если, например, в распределении доходов в начале первого дециля присутствуют крайне низкие доходы, а десятый дециль завершается аномально высокими доходами, которые существенно влияют на сумму доходов в этих децилях. В такой ситуации правильнее применять децильный коэффициент дифференциации, а не коэффициент фондов.

К показателям дифференциации близки по значению показатели концентрации: коэффициент Джини и коэффициент Герфиндаля.

Коэффициент концентрации Джини рассчитывается по формуле:

,                                   (6.27)

где pi – накопленная доля (частость) численности единиц ряда

qi – накопленная доля значений признака, приходящаяся на все единицы ряда со значеними признака не более xi.2

Коэффициент Джини может  принимать значения от 0 до 1, поэтому  результат следует разделить либо на 100, если pi или qi выражен в процентах, либо на 10000, если оба показателя выражены в процентах. Чем больше концентрация признака, тем ближе коэффициент Джини к 1. Коэффициент Джини используют для характеристики степени неравномерности распределения совокупности (например, населения) по уровню признака (например, доходов).

 

Коэффициент Герфиндаля вычисляется на основе данных о доле изучаемого признака в i-той группе в совокупном объеме признака:

 

  или   ,                         (6.28)

где  – доля выручки i-той группы в общем объеме всех значений признака;

    – объём значений признака в i-той группе.

Показатель Н зависит от числа единиц в группах.

 

 

 

 

Пример 6.6. Имеются данные о полученной балансовой прибыли 50 крупнейших банков России (по состоянию на 01.01.1998 г.) (в млн. руб.):

 

1

-

974,2

11

-

188,8

21

-

143,9

31

-

85,4

41

-

69,3

2

-

609,2

12

-

187,3

22

-

134,6

32

-

84,5

42

-

66,4

3

-

588,3

13

-

186,8

23

-

120,9

33

-

82,4

43

-

66,2

4

-

562,9

14

-

171,1

24

-

112,2

34

-

79,6

44

-

59,7

5

-

436,3

15

-

167,9

25

-

108,5

35

-

74,3

45

-

59,1

6

-

432,5

16

-

164,3

26

-

101,6

36

-

74,0

46

-

58,3

7

-

283,6

17

-

160,3

27

-

101,3

37

-

73,5

47

-

57,4

8

-

265,8

18

-

159,9

28

-

97,4

38

-

73,2

48

-

53,8

9

-

231,5

19

-

157,5

29

-

97,4

39

-

73,0

49

-

51,4

10

-

211,7

20

-

147,6

30

-

92,0

40

-

71,5

50

-

51,2


 

Величина балансовой прибыли Сбербанка России на 01.07.97 –  4353,283 млн. руб.

  1. Постройте вариационный ряд, образовав 7-8 интервалов произвольно.
  2. Рассчитайте средний размер балансовой прибыли на один банк на основе средней арифметической, моды и медианы.
  3. Рассчитайте показатели вариации.
  4. Измерьте дифференциацию банков на основе децильного коэффициента и коэффициента фондов.
  5. Рассчитайте коэффициент концентрации Джини и Герфиндаля.

 

Решение:

1. Распределение 50 банков  РФ по размеру балансовой прибыли  (БП) на 01.01.1998 г.

 

БП, млн. руб.

xk-1-xk

Коли-чество банков

Сере-дина интер-

вала

xi

xifi

На-копл. час-тоты

Vi, %

На-копл. час-тос-

ти

pi

Доля БП групп банков в общем объеме БП

fi

в %

к

ито-

гу

на-

раст.

ито-

гом,

qi

А

1

2

3

4

5

6

7

8

9

10

50-60

7

14

55

385

7

14

0,042

0,042

0,02

116487

60-80

10

20

70

700

17

34

0,076

0,118

0,006

129960

80-100

6

12

90

540

23

46

0,059

0,177

0,003

53016

100-150

8

16

125

1000

31

62

0,109

0,286

0,012

27848

150-300

13

26

225

2925

44

88

0,318

0,604

0,101

21853

300-500

2

4

400

800

46

92

0,087

0,691

0,008

93312

500-800

3

6

650

1950

49

98

0,212

0,902

0,045

651468

800-1000

1

2

900

900

50

100

0,098

1,0

0,010

512656

Итого

50

100

-

9200

-

-

1

-

0,187

1606600


 

2. Средние показатели:

а) средний размер балансовой прибыли на один банк рассчитаем по средней арифметической взвешенной:

 

б) моду рассчитаем по формуле (5.6):

 

.

 

Модальный интервал – 150-300, т.к. частота этого интервала, равная 13, является максимальной.

 

;

 

в) медиану рассчитаем по формуле (5.5):

 

.

 

Медианный интервал – 100-150, т.к. накопленная  частота этого интервала, равная 31, - первая накопленная частота, превышающая половину суммы частот ряда.

 

 

3. Показатели вариации:

а) дисперсия (по формуле 6.6):

 

= ;

 

б) среднее квадратическое отклонение (по формуле 6.7):

 

;

 

в) коэффициент вариации (по формуле 6.11):

 

 

V>35%, что свидетельствует о неоднородности совокупности.

 

4. Показатели дифференциации:

а) для нахождения децильного коэффициента определим вначале  первый и девятый децили по формуле 5.4:

 

.

 

Интервал, соответствующий  первому децилю, – 50-60, т.к. накопленная  частота этого интервала, равная 7, первая накопленная частота, превышающая 0,1 суммы частот.

 

 

Интервал, соответствующий  девятому децилю, – 300-500, т.к. накопленная частота этого интервала, равная 14, первая накопленная частота, превышающая 0,9 суммы частот.

 

Тогда децильный коэффициент  составит:    ;

б) т.к. 10% самых крупных  и 10% самых мелких банков составляют одну и ту же величину (в нашем примере ), то фондовый коэффициент составит (по данным исходной таблицы):

 

.

 

5. Показатели концентрации:

а) коэффициент Джини  рассчитаем по формуле 6.27, произведя  предварительные расчеты

 

1,652

1,428

6,018

5,428

13,156

10,974

37,448

25,168

60,808

55,568

82,984

67,718

98

90,02

Информация о работе Теория статистики