Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 24 Декабря 2012 в 14:34, лабораторная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Работа содержит 1 файл

6 вариант.doc

— 1.19 Мб (Скачать)

Гистограмма и соответствующая  таблица приведены ниже.

 

 

 

 

 

 

 

 

 

 

                

Группы предприятий  по стоимости основных фондов

Число предприятий  в группе

Накопленная частость группы

350-430

4

13,33%

430-510

5

30,00%

510-590

11

66,67%

590-670

7

90,00%

670-750

3

100,00%

     

Итого

30

 

 

Для полученного интервального  ряда значение моды рассчитывается по формуле:

,

где: хМо –левая граница модального интервала;

h – величина модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным.

 

(млрд. руб.)

Мода интервального  ряда (558 млрд. руб.) и не сгруппированного

(570 млрд. руб.) расходятся, так как описательные статистики, рассчитанные по сгруппированным данным, реализуют точные функциональные зависимости значений показателей от исходных данных, в отличие от приближённых статистических оценок, выводимых с заданным уровнем надёжности.

2. Статистический анализ  генеральной совокупности.

Задание 1.

 Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.

Генеральные показатели рассчитываются с помощью инструмента  Описательная статистика и их значения приведены в таблице 3.  Сформируем для них отдельную таблицу10 с заголовком «Описательные статистики генеральной совокупности».

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 
       

Стандартное отклонение

96,74994431

Стандартное отклонение

115,4143759

Дисперсия выборки

9360,551724

Дисперсия выборки

13320,47816

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448


Таблица 10.

 

Величина дисперсии генеральной совокупности σ2N может быть оценена по выборочной дисперсии σ2n, если использовать формулу :

                                          

Для первого признака σ2N= 9048,533333= 9360,55172

Для второго σ2N= 12876,46222= 13320,478157

При достаточно больших n можно приближено считать, что обе дисперсии совпадают:

σ2N

σ2n.

В условиях близости распределения  единиц генеральной совокупности к  нормальному соотношение R=6s  используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

          RN= 6*96,74994431 = 580,499666 - для первого признака

          RN=6*115,4143759 = 692,486255- для второго признака

Если сравнивать размах вариации для выборочной совокупности, то можно увидеть, что он немного меньше аналогичного признака для генеральной.

                     Rn=6*95,12377901=570,742674 - для первого признака

                    Rn=6*113,4745003=680,8470018 - для второго признака

Задание 2.

  Для изучаемых признаков рассчитать:

а) среднюю ошибку выборки;

                           б) предельные ошибки выборки  для уровней надежности

                          P=0,683, P=0,954, P=0,997 и границы, в которых будут   

                          находиться средние значения  признака генеральной     

                              совокупности при заданных уровнях надежности.

                                                                                           

а) Средняя ошибка выборки   выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней . Средняя ошибка выборки рассчитана для обоих признаков и соответственно   для первого признака = 17,66404231, а для второго = 21,07168571.

б)                                        Предельные ошибки выборки

и ожидаемые границы  для генеральных средних

Доверительная

вероятность

Р

Коэффициент

доверия

t

Предельные ошибки выборки

Ожидаемые границы для средних 

для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683

1

17,98562444

21,45530558

532,014

567,986

500,278

543,189

0,954

2

36,12704265

43,09645974

513,873

586,127

478,637

564,83

0,997

3

57,22093133

68,25965765

492,779

607,221

453,474

589,993


Таблица 11.

Задание 3.

Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок  сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению

 

 Значения коэффициентов  асимметрии и эксцесса следующие  для первого и второго признаков  соответственно: -0,152503649 и  0,042954448;

-0,344943844 и -0,205332365.

 Для заключения о степени близости распределения единиц генеральной совокупности к нормальной форме следует обратиться к графику распределения, проанализировать полученную гистограмму и выяснить, на сколько нарушено предположение о нормальности.

 Гистограмма имеет  одновершинную форму, поэтому  можно предположить, что выборка  является однородной по данному признаку.

As характеризует несимметричность распределения, а Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой. Для первого и второго признаков коэффициент эксцесса Ek<0, поэтому вершина кривой распределения располагается ниже  вершины нормальной кривой. Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.

В данном примере наблюдается  небольшое нарушение соотношения  нормального распределения =Mo=Me As=0 Asп=0 R=6s, поэтому это свидетельствует о наличии небольшой асимметрии. Но в целом можно сказать, что гистограмма приблизительно симметрична  и она представляет распределение близкое к нормальному.

          Таким образом, распределение единиц выборочной совокупности близко к нормальному,  выборка является репрезентативной и при этом коэффициенты AsN, EkN  указывают на небольшую или умеренную величину асимметрии и эксцесса соответственно, значит есть основание полагать, что распределение единиц генеральной совокупности по изучаемому признаку будет близко к нормальному.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение 1.

                                                                          

   

Таблица 1

 

Исходные данные

 

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

1

422,00

412,00

2

498,00

452,00

3

514,00

504,00

4

542,00

560,00

5

350,00

280,00

6

570,00

480,00

7

586,00

648,00

8

438,00

440,00

9

538,00

516,00

10

622,00

644,00

11

682,00

680,00

12

230,00

600,00

13

518,00

536,00

14

570,00

584,00

15

654,00

708,00

16

750,00

760,00

17

558,00

512,00

18

618,00

608,00

19

490,00

380,00

20

626,00

520,00

21

698,00

700,00

22

478,00

396,00

23

378,00

372,00

24

638,00

596,00

25

570,00

520,00

26

530,00

492,00

27

410,00

320,00

28

554,00

500,00

29

642,00

548,00

30

610,00

520,00

31

750,00

200,00

32

446,00

464,00


 

 

 

 

Приложение 2.

 

 

   

Таблица 2

     

Аномальные  единицы наблюдения

     

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

     

31

750,00

200,00

     

12

230,00

600,00

     
           
           
           

Описательные  статистики

 

Таблица 3.

     

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

   

Столбец1

 

Столбец2

     
           

Среднее

550

Среднее

521,7333333

   

Стандартная ошибка

17,66404231

Стандартная ошибка

21,07168571

   

Медиана

556

Медиана

518

   

Мода

570

Мода

520

   

Стандартное отклонение

96,74994431

Стандартное отклонение

115,4143759

   

Дисперсия выборки

9360,551724

Дисперсия выборки

13320,47816

   

Эксцесс

-0,344943844

Эксцесс

-0,205332365

   

Асимметричность

-0,152503649

Асимметричность

0,042954448

   

Интервал

400

Интервал

480

   

Минимум

350

Минимум

280

   

Максимум

750

Максимум

760

   

Сумма

16500

Сумма

15652

   

Счет

30

Счет

30

   

Уровень надежности(95,4%)

36,12704265

Уровень надежности(95,4%)

43,09645974

   
 

200

       

Предельные  ошибки выборки

   

Таблица 4а

   

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

   

Столбец1

 

Столбец2

     
           

Уровень надежности(68,3%)

17,98562444

Уровень надежности(68,3%)

21,45530558

   
           

Предельные ошибки выборки

   

Таблица 4б

   

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

   

Столбец1

 

Столбец2

     
           

Уровень надежности(99,7%)

57,22093133

Уровень надежности(99,7%)

68,25965765

   
           
 

Выборочные  показатели вариации и асимметрии

Таблица 5

   

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

   

Стандартное отклонение

35,67141713

Стандартное отклонение

42,55293762

   

Дисперсия

95,12377901

Стандартное отклонение

113,4745003

   

Среднее линейное отклонение

9048,533333

Дисперсия

12876,46222

   

Коэффициент вариации, %

76,53333333

Среднее линейное отклонение

87,41333333

   

Коэффициент асимметрии

17,29523255

Коэффициент вариации, %

21,74952089

   
           
 

Таблица 6

       

Карман

Частота

       
 

1

       

430

3

       

510

5

       

590

11

       

670

7

       

750

3

       
     

 

 
   
           
   

Таблица 7

     

Интервальный  ряд распределения предприятий 
по стоимости основных производственных фондов

     

Группы  предприятий по стоимости основных фондов

Число предприятий в группе

Накопленная частость группы

     

350-430

4

13,33%

     

430-510

5

30,00%

     

510-590

11

66,67%

     

590-670

7

90,00%

     

670-750

3

100,00%

     
           

Итого

30

       
           

 

 

 

 

 

 

 

 

 

 

 




Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel