Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 24 Декабря 2012 в 14:34, лабораторная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Работа содержит 1 файл

6 вариант.doc

— 1.19 Мб (Скачать)

 


 

 

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ  ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

 

 

КАФЕДРА СТАТИСТИКИ

 

 

 

 

 

 

О Т Ч Е Т 

о результатах выполнения

компьютерной лабораторной работы №1

 

«Автоматизированный априорный  анализ статистической совокупности

 в среде MS «Excel»

 

Вариант № 6

 

 

 

 

 

 

 

 

Выполнил: ст. III курса гр.3

                                                                                

                                                                                               Проверил:

 

 

 

 

 

 

 , 2005 г.

 

Постановка задачи

При проведении статистического  наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию  (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и  о выпуске продукции за год.

В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Для проведения автоматизированного  статистического анализа совокупности выборочные данные представлены в формате  электронных таблиц процессора Excel в диапазоне ячеек B4:C35. Выборочные данные приведены в таблице 1.

Таблица 1.
 

A

B

C

3

Номер  
единицы наблюдения

Среднегодовая стоимость  
основных производственных фондов, млн.руб.

Выпуск продукции,

млн. руб.

4

1

422,00

412,00

5

2

498,00

452,00

6

3

514,00

504,00

7

4

542,00

560,00

8

5

350,00

280,00

9

6

570,00

480,00

10

7

586,00

648,00

11

8

438,00

440,00

12

9

538,00

516,00

13

10

622,00

644,00

14

11

682,00

680,00

15

12

230,00

600,00

16

13

518,00

536,00

16

14

570,00

584,00

17

15

654,00

708,00

19

16

750,00

760,00

20

17

558,00

512,00

21

18

618,00

608,00

22

19

490,00

380,00

23

20

626,00

520,00

24

21

698,00

700,00

25

22

478,00

396,00

26

23

378,00

372,00

27

24

638,00

596,00

28

25

570,00

520,00

29

26

530,00

492,00

30

27

410,00

320,00

31

28

554,00

500,00

32

29

642,00

548,00

33

30

610,00

520,00

34

31

750,00

200,00

35

32

446,00

464,00


 

 

1.Статистический анализ выборочной совокупности.

Задание 1.

Выявить наличие среди  исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.

Любая исследуемая совокупность может содержать единицы наблюдения, значения признаков которых резко выделяются из основной массы значений. Такие единицы являются аномальными для совокупности, так как нарушают статистическую закономерность изучаемого явления.

В данной задаче аномальными единицами являются 2 точки с координатами(230;600) и (750;200) соответственно. Данные точки следует удалить из первичных данных и поместить в таблицу 2, представленную в качестве результативной таблицы.

Номер предприятия

Среднегодовая стоимость основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

31

750,00

200,00

12

230,00

600,00


 

 

 

Задание 2.

 Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), средние отклонения – линейное ( ) и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии  К.Пирсона (Asп).

Расчёт описательных параметров выборочной и генеральной совокупности осуществляется с использованием инструмента Описательная статистика. Рассчитанные таким образом параметры отражены в таблице 3. Расчёт описательных параметров выборочной совокупности осуществляется при помощи инструмента Мастер функций. На основе вычисленных параметров формируется таблица 5. На основе таблиц 3 и 5 можно сформировать таблицу 8, в которой отражены значения выборочных показателей перечисленных в задании 2.

По столбцу "Среднегодовая стоимость  основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 
       

Среднее

550

Среднее

521,7333333

Медиана

556

Медиана

518

Мода

570

Мода

520

Интервал

400

Интервал

480

Стандартное отклонение

95,12377901

Стандартное отклонение

113,4745003

Дисперсия

9048,533333

Дисперсия

12876,46222

Среднее линейное отклонение

76,53333333

Среднее линейное отклонение

87,41333333

Коэффициент вариации, %

17,29523255

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091


Таблица 8. «Описательные статистики выборочной совокупности»

 

 

 

Задание 3.

На основе рассчитанных показателей в предположении, что  распределения единиц по обоим признакам  близки к нормальному, оценить:

а) степень колеблемости значений признаков в совокупности;

б) степень однородности совокупности по изучаемым признакам;

в) устойчивость индивидуальных значений признаков;

                г) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( ).

 

а) Степень колеблемости признака определяется по значению коэффициента вариации Vs, который выражается в процентах и вычисляется по формуле:

%     

Величина Vs оценивает интенсивность колебаний вариантов относительно их средней величины.

Для первого признака коэффициент вариации равен 17,29523255. Он больше 0% и меньше 40%, значит для  первого признака колеблемость незначительная.

Для второго признака Vs=21,74952089. И в данном случае  0%<Vs 40%, значит,  для второго признака колеблемость так же будет незначительной.

б) Для нормальных и близких к нормальному распределений показатель Vs служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства

Vs

33%       

совокупность является количественно однородной по данному  признаку.

 В данной задаче для первого и второго признаков совокупность будет являться количественно однородной, так как в обоих случаях коэффициент вариации меньше 33% .

в) Сопоставление средних  отклонений - квадратического s и линейного  позволяют сделать вывод об устойчивости индивидуальных значений признака, то есть об отсутствии среди них  “аномальных”  вариантов значений.

В условиях симметричного и нормального, а также близких к ним распределений между показателями s и имеют место равенства

s 1,25 ,       0,8s, 

Отношение показателей и s может служить показателем устойчивости данных: если  

>0,8,     

то значения признака неустойчивы, в них имеются «аномальные» выбросы. Для первого признака данное отношение составляет 0,805, а для второго 0,77. Так как 0,805> 0,8, то, следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений при выполнении Задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы ( ) и рассматривать в качестве возможных «кандидатов» на исключение из выборки. В данном случае такими возможными кандидатами являются элементы под номером 5 и 16.

 

 

г)

Распределение значений признака по диапазонам

рассеяния признака относительно

 

Границы диапазонов

Количество значений xi, находящихся в диапазоне

 

Первый признак

Второй признак

Первый признак

Второй признак

(454,88;

645,12)

(408,26;

635,21)

20

19

(359,75;

740,25)

(294,78;

748,68)

28

28

(264,63;

835,37)

(181,31;

862,16)

30

30




Таблица 9.

На основе данных таблицы  определим процентное соотношение  рассеяний значения признака по трём диапазонам и сопоставим его с ожидаемым по правилу « трёх сигм» (68,3%; 95,4%;99,7%). Для первого признака процентное соотношение составляет: 66,67%; 93,33%;100%. А для второго - 63,33%;93,33%;100%.

Задание 4.

Дать сравнительную  характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:

а) вариации признаков;

б) количественной однородности единиц;

в) надежности (типичности) средних  значений признаков;

                г) симметричности распределений  в центральной части ряда

 а) 

       мода Мо - наиболее часто встречающийся вариант значений признака или тот вариант, который соответствует максимальной ординате эмпирической кривой распределения. В нашем случае для первого признака она равна 570; а для второго - 520.

       медиана Ме - серединное значение ранжированного ряда вариантов значений признака. Для первого признака в данной задаче медиана равна 556; а для второго 518.

           

   К показателям  размера вариации относятся:

1)  размах вариации (интервал) R= xmax - xmin, устанавливающий предельное значение амплитуды колебаний признака. Для первого признака данный показатель равен 400, а для второго 480.

2) среднее линейное  отклонение , которое вычисляется как среднее арифметическое из абсолютных отклонений |xi - |. Для первого признака =76,53, а для второго =87,41.

3) дисперсия s2, рассчитываемая как среднее арифметическое из квадратов отклонений (xi - ).Дисперсия для первого признака равна 9048,53, а для второго =12876,46.

          4) Среднее квадратическое отклонение s, вычисляемое как корень квадратный из дисперсии s2 и показывающее, на сколько в среднем отклоняются конкретные варианты от их среднего значения. Этот показатель равен 95,12377901 и 113,4745003 для первого и второго признаков соответственно.

б) Однородность совокупности устанавливается по коэффициенту вариации. Для данной задачи совокупность является количественно однородной, так как  коэффициент вариации  для обоих признаков меньше 33%.

в) Для оценки надёжности (типичности) средних значений признаков можно воспользоваться значением коэффициента вариации, Vs.. Значение коэффициента вариации  невелико для обоих признаков, и не превышают 40 %, поэтому индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

г) Для анализа формы распределения на её близость к нормальной форме используют показатель асимметрии -  коэффициент асимметрии Пирсона Asп, который оценивает асимметричность распределения в центральном диапазоне. Коэффициенты асимметрии для первого и второго признака равны -0,21025237 и 0,015275091 соответственно.

В симметричном распределении  характеристики центра распределения  совпадают  =Mo=Me. В нашем случае этого не наблюдается ни для одного признака, поэтому вершина кривой находится не в середине, а сдвинута либо влево, либо вправо. Для оценки асимметричности распределения служит коэффициент Пирсона. Для первого признака имеет место левостороння асимметрия, так как  As<0    , а для второго признака правосторонняя, потому что As>0    В нашем случае для обоих признаков асимметрия незначительна, так как  в |As|<0,25.

Задание 5

 Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

Выполнение задания  осуществляется в три этапа:

        1. Построение промежуточной таблицы.
        2. Генерация выходной таблицы и графиков.
        3. Приведение выходной таблицы и диаграммы к виду, принятому в статистике.

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel