Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 27 Декабря 2011 в 00:17, лабораторная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10-%, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели среднегодовая стоимость основных производственных фондов и выпуск продукции – как изучаемые признаки единиц.

Работа содержит 1 файл

Отчет 1.doc

— 247.50 Кб (Скачать)

    ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ 

     КАФЕДРА СТАТИСТИКИ 
 
 

     ОТЧЕТ

     о результатах выполнения

     компьютерной  лабораторной работы № 1 

     «Автоматизированный априорный анализ статистической совокупности в среде MS Excel»

     Вариант № 26 
 
 
 
 
 

       Выполнил: ст. III курса гр.      
       Проверил:
 
 
 
 
 

     Москва, 2006

 

      1. Постановка задачи. Исходные данные 

     При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10-%, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.

     В проводимом статистическом исследовании обследованные предприятия выступают  как единицы выборочной совокупности, а показатели среднегодовая стоимость основных производственных фондов и выпуск продукции – как изучаемые признаки единиц.

     В процессе исследования совокупности необходимо решить ряд статистических задач  для выборочной и генеральной  совокупностей.

     Исходные  данные приведены в таблице 1 с поправкой на вариант.

     Таблица 1

Номер предприятия Среднегодовая стоимость  основных производственных фондов, млн. руб. Выпуск продукции, млн. руб.
1 1372,00 1540,00
2 1638,00 1414,00
3 1694,00 1680,00
4 1792,00 1134,00
5 1120,00 1120,00
6 1890,00 1596,00
7 1946,00 2254,00
8 1428,00 1260,00
9 1778,00 2492,00
10 2072,00 1498,00
11 2282,00 1750,00
12 700,00 1512,00
13 1708,00 1862,00
14 1890,00 1736,00
15 2184,00 2814,00
16 2520,00 2254,00
17 1848,00 2114,00
18 2058,00 2366,00
19 1610,00 2086,00
20 2086,00 2520,00
21 2338,00 2072,00
22 1568,00 2268,00
23 1218,00 2324,00
24 2128,00 2352,00
25 1890,00 3136,00
26 1750,00 2394,00
27 1330,00 2674,00
28 1834,00 3080,00
29 2142,00 1596,00
30 2030,00 1862,00
31 2520,00 742,00
32 1456,00 3136,00
 

     2. Выявление и удаление из выборки аномальных единиц наблюдения 

     На  основе исходных данных стоится диаграмма  рассеяния изучаемых признаков (файл Лаб1). В настоящей лабораторной работе в качестве исходных данных представлены выборочные значения двух признаков – среднегодовая стоимость основных производственных фондов и выпуск продукции. Для выявления аномальных значений этих признаков можно построить график для каждого из признаков в отдельности, однако анализ упростится, если использовать диаграмму рассеивания. Диаграмма рассеивания – это точечный график, осям X и Y которого сопоставлены два изучаемых признака единиц совокупности. Затем проводится визуальный анализ  диаграммы рассеивания, где и выявляются аномальные точки, т.е. точки, отстоящие от основной массы точек на существенном расстоянии. Затем эти значения удаляются из таблицы первичных данных (таблица 1)и заносятся в таблицу 2.

     Таблица 2

Аномальные  единицы наблюдения
  Номер предприятия Среднегодовая стоимость  основных производственных фондов, млн. руб. Выпуск продукции, млн. руб.
12 700,00 1512,00
31 2520,00 742,00
 
 

     3. Оценка описательных статистических параметров совокупности 

     Описательная  (дескриптивная) статистика является инструментом статистического описания данных, представляющих всю наблюдаемую совокупность в целом. Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную (а не как выборку из некоторой другой совокупности большего объема).

     В данной лабораторной работе рассчитываем следующие статистические показатели совокупности изучаемых признаков:

      (среднее) – средняя арифметическая величина признака в выборке, вычисленная по несгруппированным данным;

       (стандартная ошибка)– средняя ошибка выборки – среднее квадратичное отклонение выборочной средней от математического ожидания генеральной средней;

     Ме (медиана) – значение признака, приходящееся на середину ранжированного ряда выборочных данных;

     Мо (мода) – значение признака, повторяющееся в выборке с наибольшей частотой;

      (стандартное отклонение) – генеральное  среднее квадратическое отклонение, оцененное по выборке;

      (дисперсия выборки) – генеральная  дисперсия, оцененная по выборке;

      (эксцесс) – коэффициент эксцесса, оценивающий по выборке значение  эксцесса в генеральной совокупности;

      (ассиметричность) – коэффициент  ассиметрии, оценивающий по выборке  величину ассиметрии в генеральной совокупности;

      (интервал)– размах вариации  в выборке;

      (минимум) – минимальное значение  признака в выборке;

      (максимум) – максимальное значение  признака в выборке;

      (сумма) – суммарное значение  элементов выборки;

      (счет) – объем выборки;

      (уровень надежности) – предельная  ошибка выборки, оцененная с  заданным уровнем надежности.

     Все значения вышеперечисленных показателей представлены в таблице 3.

     Таблица 3

Описательные  статистики
По  столбцу "Среднегодовая стоимость  основных производственных фондов", млн. руб.   По столбцу "Выпуск продукции", млн. руб.  
Столбец1   Столбец2  
       
Среднее 1820 Среднее 2079,467
Стандартная ошибка 61,82414809 Стандартная ошибка 103,9996
Медиана 1841 Медиана 2100
Мода 1890 Мода 1596
Стандартное отклонение 338,6248051 Стандартное отклонение 569,6295
Дисперсия выборки 114666,7586 Дисперсия выборки 324477,8
Эксцесс -0,344943844 Эксцесс -0,65275
Асимметричность -0,152503649 Асимметричность 0,183051
Интервал 1400 Интервал 2016
Минимум 1120 Минимум 1120
Максимум 2520 Максимум 3136
Сумма 54600 Сумма 62384
Счет 30 Счет 30
Уровень надежности(95,4%) 128,8916668 Уровень надежности(95,4%) 216,8196
 

     На  основе исходных данных и полученных показателей рассчитываются следующие  величины (таблица 4):

     Выборочное  среднее квадратичное отклонение ;

     Выборочная  дисперсия  ;

     Выборочное среднее линейное отклонение ;

     Коэффициент вариации признака в выборке  ;

     Коэффициент ассиметрии Пирсона  .

     Таблица 4

Выборочные  показатели вариации и ассиметрии
По  столбцу "Среднегодовая стоимость  основных производственных фондов", млн. руб.   По столбцу "Выпуск продукции", млн. руб.  
Стандартное отклонение 332,9332265 Стандартное отклонение 560,0552
Дисперсия 110844,5333 Дисперсия 313661,8
Среднее линейное отклонение 267,8666667 Среднее линейное отклонение 466,1689
Коэффициент вариации, % 18,29303443 Коэффициент вариации, % 26,93264
Коэффициент ассиметрии -0,21025237 Коэффициент ассиметрии 0,863248
 

     Построим  на основе полученных данных сводную  таблицу 5.

     Таблица 5

     Распределение значений признака по диапазонам рассеяния  признака относительно

  Границы диапазонов Количество  значений , находящихся в диапазоне
  Первый признак Второй признак Первый признак Второй признак
21 20
28 30
30 30
 

     На  основе данных определяем их процентное соотношение: по первому признаку 70%, 93,3%, 100%; по второму признаку – 66,7%, 100%, 100%.

     В нормально распределенных и близких  к ним рядам вероятностные  оценки диапазонов рассеяния значений признака таковы:

     68,3% войдет в диапазон  ;

     95,4% попадет в диапазон  ;

     99,7% появится в диапазоне .

     Соотношение известно как правило «трех сигм», и наши расчеты его подтверждают.

     Можно еще установить степень расхождения  между  и , она равняется .

     Показатели  ассиметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии  нормального распределения. В нормальном и близких к нему распределениях основная масса единиц (почти 70 %) располагается  в центральной зоне ряда, в диапазоне ( ). Для оценки симметричности распределения в этом центральном диапазоне служит коэффициент К. Пирсона. При правосторонней ассиметрии (столбец 2), при левосторонней ассиметрии (1 столбец).

     Наиболее  точным показателем ассиметрии является коэффициент ассиметрии . По оценочной шкале ассиметричности, при (наш случай) – ассиметрия незначительная.

     Показатель  эксцесса характеризует крутизну кривой распределения – ее заостренность или пологость по сравнению с нормальной кривой. Для оценки расхождения в степени крутизны кривых (при одинаковой силе вариации) применяют коэффициент эексцесса . При , т.е. в нашем случае, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой является более пологой по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от до .

     По  рассчитанным значениям можно сделать  следующие выводы.

     Величина  коэффициента вариации оценивает интенсивность  колебаний вариантов относительно их средней величины. Исходя из оценочной шкалы колеблемости признака, при – колеблемость незначительная.

     Для нормальных и близких к нормальному  распределений показатель служит индикатором однородности совокупности: принято считать, что при выполнении неравенства совокупность является количественно однородной по данному признаку.

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel