Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор: Пользователь скрыл имя, 13 Февраля 2013 в 11:13, лабораторная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.

Работа содержит 1 файл

статистика лаба отчет.docx

— 234.44 Кб (Скачать)

Рассчитанные  выборочные показатели представлены в  двух таблицах - табл.3 и табл.5. На основе этих таблиц формируется единая таблица (табл.8) значений выборочных показателей, перечисленных в условии Задачи 2, табл. 8 с заголовком «Описательные статистики выборочной совокупности»

 

Таблица 8

Описательные статистики выборочной совокупности

 

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Столбец1

 

Столбец2

 
       

Среднее

830

Среднее

782,6

Стандартная ошибка

26,49606347

Стандартная ошибка

31,60752857

Медиана

839

Медиана

777

Мода

860

Мода

780

Стандартное отклонение

145,1249165

Стандартное отклонение

173,1215638

Дисперсия выборки

21061,24138

Дисперсия выборки

29971,07586

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Интервал

600

Интервал

720

Минимум

530

Минимум

420

Максимум

1130

Максимум

1140

Сумма

24900

Сумма

23478

Счет

30

Счет

30

Уровень надежности(95,4%)

55,23931021

Уровень надежности(95,4%)

65,89575382

Стандартное отклонение

142,6856685

Стандартное отклонение

170,2117505

Дисперсия

20359,2

Дисперсия

28972,04

Среднее линейное отклонение

114,8

Среднее линейное отклонение

131,12

Коэффициент вариации, %

17,1910444

Коэффициент вариации, %

21,74952089

Коэффициент асимметрии

-0,21025237

Коэффициент асимметрии

0,015275091


 

 

 

          Задача 3.

а) степень колеблемости значений признаков в совокупности:

-для первого  признака, коэффициент вариации  равен 17,1910444, т.к

0%<17.19≤40%, то колеблемость незначительна;

- для второго признака, коэффициент  вариации равен 21,74952089, т.к

0%<21.75≤40%, то колеблемость незначительна.

 

б)степень однородности совокупности по изучаемым признакам:

Для нормальных и близких к нормальному  распределений показатель Vσ служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства

Vσ ≤ 33%, 17,19 ≤ 33% и 21,75 ≤ 33%

совокупность является количественно  однородной по данным признакам.

 

в) устойчивость индивидуальных значений признаков:

     Сопоставление средних отклонений – квадратического s и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

     В условиях симметричного и нормального, а также близких к ним распределений между показателями s и имеют место равенства

s

1,25
,      
0,8s,

поэтому отношение показателей  и s может служить индикатором устойчивости данных: если  

>0,8,

то значения признака неустойчивы, в них имеются «аномальные» выбросы.

 

σ ≈ 1,25*114,8 ≈ 142,68;      ≈ 0,8*142,68 ≈ 114,8 ;

т.к.  неравенство    >0,8 не выполняется, то первый признак устойчив.

 

σ ≈ 1,25*131,12 ≈ 163,9;         ≈ 0,8*170,2 ≈ 136,1;

т.к. неравенство    >0,8 не выполняется, то второй признак устойчив.

г) количество попаданий индивидуальных значений признаков в диапазоны

    ( ), ( ), ( ):

 

По значениям  показателей  и s можно определить границы диапазонов рассеяния значений признака относительно средней , т.е. установить, какая доля значений признака попадает в тот или иной диапазон отклонений от .

В нормально распределенных и близких к ним рядах вероятностные оценки диапазонов рассеяния значений признака таковы:

68,3% войдет  в диапазон  ( );

95,4% попадет  в диапазон  ( );              

99,7% появится  в диапазон ( )

Это соотношение  известно как правило «трех сигм».

Таблица 9

Распределение значений признака по диапазонам

рассеяния признака относительно

 

 

Границы диапазонов

Количество значений xi, находящихся в диапазоне

 

Первый признак

Второй признак

Первый признак

Второй признак

    687 ≤ х ≤ 973

612 ≤ х

≤ 953

20

20

  545 ≤ х ≤ 1115

442 ≤ х

≤ 1123

  28

28

  402 ≤ х ≤ 1258

272 ≤ х

≤ 1293

  30

30


 

 

Процентное  соотношение рассеяния значений признака по трем диапазонам составляет:

66,6% войдет  в диапазон  ( );

93,3% попадет  в диапазон  ( );              

100% появится  в диапазон ( )

что соответствует  правилу «трех сигм».

Задача 4.  

а) по вариации признаков:

Показатели  вариации  признака описывают степень  рассеяния вариантов значений признака относительно своего центра (или Ме). Различают показатели размера и интенсивности вариации.

В статистической практике для оценки вариации наиболее широко применяются показатели размера  вариации s2, s и показатель интенсивности вариации Vs.

 Показатели s2, s, основанные на учете отклонений (xi- ) индивидуальных значений признака xi от средней арифметической , являются обобщающими характеристиками различия в значениях признака.

 Дисперсия s2 оценивает средний квадрат отклонений (xi - ). Величина s очень чутко реагирует на вариацию признака (за счет возведения отклонений в квадрат) и органически вписывается в аппарат математической статистики (дисперсионный, корреляционный анализ и др.). На расчете дисперсии основаны многие статистические показатели.

Среднее квадратическое отклонение s показывает, на сколько в среднем отклоняются индивидуальные значения признака xi от их средней величины .

В данном случае по первому признаку среднее  квадратическое отклонение равно 142,69, а по второму равно 170,21.

Размерность отклонения s совпадает с размерностью самого признака, поэтому этот показатель экономически хорошо интерпретируется. Отклонения, выраженные в s, принято считать стандартными. 

 Интенсивность вариации обычно измеряют коэффициентом вариации Vs , который выражается в процентах и вычисляется по формуле

                                                           

Величина Vs оценивает интенсивность колебаний вариантов относительно их средней величины. Принята следующая оценочная шкала колеблемости признака:

                         0%<Vs 40%  -    колеблемость незначительная;

                      40%< Vs 60%  -    колеблемость средняя (умеренная);  

                         Vs>60%  -    колеблемость значительная.

 

В нашем  случае:

 -для первого признака, коэффициент вариации равен 17,1910444, т.к

0%<17.19≤40%,

то колеблемость незначительна;

- для  второго признака, коэффициент вариации  равен 21,74952089, т.к

0%<21.75≤40%,

то колеблемость незначительна.

б) по количественной однородности единиц:

Количественная  однородность совокупности – это  близость числовых значений признаков, определяющих качественное содержание совокупности.

Однородность  статистической совокупности означает, что все ее единицы обладают сходством  по некоторому кругу признаков, обусловливающих  качественную определенность совокупности, а количественные значения этих признаков  оказываются близкими друг к другу.

в) по надежности (типичности) средних значений признаков:

 

Для оценка надежности (типичности) средней величины можно воспользоваться значением показателя вариации, Vs. Если его значение невелико (в нашем случае оно меньше 40%), то индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны и, следовательно, средняя арифметическая величина является надежной характеристикой данной совокупности.

 

г) по симметричности распределений в центральной части ряда:

 Показатели асимметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

 В симметричном распределении максимальная ордината прямой располагается точно в середине кривой , а соответствующие ей характеристики центра распределения совпадают:

=Mo=Me

В случае асимметричного распределения вершина  кривой находится не в середине, а сдвинута либо влево, либо вправо.

Если  вершина сдвинута влево, то правая часть кривой оказывается длиннее левой, т.е. имеет место правосторонняя асимметрия, характеризующаяся неравенством >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака.

Этому неравенству  соответствует второй признак (Табл. 8).

Если  же вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя , для которой справедливо неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака.

 Этому неравенству соответствует первый признак (Табл. 8)

Для оценки асимметричности распределения  в этом центральном диапазоне служит коэффициент К.Пирсона.

При правосторонней асимметрии Asп>0, при левосторонней Asп<0. Если Asп=0, вариационный ряд симметричен.

В нашем  случае первый признак меньше нуля, значит левосторонняя асимметрия, а  второй признак больше нуля, значит правосторонняя асимметрия (Табл.8).

 

 Задача 5.

 Интервальный вариационный  ряд представляет признак в виде упорядоченного набора интервалов значений признака с указанием для каждого интервала его частоты, фиксирующей число попаданий значений признака в данный интервал.

 Интервальный ряд распределения предприятий по Стоимости основных производственных фондов представлен в Таблице 7.

Гистограмма распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов рис.3.

Мы определили (Задача 4, п. г) ), что вершина кривой сдвинута вправо и левая часть оказывается длиннее правой, то асимметрия левосторонняя , для которой справедливо неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака.

Показатель эксцесса характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой. Т.к. коэффициент эксцесса Ek меньше нуля, то наша кривая с плосковершинным распределением.

Гистограмма имеет одновершинную форму, есть основания предполагать, что выборка является однородной по данному признаку. Как мы определили (в Задаче 3, п. б) совокупность является количественно однородной по данному признаку.

Т.к. асимметрия небольшая, то относится к нормальному  типу.

Для полученного  интервального ряда значение моды Мо рассчитывается по формуле:

,

где: хМо – нижняя граница модального интервала;

h – величина модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным.

 

Мо = 530 + 600 = 890

Это означает, что наиболее часто встречаемая  величина признаков данной совокупности равна 890.

 

Анализ генеральной совокупности

 

          Задача 1.

Таблица 10

Описательные статистики генеральной совокупности

 

По столбцу "Среднегодовая  стоимость основных производственных фондов, млн.руб."

По столбцу "Выпуск продукции, млн.руб"

Стандартное отклонение

145,1249165

Стандартное отклонение

173,1215638

Дисперсия выборки

21061,24138

Дисперсия выборки

29971,07586

Эксцесс

-0,344943844

Эксцесс

-0,205332365

Асимметричность

-0,152503649

Асимметричность

0,042954448

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel