Автор: Пользователь скрыл имя, 27 Декабря 2011 в 00:17, лабораторная работа
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10-%, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели среднегодовая стоимость основных производственных фондов и выпуск продукции – как изучаемые признаки единиц.
ВСЕРОССИЙСКИЙ
ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА
СТАТИСТИКИ
ОТЧЕТ
о результатах выполнения
компьютерной
лабораторной работы
№ 1
«Автоматизированный априорный анализ статистической совокупности в среде MS Excel»
Вариант
№ 26
Выполнил: ст. III курса гр. | |
Проверил: |
Москва, 2006
1. Постановка задачи.
Исходные данные
При
проведении статистического наблюдения
за деятельностью предприятий
В
проводимом статистическом исследовании
обследованные предприятия
В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.
Исходные данные приведены в таблице 1 с поправкой на вариант.
Таблица 1
Номер предприятия | Среднегодовая стоимость основных производственных фондов, млн. руб. | Выпуск продукции, млн. руб. |
1 | 1372,00 | 1540,00 |
2 | 1638,00 | 1414,00 |
3 | 1694,00 | 1680,00 |
4 | 1792,00 | 1134,00 |
5 | 1120,00 | 1120,00 |
6 | 1890,00 | 1596,00 |
7 | 1946,00 | 2254,00 |
8 | 1428,00 | 1260,00 |
9 | 1778,00 | 2492,00 |
10 | 2072,00 | 1498,00 |
11 | 2282,00 | 1750,00 |
12 | 700,00 | 1512,00 |
13 | 1708,00 | 1862,00 |
14 | 1890,00 | 1736,00 |
15 | 2184,00 | 2814,00 |
16 | 2520,00 | 2254,00 |
17 | 1848,00 | 2114,00 |
18 | 2058,00 | 2366,00 |
19 | 1610,00 | 2086,00 |
20 | 2086,00 | 2520,00 |
21 | 2338,00 | 2072,00 |
22 | 1568,00 | 2268,00 |
23 | 1218,00 | 2324,00 |
24 | 2128,00 | 2352,00 |
25 | 1890,00 | 3136,00 |
26 | 1750,00 | 2394,00 |
27 | 1330,00 | 2674,00 |
28 | 1834,00 | 3080,00 |
29 | 2142,00 | 1596,00 |
30 | 2030,00 | 1862,00 |
31 | 2520,00 | 742,00 |
32 | 1456,00 | 3136,00 |
2.
Выявление и удаление
из выборки аномальных
единиц наблюдения
На основе исходных данных стоится диаграмма рассеяния изучаемых признаков (файл Лаб1). В настоящей лабораторной работе в качестве исходных данных представлены выборочные значения двух признаков – среднегодовая стоимость основных производственных фондов и выпуск продукции. Для выявления аномальных значений этих признаков можно построить график для каждого из признаков в отдельности, однако анализ упростится, если использовать диаграмму рассеивания. Диаграмма рассеивания – это точечный график, осям X и Y которого сопоставлены два изучаемых признака единиц совокупности. Затем проводится визуальный анализ диаграммы рассеивания, где и выявляются аномальные точки, т.е. точки, отстоящие от основной массы точек на существенном расстоянии. Затем эти значения удаляются из таблицы первичных данных (таблица 1)и заносятся в таблицу 2.
Таблица 2
Аномальные единицы наблюдения | ||
Номер предприятия | Среднегодовая стоимость основных производственных фондов, млн. руб. | Выпуск продукции, млн. руб. |
12 | 700,00 | 1512,00 |
31 | 2520,00 | 742,00 |
3.
Оценка описательных
статистических параметров
совокупности
Описательная (дескриптивная) статистика является инструментом статистического описания данных, представляющих всю наблюдаемую совокупность в целом. Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную (а не как выборку из некоторой другой совокупности большего объема).
В данной лабораторной работе рассчитываем следующие статистические показатели совокупности изучаемых признаков:
(среднее) – средняя арифметическая величина признака в выборке, вычисленная по несгруппированным данным;
(стандартная ошибка)– средняя ошибка выборки – среднее квадратичное отклонение выборочной средней от математического ожидания генеральной средней;
Ме (медиана) – значение признака, приходящееся на середину ранжированного ряда выборочных данных;
Мо (мода) – значение признака, повторяющееся в выборке с наибольшей частотой;
(стандартное отклонение) – генеральное
среднее квадратическое
(дисперсия выборки) –
(эксцесс) – коэффициент
(ассиметричность) –
(интервал)– размах вариации в выборке;
(минимум) – минимальное
(максимум) – максимальное значение признака в выборке;
(сумма) – суммарное значение элементов выборки;
(счет) – объем выборки;
(уровень надежности) – предельная ошибка выборки, оцененная с заданным уровнем надежности.
Все значения вышеперечисленных показателей представлены в таблице 3.
Таблица 3
Описательные статистики | |||
По столбцу "Среднегодовая стоимость основных производственных фондов", млн. руб. | По столбцу "Выпуск продукции", млн. руб. | ||
Столбец1 | Столбец2 | ||
Среднее | 1820 | Среднее | 2079,467 |
Стандартная ошибка | 61,82414809 | Стандартная ошибка | 103,9996 |
Медиана | 1841 | Медиана | 2100 |
Мода | 1890 | Мода | 1596 |
Стандартное отклонение | 338,6248051 | Стандартное отклонение | 569,6295 |
Дисперсия выборки | 114666,7586 | Дисперсия выборки | 324477,8 |
Эксцесс | -0,344943844 | Эксцесс | -0,65275 |
Асимметричность | -0,152503649 | Асимметричность | 0,183051 |
Интервал | 1400 | Интервал | 2016 |
Минимум | 1120 | Минимум | 1120 |
Максимум | 2520 | Максимум | 3136 |
Сумма | 54600 | Сумма | 62384 |
Счет | 30 | Счет | 30 |
Уровень надежности(95,4%) | 128,8916668 | Уровень надежности(95,4%) | 216,8196 |
На основе исходных данных и полученных показателей рассчитываются следующие величины (таблица 4):
Выборочное среднее квадратичное отклонение ;
Выборочная дисперсия ;
Выборочное среднее линейное отклонение ;
Коэффициент вариации признака в выборке ;
Коэффициент ассиметрии Пирсона .
Таблица 4
Выборочные показатели вариации и ассиметрии | |||
По столбцу "Среднегодовая стоимость основных производственных фондов", млн. руб. | По столбцу "Выпуск продукции", млн. руб. | ||
Стандартное отклонение | 332,9332265 | Стандартное отклонение | 560,0552 |
Дисперсия | 110844,5333 | Дисперсия | 313661,8 |
Среднее линейное отклонение | 267,8666667 | Среднее линейное отклонение | 466,1689 |
Коэффициент вариации, % | 18,29303443 | Коэффициент вариации, % | 26,93264 |
Коэффициент ассиметрии | -0,21025237 | Коэффициент ассиметрии | 0,863248 |
Построим на основе полученных данных сводную таблицу 5.
Таблица 5
Распределение значений признака по диапазонам рассеяния признака относительно
Границы диапазонов | Количество значений , находящихся в диапазоне | |||
Первый признак | Второй признак | Первый признак | Второй признак | |
21 | 20 | |||
28 | 30 | |||
30 | 30 |
На основе данных определяем их процентное соотношение: по первому признаку 70%, 93,3%, 100%; по второму признаку – 66,7%, 100%, 100%.
В нормально распределенных и близких к ним рядам вероятностные оценки диапазонов рассеяния значений признака таковы:
68,3% войдет в диапазон ;
95,4% попадет в диапазон ;
99,7% появится в диапазоне .
Соотношение известно как правило «трех сигм», и наши расчеты его подтверждают.
Можно еще установить степень расхождения между и , она равняется .
Показатели ассиметрии оценивают смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения. В нормальном и близких к нему распределениях основная масса единиц (почти 70 %) располагается в центральной зоне ряда, в диапазоне ( ). Для оценки симметричности распределения в этом центральном диапазоне служит коэффициент К. Пирсона. При правосторонней ассиметрии (столбец 2), при левосторонней ассиметрии (1 столбец).
Наиболее точным показателем ассиметрии является коэффициент ассиметрии . По оценочной шкале ассиметричности, при (наш случай) – ассиметрия незначительная.
Показатель эксцесса характеризует крутизну кривой распределения – ее заостренность или пологость по сравнению с нормальной кривой. Для оценки расхождения в степени крутизны кривых (при одинаковой силе вариации) применяют коэффициент эексцесса . При , т.е. в нашем случае, вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой является более пологой по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от до .
По рассчитанным значениям можно сделать следующие выводы.
Величина
коэффициента вариации оценивает интенсивность
колебаний вариантов
Для нормальных и близких к нормальному распределений показатель служит индикатором однородности совокупности: принято считать, что при выполнении неравенства совокупность является количественно однородной по данному признаку.
Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel