Обработка статистических данных предприятия

Автор: Пользователь скрыл имя, 13 Марта 2012 в 18:08, курсовая работа

Описание работы

Цель работы – применение на практике различных статистических методов для обработки информации.
В соответствии с целью поставлены следующие задачи:
1. провести аналитическую группировку, рассчитать структурные средние по данным статотчетности предприятия;
2. оценить динамику изменения показателей;
3. рассчитать показатели вариации;

Содержание

Введение………………………………………………………………….….3

1. Сущность статистических методов обработки информации
1.1. Аналитические группировки……………………………………….4
1.2. Структурные средние……………………………………………….7
1.3. Ряды динамики………………………………………………………8
1.4. Показатели вариации………………………………………….…….10
1.5. Метод корреляционно-регрессионного анализа…………….…….12

2. Статистическая обработка данных предприятия
2.1. Аналитическая группировка данных предприятия
Расчет структурных средних……………………………………….16
2.2. Оценка динамики изменения показателей…………………………18
2.3. Расчет показателей вариации………………………………………..24
2.4. Оценка взаимосвязи между факторным и результативным
признаками методом корреляционно-регрессионного анализа…..26
2.5. Определение объема выпускаемой продукции по периодам…...…32

Заключение……………………………………………………………………35
Список используемой литературы…………………………………………..36

Работа содержит 1 файл

КУРСОВАЯ - копия.doc

— 551.00 Кб (Скачать)

Интервальный ряд:

            уср =  yi / n – равные промежутки времени;            (9.1)

      уср =  yiti /  ti – неравные промежутки времени,        (9.2)

где yi – уровень ряда;

n – число уровней;

ti – длительность интервала времени между уравнениями.

 

Моментный ряд:

уср = (y1 / 2 + y2 + y3 +…+ yn / 2) / (n – 1) – равные промежутки             (10.1)

времени;

уср = ((y1 + y2)  t1 + (y2 + y3)  t2 + …+ (yn – 1 + yn)  tn – 1) /                         (10.2)

/(2  (t1 + t2 + t3 + ..+ tn – 1)) – неравные промежутки времени.

 

5. Средний абсолютный прирост ( уср) – обобщающий показатель скорости изменения явления во времени.

                                      уср = (yn – y1) / (n – 1),                                  (11)

где yn – конечный уровень ряда;

        y1 – начальный уровень ряда.

 

 

1.4             ПОКАЗАТЕЛИ ВАРИАЦИИ

 

Показатели вариации — числовые характеристики статистического распределения, демонстрирующие степень рассеяния наблюдаемых значений измеряемого показателя относительно их среднего значения.

Чем выше показатели вариации, тем больший наблюдается разброс в значениях измеряемого показателя, и тем менее надежны результаты измерений. И наоборот: чем ниже показатели вариации, тем плотнее группируются наблюдаемые значения вблизи среднего значения, и тем достовернее результаты эксперимента.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации, как разницы между максимальным (Xmax ) и минимальным (Xmin) наблюдаемыми значениями признака:

                                         R = Xmax - Xmin,                                        (12)

где  Xmax – максимальное значение совокупности;

Xmin – минимальное значение совокупности.

 

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колебаемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение, которое дает обобщенную характеристику колебаемости признаков совокупности и вычисляется как среднее арифметическое из средних значений отклонений индивидуального значения признака от средней величины:

 

          =   xi - x  / n - для не сгруппированных данных         (13.1)

        = (  xi - x  fi) / fi,- для сгруппированных данных       (13.2)

где xi – уровень ряда;

x – средний уровень ряда;

  n – количество единиц в совокупности.

 

              Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обуславливающих эту вариацию. Представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины:

           2 = (xi - x)2  / n - для сгруппированных данных             (14.1)

     2 = (xi - x)2 fi /  fi  - для не сгруппированных данных        (14.2) 

 

Показатель, равный ,  называется средним квадратическим отклонением. Это обобщающая характеристика размеров вариации признаков в совокупности.

                                       =                                        (15)

Коэффициент вариации определяется по формуле:

                                     Vϭ = (ϭ/хср) * 100 %                                     (16)

 

 

1.5.  Метод корреляционно-регрессионного анализа

 

 

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно  положительными и отрицательными.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения, а коэффициент корреляции проявляется следующим образом:

                      r =  ,                              (17)

где  r – линейный коэффициент корреляции;

xi – индивидуальное значение факторного признака в совокупности;

x – среднее значение факторного признака в совокупности;

yi – индивидуальные значения результативного признака в совокупности;

y – среднее значение результативного признака в совокупности.

 

Значения коэффициента корреляции изменяются в интервале - 1; + 1.

Значение r = - 1 свидетельствует о наличии жестко детерминированной обратно пропорциональной связи между факторами; r = + 1 – соответствует жестко детерминированной связи с прямо пропорциональной зависимостью факторов. Если линейной связи между факторами не наблюдается, r = 0.

Другие значения коэффициента корреляции свидетельствуют о наличии стохастической связи, причем чем ближе (r) к единице, тем связь теснее.

При r  0,3 - связь можно считать слабой; при 0,3  r 20,7 – связь средней тесноты; r  0,7 – тесная.

 

Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi и имеет вид:

                             y = f (x1 x2…xn),                                        (18)

где у – зависимая переменная;

xi – независимая переменная.

 

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т. е. нахождение вида зависимости между результативным показателем и независимыми факторами х1 , х2 …хn ;

-            оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

 

Для реализации регрессионного анализа необходимо выполнение ряда специальных требований:

o     множество значений - х1 , х2 …хn ;

o   у – должен быть независимым ;

o нормальное распределение случайных величин.

При линейной зависимости уравнение регрессии имеет вид:

                                              у = а + в х,                                           (19)

где а, в – параметр уравнения, из которых «в» – коэффициент регрессии.

 

Система нормальных уравнений способом наименьших квадратов для нахождения параметров линейной регрессии выглядит следующим образом:

an + вх = у                            

                                       ах + вх2 = ух,                          (20)

где n - число наблюдений;

параметр a – начальное значение результативного признака;

параметр в – значение характеризует насколько в среднем изменится значение факторного признака.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. СТАТИСТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ ПРЕДПРИЯТИЯ

 

 

2.1. АНАЛИТИЧЕСКАЯ ГРУППИРОВКА. РАССЧЕТ СТРУКТУРНЫХ СРЕДНИХ

 

Проведем аналитическую группировку данных предприятия. За группировочный признак примем фондоотдачу.

 

Определим величину интервала:

Хmax = 1,34 (руб/руб),

Хmin = 0,89 (руб/руб),

N = 15.

R = Хmax - Хmin = 1,34 – 0,89 = 0,45,                                                           (3)

n = 1 + 3,32 *lgN = 1 + 3,32*lg15 = 4,85 ≈ 5,                                            (1)

h = 0,45/5 = 0,09                                                                                          (2)

 

Рассчитаем интервалы:

1.                  [0,89 – 0,98]          0,98; 0,98; 0,89                           

2.                  [0,98 – 1,07]          -                                                   

3.                  [1,07 – 1,16]          1,12; 1,1; 1,1                               

4.                  [1,16 – 1,25]          1,2; 1,23; 1,2; 1,25; 1,2; 1,2      

5.                  [1,25 – 1,34]          1,34; 1,34; 1,3                             

 

Все полученные результаты сведем в таблицу (Талица 2.1.1). Как мы видим, наибольшее среднее значение производительности отмечено в последнем интервале, в группе с показателями фондоотдачи от 1,25 руб/руб до 1,34 руб/руб. В эту группу входят данные за три месяца: февраль и август 2007 года и март 2008.

 

 

 

Таблица 2.1.1 

                 Аналитическая группировка по фондоотдаче

№ п/п

Группы по показателю

фондоотдачи

Кол-во

Средние значения

единиц

%

ПТ

ФВ

1

0,89 – 0,98

3

20

0,681

5,6

2

0,98 – 1,07

-

-

-

-

3

1,07 – 1,16

3

20

0,750

5,5

4

1,16 – 1,25

6

40

0,714

5,4

5

1,25 – 1,34

3

20

0,753

5,7

Информация о работе Обработка статистических данных предприятия