Практическая часть курсовой работы по статистике

Автор: Пользователь скрыл имя, 14 Апреля 2013 в 22:00, курсовая работа

Описание работы

Провожу ранжирование данных таблицы по среднегодовой стоимости основных фондов, т.е. по факторному признаку Х. Здесь же определяю минимальные и максимальные значения факторного и результативного признаков. Результативным признаком У является среднесписочная численность рабочих. Результаты заношу в таблицу 2.

Работа содержит 1 файл

Моя статистика курсак.doc

— 1.13 Мб (Скачать)

 

Таблица 6 – Комбинационная таблица.

Группы по Х

Группы по У

Кол-во

Границы

1

2

3

4

5

6

нижние и верхние  границы

4

72,5

141

209,5

278

346,5

нижняя

верхняя

72,5

141

209,5

278

346,5

415

1

30

59,6

5

0

0

0

1

1

7

2

59,6

89,3

5

1

0

0

0

0

6

3

89,3

118,9

4

1

0

0

0

1

6

4

118,9

148,5

2

5

0

0

0

0

7

5

148,5

178,1

0

2

1

0

0

0

3

6

178,1

208

0

1

0

0

0

0

1

Итого в группе

16

10

1

0

1

2

30


Вычисляю общие средние арифметические тремя способами:

Нахожу простую  среднюю арифметическую по формулам:

Х =

  и У =

где Х,У – общая средняя арифметическая;

      ∑Хi, ∑Уi - сумма элементов признака Х;

      n – число фирм,

X= ;

У = .

Нахожу общую среднюю  арифметическую, взвешенную по центрам  интервалов по формулам:

Х =

  и У =
,

где Хцк , Уцк– центры интервалов;

      ∑fk – число фирм.

Х = ;

У = =97,6.

Нахожу общую среднюю  арифметическую, взвешенную по групповым  средним  по формулам:

 Х =
  и У =
,

где  Ук, Хк  - групповые средние арифметические.

Х = ;

= .

 Оцениваю погрешности расчета по формулам:

= ( , %,

= (

где , - значение простой средней арифметической.

по второму способу = (100,125-100,6)*100/100,6=0,47%;

по третьему способу = (100,6-100,6)*100/100,6= 0%;

по второму способу  =(97,6–87,36)*100/87,36=11,72%;

по третьему способу = (87,36-87,36)*100/87,36=0 %.

Наиболее точным методом расчета общих средних арифметических взвешенных является средняя арифметическая как взвешенная по центрам интервалов, так как погрешность между данными, полученными в результате расчетов по этим двум методам меньше половины процента. А при расчете общих средних арифметических как взвешенных по групповым средним появляется наибольшая погрешность. В связи с этим, расчеты, производимые по данному способу, перестают быть достаточно эффективными, и возникает вопрос о целесообразности их применения при проведении статистического анализа в макроэкономических исследованиях и на уровне предприятий. Очевидно, что полученные данные не смогут дать объективных результатов.

1.5. Строю эмпирическую и теоретическую линию регрессии зависимости результативного признака от факторного.

Рисунок 1 – Корреляционное поле и линии регрессии

Так как график  эмпирической линии регрессии (ломаная линия) , построенного по средним групповым данным, приближенно можно представить в виде прямой линии, можно рассчитать коэффициент корреляции.

Также теоретическую линию регрессии ищем в виде прямой:   

y = a + b x,

где коэффициенты а и b определяем по методу наименьших квадратов для исходных данных по формулам

                                             ,                   

,

где N = 30 – объем выборки;

= 100,6 т.р., = 87,36 чел. – средние значения признаков.

b = = 0,003

      a = 87,36 –0,003*100,6=87,05

Полученное теоретическое уравнение прямой регрессии имеет вид

                                                     У = 87,05 +0,003 ·Хк.

По этому уравнению  вычислим теоретические значения результативного  признака для значений Хmin = 30 и Хmax = 208:

У (х=30) =87,05+0,003*30=87,14;

У(х=208) =87,05+0,003*208=87,674.

Пользуясь этими значениями, строю теоретическую линию регрессии (прямая линия на рис. 1).

1.6. Определяю показатель тесноты связи между признаками, оцениваю его существенность и рассчитываю коэффициент детерминации.

    Рассчитываю  коэффициент регрессии:

=44,88

=
= 41,9

Х*У= =8795,3

                                 = = 0,004

Т.к. коэффициент корреляции больше 0, то связь прямая, теснота связи между признаками слабая.

Расчет коэффициента детерминации провожу по формулам

D =  r 2

                                                   D = 0,0042 =  0,000016≈0,00002

Коэффициент детерминации показывает, какая доля изменчивости  результативного признака обусловлена изменчивостью факторного признака. В данном случае эта доля составляет 0,02%.

       1.7 Рассчитываю коэффициенты вариации для факторного и результативного признаков по формулам:

                    = (44,88/100,6) ·100 % = 44,6 %,  что больше 33 %,

следовательно, статистическая совокупность значений по признаку Х не однородна;

           = (41,9/87,36) × 100 % = 47,96%,   что больше 33 %,

следовательно, статистическая совокупность значений по признаку Y не однородна.

1.8 По данным интервального ряда для факторного признака определяю структурные средние величины (моду, медиану, нижний и верхний децили)

          Мода – наиболее часто встречающееся значение признака. В интервальном ряду  сначала определяется  модальный  интервал,  то  есть  тот интервал, который имеет наибольшую  частоту (подсчет групповых и накопленных частот приведен в таблице 7).

Таблица 7 - Группировочная таблица для расчета децилей и построения гистограммы и кумуляты по факторному признаку

Интервалы

Число фирм fk

Накопленная частота Sk

30

59,6

7

7

59,6

89,3

6

13

89,3

118,9

6

19

118,9

148,5

7

26

148,5

178,1

3

29

178,1

208

1

30


В  данном  случае модальным является интервал (30; 59,6). Значение моды определяется по формуле:

                                        ,           

ХМо =

30

– нижняя граница модального интервала;

i =

29,6

– длина модального интервала;

fМо =

7

– частота модального интервала;

fМо -1 =

0

– частота интервала, предшествующего модальному;

fМо+1 =

6

– частота интервала, следующего за модальным.




где

 
                                Мо = = 55,9 т.р

Медиана – значение признака, которое условно делит ранжированный ряд пополам, и соответствует варианту, стоящему в середине ранжированного ряда. Номер медианы:

                                                                                                   

  

                           

Медианным является интервал, в котором сумма накопленных частот превышает половину общего числа наблюдений. В данном случае медианный интервал совпадает с модальным – (89,3; 118,9). Численное значение медианы определяется по формуле:


              

,                                        

ХМе =

89,3

– нижняя граница медианного интервала;

i =

29,6

– величина медианного интервала;

SМе -1 =

13

– накопленная частота  интервала, предшествующего медианному;

fМе =

6

– частота медианного интервала.




 

где 
Ме =

Данные расчеты означают, что фирмы, имеющие среднегодовую стоимость ОФ равную 55,9 т.р. будут встречаться чаще других, а количество фирм, имеющих среднегодовую стоимость ОФ меньше и больше 99,1 т.р. будет одинаковым.

Среднее значение нижнего (верхнего) дециля рассчитываем как среднее  значение 10% фирм с наименьшими (наибольшими) значениями признаков.

Расчет децилей по интервальному  вариационному ряду произвожу по формулам:

                                   ;                             

                                   ,                                         

где Xd1 и Xd9 – нижние границы интервалов, содержащих нижний дециль и верхний дециль  (интервалы определяют по накопленной частоте, первой превышающей 10% численности совокупности для нижнего дециля и 90% - для верхнего дециля);

i – величина интервала, содержащего соответствующий дециль;

Sd1-1 – накопленная частота до интервала, содержащего нижний дециль;

Sd9-1 – накопленная частота до интервала, содержащего верхний дециль;

     fd1, fd9 – частоты интервалов, содержащих нижний и верхний децили, соответственно.

Используя данные таблицы 7 нахожу:

                           d1 = 30 + 29,6 · =42,68 т.р.,

                          d9 = 167,95 + 29,6 · = 108,75 т.р.

Эти результаты означают, что 10% фирм  имеют среднегодовую стоимость ОФ менее 42,68 т.р., а другие 10% фирм (с наибольшей стоимостью ОФ) – более 108,75 т.р.

Построим гистограмму  и кумуляту по первому признаку. Построения произведем по данным группировочной таблицы (табл. 7). Результаты построений приведем на рисунке 2 и 3. По рисункам видно, что значения моды и медианы, найденные графическим способом и расчетным путем совпадают.

Рисунок 2 – Гистограмма  распределения фирм по среднегодовой  стоимости ОФ

Рисунок 3 – Кумулята распределения фирм по  среднегодовой стоимости ОФ.

Рассчитываю коэффициент асимметрии по трем формулам:

Аs = (Хобщ-Ме)/ х = (100,6-99,1)/44,88 = 0,03

Аs = (Хобщ-Мо)/ х = (100,6-55,9)/44,88 = 0,99

Аs = , где = ( (Хк-Хобщ)3*fк)/

 = ((42,85-100,6)3*7+(70,8-100,6)3*6+(110,1-100,6)3*6+(133,14-100,6)3*7+(164,6-100,6)3*3+(208,00-100,6)3*1)/30 = 25487,137

Аs = 25487,137/44,883 =0,28, т.к. Аs>0, то асимметрия правосторонняя. Ассиметрия незначительна, так как она меньше 0,25 по абсолютной величине

Степень существенности коэффициента Аs определяю по величине среднеквадратической ошибки:

= 0,41 – асимметрия несущественная и могла возникнуть под влиянием случайных колебаний признака.

Информация о работе Практическая часть курсовой работы по статистике