Автор: Пользователь скрыл имя, 14 Апреля 2013 в 22:00, курсовая работа
Провожу ранжирование данных таблицы по среднегодовой стоимости основных фондов, т.е. по факторному признаку Х. Здесь же определяю минимальные и максимальные значения факторного и результативного признаков. Результативным признаком У является среднесписочная численность рабочих. Результаты заношу в таблицу 2.
Таблица 6 – Комбинационная таблица.
Группы по Х |
Группы по У |
Кол-во | |||||||
№ |
Границы |
1 |
2 |
3 |
4 |
5 |
6 | ||
нижние и верхние границы | |||||||||
4 |
72,5 |
141 |
209,5 |
278 |
346,5 | ||||
нижняя |
верхняя |
72,5 |
141 |
209,5 |
278 |
346,5 |
415 | ||
1 |
30 |
59,6 |
5 |
0 |
0 |
0 |
1 |
1 |
7 |
2 |
59,6 |
89,3 |
5 |
1 |
0 |
0 |
0 |
0 |
6 |
3 |
89,3 |
118,9 |
4 |
1 |
0 |
0 |
0 |
1 |
6 |
4 |
118,9 |
148,5 |
2 |
5 |
0 |
0 |
0 |
0 |
7 |
5 |
148,5 |
178,1 |
0 |
2 |
1 |
0 |
0 |
0 |
3 |
6 |
178,1 |
208 |
0 |
1 |
0 |
0 |
0 |
0 |
1 |
Итого в группе |
16 |
10 |
1 |
0 |
1 |
2 |
30 |
Вычисляю общие средние арифметические тремя способами:
Нахожу простую среднюю арифметическую по формулам:
Х =
где Х,У – общая средняя арифметическая;
∑Хi, ∑Уi - сумма элементов признака Х;
n – число фирм,
X= ;
У = .
Нахожу общую среднюю арифметическую, взвешенную по центрам интервалов по формулам:
Х =
где Хцк , Уцк– центры интервалов;
∑fk – число фирм.
Х = ;
У = =97,6.
Нахожу общую среднюю арифметическую, взвешенную по групповым средним по формулам:
где Ук, Хк - групповые средние арифметические.
Х = ;
= .
Оцениваю погрешности расчета по формулам:
= ( , %,
= (
где , - значение простой средней арифметической.
по второму способу
= (100,125-100,6)*100/100,6=0,
по третьему способу = (100,6-100,6)*100/100,6= 0%;
по второму способу
=(97,6–87,36)*100/87,36=11,72%
по третьему способу = (87,36-87,36)*100/87,36=0 %.
Наиболее точным методом расчета общих средних арифметических взвешенных является средняя арифметическая как взвешенная по центрам интервалов, так как погрешность между данными, полученными в результате расчетов по этим двум методам меньше половины процента. А при расчете общих средних арифметических как взвешенных по групповым средним появляется наибольшая погрешность. В связи с этим, расчеты, производимые по данному способу, перестают быть достаточно эффективными, и возникает вопрос о целесообразности их применения при проведении статистического анализа в макроэкономических исследованиях и на уровне предприятий. Очевидно, что полученные данные не смогут дать объективных результатов.
1.5. Строю эмпирическую и теоретическую линию регрессии зависимости результативного признака от факторного.
Рисунок 1 – Корреляционное поле и линии регрессии
Так как график эмпирической линии регрессии (ломаная линия) , построенного по средним групповым данным, приближенно можно представить в виде прямой линии, можно рассчитать коэффициент корреляции.
Также теоретическую линию регрессии ищем в виде прямой:
y = a + b x,
где коэффициенты а и b определяем по методу наименьших квадратов для исходных данных по формулам
где N = 30 – объем выборки;
= 100,6 т.р., = 87,36 чел. – средние значения признаков.
b = = 0,003
a = 87,36 –0,003*100,6=87,05
Полученное теоретическое уравнение прямой регрессии имеет вид
По этому уравнению вычислим теоретические значения результативного признака для значений Хmin = 30 и Хmax = 208:
У (х=30) =87,05+0,003*30=87,14;
У(х=208) =87,05+0,003*208=87,674.
Пользуясь этими значениями, строю теоретическую линию регрессии (прямая линия на рис. 1).
1.6. Определяю показатель тесноты связи между признаками, оцениваю его существенность и рассчитываю коэффициент детерминации.
Рассчитываю коэффициент регрессии:
Х*У= =8795,3
= = 0,004
Т.к. коэффициент корреляции больше 0, то связь прямая, теснота связи между признаками слабая.
Расчет коэффициента детерминации провожу по формулам
D = r 2
Коэффициент детерминации показывает, какая доля изменчивости результативного признака обусловлена изменчивостью факторного признака. В данном случае эта доля составляет 0,02%.
1.7 Рассчитываю коэффициенты вариации для факторного и результативного признаков по формулам:
= (44,88/100,6) ·100 % = 44,6 %, что больше 33 %,
следовательно, статистическая совокупность значений по признаку Х не однородна;
= (41,9/87,36) × 100 % = 47,96%, что больше 33 %,
следовательно, статистическая совокупность значений по признаку Y не однородна.
1.8 По данным интервального ряда для факторного признака определяю структурные средние величины (моду, медиану, нижний и верхний децили)
Мода – наиболее часто встречающееся значение признака. В интервальном ряду сначала определяется модальный интервал, то есть тот интервал, который имеет наибольшую частоту (подсчет групповых и накопленных частот приведен в таблице 7).
Таблица 7 - Группировочная таблица для расчета децилей и построения гистограммы и кумуляты по факторному признаку
Интервалы |
Число фирм fk |
Накопленная частота Sk | |
30 |
59,6 |
7 |
7 |
59,6 |
89,3 |
6 |
13 |
89,3 |
118,9 |
6 |
19 |
118,9 |
148,5 |
7 |
26 |
148,5 |
178,1 |
3 |
29 |
178,1 |
208 |
1 |
30 |
В данном случае модальным является интервал (30; 59,6). Значение моды определяется по формуле:
,
ХМо = |
30 |
– нижняя граница модального интервала; |
i = |
29,6 |
– длина модального интервала; |
fМо = |
7 |
– частота модального интервала; |
fМо -1 = |
0 |
– частота интервала, предшествующего модальному; |
fМо+1 = |
6 |
– частота интервала, следующего за модальным. |
где
Медиана – значение признака, которое условно делит ранжированный ряд пополам, и соответствует варианту, стоящему в середине ранжированного ряда. Номер медианы:
Медианным является интервал, в котором сумма накопленных частот превышает половину общего числа наблюдений. В данном случае медианный интервал совпадает с модальным – (89,3; 118,9). Численное значение медианы определяется по формуле:
ХМе = |
89,3 |
– нижняя граница медианного интервала; | |
i = |
29,6 |
– величина медианного интервала; | |
SМе -1 = |
13 |
– накопленная частота интервала, предшествующего медианному; | |
fМе = |
6 |
– частота медианного интервала. |
где
Ме =
Данные расчеты означают, что фирмы, имеющие среднегодовую стоимость ОФ равную 55,9 т.р. будут встречаться чаще других, а количество фирм, имеющих среднегодовую стоимость ОФ меньше и больше 99,1 т.р. будет одинаковым.
Среднее значение нижнего (верхнего) дециля рассчитываем как среднее значение 10% фирм с наименьшими (наибольшими) значениями признаков.
Расчет децилей по интервальному вариационному ряду произвожу по формулам:
где Xd1 и Xd9 – нижние границы интервалов, содержащих нижний дециль и верхний дециль (интервалы определяют по накопленной частоте, первой превышающей 10% численности совокупности для нижнего дециля и 90% - для верхнего дециля);
i – величина интервала, содержащего соответствующий дециль;
Sd1-1 – накопленная частота до интервала, содержащего нижний дециль;
Sd9-1 – накопленная частота до интервала, содержащего верхний дециль;
fd1, fd9 – частоты интервалов, содержащих нижний и верхний децили, соответственно.
Используя данные таблицы 7 нахожу:
d1 = 30 + 29,6 · =42,68 т.р.,
d9 = 167,95 + 29,6 · = 108,75 т.р.
Эти результаты означают, что 10% фирм имеют среднегодовую стоимость ОФ менее 42,68 т.р., а другие 10% фирм (с наибольшей стоимостью ОФ) – более 108,75 т.р.
Построим гистограмму и кумуляту по первому признаку. Построения произведем по данным группировочной таблицы (табл. 7). Результаты построений приведем на рисунке 2 и 3. По рисункам видно, что значения моды и медианы, найденные графическим способом и расчетным путем совпадают.
Рисунок 2 – Гистограмма распределения фирм по среднегодовой стоимости ОФ
Рисунок 3 – Кумулята распределения фирм по среднегодовой стоимости ОФ.
Рассчитываю коэффициент асимметрии по трем формулам:
Аs = (Хобщ-Ме)/ х = (100,6-99,1)/44,88 = 0,03
Аs = (Хобщ-Мо)/ х = (100,6-55,9)/44,88 = 0,99
Аs = , где = ( (Хк-Хобщ)3*fк)/ fк
= ((42,85-100,6)3*7+(70,8-100,6)
Аs = 25487,137/44,883 =0,28, т.к. Аs>0, то асимметрия правосторонняя. Ассиметрия незначительна, так как она меньше 0,25 по абсолютной величине
Степень существенности коэффициента Аs определяю по величине среднеквадратической ошибки:
= 0,41 – асимметрия несущественная и могла возникнуть под влиянием случайных колебаний признака.
Информация о работе Практическая часть курсовой работы по статистике