Автор: Пользователь скрыл имя, 16 Декабря 2010 в 17:40, курсовая работа
Цель работы – освоить методику анализа исследования статистической совокупности по предложенному Показателю, используя данные «Российского статистического ежегодника 2008».
В работе рассмотрен порядок проведения вариационного анализа статистической совокупности по исследуемому показателю. Проведена бесповторная выборка и описана процедура её проведения. Выявлены и исследованы особенности проведения корреляционно-регрессионного анализа и анализа рядов динамики. Сделаны выводы на основании произведённых вычислений и графического материала.
ВВЕДЕНИЕ 6
1 ЗАДАЧА №1 9
2 ЗАДАЧА №2 12
3 ЗАДАЧА №3 24
4 ЗАДАЧА №4 30
5 ЗАДАЧА №5 38
6 ЗАДАЧА №6 61
ЗАКЛЮЧЕНИЕ 92
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 95
Также медиану можно найти графически по кумуляте. Для этого находим на оси ординат точку, соответствующую половине накопленных частот (в нашем случае 39,5), проводим через неё прямую, параллельно оси Ох, и от точки её пересечения с кумулятой проводим перпендикуляр к оси х. (рис. 2.4).
Рисунок 2.4 – Графическое нахождение медианы
Мода - это наиболее часто встречающееся значение признака, т.е. значение признака с наибольшей частотой. Для интервального ряда мода находится по формуле:
, (2.3)
где x0 - начальное значение модального интервала,
fMо – частота появления признака в модальном интервале,
fMo-1 – частота в интервале, предшествующем модальному,
fMo+1 – частота в интервале, следующем за модальным,
l – длина интервала.
Модальный интервал – это интервал с наибольшей частотой. Из таблицы 2.3 (столбец «количество субъектов») видно, что модальным интервалом в данном случае является также интервал № 2 с частотой 37 единиц. По формуле рассчитываем значение моды:
Мода, равная 13 622,64 руб., означает не то, что в большинстве субъектов ровно такой объем платных услуг на душу населения, так как в совокупности может и не быть субъектов с таким значением, а то что в большинстве субъектов приблизительно такой объем услуг на душу населения. Также моду можно найти графически по гистограмме (рис. 2.5).
Рисунок 2.5 – Графическое нахождение моды
Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Насколько велики абсолютный и относительный разбросы значений признака оценивают при помощи следующих показателей: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.
Размах
вариации – абсолютная разность между
максимальным и минимальным значениями
признака из имеющихся в изучаемой
совокупности значений. Перед расчетом
размаха вариации следует проверить совокупность
на наличие аномальных значений, но так
как мы уже исключили аномальные значения
в начале задания 2, и построенный интервальный
ряд уже не содержит таких единиц, то рассчитываем
размах по формуле:
R = xmax – xmin
,
(2.4)
где xmax – максимальное значение признака в ряду,
xmin – минимальное значение признака в ряду.
Рассчитаем
размах для данного интервального
ряда:
R
= 46 000 – 4 000 = 42 000.
Таким образом, можно сказать, что амплитуда значений в данном вариационном ряду составляет 42 000 руб.
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. В этом может помочь следующий показатель – среднее линейное отклонение. Он представляет собой средний модуль отклонения значений в совокупности от среднего значения:
, (2.5)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Для того,
чтобы рассчитать этот и другие показатели,
нам потребуется среднее
, (2.6)
где - среднее значение признака в совокупности,
xi – значения признака,
fi – частота появления признака.
За
xi для каждого интервала принимаем
значение, лежащее в середине между верхней
и нижней границей интервала. Таблица
Б.1 с расчетом средней величины приведена
в Приложении Б, итоговое значение:
Вернемся
к расчету среднего линейного
отклонения. Таблица Б.2 с вычислениями
приведена в Приложении Б, итоговое значение:
Это означает, что в среднем объем платных услуг на душу населения по субъектам РФ отклоняется от среднего объема платных услуг на душу населения на 6 331,38 руб.
Рассмотрим третий важный показатель силы вариации – дисперсию. Дисперсия – это средняя величина квадратов отклонений. Дисперсия рассчитывается по формуле:
, (2.7)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Таблица Б.3 c расчетом дисперсии приведена в приложении Б, а ее итоговое значение:
Дисперсия измеряет изменение признака совокупности под влиянием всех факторов, обуславливающих эту вариацию.
Четвертым показателем силы вариации является среднее квадратическое отклонение (СКО). СКО – это обобщенная характеристика вариации признака совокупности. Формула для СКО фактически является квадратом из дисперсии:
, (2.8)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Расчет СКО приведен в приложении, его значение для данного ряда:
Если
фактическое распределение
Для нашего вариационного ряда:
На
основании этого можно
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации к средней арифметической величине признака. Рассмотрим следующие показатели:
3 ЗАДАЧА №3
Выдвигаем
гипотезу о нормальном распределении
генеральной совокупности, предполагая,
что оно подчиняется
Фактическое значение χ2 вычисляется по формуле
где fэмп j и fт j – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения. Эмпирическая частота – частота распределения признака в фактическом вариационном ряду, а теоретическая частота определяется по формуле
где l– длина интервала;
σ – среднее квадратическое отклонение признака; fj (t) – плотность вероятности нормального нормированного распределения, определяющаяся по значению нормированного отклонения (t), которое рассчитывается по формуле
Воспользуемся вспомогательной таблицей для расчета среднего значения признака и среднего квадратического отклонения от среднего значения:
Таблица 3.1 – Расчет среднего значения признака и СКО
хi | fi | хi*fi | |
|
|
7000 | 5 | 35000 | 11240,51 | 126348983,0 | 631744913 |
13000 | 37 | 481000 | 5240,51 | 27462906,6 | 1016127544 |
19000 | 16 | 304000 | 759,49 | 576830,6 | 9229290 |
25000 | 12 | 300000 | 6759,49 | 45690754,7 | 548289056 |
31000 | 4 | 124000 | 12759,49 | 162804679,0 | 651218715 |
37000 | 3 | 111000 | 18759,49 | 351918603,0 | 1055755808 |
43000 | 2 | 86000 | 24759,49 | 613032527,0 | 1226065054 |
х | 79 | 1441000 | х | х | 5138430380 |
Среднее значение признака рассчитываем как среднюю арифметическую взвешенную, так как данные сгруппированы:
х = 1441000 / 79 = 18240,51 руб.
Среднее квадратическое отклонение от среднего значения:
σ = = 8064,95
Рассчитываем значения нормированного отклонения для каждого интервала:
t1 = (7000 - 18240,51) / 8064,95 = -1,39;
t2 = (13000 – 18240,51) / 8064,95 = -0,65 и т.д.
По
рассчитанным значениям нормированного
отклонения по таблице находим
t1 = -1,39 => f(t) = 0,1518; t2 = -0,65 => f(t) = 0,323 и т.д.
Рассчитываем значения теоретической частоты:
f т1 = 79*6000/8064,95*0,1518 = 9;
f т2 = 79*6000/8064,95*0,323 = 19 и т.д.
Расчеты значений теоретической частоты сведены в таблицу 3.2:
Таблица 3.2 – Расчет значений теоретических частот распределения признака
хi | fi | t | f(t) | f т | |
4000-10000 | 7000 | 5 | -1,39 | 0,1518 | 9 |
10000-16000 | 13000 | 37 | -0,65 | 0,3230 | 19 |
16000-22000 | 19000 | 16 | 0,09 | 0,3973 | 23 |
22000-28000 | 25000 | 12 | 0,84 | 0,2803 | 16 |
28000-34000 | 31000 | 4 | 1,58 | 0,1145 | 7 |
34000-40000 | 37000 | 3 | 2,33 | 0,0264 | 2 |
40000-46000 | 43000 | 2 | 3,07 | 0,0036 | 0 |
Итого: | х | 79 | х | х | 76 |