Анализ статистической совокупности
Курсовая работа, 16 Декабря 2010, автор: пользователь скрыл имя
Описание работы
Цель работы – освоить методику анализа исследования статистической совокупности по предложенному Показателю, используя данные «Российского статистического ежегодника 2008».
В работе рассмотрен порядок проведения вариационного анализа статистической совокупности по исследуемому показателю. Проведена бесповторная выборка и описана процедура её проведения. Выявлены и исследованы особенности проведения корреляционно-регрессионного анализа и анализа рядов динамики. Сделаны выводы на основании произведённых вычислений и графического материала.
Содержание
ВВЕДЕНИЕ 6
1 ЗАДАЧА №1 9
2 ЗАДАЧА №2 12
3 ЗАДАЧА №3 24
4 ЗАДАЧА №4 30
5 ЗАДАЧА №5 38
6 ЗАДАЧА №6 61
ЗАКЛЮЧЕНИЕ 92
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 95
Работа содержит 1 файл
Курсовая по статистике.doc
— 808.50 Кб (Скачать)Также медиану можно найти графически по кумуляте. Для этого находим на оси ординат точку, соответствующую половине накопленных частот (в нашем случае 39,5), проводим через неё прямую, параллельно оси Ох, и от точки её пересечения с кумулятой проводим перпендикуляр к оси х. (рис. 2.4).
Рисунок 2.4 – Графическое нахождение медианы
Мода - это наиболее часто встречающееся значение признака, т.е. значение признака с наибольшей частотой. Для интервального ряда мода находится по формуле:
, (2.3)
где x0 - начальное значение модального интервала,
fMо – частота появления признака в модальном интервале,
fMo-1 – частота в интервале, предшествующем модальному,
fMo+1 – частота в интервале, следующем за модальным,
l – длина интервала.
Модальный интервал – это интервал с наибольшей частотой. Из таблицы 2.3 (столбец «количество субъектов») видно, что модальным интервалом в данном случае является также интервал № 2 с частотой 37 единиц. По формуле рассчитываем значение моды:
Мода, равная 13 622,64 руб., означает не то, что в большинстве субъектов ровно такой объем платных услуг на душу населения, так как в совокупности может и не быть субъектов с таким значением, а то что в большинстве субъектов приблизительно такой объем услуг на душу населения. Также моду можно найти графически по гистограмме (рис. 2.5).
Рисунок 2.5 – Графическое нахождение моды
Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Насколько велики абсолютный и относительный разбросы значений признака оценивают при помощи следующих показателей: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.
Размах
вариации – абсолютная разность между
максимальным и минимальным значениями
признака из имеющихся в изучаемой
совокупности значений. Перед расчетом
размаха вариации следует проверить совокупность
на наличие аномальных значений, но так
как мы уже исключили аномальные значения
в начале задания 2, и построенный интервальный
ряд уже не содержит таких единиц, то рассчитываем
размах по формуле:
R = xmax – xmin
,
(2.4)
где xmax – максимальное значение признака в ряду,
xmin – минимальное значение признака в ряду.
Рассчитаем
размах для данного интервального
ряда:
R
= 46 000 – 4 000 = 42 000.
Таким образом, можно сказать, что амплитуда значений в данном вариационном ряду составляет 42 000 руб.
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. В этом может помочь следующий показатель – среднее линейное отклонение. Он представляет собой средний модуль отклонения значений в совокупности от среднего значения:
, (2.5)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Для того,
чтобы рассчитать этот и другие показатели,
нам потребуется среднее
, (2.6)
где - среднее значение признака в совокупности,
xi – значения признака,
fi – частота появления признака.
За
xi для каждого интервала принимаем
значение, лежащее в середине между верхней
и нижней границей интервала. Таблица
Б.1 с расчетом средней величины приведена
в Приложении Б, итоговое значение:
Вернемся
к расчету среднего линейного
отклонения. Таблица Б.2 с вычислениями
приведена в Приложении Б, итоговое значение:
Это означает, что в среднем объем платных услуг на душу населения по субъектам РФ отклоняется от среднего объема платных услуг на душу населения на 6 331,38 руб.
Рассмотрим третий важный показатель силы вариации – дисперсию. Дисперсия – это средняя величина квадратов отклонений. Дисперсия рассчитывается по формуле:
, (2.7)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Таблица Б.3 c расчетом дисперсии приведена в приложении Б, а ее итоговое значение:
Дисперсия измеряет изменение признака совокупности под влиянием всех факторов, обуславливающих эту вариацию.
Четвертым показателем силы вариации является среднее квадратическое отклонение (СКО). СКО – это обобщенная характеристика вариации признака совокупности. Формула для СКО фактически является квадратом из дисперсии:
, (2.8)
где xi – значения признака,
- среднее значение признака в совокупности,
fi – частота появления признака.
Расчет СКО приведен в приложении, его значение для данного ряда:
Если
фактическое распределение
Для нашего вариационного ряда:
На
основании этого можно
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации к средней арифметической величине признака. Рассмотрим следующие показатели:
- относительный размах вариации
- относительное среднее линейное отклонение
- коэффициент вариации
3 ЗАДАЧА №3
Выдвигаем
гипотезу о нормальном распределении
генеральной совокупности, предполагая,
что оно подчиняется
Фактическое значение χ2 вычисляется по формуле
где fэмп j и fт j – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения. Эмпирическая частота – частота распределения признака в фактическом вариационном ряду, а теоретическая частота определяется по формуле
где l– длина интервала;
σ – среднее квадратическое отклонение признака; fj (t) – плотность вероятности нормального нормированного распределения, определяющаяся по значению нормированного отклонения (t), которое рассчитывается по формуле
Воспользуемся вспомогательной таблицей для расчета среднего значения признака и среднего квадратического отклонения от среднего значения:
Таблица 3.1 – Расчет среднего значения признака и СКО
| хi | fi | хi*fi | |
|
|
| 7000 | 5 | 35000 | 11240,51 | 126348983,0 | 631744913 |
| 13000 | 37 | 481000 | 5240,51 | 27462906,6 | 1016127544 |
| 19000 | 16 | 304000 | 759,49 | 576830,6 | 9229290 |
| 25000 | 12 | 300000 | 6759,49 | 45690754,7 | 548289056 |
| 31000 | 4 | 124000 | 12759,49 | 162804679,0 | 651218715 |
| 37000 | 3 | 111000 | 18759,49 | 351918603,0 | 1055755808 |
| 43000 | 2 | 86000 | 24759,49 | 613032527,0 | 1226065054 |
| х | 79 | 1441000 | х | х | 5138430380 |
Среднее значение признака рассчитываем как среднюю арифметическую взвешенную, так как данные сгруппированы:
х = 1441000 / 79 = 18240,51 руб.
Среднее квадратическое отклонение от среднего значения:
σ = = 8064,95
Рассчитываем значения нормированного отклонения для каждого интервала:
t1 = (7000 - 18240,51) / 8064,95 = -1,39;
t2 = (13000 – 18240,51) / 8064,95 = -0,65 и т.д.
По
рассчитанным значениям нормированного
отклонения по таблице находим
t1 = -1,39 => f(t) = 0,1518; t2 = -0,65 => f(t) = 0,323 и т.д.
Рассчитываем значения теоретической частоты:
f т1 = 79*6000/8064,95*0,1518 = 9;
f т2 = 79*6000/8064,95*0,323 = 19 и т.д.
Расчеты значений теоретической частоты сведены в таблицу 3.2:
Таблица 3.2 – Расчет значений теоретических частот распределения признака
| хi | fi | t | f(t) | f т | |
| 4000-10000 | 7000 | 5 | -1,39 | 0,1518 | 9 |
| 10000-16000 | 13000 | 37 | -0,65 | 0,3230 | 19 |
| 16000-22000 | 19000 | 16 | 0,09 | 0,3973 | 23 |
| 22000-28000 | 25000 | 12 | 0,84 | 0,2803 | 16 |
| 28000-34000 | 31000 | 4 | 1,58 | 0,1145 | 7 |
| 34000-40000 | 37000 | 3 | 2,33 | 0,0264 | 2 |
| 40000-46000 | 43000 | 2 | 3,07 | 0,0036 | 0 |
| Итого: | х | 79 | х | х | 76 |