Анализ статистической совокупности

Автор: Пользователь скрыл имя, 16 Декабря 2010 в 17:40, курсовая работа

Описание работы

Цель работы – освоить методику анализа исследования статистической совокупности по предложенному Показателю, используя данные «Российского статистического ежегодника 2008».
В работе рассмотрен порядок проведения вариационного анализа статистической совокупности по исследуемому показателю. Проведена бесповторная выборка и описана процедура её проведения. Выявлены и исследованы особенности проведения корреляционно-регрессионного анализа и анализа рядов динамики. Сделаны выводы на основании произведённых вычислений и графического материала.

Содержание

ВВЕДЕНИЕ 6
1 ЗАДАЧА №1 9
2 ЗАДАЧА №2 12
3 ЗАДАЧА №3 24
4 ЗАДАЧА №4 30
5 ЗАДАЧА №5 38
6 ЗАДАЧА №6 61
ЗАКЛЮЧЕНИЕ 92
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 95

Скачать полностью (417.69 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

Курсовая по статистике.doc

— 808.50 Кб (Скачать)

Также медиану можно найти графически по кумуляте. Для этого находим на оси ординат точку, соответствующую половине накопленных частот (в нашем случае 39,5), проводим через неё прямую, параллельно оси Ох, и от точки её пересечения с кумулятой проводим перпендикуляр к оси х. (рис. 2.4).

Рисунок 2.4 – Графическое нахождение медианы

Мода - это наиболее часто встречающееся значение признака, т.е. значение признака с наибольшей частотой. Для интервального ряда мода находится по формуле:

, (2.3)

где x₀ - начальное значение модального интервала,

f_Mо – частота появления признака в модальном интервале,

f_Mo-1 – частота в интервале, предшествующем модальному,

f_Mo+1 – частота в интервале, следующем за модальным,

l – длина интервала.

Модальный интервал – это интервал с наибольшей частотой. Из таблицы 2.3 (столбец «количество субъектов») видно, что модальным интервалом в данном случае является также интервал № 2 с частотой 37 единиц. По формуле рассчитываем значение моды:

Мода, равная 13 622,64 руб., означает не то, что в большинстве субъектов ровно такой объем платных услуг на душу населения, так как в совокупности может и не быть субъектов с таким значением, а то что в большинстве субъектов приблизительно такой объем услуг на душу населения. Также моду можно найти графически по гистограмме (рис. 2.5).

Рисунок 2.5 – Графическое нахождение моды

Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Насколько велики абсолютный и относительный разбросы значений признака оценивают при помощи следующих показателей: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.

Размах вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений. Перед расчетом размаха вариации следует проверить совокупность на наличие аномальных значений, но так как мы уже исключили аномальные значения в начале задания 2, и построенный интервальный ряд уже не содержит таких единиц, то рассчитываем размах по формуле:

R = x_max – x_min , (2.4)

где x_max – максимальное значение признака в ряду,

x_min – минимальное значение признака в ряду.

Рассчитаем размах для данного интервального ряда:

R = 46 000 – 4 000 = 42 000.

Таким образом, можно сказать, что амплитуда значений в данном вариационном ряду составляет 42 000 руб.

Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. В этом может помочь следующий показатель – среднее линейное отклонение. Он представляет собой средний модуль отклонения значений в совокупности от среднего значения:

, (2.5)

где x_i – значения признака,

- среднее значение признака в совокупности,

f_i – частота появления признака.

Для того, чтобы рассчитать этот и другие показатели, нам потребуется среднее значение признака в данном интервальном ряду. Среднее значение рассчитываем по формуле средней арифметической взвешенной:

, (2.6)

где - среднее значение признака в совокупности,

x_i – значения признака,

f_i – частота появления признака.

За x_i для каждого интервала принимаем значение, лежащее в середине между верхней и нижней границей интервала. Таблица Б.1 с расчетом средней величины приведена в Приложении Б, итоговое значение:

= 18 240,51.

Вернемся к расчету среднего линейного отклонения. Таблица Б.2 с вычислениями приведена в Приложении Б, итоговое значение:

Это означает, что в среднем объем платных услуг на душу населения по субъектам РФ отклоняется от среднего объема платных услуг на душу населения на 6 331,38 руб.

Рассмотрим третий важный показатель силы вариации – дисперсию. Дисперсия – это средняя величина квадратов отклонений. Дисперсия рассчитывается по формуле:

, (2.7)

где x_i – значения признака,

- среднее значение признака в совокупности,

f_i – частота появления признака.

Таблица Б.3 c расчетом дисперсии приведена в приложении Б, а ее итоговое значение:

Дисперсия измеряет изменение признака совокупности под влиянием всех факторов, обуславливающих эту вариацию.

Четвертым показателем силы вариации является среднее квадратическое отклонение (СКО). СКО – это обобщенная характеристика вариации признака совокупности. Формула для СКО фактически является квадратом из дисперсии:

, (2.8)

где x_i – значения признака,

- среднее значение признака в совокупности,

f_i – частота появления признака.

Расчет СКО приведен в приложении, его значение для данного ряда:

руб.

Если фактическое распределение близко к нормальному, то выполняется равенство:

Для нашего вариационного ряда:

На основании этого можно предположить, что гипотеза о нормальном распределении не подтвердится.

Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации. Они вычисляются как отношения абсолютных показателей силы вариации к средней арифметической величине признака. Рассмотрим следующие показатели:

относительный размах вариации

;

относительное среднее линейное отклонение

;

коэффициент вариации

3 ЗАДАЧА №3

Выдвигаем гипотезу о нормальном распределении генеральной совокупности, предполагая, что оно подчиняется определенному закону. Для проверки гипотезы воспользуемся критерием согласия Пирсона, заключающемся в расчете и оценке обобщенного показателя отклонений фактических значений частоты появления признака от их теоретических значений (показателя χ²). Чем больше величина этих отклонений, тем меньше оснований считать распределение близким к теоретическому.

Фактическое значение χ² вычисляется по формуле

χ² = ∑ (f_{эмп
j} – f_{т j})² / f_{т j} , (3.1)

где f_{эмп j} и f_{т j} – частота попадания признака в j-й интервал соответственно в эмпирическом и теоретическом рядах распределения. Эмпирическая частота – частота распределения признака в фактическом вариационном ряду, а теоретическая частота определяется по формуле

f_{т
j} = (∑f_j) * l/σ * f_j (t), (3.2)

где l– длина интервала;

σ – среднее квадратическое отклонение признака; f_j(t) – плотность вероятности нормального нормированного распределения, определяющаяся по значению нормированного отклонения (t), которое рассчитывается по формуле

t = (x_i – x) / σ. (3.3)

Воспользуемся вспомогательной таблицей для расчета среднего значения признака и среднего квадратического отклонения от среднего значения:

Таблица 3.1 – Расчет среднего значения признака и СКО

х_i	f_i	х_i*f_i	х_i - х	(х_i - х)²	(х_i - х)²*f_i
7000	5	35000	11240,51	126348983,0	631744913
13000	37	481000	5240,51	27462906,6	1016127544
19000	16	304000	759,49	576830,6	9229290
25000	12	300000	6759,49	45690754,7	548289056
31000	4	124000	12759,49	162804679,0	651218715
37000	3	111000	18759,49	351918603,0	1055755808
43000	2	86000	24759,49	613032527,0	1226065054
х	79	1441000	х	х	5138430380

Среднее значение признака рассчитываем как среднюю арифметическую взвешенную, так как данные сгруппированы:

х = 1441000 / 79 = 18240,51 руб.

Среднее квадратическое отклонение от среднего значения:

σ = = 8064,95

Рассчитываем значения нормированного отклонения для каждого интервала:

t₁ = (7000 - 18240,51) / 8064,95 = -1,39;

t₂ = (13000 – 18240,51) / 8064,95 = -0,65 и т.д.

По рассчитанным значениям нормированного отклонения по таблице находим соответствующие значения плотности вероятности нормального распределения:

t₁ = -1,39 => f(t) = 0,1518; t₂ = -0,65 => f(t) = 0,323 и т.д.

Рассчитываем значения теоретической частоты:

f_т1 = 79*6000/8064,95*0,1518 = 9;

f_т2 = 79*6000/8064,95*0,323 = 19 и т.д.

Расчеты значений теоретической частоты сведены в таблицу 3.2:

Таблица 3.2 – Расчет значений теоретических частот распределения признака

	х_i	f_i	t	f(t)	f_т
4000-10000	7000	5	-1,39	0,1518	9
10000-16000	13000	37	-0,65	0,3230	19
16000-22000	19000	16	0,09	0,3973	23
22000-28000	25000	12	0,84	0,2803	16
28000-34000	31000	4	1,58	0,1145	7
34000-40000	37000	3	2,33	0,0264	2
40000-46000	43000	2	3,07	0,0036	0
Итого:	х	79	х	х	76

Информация о работе Анализ статистической совокупности