Автор: Пользователь скрыл имя, 20 Ноября 2012 в 21:59, курс лекций
ТЕМА 1. ПРЕДМЕТ И МЕТОД СТАТИСТИЧЕСКОЙ НАУКИ.
1. Статистика как наука.
2. Предмет статистической науки, основные понятия и характеристики.
3. Метод статистики.
4. Задачи статистики на современном этапе.
Основной исходной формой средних величин является степенная средняя, которая имеет следующий вид:
= простая (не взвешенная )средняя степенная
где - степенная средняя,
Х - варианта признака,
n - число единиц совокупности,
к - показатель степени.
Взвешенная степенная средняя имеет следующий вид:
где f - частота повторения признака в совокупности.
Придавая определенные значения к и преобразуя формулу средней можно получить следующие виды средних величин:
при к = 1 - средняя арифметическая
при к = 0 - средняя геометрическая
при к = -1 средняя гармоническая
при к = -2 - средняя квадратическая.
Средняя арифметическая - наиболее распространенный вид средней, которая может быть выражена при помощи формул:
где Х - варианта признака, n - число единиц в совокупности, f - частота.
В статистической практике бывают случаи, когда при вычислении средней имеются данные об индивидуальных значениях признака (Х) и его общем объеме в совокупности (w), но не известны частоты (f). В таких случаях среднее значение признака исчисляется по формуле средней гармонической, которая представляет собой величину, обратную средней арифметической из обратных значений вариант.
2 Взвешенная средняя гармоническая выражается формулой: где w - объем явления.
Средняя геометрическая величина применяется при расчетах средних темпов роста для рядов динамики и имеет следующий вид:
где П (Х) – произведение, n - число лет
Средняя квадратическая величина применяется для оценки вариации признака от среднего уровня, при расчете среднего и квадратического отклонения и дисперсии, при расчете коэффициента вариации, при проверке правила сложения дисперсии, в дисперсионном анализе, при расчете моментов в рядах распределения, коэффициентов асимметрии и эксцесса и т.д.
Вопрос 3.
Важнейшими свойствами средних величин являются следующие:
Учитывая эти свойства, в статистике применяется расчет средней способом моментов (для вариационного ряда с равными интервалами) по формуле:
где Х - срединное значение
интервального вариационного
i - величина интервала
f - частота повторения признака в совокупности
А - условная величина. За условную величину А обычно принимается варианта, имеющая наибольшую частоту или доминирующее срединное положение в данном ряду.
Эту формулу можно преобразовать следующим образом:
где средняя m1 из значений - называется моментом первого порядка.
Вопрос 4.
Для характеристики структуры совокупности применяются особые показатели, которые можно назвать структурными средними. К таким показателям относятся мода и медиана.
Модой или модальной величиной признака в ряду распределения является варианта, имеющая наибольшую частоту или частность.
В дискретном ряду мода – это варианта с наибольшей частотой (например, пусть мы имеет ряд распределения женской кожаной обуви магазина:
Размер кожанной обуви (х) |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
Число покупателей (f) |
5 |
47 |
60 |
54 |
33 |
12 |
9 |
В данном дискретном ряду модой будет являться 37-й размер обуви, так как он имеет наибольшую частоту покупки (60 раз)).
В интервальном ряду мода определяется по формуле:
где Х0 - нижняя граница или минимальная граница модального интервала.
Модальный интервал – это интервал, который имеет наибольшую частоту;
i - величина модального интервала;
f 1 - частота интервала, предшествующего модальному;
f 2 - частота модального интервала;
f 3 - частота интервала, следующего за модальным.
Медиана – это срединное значение признака, которое делит ряд на равные части. Одна часть единиц варьирующего ряда имеет значение варьирующего признака меньше, чем медиана, другая часть - больше.
Для дискретного ранжированного ряда (т. е. построенного в порядке возрастания или убывания индивидуальных величин) с нечетным числом членов медианой является варианта, расположенная в центре ряда. (Например, пусть мы имеем сведения о стаже работы 5 продавцов магазина: 1, 2, 5, 6, 9 лет. Данный ряд является ранжированным с нечетным числом членов (5 продавцов). Для данного ряда медиана будет равна 5 годам, так как ею в данном ряду является серединная, т.е. 3-я варианта со стажем работы 5 лет.)
Для дискретного ранжированного ряда с четным числом членов медианой будет варианта рассчитанная из двух смежных центральных вариант. (Например, пусть мы имеет сведения о стаже работы 6 продавцов магазина: 1, 3, 4, 5, 7, 9 лет. Данный ряд является ранжированным с четным числом членов (6 продавцов). В этом ряду медиана будет рассчитываться как средняя арифметическая простая из двух смежных центральных вариант, которыми являются стаж работы 4 года и 5 лет. Тогда медиана для данного ряда будет равна (4+5)/2 =4,5 года, т. е. ).
Для интервального вариационного ряда
медиана будет определяться по формуле:
где Х0 - нижняя граница медианного интервала.
Медианный интервал – это интервал, в котором сумма накопленных частот
( ) составляет половину или больше половины ( ) всей суммы частот ряда ( );
i – величина медианного интервала;
- сумма частот ряда;
- сумма накопленных частот
или частностей интервала,
- частота медианнного интервала.
В виду большого разнообразия средних величин выбор формулы в каждом конкретном случае затруднителен, поэтому при выборе формулы средней величины рекомендуется использовать определяющий показатель и на его основе строить уравнение или формулу средней величины. Определяющий показатель - такой обобщающий показатель для данной совокупности, от которого зависит величина средней. При выборе формулы средней величины на основе определяющего показателя необходимо:
ТЕМА 6. ПОКАЗАТЕЛИ ВАРИАЦИИ.
1. Вариация признаков и причины ее порождающие.
2. Показатели вариации и их значение в статистике.
3. Дисперсия, ее свойства
и методы расчета. Теория
Вопрос 1.
Различия индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов, которые по разному сочетаются в каждом отдельном случае.
Средняя величина является обобщающей характеристикой признака изучаемой совокупности, но она не показывает строение совокупности. Средняя величина не дает представления о том, как отдельные значения изучаемого признака группируются вокруг средней, сосредоточены ли они вблизи или значительно отклоняются от нее.
Если отдельные варианты недалеко отстоят от средней, то мы говорим, что данная средняя хорошо представляет изучаемую совокупность. Для того чтобы изучить, как велики эти отклонения, их измеряют при помощи показателей вариации.
Вопрос 2.
Ряд распределения, образующийся в результате накопления статистической информации по значению варьирующего признака, является наиболее фундаментальной характеристикой совокупности. Он дает наиболее полное представление о результатах действия и взаимодействия всех факторов явления (основных и случайных) о сложившейся под их влиянием закономерностей ряда распределения, о свойствах индивидуальных значений признака и их особенностях. Изучение ряда распределения позволяет установить связь единичного и массового, частного и общего, случайного и закономерного.
Для более глубокого изучения ряда распределения варьирующего признака служат следующие показатели вариации:
1. Размах вариации, которых представляет собой разность между максимальным и минимальным значением признака, т.е. амплитуду колебания вариации в ряду распределения.
невзвешенное
взвешенное
Среднее линейное отклонение выражается в тех же единицах измерения, что и сам признак. Среднее линейное отклонение дает приблизительную оценку вариации признака в рядах распределения, т.к. не учитывает колебаний признака в ряду. Для более точной оценки вариации признака в ряду распределения служит дисперсия или средний квадрат отклонения.
простая
взвешенная
Взвешенная дисперсия служит для расчета среднего квадратического отклонения.
простое
взвешенное
Среднее квадратическое отклонение показывает отклонение различных индивидуальных значений признака в ряду распределения от среднего уровня. Измеряется в тех же единицах, что и сам признак. Среднее квадратическое отклонение является более точной характеристикой вариации признака в ряду распределения по сравнению со средне линейным отклонением, т.к. учитывает внутренние колебания признака в ряду распределения.