Автор: Пользователь скрыл имя, 14 Октября 2011 в 00:21, контрольная работа
Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта
1. Ряды распределения и их виды…………………………………………………3
2. Задача…………………………………………………………………………….9
Список использованной литературы…………………………………………….11
ПЛАН
1. Ряды
распределения и их виды…………………
2. Задача………………………………………………………………
Список
использованной литературы…………………………………………….11
1. РЯДЫ
РАСПРЕДЕЛЕНИЯ И ИХ ВИДЫ
Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения.
Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав (структуру) изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта1.
В зависимости от признака статистические ряды распределения делятся на:
1. Атрибутивные (качественные), которые образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д.;
2. Вариационные (количественные), которые строятся на основе количественного группировочного признака.
Вариационные ряды состоят из двух элементов: вариант и частот.
Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения. Варианты могут быть положительными и отрицательными, абсолютными и относительными.
Частота
- это численность отдельных
Частости – это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100 %. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.
Вариационные ряды в зависимости от характера вариации подразделяются на:
- дискретные (прерывные)
- интервальные (непрерывные).
- ранжированные.
Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).
Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала1.
При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке.
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака , а затем подсчитывается частота повторения варианта . Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.
Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.
Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:
а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:
R = Xmax – Xmin
Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.
б) Среднее линейное отклонение
где: Х - варианты;
Х - средняя величина;
n - число признаков;
f - частоты.
Линейное отклонение учитывает различия всех единиц изучаемой совокупности.
в)
Дисперсия - показатель вариации, выражающий
средний квадрат отклонений вариант от
средних величин в зависимости от образующего
вариационного фактора.
Показатель дисперсии более объективно отражает меру вариации на практике.
г) Среднее квадратическое отклонение
Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.
д) Показатель вариации.
Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.
Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана1.
Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.
В интервальном ряду распределения мода находится по следующей формуле:
,
где: минимальная граница модального интервала;
- величина модального интервала;
{частоты модального интервала, предшествующего и следующего за ним
Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.
Медиана - варианта, находящаяся в середине ряда распределения.
Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.
В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:
,
где - варианты, находящиеся в середине ряда
В интервальном ряду распределения медиана рассчитывается следующим образом:
,
где: - нижняя граница медианного интервала;
- величина медианного интервала;
- полусумма частот ряда;
- сумма накопленных частот, предшествующих медианному интервалу;
- частота медианного интервала.
Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности1.
Медиана
находит практическое применение в
маркетинговой деятельности вследствие
особого свойства – сумма абсолютных
отклонений чисел ряда от медианы есть
величина наименьшая:
2. ЗАДАЧА
В
результате социологического опроса жителей
крупного города получены следующие
ответы респондентов на вопрос «Останавливались
ли Вы милицией на улице или в общественном
месте?»:
Пол | Ответы респондентов | Итого | |
Нет | Да | ||
Мужской | 455 | 218 | 673 |
Женский | 779 | 73 | 852 |
Итого | 1234 | 291 | 1525 |
ЗАДАНИЕ:
Установите
наличие или отсутствие связи
между полом опрошенного и фактом остановки
его милицией с помощью коэффициентов
ассоциации и контингенции.
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы1.
К
непараметрическим методам
Схематично таблицу, данную в задании можно изобразить следующим образом.
а | b | a + b |
с | d | c + d |
a + c | b + d | a + b + c + d |
где, а – «Нет» у мужчин;
c – «Нет» у женщин;
b – «Да» у мужчин;
d – «Да» у женщин.
а+c – итого ответов «Нет» у мужчин и женщин
b+d – итого ответов «Да» у мужчин и женщин.
а+b – итого ответов мужчин
c + d – итого
ответов женщин
Коэффициент ассоциации можно рассчитать по формуле:
Коэффициент контингенции рассчитывается по формуле
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если КA ≥ 0,5 или Ккон ≥ 0,3. В нашем случае коэффициент ассоциации равен – 0,67, что меньше 0,5, а коэффициент контингенции равен – 0,30, что меньше 0,3.
Таким
образом, связь между полом опрошенного
и фактом остановки его милицией в нашем
случае не имеет место.