Автор: Пользователь скрыл имя, 16 Февраля 2013 в 12:45, курс лекций
Лекция 1. Предмет, метод и организация статистики
Понятие «статистика»
Предмет статистики
Методология статистики
Организация статистики, ее основные задачи и принципы в РФ
- частота интервала, следующая за модальным.
Медиана.
Медианой является значение варианты, находящейся в центре упорядоченной по возрастанию значений признака совокупности. Медиана делит вариационный ряд на две равные части. При этом 50% единиц совокупности имеют значение меньше медианного, а 50 % - больше медианного.
Определение медианы в дискретных вариационных рядах
Для определения медианы сначала находят ее порядковый номер по формуле
,
где n – объем совокупности, .
Если n – нечетное число, то медианой будет являться значение варианты непосредственно под медианным номером.
Определение медианы в интервальных вариационных рядах
В интервальных вариационных рядах сначала определяют медианный интервал. Для этого так же, как и в дискретных рядах, рассчитывают номер медианного значения, а затем по накопленной частоте находят, какому интервалу принадлежит медианное значение признака. Непосредственно расчет медианы проводят по формуле:
,
- нижняя граница медианного интервала;
i – величина медианного интервала;
- частота медианного интервала;
- сумма накопленных частот
интервала, предшествующего
19.Понятие о выборочном наблюдении
Статистическая методология исследования массовых явлений различает, как известно, два способа наблюдения в зависимости от полноты охвата объекта: сплошное, когда изучаются все объекты и несплошное, когда изучается часть объектов.
Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому обследованию подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу – по обследуемой части дать характеристику всей совокупности единиц при условии соблюдения всех правил и принципов проведения статистического наблюдения.
При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно 5-10 %).
При этом статистическая совокупность, из которой производится отбор, называется генеральной совокупностью (количество единиц генеральной совокупности обозначается через N). Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой (n - количество единиц выборочной совокупности).
Доля выборочных единиц в объеме генеральной совокупности, выраженная в процентах, называется долей отбора:
Если исследуется
Общепринятое обозначение
Дисперсия единиц количественного признака определяется следующим образом:
- генеральная дисперсия: . Так как генеральная дисперсия по большей части в ходе исследования остается неизвестной, то условно ее принимают равной дисперсии, рассчитываемой по выборочным данным:
- выборочная дисперсия: . При малочисленных выборках формула содержит поправку: .
Наряду с нахождением
Обозначаемая численность
Дисперсия альтернативного признака рассчитывается следующим образом:
- генеральная дисперсия доли: ,
- выборочная дисперсия доли: .
Преимущества выборочного наблюдения:
- быстрота получения результатов обследования. Существенное уменьшение объема наблюдения за счет отбора лишь части единиц совокупности позволяет быстрее собрать информацию и оперативнее получить сводные результаты обследования.
- значительное снижение стоимости обследования. Все затраты на организацию наблюдения делятся на две группы: затраты, не зависящие от числа единиц наблюдения, и затраты, прямо пропорциональные числу единиц обследования. При использовании выборки можно существенно уменьшить вторую группу затрат за счет сокращения объема обследования.
- возможность лучшей организации проведения обследования, и, как следствие, - повышение достоверности полученных результатов. При проведении выборочного наблюдения возникает два типа ошибок: ошибки репрезентативности, обусловленные тем, что наблюдаются не все единицы совокупности, а лишь их часть, и ошибки регистрации, присущие также и сплошному наблюдению. Использование выборки позволяет свести последние к минимуму за счет лучшей организации проведения обследования, т.к. объем наблюдений уменьшается и появляется возможность проконтролировать основные этапы его проведения, тщательнее подготовить, привлечь лучших специалистов, осуществляющих сбор информации.
- возможность расширения программы наблюдения. Уменьшение количества наблюдаемых единиц позволяет изучить их детальнее, используя более широкий перечень вопросов, расширить программу наблюдения, что в некоторых обследованиях далеко немаловажно.
- возможность использования в тех случаях, когда проведение сплошного наблюдения методологически невозможно. Если наблюдение связано с порчей или уничтожением продукции, например, при статистических исследованиях качества продукции (продолжительность горения электрических ламп, исследование крепости нити на разрыв, дегустация продуктов питания и т.д.), выборочное наблюдение становится единственно возможным.
Если генеральная совокупность объектов бесконечно велика и нет возможности обследовать каждую единицу, также прибегают к выборочному методу (например, маркетинговое обследование покупателей, изучение пассажиропотоков и т.д.).
Недостатки выборочного наблюдения:
Наличие ошибки репрезентативности, которая, однако, компенсируется за счет снижения ошибки регистрации (возможность привлечения более квалифицированного персонала, более тщательный контроль собираемых данных и т.п.).
20.Ошибки выборки. Построение доверительных границ для средней и доли
Из одной и той же генеральной совокупности объема N можно извлечь множество различных выборок заданного объема n. Тогда в каждом случае рассчитанные отклонения выборочных характеристик от генеральных будут различны, т.е. различными будут ошибки извлеченных выборок. Если рассчитать среднюю из ошибок всех возможных выборок заданного объема, извлеченных из одной и той же генеральной совокупности, то получим их обобщающую характеристику – среднюю ошибку выборки ( ).
Средняя ошибка выборки показывает, насколько отклоняется в среднем параметр выборочной совокупности от соответствующего параметра генеральной.
В теории выборочного наблюдения выделяют два способа отбора единиц из генеральной совокупности: повторный и бесповторный.
Бесповторным является такой отбор, в результате которого однажды отобранная в выборку единица наблюдения не может быть отобранной из генеральной совокупности во второй раз.
Повторный – отбор, в результате которого попавшая в выборку единица наблюдения вновь возвращается в совокупность и ее можно отобрать во второй, третий раз и т.д.
Предельная ошибка выборки ( ) равна t – кратному числу средних ошибок выборки (в выборочной теории коэффициент t принято называть коэффициентом доверия): .
Уровень предельной ошибки выборки зависит от следующих факторов:
- степени вариации
единиц генеральной
- выбранных схем отбора
(бесповторный отбор дает
- объема выборки;
- уровня доверительной вероятности.
Если объем выборки больше 30, то значение t определяется по таблице нормального распределения, если меньше – по таблице распределения Стьюдента.
Построение доверительных границ для генерального среднего и доли осуществляется следующим образом:
Определение границ генеральной средней и доли состоит из следующих этапов:
- нахождение выборочного значения средней (или доли);
- определение в соответствии с выбранной схемой отбора и видом выборки;
- задание доверительной вероятности Р и определение коэффициента доверия t;
- вычисление предельной ошибки выборки ;
- построение доверительного интервала для среднего (или доли).
21.Виды выборок
В статистике в зависимости от способов отбора различают следующие виды выборок: собственно-случайная, механическая, типическая, серийная, комбинированная, многоступенчатая, многофазная и малая выборки.
3.1 Собственно-случайная выборка
Выборочная совокупность образуется в результате случайного отбора отдельных единиц изучаемой совокупности.
Прежде чем производить
собственно-случайный отбор, необходимо
убедиться, что все без исключения
единицы генеральной
Собственно-случайный отбор может быть как повторным, так и бесповторным.
Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определенная последовательность в расположении единиц.
Средняя ошибка выборки для механического отбора рассчитывается по формулам собственно-случайной выборки при бесповторном способе отбора Типическая выборка
При типической выборке генеральная совокупность расчленяется на однородные типические группы. Из каждой группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. Репрезентативность типической выборки обеспечивается расчленением на качественно однородные группы. Это обуславливает представительство в выборке каждой типологической группы. Группы образовываются либо методом типической группировки единиц генеральной совокупности, либо могут использоваться уже имеющиеся, естественно сложившиеся группы.
Серийной называется выборка, при которой происходит случайный или механический отбор однородных между собой (по отношению к изучаемым признакам) серий или групп объектов, а затем сплошное наблюдение всех единиц, составляющих отобранные серии (группы, гнезда).
Средняя ошибка серийной выборки зависит только от величины среднего квадрата отклонений серийных средних от общей средней (межсерийная дисперсия), т.к. при этом виде отбора отсутствует влияние внутрисерийной (внутигрупповой) дисперсии из-за того, что внутри отобранных гнезд обследуются все единицы без исключения.
Необходимый объем выборки определяется исходя из заданной исследователем величины выборочной ошибки, доверительной вероятности и способа отбора. Однако в некоторых случаях извлечение требуемого числа единиц невозможно или нецелесообразно из-за больших финансовых и трудовых затрат. В этих случаях прибегают к малым выборкам, объем которых может достигать лишь 5 – 6 единиц.
В связи с таким небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при больших выборках, становятся неподходящими и требуют корректировки. Это связано с тем обстоятельством, что при определении выборочных ошибок величину генеральной дисперсии условно принимают равной величине выборочной дисперсии.
22. Оптимальная численность выборки
Перед непосредственным
проведением выборочного
- вид предполагаемой выборки;
- способ отбора (повторный или бесповторный);
- выбор оцениваемого параметра (среднего значения или доли).
Кроме того, нужно заранее определиться со значением доверительной вероятности, устраивающей потребителя информации, и с размером допустимой предельной ошибки выборки. Задание и , как правило, не представляе6т особых трудностей и связано с природой изучаемой совокупности. Однако следует помнить, что большая доверительная вероятность позволяет получать не только более точные результаты, но и значительно увеличивает объем выборки. Аналогичная ситуация с предельной ошибкой выборки: ее снижение в два раза увеличивает размер выборки в четыре раза.