Характеристика выборочного наблюдения: виды выборки, способы отбора и ошибки выборочного наблюдения

Автор: Пользователь скрыл имя, 19 Марта 2012 в 18:54, курсовая работа

Описание работы

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления. Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития, данные учитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Содержание

Введение 3
1. Общая характеристика выборочного наблюдения 6
2. Ошибки выборки 13
3. Распространение выборочных результатов на генеральную совокупность 19
4. Определение необходимого объема выборки 24
Заключение 31
Список литературы 32

Работа содержит 1 файл

Statistika.doc

— 167.00 Кб (Скачать)

 

 


3. Распространение выборочных результатов на генеральную совокупность

 

Суть случайной выборки состоит в том, что из генеральной  совокупности отбирают нужное количество единиц наудачу, соблюдая принцип случайности. Случайная выборка позволяет дать объективную оценку генеральной совокупности.       

Механическая выборка состоит в том, что отбор единиц в выборочную совокупность из генеральной, разбитой по нейтральному признаку на равные интервалы (группы), производится таким образом, что из каждой такой группы в выборку отбирается лишь одна единица. Чтобы избежать систематической ошибки, отбираться должна единица, которая находится в середине каждой группы. [10, с. 47]

При организации механического отбора единицы совокупности предварительно располагают (обычно в списке) в определенном порядке (например, по алфавиту, местоположению, в порядке возрастания или убывания значений какого – либо показателя, не связанного с изучаемым свойством, и т.д.), после чего отбирают заданное число единиц механически, через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки. Так, при 2 %-ной выборке отбирается и проверяется каждая 50-я единица (1: 0.02), при 5%-ной выборке – каждая 20-я единица (1: 0.05), например, сходящая со станка деталь.

При достаточно большой совокупности механический отбор по точности результатов близок к собственно – случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно – случайной бесповторной выборки.

Механический отбор – это отбор по заранее установленному принципу через определенный интервал. При механическом отборе всю генеральную совокупность делят на равные по числу группы и из каждой группы берут единицу обязательно под одним и тем же номером.      

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка.

Типическая выборка используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.

При обследовании предприятий такими группами могут быть, например, отрасль и подотрасль, формы собственности. Затем из каждой типической группы собственно – случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность. [3, с. 72]

Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании семейных бюджетов рабочих и служащих в отдельных отраслях экономики, производительности труда рабочих предприятия, представленных отдельными группами по квалификации.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Среднюю ошибку выборки находят по формулам: 

Для средней количественного признака    

μx̃ = √ S²i / n                         (повторный отбор);                                                 

μx̃ = √(S²i /n)(1-(n /N))        (бесповторный отбор);                                     

  для доли (альтернативного признака)

μw = √wi (1- wi) / n            (повторный отбор);              

μw = √(wi (1-wi) / n) (1-(n / N))    (бесповторный отбор);          

где S²i – средняя из внутригрупповых дисперсий по выборочной совокупности;

wi(1-wi) – средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.

Типический отбор заключается в том, что сначала генеральная совокупность делится на типические группы  по какому – либо существенному признаку, а затем внутри каждой группы проводится случайная выборка. Ошибка типической выборки  меньше ошибки случайной выборки, а типическая выборка точнее случайной. [11, с. 28]   

Серийная выборка предполагает случайный отбор из генеральной совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с тем, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Применение серийной выборки обусловлено тем, что многие товары для их транспортировки, хранения и продажи  упаковываются в пачки, ящики и т.п. Поэтому при контроле качества упакованного товара рациональнее проверить несколько упаковок (серий), чем из всех упаковок отбирать необходимое количество товара.

Поскольку внутри групп (серии) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:

μx̃ = √ δ²x / r     (повторный отбор);                     

μx̃ = √ δ²x / r (1-(r / R))  (бесповторный отбор);               

где r – число отобранных серий; R – общее число серий.

Межгрупповую дисперсию серийной выборки вычисляют следующим образом:

       δ²x = Σ (x̃i-x̃)² / r ,

где x̃i – средняя i-й серии; x̃ – общая средняя по всей выборочной совокупности.

Средняя ошибка выборки для доли (альтернативного признака) при серийном отборе: 

μw = √δ²w / r            (повторный отбор);                            

μw = √ δ²w / r(1-(r / R))      (бесповторный отбор);                       

Межгрупповую (межсерийную) дисперсию доли серийной выборки определяют по формуле:              

δ²w = Σ(wi-w¯)² / r;                                                                

где wi- доля признака в i-й серии; w¯ - общая доля признака во всей выборочной совокупности. [4, с. 65]

Серийный отбор состоит в том, что отбирают не единицы явления, а серии единиц, и изучают все единицы выбранных серий. Этот отбор применяют тогда, когда серии наиболее однородны.      

В практике статистических обследований помимо рассмотренных ранее способов отбора применяется их комбинация (комбинированный отбор). Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов.

Выборочные средние и относительные величины распространяют на генеральную совокупность с учетом предела их возможной ошибки.

В каждой конкретной выборке расхождение между выборочной средней и генеральной, т.е. |x̃-x¯| может быть меньше средней ошибки выборки μ, равно ей или больше ее.

Причем каждое из этих расхождений имеет различную вероятность (объективную возможность появления события). Поэтому фактические расхождения между выборочной средней и генеральной |x̃-x¯| можно рассматривать как некую предельную ошибку, связанную со средней ошибкой и гарантируемую с определенной вероятностью P.    

Предельную ошибку выборки для средней (Δx̃) при повторном отборе можно рассчитать по формуле:           Δx̃= t*μ x̃ = t √ S² / n,

где t – нормированное отклонение – «коэффициент доверия», зависящий от вероятности, с которой гарантируется предельная ошибка выборки; μx̃ - средняя ошибка выборки.

 

             


4. Определение необходимого объема выборки

 

После того как определены термины и рассмотрены процедуры выбора, остается обсудить последний вопрос: каким образом следует решать, сколько выбрать объектов. Ответ на этот вопрос в значительной степени требует привлечения сложных статистических понятий, которые мы не в состоянии обсуждать в рамках настоящей книги. По этой причине часть из того, о чем говорится в данном разделе, должна быть принята на веру, хотя в конце главы мы все-таки указываем некоторые книги, в которых эти проблемы обсуждаются. Спешим, однако, подчеркнуть, что большинство соображений, лежащих в основе определения необходимого объема выборки, понять достаточно просто и, прежде чем двигаться дальше, стоит уделить им немного внимания.

Чтобы установить необходимый объем выборки следует учесть несколько факторов. Один из наиболее важных – гомогенность – степень близости друг к другу членов данной совокупности с точки зрения изучаемых нами характеристик. Если каждый индивидуум в совокупности в точности такой же, как все остальные, то, выбрав всего лишь одного из них, мы получим действительно репрезентативную выборку. Напротив, если каждый индивидуум в совокупности абсолютно не похож ни на какой другой, то, прежде чем мы сможем утверждать, что у нас имеется репрезентативная выборка, нам потребуется провести перепись всей совокупности. В первом случае совокупность называют полностью гомогенной, во втором–полностью гетерогенной. Разумеется, в действительности большинство совокупностей располагается между этими двумя полюсами. [10, с. 47]

Чем гомогенное данная совокупность, т.е. чем меньше различий между ее членами, тем меньшая по объему выборка необходима для ее представления. Напротив, чем гетерогеннее совокупность, т.е. чем больше различий  между ее членами, тем большая выборка необходима для ее представления [17, с. 175] . Это особенно важно учитывать при стратифицированном формировании выборки, поскольку самим актом стратификации мы создаем подгруппы, более гомогенные, чем совокупность в целом. Таким образом, внутри уровней можно использовать, не теряя при этом репрезентативности, выборки меньшего объема, чем следовало бы для всей совокупности.

Сходным образом, чем больше категорий мы хотим исследовать, тем больше должна быть выборка. Это вполне естественно, поскольку, увеличивая разнообразие и тонкость наших измерений, мы подчеркиваем гетерогенность исследуемой совокупности. Иными словами, чем больше вопросов мы задаем и чем больше типов ответов допускаем, тем больше вероятность того, что мы обнаружим различия между исследуемыми объектами. Чем больше различий между объектами мы принимаем во внимание, тем больше объектов мы должны изучить, чтобы выборка получилась репрезентативной.

Еще одно важное соображение касается степени точности, которая нам требуется. Мы используем выборку для оценки характеристик больших совокупностей, однако любая оценка может содержать ошибку. Какую ошибку выборки мы готовы допустить? Ответ часто зависит от предполагаемого использования результатов. Если мы получаем деньги за то, что проводим опрос общественного мнения для предсказания результатов выборов, в которых участвуют кандидаты с близкими шансами, мы, скорее всего, захотим иметь минимальную величину ошибки. Если же мы политологи и пытаемся раскрыть основные тенденции в области отношений и поступков людей, мы, видимо, согласимся допустить существенно большую величину ошибки. Вообще, чем большая точность нам требуется, тем больше должна быть наша выборка. [15, с. 28]

С этой же проблемой связан и второй вопрос: насколько мы можем быть уверены в правильности нашей оценки величины ошибки выборки? Читателю, недостаточно искушенному в статистике, возможно, непросто понять приводимые в этом случае доводы, однако предлагаемый ниже пример может кое-что прояснить. Здесь существенны следующие моменты. Каждая выборка дает нам некоторую оценку характеристик совокупности, однако вследствие  того, что никакие две выборки не будут в точности одинаковы, эти оценки будут несколько отличаться одна от другой и от оценки совокупности в целом [17, с. 176] . Это последнее отличие и есть ошибка выборки. Большинство выборок данного объема, взятых из одних и тех же совокупностей, будут очень похожи друг на друга и на саму совокупность, однако может случиться и так, что сформированная выборка будет отличаться от прочих. Может оказаться, что входящие в ее состав женщины, пожилые люди, республиканцы, выпускники колледжей и т.п. включены в таком количестве, которое не отражает реальной доли этих групп в соответствующих совокупностях. Такая выборка, естественно, не будет репрезентативной: она выйдет за рамки допустимой величины ошибки.

Проблема заключается в том, что в реальной действительности мы не всегда знаем внутренние параметры совокупности, для оценки которых предназначена наша выборка (зачастую установление таких параметров и является целью исследования); кроме того, мы формируем не множество выборок, а всего лишь одну. И хотя мы сумеем проконтролировать очевидную валидность нашей выборки, проведя сравнение с другими исследованиями той же самой совокупности или совокупности, похожей на данную, мы не можем быть уверены, что наша выборка не случайное исключение, что она нерепрезентативна (это мало вероятно, но возможно). Однако из занятий статистикой нам известно, что вероятность вытащить из горы яблок гнилое, можно снизить, если увеличить объем выборки. Чем больше объектов мы включим, тем выше вероятность того, что будет получена истинно репрезентативная выборка, которая действительно не выйдет за рамки заданной нами величины ошибки.

Наши рассуждения можно сделать менее абстрактными, если рассмотреть краткие характеристики выборок разного объема, представленные в табл. 2. В табл. 2. перечислены минимальные объемы выборок, соответствующие нескольким уровням ошибки выборки, и степени уверенности для случая простой случайной выборки при относительно гетерогенной совокупности объемом более 100 000 объектов послуживших источником для данной таблицы, показывает, что при формировании выборок для меньших совокупностей приводимые цифры могут быть несколько уменьшены, однако при возрастании объема совокупности приводимые значения задают предельный объем выборки. [17,с. 177] 

Информация о работе Характеристика выборочного наблюдения: виды выборки, способы отбора и ошибки выборочного наблюдения