Выборочное наблюдение

Автор: Пользователь скрыл имя, 19 Февраля 2012 в 10:07, реферат

Описание работы

Многоаспектность темы «Выборочное наблюдение» предопределяет рассмотрение выборочных статистических показателей, как с точки зрения получения первичных данных, необходимых для их расчета, так и с точки зрения методов исчисления, оценки репрезентативности, способов распространения на генеральную совокупность.

Работа содержит 1 файл

Лекция. Выборочное наблюдение.doc

— 160.00 Кб (Скачать)

     Особенностью  и преимуществом выборочного  метода по сравнению с другими  видами несплошного наблюдения является то, что по характеристикам отобранной части единиц можно судить о характеристиках  всей совокупности (распространяя результаты выборки на всю совокупность).

     В связи с тем, что отобранная для обследования часть совокупности имеет по изучаемому признаку иную структуру, чем совокупность в целом, выборочная совокупность недостаточно точно воспроизводит всю совокупность.. Поэтому при несплошном наблюдении (при выборочном), кроме ошибок регистрации возможны так называемые ошибки представительства. В результате обобщающие характеристики отобранной части(выборочной) более или менее существенно отличаются от обобщающих характеристик всей ( генеральной) совокупности. Соответственно, распространение результатов выборки на генеральную совокупность связано с ошибкой, называемой ошибкой репрезентативности (представительства).

     Ошибки  репрезентативности могут быть систематическими или случайными. Систематические ошибки возникают тогда, когда нарушены принципы отбора (принцип случайности отбора, его тенденциозность). Случайные ошибки возможны и при совершенно правильно организованном отборе за счет того, что случайно могут оказаться отобранными единицы с характеристиками, в среднем отличными от всей совокупности. Случайные ошибки репрезентативности могут быть доведены до незначительных размеров, их величину и пределы можно определить с достаточной точностью на основании закона Больших чисел с использованием, так называемых, предельных теорем теории вероятностей.

     Предельные  теоремы теории вероятностей выражают основное свойство выборки: если численность выборки достаточно велика, то выборочные характеристики достаточно точно воспроизводят генеральные характеристики. Возможные пределы отклонений выборочной доли и выборочной средней от  доли и средней в генеральной совокупности носят название ошибки выборки. Ошибка выборки зависит от ряда факторов:

  • степени вариации изучаемого признака,
  • численности выборки,
  • методов отбора единиц в выборочную совокупность,
  • принятого уровня достоверности результата исследования.

     Теорема Чебышева П.Л. применительно к выборочному  наблюдению утверждает, что ошибка репрезентативности – разность между выборочной средней и генеральной средней – при достаточно большом числе наблюдений будет сколь угодно малой, то есть 

     где

     | | - абсолютная величина расхождения между генеральной средней и выборочной средней, представляющая ошибку репрезентативности,

      - среднее квадратическое отклонение  вариантов выборочной средней  от  генеральной средней ( средняя  ошибка выборки),

     t - коэффициент доверия, зависящий от вероятности отклонений выборочной средней от генеральной средней Р(t).

     Средняя ошибка выборки (мю) показывает количественную меру возможных отклонений обобщающих характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.

     Величина средней ошибки выборочной средней ( ) равна корню квадратному из дисперсии признака, деленной на численность выборочной совокупности, то есть

     Размер  средней ошибки выборочной доли ( ) равен корню квадратному из дисперсии альтернативного признака в выборочной совокупности, деленной на численность выборочной совокупности, или

     Приведенные формулы исходят из схемы, так  называемой, повторной выборки, суть которой в том, что та или иная единица совокупности, попавшая в выборку, после регистрации снова возвращается в генеральную совокупность, и она при отборе других единиц может снова попасть в выборку.

     Часто выборку организуют по схеме бесповторной выборки, при которой единица  совокупности, попавшая в выборку, в дальнейшем уже в отборе не участвует, а численность единиц генеральной совокупности в процессе выборки сокращается.

     При бесповторной выборке в приведенные выше формулы средней ошибки выборки следует добавить дополнительный множитель в подкоренное выражение, равный разности между единицей и долей отобранных единиц в генеральной совокупности (_ )

     Тогда формулы средней ошибки выборки для бесповторного отбора примут вид:

     для средней    ,   для доли   

     Ошибка выборки при бесповторном отборе всегда будет меньше, чем при повторном отборе.

     Приведенные формулы ошибки выборки(μ) характеризуют среднюю величину отклонения сводных характеристик( средней или доли признака) выборочной и генеральной совокупностей.

     Однако  то, что генеральная средняя (или  генеральная доля) не выйдет за определенные пределы, можно утверждать не с абсолютной достоверностью, а лишь с определенной степенью вероятности, на величину которой  указывает коэффициент доверия  (t).

     Следовательно, с определенной степенью вероятности можно утверждать, что отклонения выборочных характеристик от генеральных не превысят некоторой величины, которая называется предельной ошибкой выборки ().Предельная ошибка выборки равна произведению средней ошибки выборки (μ) на коэффициент доверия (t), зависящий от вероятности Р(t), с которой можно гарантировать величину предельной ошибки.

     Математически это выразится равенством: ∆=μ*t

     С увеличением t возрастает вероятность нашего утверждения, но вместе с тем увеличивается и величина ошибки. То есть, чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью можно установить ее величину.

     Из  теоремы Ляпунова А.М. следует, что  вероятность отклонений Р(t). при достаточно большом числе отобранных единиц подчиняется  закону нормального распределения и при разных значениях t (связь между t и вероятностью) может быть определена по соответствующей формуле:

     Значения  интеграла при разных величинах  t табулированы и даются в специальных таблицах. Наиболее часто используемые при проведении выборочного обследования  вероятности для некоторых t:

     при  t= 1    P(t) =  0,683,         при  t= 1,5     Р(t) =  0,866 , 

     при  t= 2    Р(t) =  0,954,         при  t= 2,5     Р(t) =  0,988, 

     при  t= 3    Р(t) =  0,997,          при  t= 3,5     Р(t) =  0,999, 

     Доверительное число t указывает, что расхождение между характеристиками выборочной и генеральной совокупностей не превысит кратную ему среднюю ошибку выборки «μ».

     Например, если t=2, то расхождение между выборочной средней и генеральной средней не превысит 2мю. Или это же выразим иначе: с вероятностью 0,954 можно утверждать, что разность между выборочной и генеральной средними не превысит двукратной величины средней ошибки выборки. То есть, в 954 случаях из 1000 ошибка репрезентативности не выйдет за пределы .

     Аналогично,  при t=3 это означает: что с вероятностью 0,997, то есть близкой к достоверности, можно ожидать, что разность между выборочной и генеральной характеристиками не превзойдет трехкратной средней ошибки выборки.

     На  основе формул предельной ошибки могут  быть решены следующие задачи:

     1.Определение доверительных пределов генеральной средней (или доли) с заданной вероятностью.

     Доверительные интервалы (пределы) будут выражаться следующим образом:

для генеральной  средней   -∆ +∆

для генеральной  доли   -∆ ≤р≤ +∆  

     2. Определение вероятности того, что расхождение между выборочными и генеральными характеристиками не превзойдет определенную заданную величину (то есть определение доверительной вероятности).

     Иногда  при расчете выборочных характеристик  требуется решить обратную задачу –  определить вероятность допуска  той или иной ошибки, иначе, отклонения от соответствующих характеристик  генеральной совокупности не более, чем на заданную величину, которую можно рассматривать как предельную ошибку выборки ∆= - или ∆= р-

     Поскольку вероятность является функцией t, то необходимо сначала по исходным данным рассчитать коэффициент кратности (доверия) t по формуле . А затем по таблице определить соответствующую ему вероятность   Р(t ).

     3. Определение необходимой численности (объема) выборки, которая с определенной вероятностью обеспечит заданную точность выборочных показателей.

     При проектировании выборочного наблюдения необходимая численность выборки  определяется исходя из допустимой ошибки при выборочном наблюдении, вероятности, с которой нужно гарантировать величину устанавливаемой ошибки, и способа отбора. Необходимая численность выборки при измерении средней равна среднему квадрату отклонения, деленному на квадрат заданной точности.  Формула численности выборки для повторного отбора: . Если формула содержит в себе коэффициент t, то она приобретает вид:

     Необходимая численность выборки при определении  доли в случае повторного отбора равна доле, умноженной на дополнение ее до единицы и деленной на квадрат заданной точности. Соответственно, формула имеет вид: . Или с использованием коэффициента доверия t:

                                                          

     Аналогично  для бесповторного отбора формула определения численности выборки при измерении:

     средней    ,    доли   

     Поскольку при определении численности  планируемого выборочного обследования мера колеблемости изучаемого признака ( ) и доля альтернативного признака ( р) пока еще не известны, то их величины принимают либо на основании предыдущего опыта ( предыдущих выборок), либо на основании предположений.  Также меру колеблемости многовариантного признака(σ) можно найти приближенно по величине предполагаемого размаха вариации (R) формуле:  σ= R/ 6, поскольку с вероятностью 0,997 можно утверждать, что размах вариации укладывается при нормальном распределении признака в 6σ.

     Аналогично, если доля альтернативного признака неизвестна хотя бы приблизительно, то она принимается равной 0,5 и дает величину дисперсии, равной 0,25. 

     Рассмотренные выше формулы средней и предельной ошибок выборки  приведены применительно к собственно-случайной выборке и ее разновидности – механической выборке. Для типической и серийной выборок эти формулы видоизменяются, конкретизируются в соответствии с особенностями каждого метода.

     Так, при типической (районированной) выборке  генеральная совокупность  делится  на группы по определенному признаку, и далее из каждой группы производится случайный отбор единиц. В результате в типическую выборку должны обязательно попасть представители всех групп, что не может иметь места при случайном отборе. Поэтому средняя ошибка типической выборки будет зависеть не от общей дисперсии( ), а от средней из  типической выборки групп .

     Соответственно, средняя ошибка пропорциональной  типической  выборки определяется по формулам:   

     при повторной выборке    ,  

     при бесповторной выборке 

     Поскольку из правила сложения дисперсий следует, что средняя из внутригрупповых  дисперсий  < меньше общей дисперсии, то ошибка типического отбора меньше ошибки случайной отбора, а типическая  выборка точнее случайной.

     Несколько видоизменяются формулы ошибки выборки  и при серийном отборе. Поскольку  вместо случайного отбора единиц совокупности осуществляется отбор групп (серий, гнезд) с последующим сплошным обследованием  внутри отобранных серий, то в связи  с этим точность серийной выборки зависит не от величины общей дисперсии, а от межсерийной  дисперсии. Поэтому средняя ошибка выборки для средней и доли при серийном отборе с равновеликими сериями определяется по следующим формулам:

Информация о работе Выборочное наблюдение