Ошибки выборочного наблюдения. Определение необходимой численности выборки

Автор: Пользователь скрыл имя, 18 Февраля 2013 в 06:25, реферат

Описание работы

Изучение статистических совокупностей, состоящих из множеств единиц, связано с большими трудовыми и материальными затратами.
С давних пор представлялось заманчивым не изучать все единицы совокупности, а отобрать лишь некоторую часть, по которой можно было бы судить о свойствах всей совокупности в целом. Попытки такого рода делались еще в ХVII в.

Содержание

Содержание…………….…………………………………………………………..2
Выборочное наблюдение………...………………………………………....3
Общее понятие о выборочном наблюдении…...………………….…..3
Генеральная совокупность и выборка……………...………………….…..5
Ошибки выборочного наблюдения……………..……………………….…6
Предельная теорема, предельная ошибка…………...……………....10
Определение необходимого объема выборки……….…………………...13
Понятие малой выборки……………………………………….………….13
Заключение…………….……………………………………………………….....16

Работа содержит 1 файл

Реферат статистика.docx

— 98.93 Кб (Скачать)

Примечание. q — доля единиц, не обладающих обследуемым признаком.

Предельной ошибкой выборочного наблюдения называется разность между величиной средней в генеральной совокупности и ее величиной, вычисленной по результатам выборочного наблюдения:

. (2.1)

В курсах математической статистики доказано, что величина предельной ошибки выборки не должна превышать соотношения:

, (2.2)

где величина μ называется средним  квадратическим отклонением выборочной средней от генеральной средней и (средняя ошибка выборки) определяется по зависимости:

, (2.3)

где   — среднее квадратическое отклонение в генеральной совокупности;

n — число наблюдений.

t — коэффициент доверия, параметр, указывающий на конкретное значение вероятности того, на какую величину генеральная средняя будет отличаться от выборочной средней.

Как правило, именно произведение коэффициента доверия на среднюю ошибку выборки и рассматривают в качестве предельной ошибки, что является более строгим и правильным, а разность генерального и выборочного среднего рассматривают просто как ошибку выборки, являющуюся случайной величиной.

В некоторых случаях величину   называют также средней ошибкой выборки и также обозначают μ.

Соотношение между дисперсиями  генеральной и выборочной совокупности выражается формулой:

. (2.4)

Поскольку величина n / n - 1 при достаточно больших n близка к 1, то можно приближенно считать, что выборочная и генеральные дисперсии равны.

Составлены специальные таблицы, связывающие коэффициент доверия t с вероятностью того, что разность между выборочной и генеральной средними не превысит значения средней ошибки выборки μ:

   (2.5)

Из первой строки видно, что с  вероятностью 0,683 можно утверждать, что разность между выборочной и  генеральной средними не превысит одной величины средней ошибки выборки. Другими словами, в 68,3% случаев ошибка репрезентативности не выйдет за пределы ±μ. Далее видно, что чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью (т.е. более достоверно) судят о ее величине.

Доверительный интервал. Зная выборочную среднюю величину признака   и предельную ошибку выборки  , в уточненном только что смысле можно рассчитать границы (пределы), в которых заключена генеральная средняя:

, (2.6)

определяющие доверительный интервал.

 

 

 

  1. Определение необходимого объема выборки.

 

Для определения необходимой численности выборки исследователь должен знать уровень точности выборочной совокупности с определенной вероятностью.

В общем случае необходимая численность  выборки прямо пропорциональна  дисперсии признака и квадрату коэффициента доверия t.

Зависимости для определения необходимого объема выборки для некоторых  способов формирования выборочной совокупности приведены в формуле (2.5).

Пример. Использование зависимостей, приведенных в формуле (2.5).

Для определения средней  длины детали следует провести исследование методом случайного повторного отбора. Какое количество деталей необходимо отобрать, чтобы ошибка выборки не превышала 3 мм с вероятностью 0,997 при  среднем квадратическом отклонении 6 мм? Ошибка и среднее квадратическое отклонение заданы, исходя из технических условий.

При Р = 0,997 → t = 3. Тогда

n = (3× 6) / 3= 36 деталей.

 

 

  1. Понятие малой выборки.

При большом числе единиц выборочной совокупности (n>100) распределение случайных ошибок выборочной средней в соответствии с теоремой А.М. Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.

Однако в практике статистического  исследования в условиях рыночной экономики  все чаще приходится сталкиваться с  малыми выборками.

Малой выборкой называется такое выборочное наблюдение, численность единиц которого не превышает 30.

Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент). Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.

При оценке результатов малой выборки  величина генеральной совокупности уже не используется. Для определения возможных пределов ошибки пользуются распределением Стьюдента и критерием Стьюдента, определяемым по формуле:

, (2.8)

где —   средняя ошибка малой выборки.

Величина σ вычисляется на основе данных выборочного наблюдения. Она  равна:

. (2.9)

Необходимый объем выборки представлен  в таблице 2.

Таблица 2. Необходимый объем выборки для некоторых способов формирования выборочной совокупности

Вид выборочного наблюдения

Повторный отбор

Бесповторный отбор

Собственно случайная выборка

   

а) при определении среднего размера  признака

б) при определении доли признака

Механическая выборка

То же

То же

Типичная выборка:

   

а) при определении среднего размера  признака

б) при определении доли признака

Серийная выборка:

   

а) при определении среднего размера  признака

б) при определении доли признака


В математической теории выборочного  метода сравниваются средние характеристики признаков выборочной и генеральной совокупностей и доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются. Чем больше исследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик. На основании теоремы Чебышева—Ляпунова—Лапласа предельную величину ошибки простой случайной выборки для средней при достаточно большом объеме выборки (n) и повторном отборе можно определить по формуле:

, (2.10)

где   — предельная ошибка, а t — коэффициент доверия из формулы (2.11) см. ниже. Фактически  , где знаменатель дроби весьма близок к S.

Из этой формулы средней ошибки простой случайной выборки видно, что величина ее зависит от изменчивости признака в генеральной совокупности (чем больше вариация признака, тем больше ошибка выборки) и от объема выборки n (чем больше исследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик).

Академик A.M. Ляпунов доказал, что вероятность появления случайной ошибки выборки при достаточно большом ее объеме подчиняется закону нормального распределения. Эта вероятность определяется по формуле:

, (2.11)

численные значения которой уже приводились в формуле (2.5).

Таким образом, величина предельной ошибки выборки может быть установлена с определенной вероятностью. Вероятность появления ошибки, равной или большей утроенной средней ошибки выборки, т.е. Δ ≤ 3μ , крайне мала и равна 0,003 (1 - 0,997). Такие маловероятные события считаются практически невозможными, а потому величину Δ = 3μ можно принять за предел возможной ошибки выборки.

Выборочное наблюдение дает возможность определить среднюю арифметическую выборочной совокупности и величину предельной ошибки этой средней Δ , которая показывает (с определенной вероятностью), насколько выборочная величина может отличаться от генеральной средней в большую или меньшую сторону. Тогда величина генеральной средней будет представлена интервальной оценкой, для которой нижняя граница будет равна ( ), а верхняя граница — ( ), т.е. имеем:

. (2.12)

Интервал, в котором с данной степенью вероятности будет заключена  неизвестная величина оцениваемого параметра, называют доверительным, а вероятность Р — доверительной вероятностью. Чаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия t равен соответственно 1,96 и 2,58. Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю.

 

Заключение

Выборочное  наблюдение широко используется для: 1) статистического оценивания и проверки гипотез; 2) решения производственных и управленческих задач; 3) отраслевых социально-экономических исследований; 4) разрешения задач в сфере предпринимательской деятельности.

Совершенствование теории и практики выборочного наблюдения, все более широкое применение различных сочетаний комбинированного, многоступенчатого отбора, современных  компьютерных технологий информационной обработки в значительной мере расширяют  области использования, скорость получения  и качество результатов выборочного  наблюдения.

 


Информация о работе Ошибки выборочного наблюдения. Определение необходимой численности выборки