Автор: Пользователь скрыл имя, 13 Марта 2012 в 08:52, контрольная работа
Статистическая сводка - это научно организованная обработка материалов наблюдения, включающая в себя систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет производных показателей (средних, относительных величин).
где -квадрат ошибки репрезентативности для i-й выборки;
- число выборок с одинаковым значением выборочной средней.
Среднее квадратическое отклонение выборочных средних от генеральной средней называется средней ошибкой выборочной средней:
Поскольку, как правило, генеральная средняя μ неизвестна, этой формулой нельзя воспользоваться. Кроме того, в социально-экономических исследованиях выборки из одной и той же совокупности не проводятся многократно. Используют следующее соотношение: квадрат средней ошибки (дисперсия выборочных средних) прямо пропорционален дисперсии признака x генеральной совокупности σ2 и обратно пропорционален объему выборки п:
Соответственно средняя ошибка выборочной средней равна:
Следовательно, средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности и тем меньше, чем больше объем выборки.
Таким образом, можно утверждать, что отклонение выборочной средней от генеральной средней μ в среднем равно ±. Ошибка конкретной выборки может принимать различные значения, но отношение ее к средней ошибке практически не превышает ±3, если величина п достаточно большая (n > 100). Отношение ошибки конкретной выборки к средней квадратической ошибке называется нормированным отклонением и обозначается как t:
Распределение нормированного
отклонения выборочной средней от генеральной
средней при численности
где f(t) - плотность вероятности;
σ - среднее квадратическое отклонение значений переменной х от средней в генеральной совокупности; π: и е - математические константы (π = 3,14, e = 2, 718).
Поскольку средняя нормированных отклонений t=0, дисперсия = 1, т.е. σ=1, выражение может быть записано как
Уравнение называют стандартным уравнением нормальной кривой. Величина f(t) достигает максимума при t=0, в этом случае = 1, По мере увеличения t величина
-3 -2 -1 0 +1 +2 +3
Рис.1 Распределение ошибок выборочных средних
уменьшается и соответственно уменьшается f(t). На рис. 1 приведен график кривой нормального распределения стандартизованных ошибок выборочных средних, t. Ординаты на графике соответствуют плотностям вероятностей притом или ином значении t. Для того чтобы определить вероятность значений в интервале от t1 до t2. следует найти отношение части площади кривой, заключенной между ординатами, соответствующими t1 и t2, ко всей площади кривой. Вся площадь под кривой нормального распределения вероятностей принимается за единицу.
Уравнение Лапласа—Гаусса предполагает непрерывное изменение t и неограниченное возрастание п. Поэтому площадь нормальной кривой, заключенную между ординатами t1 и t2, определяют, интегрируя функцию.
Имеются таблицы, которые содержат значения вероятностей для нормированных отклонений t или для интервалов от t1 до t2.
На пересечении строк и граф таблицы интеграла вероятностей находится значение вероятности F(t), соответствующее данному значению t. Для краткости записи в таблице приводятся только десятичные знаки вероятности, следовательно, к табличному значению F(t) надо приписывать нуль целых. Например, чтобы определить, какая вероятность соответствует t=1,96, надо взять строку 1,9 и графу 6 и на их пересечении прочитать значение вероятности, добавив перед первым знаком нуль целых. Если t= 1,96, то F(t)=0,9500. По мере увеличения t (уже при t = ±3) значение интеграла вероятностей приближается к единице. Чем шире пределы t, тем большая площадь под кривой охватывается ординатами, восстановленными из соответствующих значений t. Поскольку вероятность — это отношение части площади под кривой, заключенной между ординатами, ко всей площади, соответственно возрастает и вероятность.
Распределение ошибок выборочных средних подчиняется закону нормального распределения или приближается к нему даже в случаях, когда генеральная совокупность имеет иную форму распределения.
Из формулы следует, что отклонение выборочной средней от генеральной средней равно:
Нормированное отклонение t может быть установлено по таблице. Для этого необходимо принять определенный уровень вероятности суждения о точности данной выборки.
Вероятность, которая принимается при расчете ошибки выборочной характеристики, называют доверительной. Чаще всего принимают доверительную вероятность равной 0,95, 0,954, 0,997 или даже 0,999. Уровень доверительной вероятности 0,95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы; при вероятности 0,954 — в 46 случаях из 1000, при 0,997 — в 3 случаях, а при 0,999 — в 1 случае из 1000.
Для того чтобы вычислить ошибку выборки при принятой доверительной вероятности, нужно рассчитать величину средней ошибки выборки . Формула для ее определения включает дисперсию признака в генеральной совокупности σ2, которая, как правило, неизвестна. Может быть определена только выборочная дисперсия 2,. Доказано, что соотношение между σ2 и 2 определяется следующим равенством:
Отсюда:
Если п велико, то сомножитель п/(п - 1) = 1 и можно принять выборочную дисперсию в качестве оценки величины генеральной дисперсии. Подставив выражение в формулу средней ошибки выборочной средней, получим:
Соответственно
Пример. Для определения скорости расчетов с кредиторами предприятий едкого треста была проведена случайная выборка 50 платежных документов, по которым средний срок перечислен ил денег оказался равен 28,2 дня со стандартным отклонением 5,4 дня. Определим средний срок прохождения всех платежей в течение данного года с доверительной вероятностью F(t)=0,95, Тогда t=1,96; скорректированная дисперсия
средняя ошибка выборки
Отклонение выборочной средней от генеральной с вероятностью 0,95 составит: дня,
Величина называется доверительной ошибкой выборки или предельной ошибкой выборки. Рассчитав величину , мы можем записать следующее неравенство:
28,2- 1,51 ≤ μ ≤ 28,2 + 1,51;
26,7 дня ≤ μ ≤ 29,7 дня.
Таким образом, с вероятностью 0,95 можно утверждать, что средняя продолжительность расчетов предприятия данного треста с кредиторами составляет не менее 26,7 дня и не более 29,7 дня.
Ошибка выборки для выборочной относительной величины (доли) определяется аналогично. Дисперсию относительной величины определим по данным выборки:
,
где р - доля тех или иных единиц в выборке,
Выражение получено в соответствии с обычной формулой дисперсии. Поскольку имеется в виду альтернативная, или дихотомическая, переменная, обозначим ее значение одной категории единиц 0, в другой -1, Тогда среднее переменной составит:
,
квадрат отклонения от средней
что соответствует выражению Средня
.
Предельная ошибка выборочной доли с принятой доверительной вероятностью имеет вид:
.
Пример. По данным выборочного изучения 100 платежных документов предприятий одного треста оказалось, что в шести случаях сроки расчетов с кредиторами были превышены. С вероятностью 0,954 требуется установить доверительный интервал доли платежных документов треста без нарушения сроков:
;
;
.
Генеральная доля платежных документов π, не выходящих за установленные сроки, с вероятностью 0,954 находится в интервале
0,892 ≤ π ≤ 0,988, или 89,2% ≤π ≤ 98,8%.
Литература.