Автор: Пользователь скрыл имя, 11 Марта 2012 в 15:40, реферат
Статистика — самостоятельная общественная наука. Она изучает количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной.
В зависимости от того, какую сторону явлений общественной жизни изучает та или иная отрасль статистики, она получает специальное название.
В процессе исторического развития в ее составе статистики как единой науки выделились и получили известную самостоятельность следующие разделы:
· общая теория;
Содержание
1. Предмет, методология и задачи статистики
2. Статистическое наблюдение, его виды и способы
4. Группировка и сводка материалов статистических наблюдений
5. Абсолютные и относительные величины
5. Средние величины
5.1 Основные понятия
5.2 Меры оценки колеблемости ряда и типичности средних величин
6. Выборочный метод и оценка достоверности относительных и средних величин (средние ошибки)
6.1 Оценка достоверности относительных величин и различий между ними
6.2 Оценка достоверности различий между относительными величинами
6.3 Оценка достоверности средних величин и различий между ними
6.4 Оценка достоверности различий между двумя средними величинами
6.5 Порядок оценки достоверности различий двух серий наблюдений, проведенных на одной и той же совокупности (разностный метод критерия Стьюдента)
7. Динамические ряды
7.1 Методика расчета показателей
Приложение
· однородность совокупности;
· достаточное число наблюдений.
Первый вопрос может и должен быть решен в свете качественного анализа, определяющего сущность изучаемых явлений. Например, нельзя изучать физическое развитие вообще, без учета пола и возраста. Или вычислять средние сроки лечения больных в терапевтическом отделении без распределения их по отдельным нозологическим формам. Необходимое число наблюдений определяется конкретно для каждого исследования при помощи средних ошибок. Следует избегать формального, шаблонного подхода: “не менее 100 наблюдений в каждой группе”, т. к. этого может быть и много, и мало.
В связи с этим всегда следует помнить об опасности “усредненных” данных. Необходимо применять только групповые средние, приводя наряду с ними показатели максимума и минимума колебаний.
Средняя представляет собой средство обобщения на базе группировок: можно вычислять, наряду с групповыми или частными, и общую среднюю для всей совокупности. Но совокупность обязательно должна быть качественно однородной, т. к. в разнотипной, разносоставной совокупности средняя теряет свой смысл и не отражает подлинной действительности.
Виды средних величин, которыми пользуются в санитарно-статистической практике, — это средняя арифметическая, мода, медиана и средняя прогрессивная. Другие виды средних: средняя гармоническая, квадратическая, кубическая, геометрическая — не находят практического применения для решения медико-санитарных вопросов.
Наиболее употребительной средней, чаще всего встречающейся в санитарной статистике, является средняя арифметическая величина, представляющая собой как бы прототип остальных средних. Обозначается средняя арифметическая буквой М от латинского слова Media.
Средняя арифметическая может быть простая и взвешенная. Примером средней арифметической простой может служить результат измерения веса шести лиц. Сумма этих измерений (59, 60, 61, 62, 63 и 64 кг), равная 369 кг и деленная на 6, и дает среднюю величину веса — 61,5 кг.
Результат сложения сроков лечения десяти больных (которые провели в больнице 14, 15, 17, 18, 19, 20, 24, 25, 26 и 32 дня) составляет 210 дней, что при делении на 10 дает средний срок стационарного лечения, равный 21 дню.
Таким образом, средняя арифметическая простая получается как сумма величин (вариант), деленная на их число.
Нетрудно заметить, что среднюю арифметическую простую можно вычислить лишь в тех случаях, когда каждая величина (варианта) представлена единичным наблюдением, т. е. когда частоты равны единице (или равны между собой).
Ряд последовательных измерений, расположенных по нарастающему или убывающему значению признака, называется вариационным рядом. Вариационный ряд — это совокупность числовых значений меняющегося признака (числовое распределение предмета или явления по определенному признаку). Вариационный ряд состоит из вариант и частот и выражает зависимость между величиной признака и частотой его проявления.
Вариантой (V) называется меняющийся, признак изучаемого явления (вес, рост, число дней лечения), т.е. его различные числовые значения или выражения.
Частоты, обозначаемые буквой р (от слова pars) или иногда f (от слова frequency) — числа случаев наблюдения данного признака, указывающие, сколько раз встречается данная варианта.
Из табл. 6 видно, что в ряду, где частоты не равны единице и не равны между собой, нельзя складывать значение вариант и, следовательно, простая средняя здесь неприменима. В этом случае надо вычислить среднюю арифметическую взвешенную, которая получается как сумма произведений вариант на соответствующие частоты, деленная на общее число наблюдений.
Таблица 6
Распределение больных по срокам лечения
Число дней лечения V | Число больных р | V х р |
13 | 1 | 13 |
14 | 2 | 28 |
17 | 2 | 34 |
18 | 5 | 90 |
20 | 4 | 80 |
22 | 8 | 176 |
23 | 5 | 115 |
25 | 2 | 50 |
32 | 2 | 64 |
38 | 2 | 76 |
33 | 726 |
дня.
При этом каждая варианта умножается на свою частоту. Она как бы “взвешивается”, и при этом частоты служат “весами”.
Если варианты обозначить буквой V, частоты — буквой р, общее число наблюдений буквой N (Numerus), арифметическую сумму — буквой , то формула средней арифметической выразится следующим образом:
.
Нетрудно заметить, что эта формула средней арифметической взвешенной является пригодной и для средней арифметической простой. Т. к. в последнем случае частоты равны единице, то умножение излишне, и мы ограничиваемся простым сложением. Средняя арифметическая простая — это частный случай средней арифметической взвешенной.
Иногда на практике средние величины получают и без наличия вариационного ряда. Например, путем деления общего числа поликлинических посещений на число жителей обслуживаемого района или путем деления общей суммы койко-дней, проведенных больными в больнице, на число лечившихся больных.
Наряду со средней арифметической, в санитарной статистике применяются, хотя и реже, такие виды средних, как медиана и мода.
Медиана (обозначаемая буквами Ме) — это серединная, центральная варианта, делящая вариационный ряд пополам, на две равные части.
Таким образом, медиана находится на центральном месте, от которого отстоит одинаковое число и больших, и меньших вариант (и в сторону минуса, и в сторону плюса). Приближенное нахождение медианы в простом, несгруппированном ряду производится очень легко, особенно если число наблюдений нечетное. Так, например, в табл. 6, где число наблюдений составляет 33, медианой будет 17-я по счету, т. к. в обе стороны от нее отстоит по 16 наблюдений. Путем простого подсчета убеждаемся, что значение 17-й величины составляет 22. Следовательно, медиана равна 22 дням.
В ряду с четным числом наблюдений в центре находятся две величины. Иногда они одинаковы по своему значению, и тогда не возникает затруднений в приближенном определении медианы. Если же числовые значения двух величин различны, то за медиану принимается их полусумма.
Мода (обозначаемая Мо) — чаще всего встречающаяся или наиболее часто повторяющаяся величина, соответствующая при графическом изображении максимальной ординате, т. е. наивысшей точке графической кривой. Таким образом, при приближенном нахождении моды в простом (несгруппированном) ряду она определяется как наиболее насыщенная или частая величина, как варианта с наибольшим количеством частот.
Отличие медианы и моды от средней арифметической заключается в том, что при упрощенном, ориентировочном определении эти величины чрезвычайно легко и быстро находятся и не зависят от крайних вариант или от степени рассеяния ряда.
Приближенное определение дает конкретное выражение для размеров медианы и моды.
Возвращаясь к нашему примеру из табл. 6, мы видим, что варианта с наибольшим количеством частот (8) равняется 22.
Мода составляет 22 дня, т. е. фактически не отличается от медианы и средней арифметической данного ряда.
Подобное совпадение не является случайным. В этом можно убедиться также из последующих примеров. Объяснение этого кроется в том, что данный ряд является симметричным, близким к нормальному Напомним, что нормальным называется распределение, плотность вероятности которого определяется формулой: , где х — исследуемая величина, среднее значение которой равно а, а дисперсия — 2., так что большие отклонения средней в сторону плюса и в сторону минуса в равной мере соответствуют меньшим частотам.
Рис. 2
Распределение вариант в нормальной кривой
Как видно из схематического рис. 2, при нормальном распределении все три средние величины (М, Мо, Ме) совпадают. Средняя арифметическая соответствует середине ряда, т. к. в симметричном ряду отклонения в сторону увеличения и в сторону уменьшения вариант соответственно уравновешиваются. Медиана, как центральная величина, также соответствует середине ряда. Мода, как наиболее насыщенная величина, приходится на наивысшую точку ряда, также находящуюся в его центре.
Многие распределения, с которыми встречается врач на практике, является симметричными, близкими к нормальным. В частности, это относится к показателям физического развития. Параметры такого ряда имеют большое практическое значение для легкой промышленности, для изготовления так называемых “ходовых”, наиболее часто встречающихся размеров одежды и обуви.
Поэтому для большинства вариационных рядов нет необходимости вычислять другие средние величины, кроме средней арифметической. В этом кроется объяснение упомянутого выше обстоятельства, что средняя арифметическая всегда является наиболее употребительной и чаще всего применяемой в санитарной статистике величиной. Прибегать к медиане и моде приходится при наличии асимметричных рядов. Наглядное представление об этом мы получаем при рассмотрении рис. 3, на котором изображена резко асимметричная кривая
Рис. 3
Распределение больных раком прямой кишки по продолжительности болезни до смерти (цифры условные)
распределения умерших от рака прямой кишки по срокам длительности болезни. У подавляющего большинства летальные исходы наступили в ранние сроки, но в отдельных случаях продолжительность болезни составила 96, 104 и более месяцев. Эти нетипичные, эксквизитные случаи “отягощают” среднюю арифметическую, которая равняется 25,6 месяца, в то время как мода, высчитанная по соответствующей формуле, составила 10,38 месяца, а медиана — 20,7 месяца. Очевидно, что наиболее типичной и характерной для данного явления средней величиной служит мода.
Таким образом, различия в применяемых средних могут быть отражены в следующих определениях. Средняя арифметическая (М) является результативной суммой всех влияний. В ее формировании принимают участие все без исключения варианты, в том числе и крайние варианты, имеющие подчас эксквизитный характер. Медиана и мода, в отличие от средней арифметической, не зависят от величины всех индивидуальных значений, т. е. всех членов вариационного ряда, а обусловливаются относительным расположением или распределением вариант. Поэтому медиану и моду также называют описательными или позиционными средними, т. к. они характеризуют главнейшие свойства данного распределения. Особенно это касается медианы, являющейся в известном смысле, непараметрической величиной. М характеризует всю массу наблюдений, а Ме и Мо — основную массу, без учета воздействия крайних вариант, т. е. исключая крайние значения, зависящие иногда от случайных причин.
Б. Хилл говорит о моде, что она отражает не столько среднюю, сколько обычную длительность течения. Если задача заключается в нахождении величины, отражающей всю сумму индивидуальных значений вариант, то применяют М, если же надо определить величину, соответствующую главнейшим значениям вариант, применяют Мо.
В примере, приведенном на рис. 3, нас интересует не столько средний срок длительности течения болезни, сколько тот срок, до которого практически остается в живых наибольшее число больных, т. е. модальный срок.
Незначительная частота моды ее обесценивает. В тех случаях, когда в асимметричных рядах мода по частоте своей не намного отличается от соседних вариант, предпочтительнее пользоваться медианой.
Бимодальный (или мультимодальный) ряд распределения всегда внушает подозрение своей неоднородностью, когда две вершины ряда получены в результате смешения качественно различных совокупностей. Так, например, при изучении физического развития школьников без учета их пола получаются две моды (одна из них характеризует мальчиков, другая — девочек). Подобное явление может наблюдаться в исследовании физического развития призывников при игнорировании национально-этнических групп. Если же вскрыть и устранить причину бимодального ряда не удается, то лучше пользоваться медианой.
Следующим видом средних величин, подлежащих нашему рассмотрению, является средняя прогрессивная.
Средняя прогрессивная (табл. 7) имеет огромное значение в экономической статистике и значительно меньшее в санитарной статистике. Дело в том, что при вычислении обычной средней арифметической в нее входят все предприятия по уровню производительности труда, все колхозы по уровню урожайности и этим самым в подсчет входят и отстающие предприятия, с низким показателем.
Таким образом, средняя арифметическая не может быть принята в качестве правильно построенного планового норматива.
Методика получения средней прогрессивной заключается в том, что её вычисляют не для всего круга предприятий или учреждений, а только для передовых, показывающих лучшие образцы работы. Границей, разделяющей их совокупность, служит средняя арифметическая, т. е. средний уровень. По той части предприятий, которая находится выше этого среднего уровня, вычисляется новая, вторая средняя величина. Это и будет средняя прогрессивная.
Сразу отметим, что реальность выдвижения этой величины в качестве нормативной обусловлена тем, что это не максимальный, трудно достижимый результат, а обобщенный опыт многих передовых образцов.
Средняя прогрессивная — это средняя той части совокупности, варианты которой превышают среднюю всей совокупности.
Применение средней прогрессивной в санитарно-статистической практике требует известной осторожности, т. к. своеобразие медицинской деятельности заключается в ее качественной стороне.
Увеличение нагрузки врача или занятости койки возможно лишь в узких пределах и может сказаться на качестве лечения.
Можно пользоваться средней прогрессивной при изучении деятельности лечебно-вспомогательных (например, физиотерапевтических) отделений, при изучении показателей участковости в поликлинической практике, при учете результатов физических тренировок и достижений физкультурников и спортсменов.
Таблица 7
Средняя прогрессивная и методика ее вычисления
Число дней занятости койки в году | Середина | Число коек в % | Произведение числа дней в каждой группе на число |
281 — 290 | 285 | 5 | 1425 |
291 — 300 | 295 | 8 | 2360 |
301 — 310 | 305 | 17 | 5185 |
311 — 320 | 315 | 25 | 7875 |
321 — 330 | 325 | 30 | 9750 |
331 — 340 | 335 | 10 45 | 3350 14825 |
341 — 350 | 345 | 5 | 1725 |
Итого | — | 100 | 31670 |