Количественные методы оценки

Автор: Пользователь скрыл имя, 04 Декабря 2011 в 11:43, реферат

Описание работы

Каково бы ни было определение математической вероятности (классическое, комбинаторное, статистическое или субъективное), это понятие призвано отражать некоторые объективные свойства изучаемых явлений, и каждое определение отражает свою сторону общего объективного свойства. Само утверждение о наличии вероятности требует обоснования или проверки для каждого отдельного случая практики, и никогда предельное и теоретическое понятие математической вероятности не совпадает прямо с чисто житейским (обусловленным речевой практикой) пониманием ее как степени субъективной уверенности в чем-то.

Работа содержит 1 файл

количественные методы оценки.doc

— 432.50 Кб (Скачать)

     Нормальное (гауссово) распределение - это один из предельных случаев распределения биноминального, имеющий место при неограниченном увеличении числа испытаний (N       ). При этом должно соблюдаться и такое общее условие, чтобы величина (q-p) была малой по сравнению с величиной npq.

    Исходя  из теории ошибок Гаусса (из центральной предельной теоремы), распределение может считаться нормальным при условии достаточно большого числа независимых случайных величин, ни одна из которых не доминирует над другим ни по вероятности, ни по силе воздействия на общую сумму случайных величин. Именно эта сумма подчиняется тогда нормальному закону распределения, а вероятности и воздействия всех составляющих факторов есть величины бесконечно малые.

    Нормальное  распределение есть некоторая идеальная (колоколообразная) форма симметрического распределения (см. рис. 20). Его аналитическое выражение имеет вид:

    Pn (m) =

где известные  математические постоянные  3,14, е 2,72.

    Значит, нормальное распределение также  описано двумя параметрами: средним  значением (математическим ожиданием) М (см. разд. 4 данной главы) и средним квадратическим отклонением о (см. разд. 5 данной главы). Поскольку само понятие гауссового распределения является предельным, математическое описание эмпирических распределений (принимаемых за нормальное) требует еще добавления параметра N, что характеризует репрезентативность статистической совокупности.

    Когда при обработке экспериментального статистического материала встает задача установления формы полученного  распределения, т.е. сведения его к  одной из теоретических форм, то чаще всего предполагается, что измеренные показатели подчинены закону Гаусса. Нормальное распределение является наиболее изученным теоретически, имеет ряд чисто математических удобств, к нему отнесены многие мощные приемы и методы анализа. Разработаны даже специальные средства для преобразования эмпирических данных в нормальное распределение (подбор задач и условий эксперимента, смена аргумента, нормализация выборки по составу).

    Математические  преимущества закона Гаусса бесспорны, однако не только они должны приниматься во внимание при анализе результатов измерения. Предположение нормальности эмпирического распределения необходимо обосновывать качественно, осознавая все те допущения, о которых говорилось выше и которые сопутствуют теоретическому нормальному закону. Ведь всего удобнее было предполагать, например, некоторое точечное постоянство исследуемого в эксперименте показателя, т.е. исходить из полного отсутствия статистического распределения вообще. Так что весь вопрос выбора методики обработки заключается не просто в уровне математических удобств, а в степени соответствия той или иной математической модели теории реального процесса. Известно, что абсолютного соответствия здесь быть не может, поэтому речь идет всегда о “весе” тех неизбежных потерь сведений об изучаемом процессе, которые проистекают от математического (в данном случае статистического, вероятностного) его моделирования. Злоупотребления же безосновательными предположениями нормального закона распределения характерны отнюдь не только для психологии и подвергаются обоснованной критике.

     Распределение Пуассона также исходит из биноминального распределения, когда величина одной из вероятностей р 0, т.е. становится бесконечно малой, а число испытания n         , т.е. неограниченно возрастает. В таком случае произведение np          или стремится  к некоторой малой, отличной от нуля величине  . Тогда вероятность P(m) того, что в последовательности из n независимых испытаний некое редкое событие А с вероятностью P(À)        0 осуществиться m раз, определена формулой:

P(m) =

    Значит, распределение Пуассона полностью  описывается одним параметром  , который характеризует и среднее  значение распределения, и меру разброса случайных значений.

    Близким к этому закону является, например, статистическое распределение числа военнослужащих конных войск, погибших под копытами лошадей. При этом редкие события как бы уходят из класса событий слепого случая, приобретают вероятностное толкование.

    Форма распределения Пуассона также существенно  варьирует от крайней асимметрии к симметрии (в зависимости от величины  ).

  1. ОСНОВНЫЕ ВИДЫ СРЕДНИХ ЗНАЧЕНИЙ И ИХ ВЫЧИСЛЕНИЕ

    Итак, измерение исследуемого в эксперименте признака дает нам выборку, или набор  варьирующих значений признака. Каждая варианта в какой-то степени имеет право количественно представлять измеренный процесс в целом. Полные же сведения об этом процессе заключены во всей статистической совокупности, уже прошедшей свою первоначальную обработку сведений к той или иной кривой распределения (см. разд. 2,3 этой главы).

    Процесс последующей обработки эмпирического  материала идет по пути дальнейшего  свертывания информации. Ведь в статистическом распределении слишком много  различных характеристик, а дальнейшая практическая работа, анализ и сопоставление  различных выборок требуют количества этих характеристик до некоторого минимального числа. Другими словами, требуется выявить систему параметров, т.е. тех немногих характеристик статистического распределения, которые в достаточной мере выражают общие свойства совокупности.

    Выше  указывалось, что для описания теоретических  распределений имеется четкая и  строгая система исчерпывающих  параметров. Распределения эмпирические описываются аналогично, только сжатие информации на практике неизбежно означает и потерю ее части. Каждый параметр выборки - это лишь одна из ее характеристик, одна из фотографий исследуемого процесса, вовсе не исчерпывающая всей его картины. Система используемых параметров выборки должна охватывать максимум свойств исследуемого процесса в их комплексе. Всякий такой параметр (или критерий) должен быть четко осмыслен, т.е. требуется осознать, в каком именно направлении характеризует данный параметр всю выборку, сам измеренный процесс.

    Среднее значение (центральное) - это некий обобщающий показатель положения и уровня центра распределения, т.е. того значения признака, вокруг которого концентрируются все другие варьирующие значения. Это очень важный и распространенный параметр выборки. В математической статистике есть довольно много видов средних величин. Каждая из них - это некоторая специфическая абстракция, за которой лежит вполне определенное содержание, своя специфическая смысловая нагрузка, что и делает среднюю величину определенным сплавом количественной и качественной оценки. Поэтому выбор формы средней - это выбор способа опосредствования данных, заключенных в полном объеме исходной выборки. Все последующие выводы несут на себе печать такого опосредствования, так или иначе отражающих специфику выбранной средней величины и в этом смысле являются относительными. К тому же вопрос о выборе адекватной средней величины тесно переплетается с вопросом о форме статистического распределения и о необходимости соответствующего ее анализа.

    Итак, основным, или определяющим, для  каждого вида средней является качественное ее содержание, знание того, в каком смысле это средняя, в каких пределах идет усреднение. Именно в этом контексте будет идти наше дальнейшее рассмотрение основных видов средних значений, при этом умышленно будут избегаться теоретико-математические положения.

    4-1. Средняя арифметическая величина соответствует формуле: 

    где xi - значение варианты с номером от 1 до n

          fi - частота соответствующей варианты,

            N - объем выборки.

    Для примера № 1 (данные табл. 2) имеем:

    Xap = 1*1+4*2+10*3+13*4+7*5/35 = 126/35 = 3,6 (ед).

    Для примера № 2 (данные табл. 1) имеем:

    Xap = 1*5*+2*6+4*7+7*8+5*9+3*10+3*11+2*12+2*13+2*14/30 = 273/30 = 9,1 (сек).

    Средняя арифметическая по своему определению (по формуле) предполагает суммирование всех исходных вариант и как бы равномерное распределение общего количества измеренного показателя между всеми вариантами (деление на N =  fi). Можно сказать, что в этой средней всегда присутствует некоторая скрытая оценка вала, т.е. суммы всех вариант исходной выработки (Xap* N =   fi xi).

    Средняя арифметическая несет в себе целый ряд математических преимуществ, ею удобно оперировать. Например, сумма отклонений всех вариант от нее равняется нулю (  (xi - Xap) = 0), средняя арифметическая суммы (или разности) нескольких выборок равна сумме (или разности) средних арифметических значений этих выборок.

    В практике измерений параметр Xap чрезвычайно распространен, для всех привычен и, можно сказать, превратился в определенный стереотип при количественном анализе результатов (см. разд. 2 гл. I). Тем не менее смысл этого параметра отнюдь не так прост и очевиден.

    Вернемся  к нашим примерам № 1 и № 2. Что  означает, скажем, величина Xap = 3,6 (ед) для эксперимента по заучиванию двузначных чисел (работа № 10 гл. II)? Ведь ни один испытуемый не имел такого результата. По-видимому, наше Xap означает лишь то, что если бы все 35 испытуемых запомнили именно 3,6 числа, их общая сумма, (3,6*35) составила бы то же самое число, что и в опыте (126 двузначных чисел)... Осмысливанию параметра средней арифметической для конкретного рабочего измерения не слишком помогает и его механическая интерпретация, т.е. представление о параметре Xap как о некой точке приложения равнодействующей всех сил (представленных в единицах fi), формирующих данное статистическое распределение (центр тяжести фигуры, см. рис. 18).

    Применяя  параметр средней арифметической в  обычном (и не слишком статистически  представительном) измерении, мы, по-видимому имеем в виду совсем другое среднее  качество, т.е. то, которым параметр Xap в данном случае не обладает вовсе. Исследователю хотелось бы назвать наиболее вероятное значение измеренного показателя, и здесь вступает в силу обозначенное ранее несоответствие понятий вероятность  и типичность (см. разд. 2 гл. I). В самом деле, средняя арифметическая  вовсе не обязательно указывает то значение признака, которое скорее всего будет получено при проведении еще одного, (n+1) - го измерения. Параметр средней арифметической является аналогом классического (теоретико-вероятностного) параметра математического ожидания:         М = xi * pi. Но эта аналогия справедлива в предельном случае, когда N

а wi = fi / N          pi.

    При этом предполагается соблюдение принципа симметрии или взаимопогашение  разносторонних отклонений от средней, а также соблюдение целого ряда указанных ранее допущений, обусловленных самой концепцией вероятностей (см. разд. 2 гл. I и разд. 1, 3 гл. III).

    Так что в целом ряде практических случаев, при недостаточности объема выборки, а в особенности при  наличии закономерной скошенности  эмпирического распределения, некритическое использование параметра средней арифметической величины чревато серьезными ошибками в последующем содержательном анализе экспериментального материала (так называемые огульные средние).

    4-2. Средняя геометрическая G определена следующей формулой: 

    где xi - величина каждой варианты,

          fi - частота варианты xi,

          П - знак произведений всех  вариант.

    Она вычисляется как корень степени  N из произведений всех вариант исходной выборки.

    Величина  G для любой выборки меньше, чем величина средней арифметической.

    Путем несложных математических преобразований удается показать, что средняя  геометрическая может быть понята по смыслу как некое центральное  или медианное значение в такой  выборке, в которой варианты представляют собой геометрическую прогрессию, т.е. всякая последующая варианта равна предшествующей, умноженной на некий коэффициент прироста.

    4-3. Средняя гармоническая Н вычисляется по формуле:

    Н = N / fi xi.

    Это величина, аналогичная параметру  средней арифметической. Н - средняя, обратная средней арифметической, вычисленной не по исходному параметру xi, а по обратному ему параметру 1/ xi.

    Скажем, для нашего примера № 2 (см. разд. 2 гл. III) вычисление средней гармонической означает отыскание такой величины времени, которая исходит из предварительного вычисления некой средней скорости. Правда, подобная смена аргумента (проведенного уже измерения) отнюдь не всегда представляется нейтральным, чисто математическим приемом, отвечающим методике проведенного эксперимента. Тем не менее практика знает задачи, для которых применение параметра средней гармонической соответствует даже более, чем применение параметра обычной средней арифметической величины.

    Величина  Н всегда меньше величины средней  геометрической G. Следует сказать, что обе эти формы средних величин используются довольно редко как в элементарной статистике, так т в самой теории математической статистики.

    4-4. Медиана Ме - это такое значение переменной, которое является срединным, центральным (по положению) в общем упорядоченном ряду вариант выборки. Медиана - это своеобразная золотая середина, справа и слева от которой остальные варианты располагаются поровну, тогда как их удельный вес, т.е. абсолютная величина каждой, как бы не принимается во внимание. Итак, Ме является величиной по смыслу срединной, центральной, она по происхождению прежде всего качественна, т.е. исходит не из аналитического выражения.

Информация о работе Количественные методы оценки