Автор: Пользователь скрыл имя, 10 Апреля 2012 в 21:52, курсовая работа
Появление влияющей на качество результата измерения случайной составляющей связано с проблемой измерения параметров реальных процессов или явлений в реальных условиях. При подготовке и проведении высокоточных измерений в метрологической практике учитываются влияния объекта измерения, субъекта, способа измерения средства и ,соответственно, реальных условий измерения. Относительная влажность воздуха, колебание напряжения в электрической цепи, вибрации, психофизического состояние субъекта, его внимательность или острота зрения и множество других явлений составляют совокупность факторов, оказывающих влияние на качество результата измерения, и носят случайный характер.
Введение……………………………………………………………………………..6
1 Общие положения об этапах выполнения работы………………………….10
2 Обработка экспериментальных данных…………………………………......13
2.1 Построение статистического ряда……………………………………...13
2.2 Определение оценок числовых характеристик……………………….19
2.2 Обнаружение и исключение из массива промахов…………………....24
3 Приближённая идентификация формы и вида закона
распределения вероятности экспериментальных данных…………………..28
3.1 Метод наибольшего правдоподобия и графический метод……….....29
3.2 Аппроксимация гистограммы и определение аналитического
выражения функции плотности распределения вероятности…………….39
4 Определение соответствия аналитического выражения ЗРВ экспериментальным данным……………………………………………………45
4.1 Критерий согласия Пирсона………………………………………….....45
5 Определение результата измерения…………………………………………48
Заключение………………………………………………………………………...50
Список литературы……………………………………………………………….52
Приложения……………………………………………………………………......54
5. Для того чтобы оценить интервал неопределенности, в котором находится результат многократного измерения без каких-либо предположений об уровне доверительной вероятности, определяется оценка энтропийного коэффициента. Оценка энтропийного коэффициента является еще одной числовой характеристикой формы распределения вероятности. По гистограммам, приведенным далее, она оценка вычисляется по формуле.
где d – ширина столбца гистограммы (шаг), n – количество отсчетов в массиве
исходных данных, m – число столбцов в гистограмме, nj – число отсчетов в
j – м столбце гистограммы (j = 1……m).
Для 7 интервалов Kэ = 2,0603, для 9 интервалов Kэ = 2,0479, для 11 интервалов Kэ = 2,1132.
Из наиболее часто встречающихся
распределений максимально возможное
значение энтропийного коэффициента kэ
= 2,066 у нормального закона распределения
вероятности,
минимальное kэ
= 1,11 –
Оценки числовых характеристик
произведены и позволяют
Никакие измерения не могут
быть абсолютно точными. Измеряя
какую-либо величину, мы всегда получаем
результат с некоторой
Промахи (или грубые погрешности) проявляются обычно в резком отклонении результата отдельного измерения от остальных. Промахи обусловлены главным образом недостаточным вниманием экспериментатора или неисправностями средств измерения. Результаты таких измерений отбрасываются.
Оценка наличия грубых погрешностей решается методами математической статистики – статистической проверкой гипотез. Суть метода сводится к следующему. Выдвигается гипотеза относительно результата измерения, который вызывает некоторое сомнение и рассматривается как грубых промах в связи с большим отклонением от других результатов измерения. При этом нулевая гипотеза заключается в утверждении, что «сомнительный» результат в действительности принадлежит к возможной совокупности полученных в данных условиях результатов измерений, и получение такого результата вероятно.
Пользуясь определенными критериями и правилами (правило «трех сигм», критерий Диксона, критерий Шарлье, неравенство Чебышева) пытаются опровергнуть нулевую гипотезу, то есть пытаются доказать ее практическую невероятность. Если это удается, то промах исключают, если нет – то результат измерения оставляют.
Для различных законов распределения в нашем случае можно применить неравенство Чебышева, которое устанавливает нижнюю границу вероятности того, что ни при каком законе распределения вероятности случайное значение результата измерения не отличается от среднего значения более чем на половину доверительного интервала, определяемого по формуле
,
отсюда могут быть найдены значения t для заданной вероятности
и границы доверительного интервала
Однако в указанном виде неравенство Чебышева не позволяет учесть особенности конкретного ЗРВ экспериментальных данных, по этой причине границы доверительной вероятности чрезвычайно широкие (для Р = 0,95 t ≤ 4,47, а для нормального закона распределения вероятности, например, t = 2 при Р = 0,95), что в некоторых случаях может привести к искажению исходного закона распределения вероятности результата измерения, так как будут учитываться в нем сомнительные отсчеты.
Можно уменьшить доверительную вероятность (вероятность того, что значение параметра генеральной совокупности находится в построенном для него доверительном интервале) и получить более узкий доверительный интервал.
Для учета ЗРВ при определении границ доверительной вероятности
целесообразно использовать неравенство, определенное с помощью четвертого центрального момента
.
Параметр t в этом случае определяется следующим выражением:
.
После расчета параметра t для выбранной доверительной вероятности
верхняя и нижняя границы предельных значений отсчетов определяются
выражениями
.
Вычисленный мною параметр t=2,650731, откуда следует по выше данным формулам, что доверительный интервал имеет вид
-5,5694015,571901.
Отсчеты Qi < Q- и Qi > Q+ считаются промахами и должны быть исключены из массива данных, но таких по доверительному интервалу не обнаружено, что означает отсутствие грубых промахов и позволяет беспрепятственно следовать далее по этапам выполнения работы.
3 Приближённая идентификация формы и вида закона распределения вероятности экспериментальных данных
До сих пор, говоря о законах распределения случайных величин, мы не затрагивали вопроса о том, откуда берутся, на каком основании устанавливаются эти законы распределения.
Ответ на вопрос вполне определенен - в основе всех этих характеристик лежит опыт; каждое исследование случайных явлений прямо или косвенно опирается на экспериментальные данные. Оперируя такими понятиями, как события и их вероятности, случайные величины, их законы распределения и числовые характеристики, теория вероятностей дает возможность теоретическим путем определять законы распределения и числовые характеристики одних случайных величин через законы распределения и числовые характеристики других. [3]
Оценки числовых характеристик, описанные выше, дают предварительное, но неполное представление о возможном законе распределения вероятности.
Значения числовых характеристик сравниваются с табличными (приложения 2 и 3), но часто их сравнение не дает достоверного вывода о ЗРВ, так как у разных ЗРВ достаточно схожие данные. Для дальнейшего точного анализа необходима гистограмма, о чем речь пойдет ниже. После построения гистограммы, некоторые оценки числовых характеристик предполагаемого ЗРВ могут не совпадать со значениями распределений в приложениях, что потребует дополнительных построений и проверок.
Оценки характеристик же, как мы выяснили нужны для того, чтобы оценить параметры кривой распределения. Например, островершинность кривой распределения и его протяженность. При симметричном одномодальном распределении эксцесс обычно положителен, если кривая распределения островершинна, и отрицателен, если кривая плосковершинна (если ε ≈ 3, то можно считать, что закон распределения плотности вероятности вероятнее всего близок к нормальному).
Симметричность в этом случае позволяет определить оценка асимметрии. Асимметрия положительна, если мода находится влево от среднего значения, и она отрицательна, если мода находится вправо от среднего значения. Если выполняется условие , то ЗРВ симметричный.
Наличие моды (или нескольких вершин) может быть оценено по анализу линейчатой диаграммы. Если экспериментальные данные имеют тенденцию группироваться в какой- либо области значений (или областях значений), то можно говорить о возможности наличия моды (или нескольких мод). [15]
После анализа возможного характера кривой плотности распределения
вероятности и сравнения полученных оценок показателей формы ЗРВ со значениями показателей, приведенными в приведенными в приложениях 2 и 3, делается предварительный вывод о возможных формах ЗРВ (один или несколько возможных вариантов). Приступим к анализу вычисленных оценок совместно с графическим методом представления данных.
3.1 Метод наибольшего правдоподобия и графический метод
Методом наибольшего правдоподобия называется метод поиска модели, наилучшим в каком-то смысле образом описывающей данную выборку, полученную с некоторым неизвестным распределением или метод нахождения статистических оценок неизвестных параметров распределения, где в качестве оценок выбираются те значения параметров, при которых данные результаты наблюдений «наиболее вероятны». Другими словами, сравнив полученные оценки характеристик (эксцесс, контрэксцесс, коэффициент асимметрии и др.) с табличными значениями, мы ищем модель распределения наиболее близкую к нашему распределению по максимальному числу совпавших элементов. [16]
Для упрощения задачи и
для наглядности сравнения
Оценки числовых характеристик и критериальные значения характеристик распределения
Числовые характеристики |
Оценки |
Критериальные значения характеристик распределения | |
Для нормального ЗРВ |
Для треугольного ЗРВ | ||
Среднее арифметическое |
-0,00125 |
- |
- |
ДисперсияQ2 |
4,416532 |
- |
- |
СКО SQ |
2,101555 |
- |
- |
Коэффициент асимметрии S |
0,039308434 |
0 |
|
Эксцесс ε |
2,46829 |
3 |
2,4 |
Коэффициент эксцесса |
-0,531707 |
0 |
-0,6 |
Контрэксцесс |
0,636505 |
0,577 |
0,646 |
Энтропийный коэффициент Kэ (7 интервалов) |
2,1132 |
2,066 |
2,02 |
Продолжение таблицы 3.1 | |||
Энтропийный коэффициент Kэ (9 интервалов) |
2,0603 |
2,066 |
2,02 |
Энтропийный коэффициент Kэ (11 интервалов) |
2,0479 |
2,066 |
2,02 |
Исходя из анализа данных при помощи таблицы методом наибольшего правдоподобия, я уже могу предположить, что мое распределение близко к нормальному и еще приближеннее по максимальному числу признаков к треугольному ЗРВ, но этих данных, полученных путем статистической обработки, как оглашалось во введении и теории курсовой работы, мало для точного определения ЗРВ, потому мы воспользуемся еще графическим методом.
Графический метод заключается в построении гистограммы, которая представляет собой столбиковый график, построенный по полученным данным, которые разбиваются на несколько интервалов. Число данных, попадающих в каждый из интервалов (частота) выражается высотой столбика.
Гистограмма должна давать наглядное изображение того, с какой частотой повторяется то или иное значение или группа значений и давать возможность предположить ЗРВ. [9]
Гистограмма наглядно показывает величину и характер разброса контролируемого параметра.
Для построения гистограммы необходимо выбрать оптимальное число
интервалов группирования экспериментальных данных. Количество отсчетов 240, следовательно количество интервалов варьируется от 8 до 12 включительно. Для симметричного распределения, а оно таковым является в данной работе, целесообразно использовать нечетное количество интервалов, чтобы избежать двух или более интервалов одинаковой площади в центре гистограммы, то есть чтобы определить одну явно выраженную моду. Для этого сначала целесообразно обратить внимание на линейчатую диаграмму (рис. 2.1), где заметная частость одного из значений свидетельствует о наличии одной моды.
В своей работе я выбрала 7, 9 и 11 интервалов для трех гистограмм, так как для получения гистограммы, наиболее близкой к реальному закону распределения вероятности, целесообразно построить их несколько.
Гистограммы я построила следующим образом: на оси абсцисс отложила интервалы группирования данных, на которых построила прямоугольники, площадь которых равна относительному количеству отсчетов, приходящихся на данный интервал, т.е. по оси ординат откладывается величина, равная отношению N / n × ∆Q, где N – количество отсчетов, попавших в данный интервал, n - количество отсчетов в исходном массиве, ∆Q - длина интервала. Таким образом, в гистограмме площадь прямоугольника равна вероятности попадания отсчета в интервал, который является основанием прямоугольника. [7]
Как правило, используются интервалы равной длины или шаг, который определяется по формуле