Определение с помощью многократного измерения наиболее эффективной оценки характеристики положения закона распределения вероятности, и

Автор: Пользователь скрыл имя, 10 Апреля 2012 в 21:52, курсовая работа

Описание работы

Появление влияющей на качество результата измерения случайной составляющей связано с проблемой измерения параметров реальных процессов или явлений в реальных условиях. При подготовке и проведении высокоточных измерений в метрологической практике учитываются влияния объекта измерения, субъекта, способа измерения средства и ,соответственно, реальных условий измерения. Относительная влажность воздуха, колебание напряжения в электрической цепи, вибрации, психофизического состояние субъекта, его внимательность или острота зрения и множество других явлений составляют совокупность факторов, оказывающих влияние на качество результата измерения, и носят случайный характер.

Содержание

Введение……………………………………………………………………………..6
1 Общие положения об этапах выполнения работы………………………….10
2 Обработка экспериментальных данных…………………………………......13
2.1 Построение статистического ряда……………………………………...13
2.2 Определение оценок числовых характеристик……………………….19
2.2 Обнаружение и исключение из массива промахов…………………....24
3 Приближённая идентификация формы и вида закона
распределения вероятности экспериментальных данных…………………..28
3.1 Метод наибольшего правдоподобия и графический метод……….....29
3.2 Аппроксимация гистограммы и определение аналитического
выражения функции плотности распределения вероятности…………….39
4 Определение соответствия аналитического выражения ЗРВ экспериментальным данным……………………………………………………45
4.1 Критерий согласия Пирсона………………………………………….....45
5 Определение результата измерения…………………………………………48
Заключение………………………………………………………………………...50
Список литературы……………………………………………………………….52
Приложения……………………………………………………………………......54

Работа содержит 1 файл

готовая. docx.docx

— 960.59 Кб (Скачать)

где Qmax – Qmin разность между максимальными и минимальными отсчетами исходного массива, а m – число интервалов. Получается, что

7 = 1,6667

9 = 1,25

11 = 1

Строить гистограмму желательно симметрично относительно середины; середина моего массива данных имеет значение -0,00125, при построении для упрощения примем ≈ 0.

В таблицах 3.2 - 3.4 указаны подробные данные для построения гистограммы (полигона и кумулятивной кривой) с семью интервалами, с девятью и с одиннадцатью интервалами.

 

                                                                                                       Таблица 3.2

Данные для построения гистограммы с семью интервалами

Границы интервала

Кол. попаданий в интервал

Середины интервалов

N/nXdQ

N/n

-5,8335;

-4,1668

6

-5

0,015

0,025

 

-4,1668;

-2,5

24

-3,3334

0,06

0,1

-2,5;

-0,8335

52

-1,6667

0,13

0,2167

-0,8335;

0,83355

77

0

0,1925

0,3208

0,8335;

2,5

50

1,6667

0,125

0,2083

2,5;

4,1668

25

3,3334

0,0625

0,1042

4,1668;

5,8335

6

5

0,015

0,025


 

                                                                                                           Таблица 3.3

Данные для построения гистограммы с девятью интервалами

Границы интервала

Кол. попаданий в интервал

Середины интервалов

N/nXdQ

N/n

Продолжение таблицы 3.3

-5,625; -4,375

4

-5

0,0133

0,016667

-4,375; -3,125

13

-3,75

0,0433

0,0541667

-3,125; -1,875

27

-2,5

0,09

0,1125

-1,875; -0,625

50

-1,25

0,1667

0,208333

-0,625; 0,625

56

0

0,1867

0,233333

0,625; 1,875

45

1,25

0,15

0,1875

1,875; 3,125

29

2,5

0,0967

0,120833

3,125; 4,375

11

3,75

0,0367

0,045833

4,375; 5,625

5

5

0,0167

0,020833


 

                                                                                                           Таблица 3.4

Данные для построения гистограммы с одиннадцатью интервалами

Границы интервала

Кол. попаданий в интервал

Середины интервалов

N/nXdQ

N/n

-5,5; -4,5

3

-5

0,0125

0,0125

-4,5; -3,5

7

-4

0,0292

0,029167

-3,5; -2,5

19

-3

0,0792

0,079167

-2,5; -1,5

34

-2

0,1417

0,141667

-1,5; -0,5

39

-1

0,1625

0,1625

-0,5; 0,5

41

0

0,1708

0,170833

0,5; 1,5

37

1

0,1542

0,154167

Продолжение таблицы 3.4

1,5; 2,5

29

2

0,1208

0,120833

2,5; 3,5

19

3

0,0792

0,079167

3,5; 4,5

8

4

0,0333

0,033333

4,5; 5,5

4

5

0,0167

0,016667


 

Непосредственно графическое  представление результатов далее. Заметим, что для большей наглядности строят графики статистического распределения, в частности, полигон.

Полигоном частот называют ломаную линию, отрезки которой  соединяют точки середин интервалов. Для построения полигона частот на оси абсцисс откладывают середины интервалов, а на оси ординат – соответствующие им частоты, то есть вероятность попадания в каждый интервал. Совместно с осью абсцисс образуется замкнутая фигура, площадь которой в соответствии с правилом нормировки должна быть равна единице (или числу наблюдений при использовании частостей). [13]

 

Рис 3.1 Гистограмма и полигон  для семи интервалов

Гистограмма первая и ее полигон по виду напоминают треугольный  ЗРВ, но ее количество интервалов, на которое  я разбила совокупность экспериментальных  данных слишком мало, поэтому возможно потеряны характерные особенности действительного ЗРВ, к тому же полигон получился резким. Для этого рассмотрим гистограмму с девятью интервалами.

Рис 3.2 Гистограмма и полигон  для девяти интервалов

 

Как мы видим, при увеличении числа интервалов и соответственно уменьшении их длины, гистограмма все более приближается к гладкой и плавной кривой — графику плотности распределения вероятности. Вторая гистограмма и полигон, несомненно, схожи с нормальным законом распределения вероятности.

После построения гистограмм последует аппроксимация одной  из гистограммы и определение соответствия аналитического ЗРВ экспериментальным данным, выдвижение гипотезы о распределении и проверка гипотезы. Но для завершения графического метода представления экспериментальных данных обратим внимание и на гистограмму с одиннадцатью интервалами.

 

Рис. 3.3 Гистограмма и полигон  для одиннадцати интервалов

 

Получается, что и третья гистограмма схожа с нормальным ЗРВ, но немного отдалена от него в  связи со слабовыраженной пологостью, которая обусловливается значением СКО.

Увеличение  оценок  энтропийного  коэффициента для каждой гистограммы указывает на увеличение интервала неопределенности, в  котором  должен  находиться  результат  многократного  измерения.

Для исключения грубых промахов кроме гистограмм целесообразно построить кумулятивные кривые по экспериментальным данным, что я и сделала.

Кумулятивная кривая представляет собой ломаную, составленную  по последовательно суммированным вероятностям.  При построении кумулятивной кривой на ось абсцисс наносятся значения признака, а ординатами служат нарастающие итоги вероятностей. Соединением вершин ординат прямыми линиями получают кумуляту. [5]

Рис. 3.4 Кумулята для семи интервалов

 

Рис. 3.5 Кумулята для девяти интервалов

Рис. 3.6 Кумулята для 11 интервалов

 

Кумуляты в данном случае определяют отсутствие промахов при построении.

Таким образом следует, что из полученных гистограмм я выбираю для

дальнейшего анализа гистограмму  с девятью интервалами и с одиннадцатью, так как они отвечают максимальному числу признаков, установленных в результате предварительного анализа. Именно эти гистограммы будут аппроксимироваться.

 

 

3.2 Аппроксимация гистограммы и определение аналитического

  выражения функции плотности распределения вероятности

 

В классической математической статистике предполагается известным вид закона распределения и производится оценка значений его параметров по результатам  наблюдений. Но обычно заранее вид  закона распределения неизвестен, а  теоретические предположения не позволяют его однозначно установить. Обработка экспериментальных также не позволит точно вычислить истинный закон распределения показателя. В таком случае следует говорить только об аппроксимации (приближенном описании) реального закона некоторым другим, который не противоречит ЭД (экспериментальным данным) и в каком-то смысле похож на этот неизвестный истинный закон. [4]

В соответствии с этими положениями постановка задачи аппроксимации закона распределения ЭД формулируется следующим образом. Имеется выборка наблюдений (x1, x2, …, xn) за случайной величиной Х. Объем выборки п фиксирован.

Необходимо подобрать закон  распределения (вид и параметры), который бы в статистическом смысле соответствовал имеющимся наблюдениям.

Задача аппроксимации на основе типовых распределений решается итерационно и включает выполнение трех основных шагов:

    • определения оценок параметров закона распределения;
    • предварительного выбора вида закона распределения;
    • оценки согласованности закона распределения и ЭД

В моей работе первый шаг уже выполнен.

Если заданный уровень согласованности  достигнут, то задача считается решенной, а если нет, то шаги повторяются снова, начиная со второго шага, на котором выбирается другой вид закона, или начиная с первого – путем некоторого уточнения параметров распределения.

Выбор вида закона распределения осуществляется посредством анализа гистограммы  распределения, оценок коэффициентов  асимметрии и эксцесса. По степени "похожести" гистограммы и графиков плотностей распределения типовых законов  или по "близости" значений оценок коэффициентов и диапазонов их теоретических  значений выбираются распределения  – кандидаты для последующей  оценки параметров.

Применительно к выбранному закону распределения производится проверка гипотезы о том, что имеющаяся  выборка может принадлежать этому  закону. Если гипотеза не отвергается, то можно считать, что задача аппроксимации решена. Если гипотеза отвергается, то возможны следующие действия: изменения значений оценок параметров распределения; выбор другого вида закона распределения; продолжение наблюдений и пополнение выборки. Конечно, такой подход не гарантирует нахождение "истинного" или даже подбора подходящего закона распределения.

В данной работе для определения аналитического выражения аппроксимирующей функции плотности распределения вероятности я сгладила полученный на основе гистограммы полигон распределений, представив его в виде более плавной кривой, после чего построила теоретическую кривую плотности распределения вероятности и сравнила с ней полученную кривую.

 

Рис. 3.7 Экспериментальный полигон распределения и аппроксимирующая функция плотности для 11 интервалов

 

Рис. 3.8 Экспериментальный полигон распределения и аппроксимирующая функция плотности для 9 интервалов

 

Так как очень часто  по внешнему виду один закон распределения вероятности трудно отличить от другого, а некоторые из них при определенных значениях параметров переходят друг в друга, я вместе с определением аналитического выражения аппроксимирующей функции плотности распределения вероятности провела сравнение оценок начальных и центральных моментов(стандартное отклонение, оценки ассиметрии, эксцесса и т.д.), представленных в таблице 3.1, с теоретическими (приложение 2 и 3).

Исходя из метода наибольшего  правдоподобия, графического метода и аппроксимации гистограмм можно предположить, что мое действительное распределение близко к нормальному, то есть выдвинуть гипотезу о виде распределения и в последствии ее доказать.

Обычно после выбора аналитического выражения аппроксимирующей

функции плотности вероятности  необходимо определить параметры функции (т.е. коэффициенты, входящие в аналитическое выражение), если вычисленных моментов недостаточно. Параметры некоторых функций (например, равномерное распределение вероятности, треугольное, трапецеидальное и т.д.) определяются легко с помощью полученной экспериментальной кривой, другие не требуют дополнительных вычислений, так как полученных значений среднего арифметического и стандартного отклонения достаточно для определения всех констант, входящих в аналитическое выражение функции плотности вероятности. Например, функция нормального распределения имеет вид

Информация о работе Определение с помощью многократного измерения наиболее эффективной оценки характеристики положения закона распределения вероятности, и