Автор: Пользователь скрыл имя, 27 Октября 2013 в 12:19, курсовая работа
Целью работы является проверка гипотезы о возможности описания потока, образуемого моментами появления кадров в сети Ethernet моделью простейшего потока.
Для реализации поставленной цели необходимо решить следующие задачи:
1.Выбрать согласно варианту – (порядковый номер в журнале) исходные данные для исследования.
2.Проанализировать исходные данные на предмет стационарности потока случайных событий, используя критерий Краскала-Уоллиса.
3.Исследовать поток данных на отсутствие последствия с помощью критерия серий и тренда.
Введение 3
1.Теоритический раздел 5
1.1 Определение простейшего потока. Характеристики простейшего потока. 5
1.2 Свойство стационарности. 7
1.3 Свойство отсутствия последствия. 8
1.4 Проверка допущений о распределениях. 10
1.4.1 Критерий согласия WE для проверки достоверности гипотезы об экспоненциальном распределении исследуемой статистики. 11
1.4.2 Использование критерия согласия χ2 для проверки достоверности гипотезы о распределении исследуемой статистики. 12
1.4.3 Схематическое представление выполнения курсового проекта. 15
2.Практическое исследование 16
2.1.1.Проверка свойства отсутствия последствия 17
2.1.2.Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия WE 19
2.1.3Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2 20
2.1.4 Проверка свойства стационарности 24
Вывод 25
Список использованных источников 26
Критерий согласия WE ориентирован на проверку достоверности гипотезы об экспоненциальном распределении исследуемой статистики [6].
Вычисление
критерия производится по
Вычисленный
таким образом критерий
Наиболее гибкой методикой оценки допущений о распределении является проверка с помощью критерия χ2 [5,7]. Для применения этого критерия полученные данные группируются по интервалам частот и сравниваются с ожидаемым числом наблюдений для принятого распределения. На основе этого сравнения вычисляется критерий, который приближённо следует распределению χ2 только в том случае, если модель выбрана правильно. Если модель выбрана неправильно, то значение критерия превысит значение случайной величины, распределённой по закону χ2. Основным преимуществом этого критерия является его гибкость. Его можно легко использовать для проверки допущения о любом распределении.
Основными недостатками критерия χ2 являются нечувствительность к обнаружению адекватной модели, когда число наблюдений велико, и зачастую необходимо группировать данные по произвольным интервалам, что может оказать влияние на результат проверки.
Как и любой критерий, критерий χ2 не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости согласие или несогласие.
В общем случае проверка с помощью χ2 производится следующим образом:
1. Нахождение оценок для каждого из неизвестных параметров принятого распределения.
2. Деление полученных данных на k интервалов и определение вероятности попадания в каждый интервал случайной величины, имеющей принятое распределение. Существует 2 метода выполнения этой работы. Первый из них применяется в том случае, когда данные первоначально были распределены по интервалам или могут быть разбиты по этим интервалам естественным образом. Это будет иметь место в случае дискретного распределения. Второй метод применяется, когда данные первоначально не разбиваются на интервалы.
Метод 1. Число интервалов k, на которые разбиваются полученные данные, подчиняются требованию, чтобы для принятой модели ожидаемое число наблюдений в каждом интервале было не меньше пяти [1]. Пусть CLi и CUi обозначают соответственно нижнюю и верхнюю границы i-го интервала. Затем для нахождения оценки,
P(CLi ≤ x < CUi),
i = 1, 2,… k, т. Е. вероятности попадания случайного наблюдения в каждый из интервалов, используется принятое значение распределения.
Метод 2. В данном случае выбор k более произволен. Когда число наблюдений N велико (например, более 200) [1], одно из возможных правил состоит в выборе в качестве k целого числа, ближайшего к:
k = 4[0,75(N – 1)2]0,2
При средних значениях N правило выбора k состоит в выборе как можно большего значения k при условии, что оно не должно превышать N/5.
Границы интервалов x1, x2,…xk определяются с помощью теоретического распределения (с использованием оценок параметров) так, что
P(x ≤ x1) = 1/k
P(x ≤ x2) = 2/k,… P(x ≤ xk -1) = (k – 1)/k
Нижняя граница первого интервала и верхняя граница последнего интеграла являются соответственно наименьшим и наибольшим значениями, которые может принимать случайная величина, В этом случае границы интервалов установили таким образом, что для каждого интервала вероятность попадания случайной величины в данный интервал оценивается как 1/k.
3. Умножение
каждой вероятности попадания
наблюдений в интервал на
Ei = N/k, i = 1, 2, … k.
4. Если данные
не были предварительно
5. Вычисляем критерий χ2
При использовании второго метода это выражение немного проще и имеет вид:
6. Сравнить вычисленное значение χ2 с табличным значением, выбирая число степеней свободы r.
R = k – r – 1,
где k – число рассматриваемых интервалов;
r – число параметров распределения.
Поскольку односторонний критерий более «жестоко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α:
P[χ2 > χ2кр(α; r)] = α[1]
Таким образом, правосторонняя критическая область определяется неравенством
χ2 > χ2кр(α; r),
а область принятия нулевой гипотезы – неравенством
χ2 < χ2кр(α; r)
По таблице распределения χ2 найдём критическую точку χ2кр(α; r).
Если χ2набл < χ2кр – нет основания отвергать гипотезу, т. е. гипотеза верна, но если наоборот, т. е. χ2набл < χ2кр, гипотезу отвергаем. Большие значения χ2 означают, что анализируемые данные противоречат принятой модели. В этом случае полезно сравнить фактические частоты с ожидаемыми, чтобы увидеть, какие интервалы оказывают наибольшее влияние на величину χ2. Это сравнение показывает характер отклонений от принятой модели.
В общем
случае выполнение данной
Вывод о правдоподобности выдвинутой гипотезы
Проверка отсутствия последствия
Критерий
тренда
Критерий
серий
&
χ2
Критерий
согласия WE
Проверка стационарности потока
Проверка стационарности потока
Критерий
Краскала-Уоллиса
Проверка гипотезы о возможности описания потоков кадров сети Ethernet моделью простейшего потока
Выборка
04.04.2000 |
11:15:13 |
1541 |
04.04.2000 |
11:17:52 |
2388 |
04.04.2000 |
11:15:19 |
1722 |
04.04.2000 |
11:17:58 |
2199 |
04.04.2000 |
11:15:25 |
1412 |
04.04.2000 |
11:18:01 |
776 |
04.04.2000 |
11:15:28 |
905 |
04.04.2000 |
11:18:04 |
3040 |
04.04.2000 |
11:15:34 |
1390 |
04.04.2000 |
11:18:07 |
3025 |
04.04.2000 |
11:15:41 |
898 |
04.04.2000 |
11:18:10 |
128 |
04.04.2000 |
11:15:47 |
971 |
04.04.2000 |
11:18:13 |
2064 |
04.04.2000 |
11:15:50 |
1371 |
04.04.2000 |
11:18:22 |
1975 |
04.04.2000 |
11:15:56 |
2338 |
04.04.2000 |
11:18:26 |
1796 |
04.04.2000 |
11:15:59 |
64 |
04.04.2000 |
11:18:29 |
2574 |
04.04.2000 |
11:16:02 |
2106 |
04.04.2000 |
11:18:36 |
3557 |
04.04.2000 |
11:16:08 |
1033 |
04.04.2000 |
11:18:39 |
2073 |
04.04.2000 |
11:16:11 |
971 |
04.04.2000 |
11:18:46 |
1547 |
04.04.2000 |
11:16:17 |
1366 |
04.04.2000 |
11:18:53 |
2008 |
04.04.2000 |
11:16:23 |
5058 |
04.04.2000 |
11:18:57 |
1759 |
04.04.2000 |
11:16:29 |
1219 |
04.04.2000 |
11:19:04 |
5247 |
04.04.2000 |
11:16:33 |
1146 |
04.04.2000 |
11:19:07 |
2669 |
04.04.2000 |
11:16:39 |
1321 |
04.04.2000 |
11:19:12 |
1460 |
04.04.2000 |
11:16:45 |
1869 |
04.04.2000 |
11:19:17 |
4593 |
04.04.2000 |
11:16:48 |
3633 |
04.04.2000 |
11:19:24 |
1403 |
04.04.2000 |
11:16:54 |
2450 |
04.04.2000 |
11:19:27 |
5441 |
04.04.2000 |
11:17:03 |
1747 |
04.04.2000 |
11:19:33 |
2144 |
04.04.2000 |
11:17:06 |
2585 |
04.04.2000 |
11:19:39 |
4809 |
04.04.2000 |
11:17:09 |
3239 |
04.04.2000 |
11:19:42 |
1902 |
04.04.2000 |
11:17:15 |
1946 |
04.04.2000 |
11:19:48 |
2034 |
04.04.2000 |
11:17:20 |
2514 |
04.04.2000 |
11:19:54 |
4123 |
04.04.2000 |
11:17:26 |
3539 |
04.04.2000 |
11:20:20 |
1995 |
04.04.2000 |
11:17:32 |
2668 |
04.04.2000 |
11:20:03 |
2553 |
04.04.2000 |
11:17:38 |
4947 |
04.04.2000 |
11:20:09 |
2269 |
04.04.2000 |
11:17:41 |
1644 |
04.04.2000 |
11:20:16 |
1670 |
04.04.2000 |
11:17:44 |
437 |
04.04.2000 |
11:20:19 |
2028 |
04.04.2000 |
11:17:47 |
2408 |
04.04.2000 |
11:20:26 |
1678 |
1.1Расчёт критерия
серий при общем числе
Просматривая
данные выборки, определим
Таблица 1
Число |
Серия |
Число |
Серия |
Число |
Серия |
Число |
Серия | ||||
1541 |
- |
1146 |
- |
2388 |
+ |
12 |
2669 |
+ |
18 | ||
1722 |
- |
1321 |
- |
2199 |
- |
1460 |
- |
19 | |||
1412 |
- |
1869 |
- |
5 |
776 |
- |
13 |
4593 |
+ |
20 | |
905 |
- |
3633 |
+ |
3040 |
+ |
1403 |
- |
21 | |||
1390 |
- |
2450 |
+ |
6 |
3025 |
+ |
14 |
5441 |
+ |
22 | |
898 |
- |
1747 |
- |
7 |
128 |
- |
2144 |
- |
23 | ||
971 |
- |
2585 |
+ |
2064 |
- |
4809 |
+ |
24 | |||
1371 |
- |
1 |
3239 |
+ |
8 |
1975 |
- |
1902 |
- |
||
2338 |
+ |
2 |
1946 |
- |
9 |
1796 |
- |
15 |
2034 |
- |
25 |
64 |
- |
2514 |
+ |
2574 |
+ |
4123 |
+ |
26 | |||
2106 |
- |
3539 |
+ |
3557 |
+ |
16 |
1995 |
- |
27 | ||
1033 |
- |
2668 |
+ |
2073 |
- |
2553 |
+ |
||||
971 |
- |
4947 |
+ |
10 |
1547 |
- |
2269 |
+ |
28 | ||
1366 |
- |
3 |
1644 |
- |
2008 |
- |
1670 |
- |
29 | ||
5058 |
+ |
4 |
437 |
- |
11 |
1759 |
- |
17 |
2028 |
- |
|
1219 |
- |
2408 |
+ |
5247 |
+ |
1678 |
- |
Из таблицы видно, что я получил 29 серии, представляющие последовательность 64 наблюденного значения. Выполним проверку при уровне значимости α = 0,05. Выдвинем гипотезу о независимости значений:
r32; 0,975 < r ≤ r32; 0,025
22 < r ≤ 39
Результаты расчёта критерия серий показали, что выдвинутая мною гипотеза об отсутствии последствия входящего потока, образуемого кадрами сети Ethernet, принимается с уровнем значимости 0,05, так как найденное значение r = 29 входит в интервал между 22 и 39.
1.2Расчёт критерия
тренда при общем числе
Проверим последовательность наблюденных значений на наличие тренда при уровне значимости α = 0,05. Полученные данные представлены в таблице 2.
Таблица 2
Число |
Число |
Число |
Число |
||||
1541 |
18 |
1146 |
3 |
2388 |
20 |
2669 |
11 |
1722 |
22 |
1321 |
3 |
2199 |
18 |
1460 |
1 |
1412 |
16 |
1869 |
12 |
776 |
1 |
4593 |
11 |
905 |
5 |
3633 |
38 |
3040 |
22 |
1403 |
0 |
1390 |
13 |
2450 |
26 |
3025 |
21 |
5441 |
11 |
898 |
4 |
1747 |
9 |
128 |
0 |
2144 |
6 |
971 |
4 |
2585 |
28 |
2064 |
13 |
4809 |
9 |
1371 |
10 |
3239 |
32 |
1975 |
8 |
1902 |
2 |
2338 |
33 |
1946 |
12 |
1796 |
6 |
2034 |
4 |
64 |
0 |
2514 |
24 |
2574 |
15 |
4123 |
6 |
2106 |
28 |
3539 |
30 |
3557 |
16 |
1995 |
2 |
1033 |
4 |
2668 |
26 |
2073 |
11 |
2553 |
4 |
971 |
3 |
4947 |
33 |
1547 |
2 |
2269 |
3 |
1366 |
6 |
1644 |
6 |
2008 |
7 |
1670 |
0 |
5058 |
47 |
437 |
1 |
1759 |
4 |
2028 |
1 |
1219 |
4 |
2408 |
21 |
5247 |
17 |
1678 |
- |
Информация о работе Обоснование модели простейшего потока, образуемого кадрами сети Ethernet