Автор: Пользователь скрыл имя, 27 Октября 2013 в 12:19, курсовая работа
Целью работы является проверка гипотезы о возможности описания потока, образуемого моментами появления кадров в сети Ethernet моделью простейшего потока.
Для реализации поставленной цели необходимо решить следующие задачи:
1.Выбрать согласно варианту – (порядковый номер в журнале) исходные данные для исследования.
2.Проанализировать исходные данные на предмет стационарности потока случайных событий, используя критерий Краскала-Уоллиса.
3.Исследовать поток данных на отсутствие последствия с помощью критерия серий и тренда.
Введение 3
1.Теоритический раздел 5
1.1 Определение простейшего потока. Характеристики простейшего потока. 5
1.2 Свойство стационарности. 7
1.3 Свойство отсутствия последствия. 8
1.4 Проверка допущений о распределениях. 10
1.4.1 Критерий согласия WE для проверки достоверности гипотезы об экспоненциальном распределении исследуемой статистики. 11
1.4.2 Использование критерия согласия χ2 для проверки достоверности гипотезы о распределении исследуемой статистики. 12
1.4.3 Схематическое представление выполнения курсового проекта. 15
2.Практическое исследование 16
2.1.1.Проверка свойства отсутствия последствия 17
2.1.2.Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия WE 19
2.1.3Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2 20
2.1.4 Проверка свойства стационарности 24
Вывод 25
Список использованных источников 26
По результатам получили, что общее число инверсий А = 773.
Рассмотрим гипотезу о том, что наблюдения представляют собой независимые наблюденные значения случайной величины, не содержащей тренда. В этом случае область приятия гипотезы определяется неравенством:
A100; 1-α/2 < A ≤ Aα/2
При уровне значимости α = 0,05 неравенство переписывается следующим образом:
A64; 0,975 < A ≤ A64; 0,025
731 < A ≤ 1038
Выдвинутая гипотеза принимается при 5% - ом уровне значимости, так как значение А = 773 попадает в интервал между 731 и 1038.
Поскольку критерий WE предназначен для исследования малочисленных выборок, то достаточным является проанализировать первые двадцать чисел от общего объёма наблюдений. Все данные для расчёта критерия WE представлены в таблице 3.
Таблица 3
Значение хi |
(xi – xсреднее)2 |
Значение хi |
(xi – xсреднее)2 |
1541 |
5730,49 |
2106 |
239414,49 |
1722 |
11088,09 |
1033 |
340705,69 |
1412 |
41902,09 |
971 |
416928,49 |
905 |
506516,89 |
1366 |
62850,49 |
1390 |
51392,89 |
5058 |
11842545,69 |
898 |
516529,69 |
1219 |
158165,29 |
971 |
416928,49 |
1146 |
221558,49 |
1371 |
60368,49 |
1321 |
87438,49 |
2338 |
520273,69 |
1869 |
63655,29 |
64 |
2410877,29 |
3633 |
4065465,69 |
Вспомогательные данные:
хсреднее = х = 1616,7
∑(xi – xсреднее)2 = 22040336,2
Воспользовавшись данными таблицы 3, рассчитаем критерий согласия WE по формуле:
WE = = 0,109385
Полученный
результат сравним с
[0,025 ≤ WE ≤ 0,106]
Вычисленное
значение не попадает в
Воспользуемся критерием χ2 для оценки приемлемости экспоненциального распределения в качестве модели для времени появления кадров в сети, данные по которым приведены в выборке. Для исследований выбраны 64 числа. В этом случае данные легко поддаются группировке, поэтому для разбиения данных по интервалам используется первый метод.
Порядок проверки состоит в следующем:
- По данной выборке найдём максимальные и минимальные объекты выборки:
xmax = 5441; xmin = 64;
Так как
минимальное значение
f(x) = λ,
где – λ параметр экспоненциального распределения:
λ = 1/xВ
где хВ – средняя выборочная эмпирического распределения
хВ =
λ = 1/2209,140625 = 0,000453
- Определим размах варьирования:
R = xmax – xmin = 5441 – 64 = 5377
- Для определения числа интервалов группировки k воспользуемся эмпирической формулой Стерджеса с округлением до большего значения:
k = 1 + 3,32lgN,
Где N – число наблюдений;
k = 1 + 3,32lg64 = 7
h = R/k
h = 5377/7 = 768,143
Так как данные не были предварительно табулированы подсчитаем число наблюдений в каждом интервале mi , т. е. число элементов вариационного ряда, попавших в интервалы [CLi; CUi], где I = 1…k,
CLi – нижняя границ i – го интервала,
CUi – верхняя граница i – го интервала.
- Определим
вероятность попадания
,
где xi, xi + 1 границы частотных интервалов.
Все вычисления занесём в табл. 4
Таблица 4
Расчёт критерия χ2
CUi |
mi |
pi |
xi |
832,143 |
4 |
0,487065549 |
448,0715 |
1600,286 |
16 |
0,20158429 |
1632,286 |
2368,429 |
22 |
0,142342885 |
1984,3575 |
3136,572 |
11 |
0,100511289 |
2752,5005 |
3904,715 |
4 |
0,070973124 |
3520,6435 |
4672,858 |
2 |
0,050115608 |
4288,7865 |
5441 |
5 |
0,035387641 |
5056,929 |
CUi – верхняя граница i – го интервала
mi – фактическое число наблюдений в i – ом интервале
pi – вероятность попадания случайной величины в i – ый интервал
xi – середина i – го интервала.
- По данным
в таблице построим
Гистограмма частот
Была выдвинута гипотеза о том, что время появления кадров в сети распределено по показательному закону, но в нашем случае получилось, что время появления кадров в сети распределено по нормальному закону, следовательно, данная гипотеза не подтверждается.
Рассчитаем критерий χ2.
- Задаёмся
уровнем значимости и
- Определяем значение параметра χ2. Для удобства подсчёта χ2набл построим табл. 5.
Таблица 5
mi |
pi |
Ni = N*pi |
|
4 |
0,487065549 |
31,1722 |
5,618972 |
16 |
0,20158429 |
12,90139 |
0,030242 |
22 |
0,142342885 |
9,109945 |
0,369543 |
11 |
0,100511289 |
6,432722 |
0,03276 |
4 |
0,070973124 |
4,54228 |
0,000326 |
2 |
0,050115608 |
3,207399 |
0,001142 |
5 |
0,035387641 |
2,264809 |
0,004137 |
- Используя формулу
получили χ2набл = 6,057122
- Сравним полученное значение χ2набл и χ2кр. Из приложения 2 видно, что
χ2кр = 11,07
6,057122 < 11,07
Результат исследования критерия χ2 показал, что данная гипотеза не верна, т. К. мы получили нормальное распределение времени появления кадров в сети, а не экспоненциальное.
Пусть X1… Xk – случайные величины, определяемые числом событий потока на k непересекающихся интервалах одинаковой длины; тогда есть j-ая реализация случайной величины Xj (j = 1,… m). В качестве k рассмотрим временные интервалы, например, трёхсекундной кратности (3, 6,… kn c), а в качестве j – временные интервалы, например, тридцати секундной кратности (30, 60, … jn с). Такие интервалы удобно взять конкретно для исследуемой выборки, для любой другой последовательности, временные интервалы могут быть как секундной минутной, так и часовой кратности. Выбор интервалов напрямую зависит от показаний. Тогда есть суммарные значения числа кадров, прошедших через порт коммутатора. В таблице 6 представлены данные значения и соответствующие им ранги.
Таблица 6
6 |
Ранг |
12 |
Ранг |
18 |
Ранг |
24 |
Ранг |
30 |
Ранг | |
30 |
1371 |
14 |
2338 |
42,5 |
2106 |
38 |
1033 |
9 |
971 |
7,5 |
60 |
1366 |
13 |
5058 |
62 |
1146 |
10 |
1321 |
12 |
1869 |
28 |
90 |
3633 |
57 |
2450 |
45 |
1747 |
25 |
2585 |
49 |
1946 |
30 |
120 |
2514 |
46 |
3539 |
55 |
2668 |
50 |
4947 |
61 |
437 |
3 |
150 |
2408 |
44 |
2199 |
40 |
776 |
4 |
3025 |
52 |
2064 |
36 |
Сум. ранг Rk |
174 |
244,5 |
127 |
183 |
104,5 | |||||
Rk2 |
30276 |
59780,25 |
16129 |
33489 |
10920,25 |
H = –
- 3(25 + 1) = 478,04
Проверим значимость
полученного критерия путём
478,04 > 9,49
Получается, что гипотеза о стационарности потока, образуемого кадрами, не верна с уровнем значимости 0,05.
В данной
работе мы исследовали поток,
образуемый моментами
Результат: из всех гипотез сошлась только одна, а именно гипотеза об отсутствии последствия. Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2 показала, что с заданными параметрами у нас получается нормальный закон распределения. Также при проверке свойства стационарности мы получили значение критерия Краскала – Уоллиса, значительно превышающее критическое. Следовательно, можно утверждать о том, что гипотеза о возможности описания потока, образуемого моментами появления кадров в сети Ethernet, моделью простейшего потока является неверной, а это значит, что поток не является простейшим.
Информация о работе Обоснование модели простейшего потока, образуемого кадрами сети Ethernet