Обоснование модели простейшего потока, образуемого кадрами сети Ethernet

Автор: Пользователь скрыл имя, 27 Октября 2013 в 12:19, курсовая работа

Описание работы

Целью работы является проверка гипотезы о возможности описания потока, образуемого моментами появления кадров в сети Ethernet моделью простейшего потока.
Для реализации поставленной цели необходимо решить следующие задачи:
1.Выбрать согласно варианту – (порядковый номер в журнале) исходные данные для исследования.
2.Проанализировать исходные данные на предмет стационарности потока случайных событий, используя критерий Краскала-Уоллиса.
3.Исследовать поток данных на отсутствие последствия с помощью критерия серий и тренда.

Содержание

Введение 3
1.Теоритический раздел 5
1.1 Определение простейшего потока. Характеристики простейшего потока. 5
1.2 Свойство стационарности. 7
1.3 Свойство отсутствия последствия. 8
1.4 Проверка допущений о распределениях. 10
1.4.1 Критерий согласия WE для проверки достоверности гипотезы об экспоненциальном распределении исследуемой статистики. 11
1.4.2 Использование критерия согласия χ2 для проверки достоверности гипотезы о распределении исследуемой статистики. 12
1.4.3 Схематическое представление выполнения курсового проекта. 15
2.Практическое исследование 16
2.1.1.Проверка свойства отсутствия последствия 17
2.1.2.Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия WE 19
2.1.3Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2 20
2.1.4 Проверка свойства стационарности 24
Вывод 25
Список использованных источников 26

Работа содержит 1 файл

Курсовая (Симонович).doc

— 112.03 Кб (Скачать)

 

     По результатам получили, что общее число инверсий А = 773.

     Рассмотрим гипотезу о том, что наблюдения представляют собой независимые наблюденные значения случайной величины, не содержащей тренда. В этом случае область приятия гипотезы определяется неравенством:

A100; 1-α/2 < A ≤ Aα/2

 

     При уровне значимости α = 0,05 неравенство переписывается следующим образом:

 

A64; 0,975 < A ≤ A64; 0,025

 

731 < A ≤ 1038

 

     Выдвинутая гипотеза принимается при 5% - ом уровне значимости, так как значение А = 773 попадает в интервал между 731 и 1038.

 

2.1.2.Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия WE

       Поскольку  критерий WE предназначен для исследования малочисленных выборок, то достаточным является проанализировать первые двадцать чисел от общего объёма наблюдений. Все данные для расчёта критерия WE представлены в таблице 3.

 

Таблица 3

Значение хi

(xi – xсреднее)2

Значение хi

(xi – xсреднее)2

1541

5730,49

2106

239414,49

1722

11088,09

1033

340705,69

1412

41902,09

971

416928,49

905

506516,89

1366

62850,49

1390

51392,89

5058

11842545,69

898

516529,69

1219

158165,29

971

416928,49

1146

221558,49

1371

60368,49

1321

87438,49

2338

520273,69

1869

63655,29

64

2410877,29

3633

4065465,69


 

       Вспомогательные  данные:

хсреднее = х = 1616,7

 

∑(xi – xсреднее)2 = 22040336,2

 

     Воспользовавшись данными таблицы 3, рассчитаем критерий согласия WE по формуле:

 

WE = = 0,109385

 

        Полученный  результат сравним с двусторонним  доверительным интервалом, который  при заданном уровне значимости  и объёме выборки составит:

[0,025 ≤ WE ≤ 0,106]

     Вычисленное  значение не попадает в интервал, а  это значит, что выдвинутая  гипотеза об экспоненциальном  распределении времени появления  заявок в сети не верна с уровнем значимости 0,05. 

2.1.3Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2

     Воспользуемся  критерием χ2 для оценки приемлемости экспоненциального распределения в качестве модели для времени появления кадров в сети, данные по которым приведены в выборке. Для исследований выбраны 64 числа. В этом случае данные легко поддаются группировке, поэтому для разбиения данных по интервалам используется первый метод.

     Порядок проверки состоит в следующем:

     - По данной  выборке найдём максимальные  и минимальные объекты выборки:

 

xmax = 5441; xmin = 64;

 

     Так как  минимальное значение случайной  величины в рассматриваемом случае  равно 64 и выдвинутая гипотеза  об экспоненциальном законе распределения,  то необходимо осуществить смещение  по оси 0х на значение х0 = 64. Тогда функция плотности распределения будет выглядеть следующим образом:

 

f(x) = λ,

 

где – λ параметр экспоненциального  распределения:

 

λ = 1/xВ

 

где хВ – средняя выборочная эмпирического распределения

 

хВ =

 

λ = 1/2209,140625 = 0,000453

     - Определим  размах варьирования:

 

R = xmax – xmin = 5441 – 64 = 5377

 

     - Для определения числа интервалов группировки k воспользуемся эмпирической формулой Стерджеса с округлением до большего значения:

k = 1 + 3,32lgN,

Где N – число наблюдений;

k = 1 + 3,32lg64 = 7

  • Определим длину интервалов группировки

h = R/k

h = 5377/7 = 768,143

     Так как  данные не были предварительно  табулированы подсчитаем число наблюдений в каждом интервале mi , т. е. число элементов вариационного ряда, попавших в интервалы [CLi; CUi], где I = 1…k,

CLi – нижняя границ i – го интервала,

CUi – верхняя граница i – го интервала.

     - Определим  вероятность попадания случайного  наблюдения в каждый из интервалов:

,

где xi, xi + 1 границы частотных интервалов.

     Все вычисления  занесём в табл. 4

Таблица 4

Расчёт критерия χ2

CUi

mi

pi

xi

832,143

4

0,487065549

448,0715

1600,286

16

0,20158429

1632,286

2368,429

22

0,142342885

1984,3575

3136,572

11

0,100511289

2752,5005

3904,715

4

0,070973124

3520,6435

4672,858

2

0,050115608

4288,7865

5441

5

0,035387641

5056,929


 

CUi – верхняя граница i – го интервала

mi – фактическое число наблюдений в i – ом интервале

pi – вероятность попадания случайной величины в i – ый интервал

xi – середина i – го интервала.

     - По данным  в таблице построим гистограмму  частот, которую используют для  оценки закона распределения. По виду гистограммы можно предположить, что случайная величина распределена по нормальному закону.

 

 

 

Гистограмма частот

     Была выдвинута гипотеза о том, что время появления кадров в сети распределено по показательному закону, но в нашем случае получилось, что время появления кадров в сети распределено по нормальному закону,  следовательно, данная гипотеза не подтверждается.

     Рассчитаем  критерий χ2.

     - Задаёмся  уровнем значимости и определяем  число степеней свободы. Уровень  значимости принят α = 0,05. Для  экспоненциального закона распределения  число степеней свободы r = k – 2. Учитывая то, что выборку разбили на 7 интервалов, получилось, что r = 5.

     - Определяем  значение параметра χ2. Для удобства подсчёта χ2набл построим табл. 5.

Таблица 5

 

mi

pi

Ni = N*pi

 

4

0,487065549

31,1722

5,618972

16

0,20158429

12,90139

0,030242

22

0,142342885

9,109945

0,369543

11

0,100511289

6,432722

0,03276

4

0,070973124

4,54228

0,000326

2

0,050115608

3,207399

0,001142

5

0,035387641

2,264809

0,004137


 

 

     - Используя формулу

 

получили χ2набл = 6,057122

     - Сравним полученное  значение χ2набл и χ2кр. Из приложения 2 видно, что

χ2кр = 11,07

6,057122 < 11,07

     Результат  исследования критерия χ2 показал, что данная гипотеза не верна, т. К. мы получили нормальное распределение времени появления кадров в сети, а не экспоненциальное. 

 

2.1.4 Проверка свойства стационарности

     Пусть X1… Xk – случайные величины, определяемые числом событий потока на k непересекающихся интервалах одинаковой длины; тогда есть j-ая реализация случайной величины Xj (j = 1,… m). В качестве k рассмотрим временные интервалы, например, трёхсекундной кратности (3, 6,… kn c), а в качестве j – временные интервалы, например, тридцати секундной кратности (30, 60, … jn с). Такие интервалы удобно взять конкретно для исследуемой выборки, для любой другой последовательности, временные интервалы могут быть как секундной минутной, так и часовой кратности. Выбор интервалов напрямую зависит от показаний. Тогда есть суммарные значения числа кадров, прошедших через порт коммутатора. В таблице 6 представлены данные значения и соответствующие им ранги.

Таблица 6

 

6

Ранг

12

Ранг

18

Ранг

24

Ранг

30

Ранг

30

1371

14

2338

42,5

2106

38

1033

9

971

7,5

60

1366

13

5058

62

1146

10

1321

12

1869

28

90

3633

57

2450

45

1747

25

2585

49

1946

30

120

2514

46

3539

55

2668

50

4947

61

437

3

150

2408

44

2199

40

776

4

3025

52

2064

36

Сум. ранг Rk

174

 

244,5

 

127

 

183

 

104,5

Rk2

30276

 

59780,25

 

16129

 

33489

 

10920,25


 

H = –

- 3(25 + 1) = 478,04

     Проверим значимость  полученного критерия путём сравнения  с квантилем распределения χ2 с 4-мя степенями свободы. При заданном уровне значимости имеет место выполнение неравенства

478,04 > 9,49

      Получается, что гипотеза о стационарности потока, образуемого кадрами, не верна с уровнем значимости 0,05.

 

Вывод

     В данной  работе мы исследовали поток,  образуемый моментами появления  кадров в локальной вычислительной  сети Ethernet. В качестве исходных данных взят статистический материал, собранный системой дистанционного мониторинга посредством специализированного программного обеспечения. Проверена правдоподобность выдвинутых гипотез о стационарности рассматриваемых данных, об отсутствии последствия и об экспоненциальном распределении времени появления заявок в потоке.

     Результат: из всех гипотез сошлась только одна, а именно гипотеза об отсутствии последствия. Проверка достоверности гипотезы об экспоненциальном распределении исследуемой статистики с помощью критерия согласия χ2 показала, что с заданными параметрами у нас получается нормальный закон распределения. Также при проверке свойства стационарности мы получили значение критерия Краскала – Уоллиса, значительно превышающее критическое. Следовательно, можно утверждать о том, что гипотеза о возможности описания потока, образуемого моментами появления кадров в сети Ethernet, моделью простейшего потока является неверной, а это значит, что поток не является простейшим.

 

Список использованных источников

  1. Пугачёв В. С. Теория вероятностей и математическая статистика – М.: Физматлит, 2002. – 400с.
  2. Хогдал М. Анализ и диагностика компьютерных сетей – М.: Лори, 2002. – 353с.
  3. Шнепс М. А. Системы распределения информации. Методы расчёта: Справ. пособие. – М.: Связь, 1979. – 344с.
  4. Информационные технологии на железнодорожном транспорте учебник для вузов железнодорожного транспорта / Э. К. Лекций, В. И. Понкратов, В. В. Яковлев и др. – М.: УМК МПС России, 2000. – 680с.
  5. Бендат Дж., Пирсол А. Прикладной анализ случайных данных: Пер. с англ. – М.: Мир, 1989. – 540с.
  6. Хан Г., Шапиро С. Статистические модели в инженерных задачах: Пер. с англ. – М.: Мир, 1969. – 397с.
  7. Гмурман В. Е. Теория вероятностей и математическая статистика: Учеб. Пособие для вузов. – М.: Высш. шк., 2002. – 479с.

Информация о работе Обоснование модели простейшего потока, образуемого кадрами сети Ethernet