Компьютерные технологии статистических методов в управлении качеством при анализе данных

Автор: Пользователь скрыл имя, 23 Декабря 2012 в 13:24, курсовая работа

Описание работы

1. Постановка задачи.
При сбое на телефонной линии главным показателем является время устранения дефекта. Определите оценки математического ожидания, моды, медианы, дисперсии, размах выборки. Постройте доверительные интервалы для среднего и дисперсии, если известно, что случайная величина распределена по нормальному закону.

Содержание

Постановка задачи.
Теоретические основы. Методы. Область применения.
Решение задачи.
Вывод.
Список литературы.

Работа содержит 1 файл

statistika (1).docx

— 168.55 Кб (Скачать)

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ЖЕЛЕЗНОДОРОДНОГО ТРАНСПОРТА

 

Федеральное Государственное бюджетное  образовательное учреждение высшего  профессионального образования 

 

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПУТЕЙ СООБЩЕНИЯ»

 

Институт пути, строительства  и сооружений

 

Кафедра «Менеджмент качества»

 

 

Курсовая работа

по дисциплине «Статистические  методы в управлении качеством»

на тему «Компьютерные технологии статистических методов в управлении качеством при анализе данных»

 

 

 

Выполнил:

Ст. гр. СКУ 312

Е. Е. Пылаев

 

Проверил:

И. В. Изотова

 

 

Москва 

2012

 

Курсовое  проектирование

«Статистические методы в управлении качеством»

 

Содержание курсового проекта:

  1. Постановка задачи.
  2. Теоретические основы. Методы. Область применения.
  3. Решение задачи.
  4. Вывод.
  5. Список литературы.

 

  1. Постановка задачи.

При сбое на телефонной линии главным  показателем является время устранения дефекта. Определите оценки математического  ожидания, моды, медианы, дисперсии, размах выборки. Постройте доверительные  интервалы для среднего и дисперсии, если известно, что случайная величина распределена по нормальному закону.

18

23

33

26

23

30

27

23

28

26

16

27

29

25

23

26

21

23

20

24

21

28

32

28

25

25

30

24

18

22

22

25

26

21

27

22

27

17

20

30

19

26

23

23

28

22

32

26

22

23

31

21

28

20

31

27

36

25

29

26

23

22

32

21

24

22

31

22

30

24

28

24

24

20

26

19

19

22

22

23

24

28

24

36

31

21

20

22

30

25

24

25

20

28

19

18

33

27

25

17

28

26

26

19

27

17

29

24

28

27

18

18

20

23

33

25

30

20

20

16

 

24

22

23

23

21

23

22

28

26

17

23

19

25

29

0

0

0

0

0

0

0

0

0

18

23

33

26

23

30

27

23

28


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Теоретические основы. Методы. Область применения.

Числовые  характеристики выборки

Одним из этапов обработки данных является вычисления числовых характеристик  выборки. Главные из них: среднее значение, дисперсия, среднее квадратическое значение, моменты.

 Так как функцию выборочных  значений называют статистикой,  то числовые характеристики, вычисленные  по выборке, также называют  статистиками.

 Числовые характеристики, вычисленные  по генеральной совокупности, называют  параметрами генеральной совокупности.

 

Выборочное  среднее

Для конкретной выборки объема n ее выборочное среднее  определяется соотношением

 где Xi – значение элемента выборки.

 Обычно требуется описать  статистические свойства произвольных  случайных выборок одного объема, а не одной из них. Это  значит, что рассматривается математическая  модель, которая предполагает достаточно  большое количество выборок объема n. В этом случае элементы выборки  рассматриваются как независимые случайные величины Xi, принимающие значения Xi с одной и тоже плотностью вероятностей f(x), являющейся плотностью вероятностей генеральной совокупности. Тогда выборочное среднее также является случайной величиной , равной

 Среднее значение генеральной  совокупности, из которой производится  выборка, будем называть генеральным средним и обозначать mx. При значительном объеме выборки можно ожидать, что выборочное среднее не будет заметно отличаться от генерального среднего. Поскольку выборочное среднее является случайной величиной, то для нее можно найти математическое ожидание:

 Таким образом, математическое  ожидание выборочного среднего  равно генеральному среднему. В  этом случае говорят, что выборочное  среднее является несмещенной  оценкой генерального среднего. В дальнейшем мы вернемся к  этому термину. Так как выборочное  среднее является случайной величиной,  флуктуирующей вокруг генерального  среднего, то желательно оценить  эту флуктуацию с помощью дисперсии  выборочного среднего. Рассмотрим  выборку, объем которой n значительно  меньше объема генеральной совокупности N (n << N).

Предположим, что при формировании выборки характеристики генеральной  совокупности не меняются, что эквивалентно предположению N = ¥. Тогда

Случайные величины Xi и Xj (i¹j) независимы, следовательно,

 Подставим полученный результат  в формулу для дисперсии:

, где  – дисперсия генеральной совокупности. Тогда среднее квадратическое отклонение выборочного среднего  равно:

.

 Из этой формулы следует,  что с увеличением объема выборки  флуктуации среднего выборочного  около среднего генерального  уменьшаются как  . Проиллюстрируем сказанное примером. Пусть имеется случайный сигнал с математическим ожиданием и дисперсией, соответственно равными mx = 10,   = 9.

 Отсчеты сигнала берутся  в равноотстоящие моменты времени t1, t2, ... , tn.

 

 Так как отсчеты являются  случайными величинами, то будем их обозначать X(t1), X(t2), ... , X(tn).

 Определим количество отсчетов, чтобы среднее квадратическое отклонение оценки математического ожидания сигнала не превысило 1% его математического ожидания. Поскольку mx=10, то нужно, чтобы . С другой стороны,  поэтому   или . Отсюда получаем, что n ³ 900 отсчетов.

Вариационный интервальный ряд

Важнейшей частью статистического анализа  является построение рядов распределения (структурной группировки) с целью  выделения характерных свойств  и    закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.

Если  за основу группировки взят качественный признак, то такой ряд распределения  называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если  ряд распределения построен по количественному  признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного  ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Другие формы вариационного  ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают  дискретные (прерывные) и непрерывные  признаки.

Дискретный  ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Дискретный вариационный ряд представляет таблицу, которая состоит из двух граф. В первой графе указывается  конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака.

Если признак имеет непрерывное  изменение (размер дохода, стаж работы, стоимость основных фондов предприятия  и т.д., которые в определенных границах могут принимать любые  значения), то для этого признака нужно строить интервальный вариационный ряд.

Групповая таблица здесь также  имеет две графы. В первой указывается  значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота).

Частота (частота повторения) - число  повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается

где k - число вариантов значений признака

Очень часто таблица дополняется  графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение.

Частоты ряда f могут заменяться частностями w, выраженными в относительных  числах (долях или процентах). Они  представляют собой отношения частот каждого интервала к их общей  сумме, т.е.:

 

При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп m:

где R = X max – X min; m = 1 + 3,322 lgn (формула Стерджесса); n - общее число единиц совокупности.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана  и мода, или так называемые структурные  средние. Если средняя арифметическая рассчитывается на основе использования  всех вариантов значений признака, то медиана и мода характеризуют  величину того варианта, который занимает определенное среднее положение  в ранжированном вариационном ряду.

Функция распределения

Функция распределения в теории вероятностей — функция, характеризующая распределение случайной величины или случайного вектора. При соблюдении известных условий полностью определяет случайную величину.

1.      Равномерный  закон распределения. 

На практике встречаются случайные  величины, о которых заранее известно, что они могут принять какое-либо значение в строго определенных границах, причем в этих границах все значения случайной величины имеют одинаковую вероятность (обладают одной и той  же плотностью вероятностей).

Например, при поломке часов  остановившаяся минутная стрелка будет  с одинаковой вероятностью (плотностью вероятности) показывать время, прошедшее  от начала данного часа до поломки  часов. Это время является случайной  величиной, принимающей с одинаковой плотностью вероятности значения, которые  не выходят за границы, определенные продолжительностью одного часа. К  подобным случайным величинам относится  также и погрешность округления. Про такие величины говорят, что  они распределены равномерно, т. е. имеют  равномерное распределение.

 Определение. Непрерывная случайная  величина Х имеет равномерное распределение на отрезке [а, b], если на этом отрезке плотность распределения вероятности случайной величины постоянна, т. е. если дифференциальная функция распределения f(х) имеет следующий вид:

Иногда это распределение называют законом равномерной плотности. Про величину, которая имеет равномерное  распределение на некотором отрезке, будем говорить, что она распределена равномерно на этом отрезке.

Найдем значение постоянной c. Так как площадь, ограниченная кривой распределения и осью Ox, равна 1, то

откуда с=1/(b-a).

Теперь функцию f(x) можно представить  в виде:

Построим функцию распределения F(x), для чего найдем выражение F(x) на интервале [a, b]:

Графики функций f(x) и F(x) имеют вид:

Нахождение  числовых характеристик.

Используя формулу для вычисления математического ожидания НСВ, имеем:

 Таким образом, математическое  ожидание случайной величины, равномерно  распределенной на отрезке [a, b] совпадает с серединой этого  отрезка. 

Найдем дисперсию равномерно распределенной случайной величины:

Информация о работе Компьютерные технологии статистических методов в управлении качеством при анализе данных