Распределение смесей

Автор: Пользователь скрыл имя, 22 Декабря 2011 в 21:09, контрольная работа

Описание работы

Формирование признака Y (объем отгруженной инновационной продукции, приходящийся на одного человека)
Построение гистограммы признака с целью определения закона распределения (т.к. на Y воздействует большое количество неуправляемых мультипликативных факторов, можно предположить логнормальное распределение)
Формирование lnY и построение гистограммы. Выбор карманов так, чтобы элементы распределились равномерно на интервале. (в «еще» не должно быть более 2-х элементов).

Работа содержит 1 файл

Распределение смесей(задание).doc

— 408.50 Кб (Скачать)

Распределение смесей 

  1. Формирование  признака Y (объем отгруженной инновационной продукции, приходящийся на одного человека)
  2. Построение гистограммы признака с целью определения закона распределения (т.к. на Y воздействует большое количество неуправляемых мультипликативных факторов,  можно предположить логнормальное распределение)
  3. Формирование lnY и построение гистограммы. Выбор карманов так, чтобы элементы распределились равномерно на интервале.  (в «еще» не должно быть более 2-х элементов).
Карман Частота
1 1
2 0
3 2
4 5
5 5
6 8
7 24
8 14
9 10
10 3
11 0
Еще 0

  1. Выдвинуть предположение о  числе (количестве) элементов  смеси (стратах). Можно  предположить, что  страт будет три (передовые, средние и отстающие  регионы).
  2. Упорядочить анализируемую переменную (lnY ) по возрастанию (если есть выбросы, то их лучше удалить из анализа).
  3. Вычисление оценок методом максимального правдоподобия (МП). Для этого формируем функцию правдоподобия для параметров, начальное приближение для которых оцениваем по графику (гистограмме). Составляем таблицу параметров, например,
 
μ σ q
3,7 0,8 0,17
6,5 0,65 0,58
8,4 0,7 0,25
 

       Отметим, что при формировании столбца q (веса) последний элемент лучше формировать путем вычитания из единицы первого и второго столбца (т.к. сумма всех трех элементов =1).

    Значения  q выбираем по графику, руководствуясь тем, сколько примерно % занимает каждая страта

  1. Путем последовательного изменения каждого параметра (задача оптимизации) добиваемся получения максимума функции правдоподобия. (L(lnY)=Пf(yi).

    Для каждого значения Y в меню fx задаем, например:=НОРМРАСП(B2;$H$3;$I$3;ЛОЖЬ)*q1($J$3)+НОРМРАСП(B2;$H$4;$I$4;ЛОЖЬ)* q2($J$4)+НОРМРАСП(B2;$H$5;$I$5;ЛОЖЬ)* q3($J$5).

    Данную  формулу растягиваем  на весь столбец

    Формируем L: =ПРОИЗВЕД(D3:D73). Если значения получились очень маленькие, например, Е-66, то лучше для наглядности L помножить на 1Е+66.

    Изменяя последовательно  значения переменных в табл.

μ σ q

    Находим максимальное значение функции.

L 9,76204E-57 976,2041
 
  1. Анализируем качество аппроксимации теоретическим распределением эмпирических данных. Для этого по найденным параметрам
μ σ q

    Строим  функцию распределения. Выбираем интервал (согласно анализируемым данным, в нашем случае от 1, 1 до 10 с шагом 0,1) и для каждого значения находим плотность вероятности всей смеси и каждой компоненты (1,2,3 страты).

    Фрагмент  таблицы:

        общая 1 страта 2 страта 3 страта
      1,1 0,000431173 0,000431173 3,66784E-16 3,4505E-25
      1,2 0,00064223 0,00064223 1,3012E-15 1,5152E-24
      1,3 0,000941768 0,000941768 4,50818E-15 6,5189E-24
      1,4 0,001359601 0,001359601 1,52538E-14 2,7481E-23
      1,5 0,001932382 0,001932382 5,04052E-14 1,1351E-22
      1,6 0,002703889 0,002703889 1,62665E-13 4,5935E-22
      1,7 0,003724764 0,003724764 5,12664E-13 1,8214E-21
      1,8 0,005051529 0,005051529 1,57795E-12 7,0763E-21
      1,9 0,006744676 0,006744676 4,74323E-12 2,6937E-20
      2 0,008865709 0,008865709 1,39244E-11 1,0047E-19
      2,1 0,01147308 0,01147308 3,99207E-11 3,6713E-19
      2,2 0,014617084 0,014617084 1,11774E-10 1,3145E-18
      2,3 0,018333931 0,01833393 3,05637E-10 4,6117E-18
      2,4 0,022639383 0,022639382 8,1619E-10 1,5852E-17
      2,5 0,027522491 0,027522489 2,12862E-09 5,3387E-17
      2,6 0,032940112 0,032940106 5,42156E-09 1,7617E-16
      2,7 0,038812944 0,038812931 1,34856E-08 5,6959E-16
      2,8 0,04502382 0,045023787 3,27597E-08 1,8044E-15

    Где графа общая =

    =НОРМРАСП($C76;$H$3;$I$3;ЛОЖЬ)* q1 ($J$3)+НОРМРАСП(C76;$H$4;$I$4;ЛОЖЬ)* q2 ($J$4)+НОРМРАСП(C76;$H$5;$I$5;ЛОЖЬ)* q3 ($J$5)

    Первая  страта

    =НОРМРАСП($C76;$H$3;$I$3;ЛОЖЬ)*$J$3.

    Вторая  страта

    НОРМРАСП(C76;$H$4;$I$4;ЛОЖЬ)*$J$4.

    Третья  страта=

    =НОРМРАСП(C76;$H$5;$I$5;ЛОЖЬ)*$J$5. 

    Строим  график:

     

    Если  руководствоваться  Байевским критерием минимума среднего риска ошибок классификации в отсутствии априорных данных объект следует отнести к той страте, для которой максимально значение плотности вероятности для признака, характеризующего данный объект. Таким образом, границы страт можно определить как абсциссы точек распределения компонент смеси (т.е. границы страт находятся на пересечении кривых плотности распределения страт). 

  1. Сделать вывод о принадлежности объектов к стратам (построить  таблицу классификации).
 
  1.   В Прометее прислать  результаты работы до 15.12.05.
  2. В форуме до 15. 12 05 ответить на вопрос:

    Преимущества  и недостатки использования  смесей для классификации  экономических объектов.

    12. Выполнить итоговый  тест! 

Информация о работе Распределение смесей