Автор: Пользователь скрыл имя, 22 Декабря 2011 в 21:09, контрольная работа
Формирование признака Y (объем отгруженной инновационной продукции, приходящийся на одного человека)
Построение гистограммы признака с целью определения закона распределения (т.к. на Y воздействует большое количество неуправляемых мультипликативных факторов, можно предположить логнормальное распределение)
Формирование lnY и построение гистограммы. Выбор карманов так, чтобы элементы распределились равномерно на интервале. (в «еще» не должно быть более 2-х элементов).
Распределение
смесей
Карман | Частота |
1 | 1 |
2 | 0 |
3 | 2 |
4 | 5 |
5 | 5 |
6 | 8 |
7 | 24 |
8 | 14 |
9 | 10 |
10 | 3 |
11 | 0 |
Еще | 0 |
μ | σ | q |
3,7 | 0,8 | 0,17 |
6,5 | 0,65 | 0,58 |
8,4 | 0,7 | 0,25 |
Отметим, что при формировании столбца q (веса) последний элемент лучше формировать путем вычитания из единицы первого и второго столбца (т.к. сумма всех трех элементов =1).
Значения q выбираем по графику, руководствуясь тем, сколько примерно % занимает каждая страта
Для
каждого значения
Y в меню fx
задаем, например:=НОРМРАСП(B2;$H$3;$I$
Данную формулу растягиваем на весь столбец
Формируем L: =ПРОИЗВЕД(D3:D73). Если значения получились очень маленькие, например, Е-66, то лучше для наглядности L помножить на 1Е+66.
Изменяя последовательно значения переменных в табл.
μ | σ | q |
Находим максимальное значение функции.
L | 9,76204E-57 | 976,2041 |
μ | σ | q |
Строим функцию распределения. Выбираем интервал (согласно анализируемым данным, в нашем случае от 1, 1 до 10 с шагом 0,1) и для каждого значения находим плотность вероятности всей смеси и каждой компоненты (1,2,3 страты).
Фрагмент таблицы:
общая | 1 страта | 2 страта | 3 страта | |
1,1 | 0,000431173 | 0,000431173 | 3,66784E-16 | 3,4505E-25 |
1,2 | 0,00064223 | 0,00064223 | 1,3012E-15 | 1,5152E-24 |
1,3 | 0,000941768 | 0,000941768 | 4,50818E-15 | 6,5189E-24 |
1,4 | 0,001359601 | 0,001359601 | 1,52538E-14 | 2,7481E-23 |
1,5 | 0,001932382 | 0,001932382 | 5,04052E-14 | 1,1351E-22 |
1,6 | 0,002703889 | 0,002703889 | 1,62665E-13 | 4,5935E-22 |
1,7 | 0,003724764 | 0,003724764 | 5,12664E-13 | 1,8214E-21 |
1,8 | 0,005051529 | 0,005051529 | 1,57795E-12 | 7,0763E-21 |
1,9 | 0,006744676 | 0,006744676 | 4,74323E-12 | 2,6937E-20 |
2 | 0,008865709 | 0,008865709 | 1,39244E-11 | 1,0047E-19 |
2,1 | 0,01147308 | 0,01147308 | 3,99207E-11 | 3,6713E-19 |
2,2 | 0,014617084 | 0,014617084 | 1,11774E-10 | 1,3145E-18 |
2,3 | 0,018333931 | 0,01833393 | 3,05637E-10 | 4,6117E-18 |
2,4 | 0,022639383 | 0,022639382 | 8,1619E-10 | 1,5852E-17 |
2,5 | 0,027522491 | 0,027522489 | 2,12862E-09 | 5,3387E-17 |
2,6 | 0,032940112 | 0,032940106 | 5,42156E-09 | 1,7617E-16 |
2,7 | 0,038812944 | 0,038812931 | 1,34856E-08 | 5,6959E-16 |
2,8 | 0,04502382 | 0,045023787 | 3,27597E-08 | 1,8044E-15 |
Где графа общая =
=НОРМРАСП($C76;$H$3;$I$3;ЛОЖЬ)
Первая страта
=НОРМРАСП($C76;$H$3;$I$3;ЛОЖЬ)
Вторая страта
НОРМРАСП(C76;$H$4;$I$4;ЛОЖЬ)*$
Третья страта=
=НОРМРАСП(C76;$H$5;$I$5;ЛОЖЬ)*
Строим график:
Если
руководствоваться
Байевским критерием
минимума среднего риска
ошибок классификации
в отсутствии априорных
данных объект следует
отнести к той страте,
для которой максимально
значение плотности
вероятности для признака,
характеризующего данный
объект. Таким образом,
границы страт можно
определить как абсциссы
точек распределения
компонент смеси (т.е.
границы страт находятся
на пересечении кривых
плотности распределения
страт).
Преимущества и недостатки использования смесей для классификации экономических объектов.
12.
Выполнить итоговый
тест!