Автор: Пользователь скрыл имя, 22 Декабря 2012 в 20:48, курсовая работа
В курсовой работе рассматривается элементарная теория принятия решений (ТПР) в условиях неопределенности и риска. Предполагается, что человек находится как бы в состоянии игры с природой. А так как природа не может быть сознательным противником, то критерий минимального гарантированного результата (критерий максимина) в ТПР не может иметь большого значения в отличие от теории игр. Этот критерий в игре с природой слишком пессимистичен.
Тогда для каждой стратегии определяется усредненная по всем состояниям природы средняя полезность по формуле:
(13)
U(Si,Qj) – полезность стратегии при состоянии природы , которая находится по формуле (9). Затем из множества , , выделяется максимальный элемент,
Стратегия , обладающая максимальной средней полезностью , называется байесовской стратегией,
Пусть в рассмотренном ранее примере р(Q1) = 0.6, p(Q2) = 0.4. Используя данные табл. 9. и формулу (13), вычислим среднюю полезность для каждой допустимой стратегии,
= 10×0.6 + 0×0.4 = 6,
= 8.8×0.6 + 5×0.4 = 6.68,
= 7.6×0.6 + 4.9×0.4 = 6.52,
= 5.2×0.6 +5.6×0.4 =5.36,
= 4×0.6 + 7×0.4 =5.2 .
Затем найдем наибольшее число из полученных пяти чисел,
Следовательно, оптимальной стратегией является стратегия , обладающая максимальной средней полезностью, равной 6.68 ед.
Заметим, что стратегия является байесовской для конкретных значений априорных вероятностей: р(Q1) = 0.6, p(Q2) = 0.4. При других значениях р(Q1), р(Q2) байесовской может быть и другая стратегия. Так, при р(Q1) = 0.5, p(Q2) = 0.5 байесовской является стратегия .
Проведение эксперимента в рассмотренной ситуации выгодно. Действительно, если эксперимент не проводить, то по данным табл.7 имеем:
Байесовской операцией (стратегией) является операция а1, средняя полезность которой равна 6 ед.
Для дальнейших рассуждений нам понадобиться объединить выражения (13), (9) в одно,
Меняя порядок суммирования в правой части последнего равенства, получим
(14)
Из этого равенства следует, что при выборе оптимальной стратегии максимизация сводится к максимизации выражения в квадратных скобках в правой части (14), т.е. для каждого результата эксперимента zβ максимизация полезности Uβ(ai) сводится к выбору такой операции , которая максимизирует выражение в квадратных скобках.
3.4. Использование формулы Байеса
В общем случае число допустимых стратегий Si, i = 1, 2,…, , может быть очень велико, и поэтому пользоваться формулой (13) затруднительно. Эта трудность обходится с помощью формулы Байеса [3, 8, 13]. Проводя эксперимент, оценивают новые апостериорные вероятности состояний природы P(Qj/zb), j = 1, 2, …, n, b = 1, 2, …, t. Используя эти уточненные вероятности состояний природы, находят оптимальную операцию ai, i Î {1, 2, …, m}, обычным способом. Для простоты предположим, что распределения дискретные. Согласно формуле Байеса для апостериорной вероятности состояния природы Qj при результате эксперимента zb имеем:
– известная условная вероятность получить результат эксперимента zb при состоянии природы Qj, p(Qj) – априорная вероятность состояния природы Qj, P(zb) – полная вероятность результата эксперимен-та zb,
. (16)
Фиксируя b, bÎ{1, 2,…, t}, для каждой операции ai, i =1, 2, … ,m, находим среднюю полезность Ub (ai ) по формуле
, (17)
– условная вероятность, определяемая из равенства (15), a i j – полезность операции a i при состоянии природы Qj. Далее при фиксированном значении b находим
Операцию , ib Î{1, 2,…, m}, считаем оптимальной для данного результата эксперимента zb, bÎ{1, 2,…, t},
Покажем, что таким путем получается байесовская стратегия
SB =
В силу формул (15 – 17) имеем:
Из этого равенства следует, что для каждого результата эксперимента zb максимизация полезности Ub(ai ) сводится к отысканию такой операции , которая максимизирует выражение в квадратных скобках в его правой части.
В формулах (14), (18) для каждого результата эксперимента максимизация , Ub (ai) сводится к нахождению такой операции , которая максимизирует выражения в квадратных скобках, стоящих в их правых частях. А так как эти максимизирующие операции совпадают, то оба метода приводят к одному и тому же результату, что и требовалось доказать.
Затем находится максимальная усредненная по всем результатам эксперимента средняя полезность по формуле:
i=1,2,…,m,
где Ub(ai) определяется из равенства (17).
Отметим, что при отыскании оптимальной стратегии в вычислительном отношении проще использовать формулы (17), (15), а не формулы (13), (9).
В нашей задаче найдем оптимальную стратегию SB, используя второй метод, т.е. формулы (15) и (17).
Для b= 1 находим U1(a1),U1(a2),
Следовательно, при z1 оптимальной операцией является а1, дающая 7.5 ед. полезности, P(z1) = 0.48.
Для b=2 находим U2(a1), U2(a2),
Следовательно, при z2 оптимальной операцией является a2, дающая 5.875 ед. полезности, P(z2)=0.32.
Для b=3 находим U3(a1), U3(a2),
Следовательно, при z3 оптимальной операцией является a1, дающая 6 ед. полезности, P(z3)=0.20.
Оптимальной, байесовской стратегией является стратегия
совпадающая со стратегией S3, полученной при использовании формул (9), (13).
Вычислим максимальную (усредненную по трем результатам эксперимента) среднюю полезность по формуле (19),
что совпадает со значением , полученным ранее.
Заключение
Выбор решения в условиях неопределенности всегда условен, субъективен. И всё же в какой-то (ограниченной) мере математические методы полезны и тут. Прежде всего, они позволяют привести игру с природой к матричной форме, что далеко не всегда бывает просто, особенно когда стратегий много (в наших примерах их было очень мало). Кроме того, они позволяют заменить простое лицезрение матрицы выигрышей (или рисков) последовательным численным анализом ситуации с разных точек зрения, выслушать рекомендации каждой из них и, наконец, остановиться на чем-то определенном. Это аналогично обсуждению вопроса с различных позиций, а в споре, как известно, рождается истина.
Если рекомендации, вытекающие из различных критериев, совпадают — тем лучше, значит, можно смело выбрать рекомендуемое решение: оно скорее всего «не подведет». Если же, как это часто бывает, рекомендации противоречат друг другу, надо задуматься над этими рекомендациями, выяснить, насколько к разным результатам они приводят, уточнить свою точку зрения и произвести окончательный выбор. Не надо забывать, что в любых задачах обоснования решений некоторый произвол неизбежен — хотя бы при построении математической модели, выборе показателя эффективности: Вся математика, применяемая в исследовании операций, не отменяет этого произвола, а позволяет только «поставить его на свое место».
В неопределенности ничего хорошего нет, и при отсутствии нужной информации никакая математика не поможет нам в однозначном выборе «оптимального» решения. Жизнь есть жизнь, будущее полно неопределенностей, и нам зачастую приходится принимать отнюдь не строго оптимальные, а «приемлемые» решения, при обсуждении которых разные «подходы» и «критерии» выступают в качестве как бы спорящих сторон.
Литература
1. Апраушева Н.Н. «Элементарный курс теории принятия решений», М.: ВЦ РАН, 2000.
2. Вентцель Е. С. «Исследование операций», М.: Наука, 2000.
Содержание
Информация о работе Принятие решений в условиях неопределенности