Автор: Пользователь скрыл имя, 22 Декабря 2012 в 20:48, курсовая работа
В курсовой работе рассматривается элементарная теория принятия решений (ТПР) в условиях неопределенности и риска. Предполагается, что человек находится как бы в состоянии игры с природой. А так как природа не может быть сознательным противником, то критерий минимального гарантированного результата (критерий максимина) в ТПР не может иметь большого значения в отличие от теории игр. Этот критерий в игре с природой слишком пессимистичен.
Министерство общего и профессионального
образования Российской Федерации
Московский Государственный Институт
Радиотехники, Электроники и Автоматики
(Технический Университет)
ФАКУЛЬТЕТ Кибернетики
КАФЕДРА Интеллектуальных
технологий и систем
Курсовая работа по дисциплине:
Теория принятия решений
Тема курсовой работы:
Принятие решений в условиях неопределенности
(8 семестр)
Студент Морозов О.Е.
Группа ИЖ-1-99
Руководитель Панов А.В.
Москва
2003
Введение
В курсовой работе рассматривается элементарная теория принятия решений (ТПР) в условиях неопределенности и риска. Предполагается, что человек находится как бы в состоянии игры с природой. А так как природа не может быть сознательным противником, то критерий минимального гарантированного результата (критерий максимина) в ТПР не может иметь большого значения в отличие от теории игр. Этот критерий в игре с природой слишком пессимистичен.
Основное внимание в курсовой работе будет уделено более реалистичному байесовскому подходу, который позволяет рассматривать процесс ПР как процесс обучения. Проведя достаточно большое число экспериментов и используя формулу Байеса, можно, хотя бы теоретически, сколь угодно точно оценить вероятности возможных состояний природы. А это ставит лицо, принимающее решение (ЛПР), в условия, близкие к достоверным.
Принятие конкретного решения человеком в той или иной области базируется на его практическом опыте, знании существа дела, интуиции.
Математическая теория принятия решения – дополнительное средство, помогающее принимать решение. Полезность этой теории состоит в том, что она дает правильную ориентацию человеку, настраивает его на количественный лад. Она формализует процесс ПР, а это открывает большие возможности применения ЭВМ.
Наиболее важными
Вопрос о критериях является наиболее сложным. Обычно трудно приписать каждому варианту определенное числовое значение. В большинстве практических случаев эти числовые значения можно задавать весьма приближенно и, к тому же, относительно.
Математическую теорию ПР можно рассматривать как часть математической статистики. Раздел «Теория статистической проверки гипотез» относится с точностью до терминов к ТПР. С другой стороны, ТПР можно рассматривать как часть теории исследования операций, поскольку в обеих теориях из множества вариантов согласно некоторому критерию выбирается наилучший.
Теория принятия решений, как и родственная ей теория игр, – раздел прикладной математики, в котором исследуется весьма широкий класс задач оптимизации. Центральное место в ТПР играют байесовские стратегии, позволяющие рассматривать процесс принятия решений как своеобразный обучающий процесс.
1. Принятие решений в условиях полной неопределенности
Для начала возьмем случай полной («дурной») неопределенности, когда вероятности состояний природы либо вообще не существуют, либо не поддаются оценке даже приближенно. Обстановка неблагоприятна для принятия «хорошего» решения — попытаемся найти хотя бы не самое худшее.
Здесь все зависит от точки зрения на ситуацию, от позиции исследователя, от того, какими бедами грозит неудачный выбор решения. Опишем несколько возможных подходов, точек зрения (или, как говорят, несколько «критериев» для выбора решения).
Пусть имеется совокупность действий, операций
а1, а2, ..., аm, m ³ 2, (1)
которые может совершить человек для достижения поставленной цели, причем одну и только одну операцию аi, iÎ{1, 2, ..., m}, выбирает человек, принимающий решение.
Кроме того, представлен перечень объективных условий, например, состояний природы
Q1, Q2, ..., Qn, (2)
одно из которых Qj, jÎ{1, 2, ..., n}, будет иметь место в действительности.
Для каждой операции аi, i = 1, 2, ..., m, при любом условии Qj, j = 1, 2, ..., n, задана полезность (выгода, доход) в некоторых единицах aij. Величины aij, играющие роль платежей в теории игр, обычно задаются из эвристических, субъективных соображений. При этом возникают специфические трудности при их числовой оценке, обусловленные такими факторами, как: болезни, удовольствия, престиж, репутация и т.д. Величины aij можно задавать относительно, поэтому их называют показателями предпочтительности.
Все перечисленные условия, при которых принимается решение, представлены в табл. 1.
Таблица 1
Объективные условия Операции |
Q1 |
Q2 |
… |
Qn |
a1 |
a11 |
a12 |
… |
a1n |
a2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
am |
am1 |
am2 |
… |
amn |
Если ЛПР не располагает никакой информацией о состояниях природы (2), то имеем ситуацию принятия решения в условиях полной неопределенности. Рассмотрим три известных подхода ПР в этой ситуации.
Согласно этому критерию игра с природой ведется как игра с разумным, причем агрессивным противником, делающим все для того, чтобы помешать нам достигнуть успеха. Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае не меньший, чем «нижняя цена игры с природой».
. (3а)
Затем определяется то значение i0, при котором величина максимальна,
. (3в)
Принимаемое решение – выбор наилучшей операции из множества исходных (1). Равенства (3а), (3в) можно объединить в одно
. (4)
Рассмотренная операция максимин соответствует лучшему из худших исходов. Если руководствоваться этим критерием, олицетворяющим «позицию, крайнего пессимизма», надо, всегда ориентироваться на худшие условия, зная наверняка, что «хуже этого не будет». Критерий максимина является чисто перестраховочным, поскольку природа не может быть сознательным противником. Очевидно, такой подход - естественный для того, кто очень боится проиграть, - не является единственно возможным, но как крайний случай он заслуживает рассмотрения. Максиминную операцию использует только крайний пессимист, не желающий идти ни на какой риск. Обычно такие люди довольствуются малым и предпочитают спокойную жизнь.
Этот критерий — тоже крайне пессимистический, но при выборе оптимальной стратегии советует ориентироваться не на выигрыш, а на риск. Выбирается в качестве оптимальной та стратегия, при которой величина риска (сожаления) в наихудших условиях минимальна. Сожаление (риска) в ТПР – потери в результате упущенных возможностей.
Пусть природа находится в состоянии Qs найдем максимальный элемент s-го столбца табл. 1,
Мера сожаления определяется как разность:
где если если Тогда при состоянии природы Qs лучшей операцией является : для нее сожаление равно нулю. Изменяя последовательно значения s, s = 1,2,…, n, получим сожаление для каждой операции ai, i=1,2,…, m, при любом состояния природы Qs, s=1,2,…, n. Матрица сожалений представлена в табл. 2.
Для принятия решения к табл. 2 применяется критерий минимакса (minmax): для каждой операции ai, i=1,2,…, m, находится наибольшее сожаление,
Таблица 2
Qj ai |
Q1 |
Q2 |
… |
Qn |
a1 |
Da11 |
Da12 |
… |
Da1n |
a2 |
Da21 |
Da22 |
… |
Da2n |
… |
… |
… |
… |
… |
am |
Dam1 |
Dam2 |
… |
Damn |
Затем среди членов последовательности , i=1,2,…, m, s = 1,2,…, n, находится минимальный
Последние два равенства соединим в одно:
Принимаемое решение – наилучшая операция
Сущность такого подхода в том, чтобы всячески избегать большого риска при принятии решения. В смысле «пессимизма» критерий Сэвиджа сходен с критерием Вальда, но самый «пессимизм» здесь понимается по-другому.
По этому критерию выбирается та операция ai0, для которой сумма полезностей
максимальна,
Рассмотрим на конкретном примере принятие решений по трем описанным критериям. Пусть m=3, n=2, и матрица полезностей представлена в табл. 3.
Таблица 3 Таблица 4
Qs ai |
Q1 |
Q2 |
Qs ai |
Q1 |
Q2 | |
a1 |
1 |
11 |
a1 |
9 |
3 | |
a2 |
10 |
6 |
a2 |
0 |
8 | |
a3 |
0 |
14 |
a3 |
10 |
0 |
Например, ai – i-ый вариант технологического процесса для изготовления некоторых изделий, Q1 – возникновение дефицита в ближайшие два года на сырье, из которого изготовляются детали, Q2 – отсутствие такого дефицита.
1. Применяя операцию максимина, получим
Максиминной операцией является операция а2, гарантирующая 6 единиц полезности.
2. Для использования критерия
минимакса сожалений
Тогда матрица сожалений примет вид, представленный в табл. 4. Применяя к данным этой таблицы критерий минимакса, получим:
max(9, 3) = 9, max(0, 8) = 8, max(10, 0) = 10, min(9, 8, 10) = 8.
Следовательно, операцией, соответствующей минимаксу сожалений, является операция а2.
По критерию равновозможных состояний для данных табл. 3 имеем:
Аi = 1+11 = 12, A2 = 10+6 = 16, A3 = 0+14 = 14, .
Значит, оптимальной операцией по критерию равновозможных состояний природы является операция а2. В рассмотренном примере все три критерия дали один и тот же ответ: операция а2 является оптимальной, она гарантирует 6 ед. полезности.
Если выбрать операцию а1, то в случае везения получим 11 ед. полезности, а в случае невезения – всего 1 ед. полезности. Если выбрать операцию а3, то в случае везения имеем 14 ед. полезности, а в случае невезения – 0 ед. полезности. Операция а2 гарантирует наибольшую полезность, 6 ед. Конкурирующие операции а1 и а3 гарантируют меньшие полезности: 1 ед. и 0 ед., соответственно.
Информация о работе Принятие решений в условиях неопределенности