Автор: Пользователь скрыл имя, 06 Февраля 2013 в 12:33, реферат
Цель моей курсовой работы заключается в том, чтобы научиться применять теорию игр в жизни, т.е. выбирать наиболее выгодные для себя стратегии или хотя бы беспроигрышные. А для этого мы рассмотрим раздел теории игр «Биматричные игры» и научимся их решать.
1. Введение
2. Общее введение в теорию игр
3. Биматричные игры
4. Оптимальность по Парето
5. Равновесие по Нэшу
6. Решение биматричных игр
7. Биматричные игры 2х2 и их решение
7.1. «Семейный спор»
7.2. «Дилемма заключенного»
7.3. «Зачет»
8. Почти антагонистические игры
8.1. «Борьба за рынки»
9. Заключение
10. Список литературы
Если наконец, сознается лишь один из преступников, то по законам той «модельной» страны, в которой происходят описываемые события, он будет выпущен на свободу (потери равны 0), а его упорствующий партнер получит полную меру наказания (потери будут равны -10).
В этой игре каждый игрок
имеет две стратегии
А теперь решим эту игру алгебраическим способом. В этой игре С = 1, α = - 1, η* = - 1; поэтому ситуациями, приемлемыми для игрока 1, будут ситуации вида (1,η) при произвольном η є [0, 1].
Аналогично мы получаем, что ξ*=-1, так что для игрока 2 приемлемыми ситуациями будут ситуации вида (ξ,1) при произвольном ξ.
Для наглядности на рис. 5 изображены зигзаги, описывающие решения неравенств (11) — (15) и за пределами сегментов [0,1] – изменения вероятностей ξ и η.
Единственной ситуацией равновесия в рассматриваемой игре оказывается поэтому ситуация (1, 1), в которой каждый из игроков должен сознаться. В этой ситуации каждый из участников игры теряет 8.
Рисунок 5
Вместе с тем очевидно, что в ситуации (0, 0) каждый игрок теряет лишь по единице. Однако ясно, что ситуация (0, 0) ,в которой каждый выбирает свою вторую чистую стратегию и потери обоих игроков минимальны, является весьма неустойчивой: каждый игрок, изменяя в ней произвольным образом свою стратегию, увеличивает свой выигрыш.
Множество ζ (Г) всех реализуемых векторов выигрышей для рассматриваемой игры имеет вид, изображенный на рис. 6 Очевидно, здесь ситуации с выигрышами (- 1, — 1), (- 10,0) и (0, - 10) являются оптимальными по Парето. При этом первая из них, в которой получаются наибольшие выигрыши (—1,-1), для каждого из игроков лучше, чем равновесная.
Рисунок 6
Противоречие
между осуществимостью
Студент (Игрок 1) готовиться к зачёту, который будут принимать преподаватель (Игрок 2). Будем считать, что у студента две стратегии: хорошо подготовиться (Х) и плохо (П), у преподавателя так же две стратегии: поставить зачет (+) или не поставить (-). В основу оценки значений функции выигрыша игроков можно положить, например, следующие соображения, отражённые в матрицах:
Выигрыши студента
Выигрыши преподавателя
Для студента наиболее беспроигрышной стратегией является вторая, т.е. плохо подготовиться, так как в этом случае ему либо удастся словчить либо он получит по заслугам.
Теперь рассмотрим эту же задачу алгебраически.
С=2, α=-1, η*= 1/2.
(0,η) , где 0≤η≤1/2
(ξ, 1/2) , где ξ произвольно
(1,η) , где 1/2≤η≤1
Аналогично, D = 4, β = 2, ξ* = 1/2. Поэтому приемлемыми для игрока 2 будут ситуации
(ξ,0), где 0≤ξ≤1/2,
(1/2,η), где η произвольно,
(ξ,1), где 1/2≤ξ≤1.
Как видно из рис.7, данная игра имеет две ситуации равновесия: (0,0), (1/2,1/2).
8. Почти антагонистические игры.
Отдельные классы биматричных игр (и в том числе 2 X 2-игр) поддаются более простому и содержательному анализу, чем те общие рассмотрения, которые были изложены в предыдущей части.
Одним из таких классов являются антагонистические игры. Более общий класс составляют почти антагонистические игры.
Определение: Будем называть почти антагонистической игрой биматричную игру с матрицами выигрыша А и В, для которых из аij < аkl или аij = акl следует соответственно bij > bkl или bij = bkl.
В почти антагонистическую игру превращается всякая матричная игра, если в ней начать оценивать выигрыш игроков по различным (но монотонным!) шкалам полезности. В положении игрока 1 в почти антагонистической игре оказывается, например, сторона, стремящаяся нанести ущерб противнику и правильно сравнивающая его ущерб в различных ситуациях, но дающая размеру этого ущерба, вообще говоря, неверную количественную оценку.
Проведем анализ почти антагонистической 2 X 2-игры.
Не нарушая общности (т.е. переходя, если нужно, к аффинно-эквивалентным играм19 и отвлекаясь от некоторых случаев вырождения), мы можем считать, что матрицы выигрышей в рассматриваемой игре суть
Если а22< a21, то по условию почти антагонистичности должно быть b22 > b21, и вторая чистая стратегия игрока 2 доминирует его первую чистую стратегию. Значит, все приемлемые для него ситуации имеют вид (ξ, 0). Отсюда следует, что ситуациями равновесия в игре будут либо (1, 0) ,либо (0, 0) , либо все ситуации вида (ξ, 0), смотря по тому, будет ли а22 > 0, а22 < 0 или, наконец, а22 =0.
Пусть теперь а22≥a21 так что по почти антагонистичности b22 ≤b21. Тогда для характеристик игры ξ * и η* мы имеем
8.1. «Борьба за рынки»
В качестве примера почти
Небольшая фирма (игрок 1) намерена сбыть крупную партию товара на одном из рынков, контролируемых другой, более крупной фирмой (игрок 2). Для этого она может предпринять на одном из рынков соответствующие действия (например, развернуть рекламную кампанию) . Господствующий на рынках игрок 2 может попытаться воспрепятствовать этому, приняв на одном из рынков предупредительные меры. Игрок 1, не встретивший на рынке препятствий, захватывает его; встретившись же с сопротивлением — терпит поражение. Выборы фирмами рынков являются их стратегиями.
Предположим, что проникновение игрока 1 на первый рынок более выгодно для него, чем проникновение на второй, но борьба за первый
рынок требует больших средств. Например, победа игрока 1 на первом рынке принесет ему вдвое больший выигрыш, чем на втором, но зато поражение на первом рынке полностью его разоряет (проигрыш равен 10), а игрока 2 избавляет от конкурента (выигрыш равен 5) .
Таким образом, у фирмы 1 две стратегии:
11 — выбор первого рынка, 12 — выбор второго рынка.
Такие же стратегии и у фирмы 2
21 — выбор первого рынка, 22 — выбор второго рынка.
Для того
чтобы составить платежные
Взглянем на выписанные матрицы выплат. Из сказанного выше ясно, что если оба игрока выберут один и тот же рынок, то победа останется за более сильной фирмой 2.
То, что в ситуации (11, 21) выигрыш игрока 2 равен 5, а в ситуации (12, 12) — 1, подчеркивает, что первый рынок более выгоден (удобно расположен, хорошо посещаем и т. п.), чем второй. Выигрыш (-10) игрока 1 в ситуации (11, 21) (а точнее, проигрыш) в сопоставлении с его выигрышем (-1) в ситуации (12, 22) выглядит, разумеется, вполне сокрушительно. Что же касается ситуации, когда фирмы уделяют основное внимание разным рынкам (11, 22) и (12, 21), то здесь фирму 1 ждет настоящий выигрыш, больший на более выгодном рынке. Потери, которые при этом несет фирма 2, оказываются прямо противоположными.
Замечание: Ясно, что точно рассчитать выгоду и ущерб сторон в этом конфликте заранее довольно трудно. Зато в следующей конфликтной ситуации размеры выигрышей игроков известны им со всей определенностью.)
Теперь решим эту задачу алгебраическим способом.
Для этой игры, как легко видеть, С = - 14, α = - 3, η* = 3/14. Значит, ситуациями, приемлемыми для игрока 1, будут все ситуации вида
(0,η), где 3/14≤η≤1,
(ξ,3/14), где 0≤ ξ ≤1,
(1,η), где 0 ≤η≤3/14.
Множество всех приемлемых для игрока 1 ситуаций изображено на рис 8.
Рисунок 8.
Далее мы имеем: D = 9,β = 2,ξ* = 2/9, так что приемлемыми для игрока 2 будут все ситуации вида
(ξ,0), где 0≤ξ<2/9,
(2/9,η), где η произвольно,
(ξ, 1), где 2/9≤ξ≤1.
Их множество изображено на рис. 5 пунктиром.
Зигзаги приемлемых ситуаций пересекаются в единственной точке (2/9, 3/14), которая и оказывается единственной ситуацией равновесия.
9. Заключение
В заключение данной работы
можно сделать вывод о
В условиях альтернативы (выбора)
очень часто нелегко принять
решение и выбрать ту или иную
стратегию. Исследование операций позволяет
с помощью использования
В данной работе были проиллюстрированы
практическое применение двух основных
способов решения «биматричных игр»
аналитический и алгебраический
и сделаны соответствующие
Аналитический метод на мой взгляд более простой и понятный, к тому же он более точен нежели алгебраический.
10. Список литературы
4. Оуэн Г. Теория игр. М.:Мир,1971. - 230с.
5. Р.Д. Льюс, Х.Райфа, Игры и решения. Введение в критический обзор.- М.: «Издательство иностранной литературы»,1961.
6. Хемди А. Таха Глава 14. Теория игр и принятия решений— 7-е изд. — М.: «Вильямс», 2007. — 549-594 с.
1 Минимаксная стратегия - выбор из максимальных (наихудших) проигрышей минимальных (наилучших). (2.Общее введение в теорию игр.)
2 Максиминная стратегия - выбор из минимальных (наихудших) выигрышей максимальных (наилучших). (2.Общее введение в теорию игр.)
3 Антагонизм интересов – противобортсвующие интересы. (Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
4 Игра называется кооперативной, или коалиционной, если игроки могут объединяться в группы, беря на себя некоторые обязательства перед другими игроками и координируя свои действия. Этим она отличается от некооперативных игр, в которых каждый обязан играть за себя.( Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
5 Стратегией называется совокупность правил, определяющих выбор его действия при каждом личном ходе в зависимости от сложившейся ситуации. (Аркин П.А., Межевич К.Г., Исследование операций/ учебное пособие.-СПб.:СПбГТИ(ТУ), 2008.-333с.)
6 Конечные бескоалиционные игры- это биматричные игры (Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
7 Смешанной стратегией называется случайная величина, значениями которой являются стратегии игрока.( Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
8 Ситуация х называется ситуацией равновесия, если для любого игрока i є I и любой его стратегии xi є хi - выполняется неравенство . (5. Равновесие по Нэшу).
9 Пара чистых стратегий Аi и Bj дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент aij , является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой. (Аркин П.А., Межевич К.Г., Исследование операций/ учебное пособие.-СПб.:СПбГТИ(ТУ), 2008.-333с.)
10 Принцип оптимальности - это условия, которым должны удовлетворять стратегии и ситуации для того, чтобы считаться разумными, оптимальными.( Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
11 Топология- это раздел математики, изучающий в самом общем виде явление непрерывности, в частности свойства пространства, которые остаются неизменными при непрерывных деформациях, например связанность, ориентируемость.( Википедия.)
12 Спектром стратегий игрока в конечной антагонистической игре называется множество всех его чистых стратегий, вероятность которых согласно этой стратегии положительна.( Хемди А. Таха Глава 14. Теория игр и принятия решений— 7-е изд. — М.: «Вильямс», 2007. — 549-594 с.)
13 Теорема: Если смешенная стратегия Xi игрока i входит в приемлемую для него ситуацию X и для некоторой его чистой стратегии х0i имеет место строгое неравенство (Воробьёв Н.Н. Теория игр для экономистов-кибернетиков. - М: «Наука», 1985. - 272с.)
14 «антагонизм поведения»- борьба противоположных интересов