Биматричные игры

Автор: Пользователь скрыл имя, 06 Февраля 2013 в 12:33, реферат

Описание работы

Цель моей курсовой работы заключается в том, чтобы научиться применять теорию игр в жизни, т.е. выбирать наиболее выгодные для себя стратегии или хотя бы беспроигрышные. А для этого мы рассмотрим раздел теории игр «Биматричные игры» и научимся их решать.

Содержание

1. Введение
2. Общее введение в теорию игр
3. Биматричные игры
4. Оптимальность по Парето
5. Равновесие по Нэшу
6. Решение биматричных игр
7. Биматричные игры 2х2 и их решение
7.1. «Семейный спор»
7.2. «Дилемма заключенного»
7.3. «Зачет»
8. Почти антагонистические игры
8.1. «Борьба за рынки»
9. Заключение
10. Список литературы

Скачать полностью (237.38 Кб) Сколько стоит заказать работу?

Работа содержит 1 файл

Биматр.docx

— 257.81 Кб (Скачать)

Этот факт является для дальнейшего решающим.

Во-первых, из него следует, что вместе с любой приемлемой для игрока 1 ситуацией (X,Y) таковой же является любая ситуация (X’, F), где , т.е. ситуации входят (или не входят) в ζ(Г) целыми «блоками» вида (X(s), Y).

Во-вторых, отсюда же следует, что на X(s_Х) выражение ХАY^Т представляет собой единую линейную форму от Y, и на X(s_x) система (7) оказывается системой именно линейных (а не билинейных) неравенств, и множество ее решений составляет выпуклый многогранник, который зависит опять-таки не от конкретной стратегии X, и лишь от ее спектра s_x = s. Обозначим этот многогранник через ζ(s).

Попутно обратим внимание на то, что каждый из таких многогранников ζ(s) зависит только от матрицы А (и не зависит от матрицы В ). Значит, ситуации входят (или не входят) в ζ₁(Г) целыми произведениями X(s) х ζ₁(s). Иными словами,

Очевидно, число произведений в этом объединении не может превосходить 2^m — 1 (s может быть любым непустым подмножеством х), а множество ζ₁ ( Г ) зависит только от матрицы А. В силу тех же причин

где Y(t) — множество стратегий игрока 2, имеющих данный спектр t, а ζ₂(t) - множество решений X системы неравенств

(8)

где supp Y = t (как и выше, решение зависит здесь не от самой стратегии у, а лишь от ее спектра). Здесь в объединение входит не более 2ⁿ — 1 произведений. Множество ζ₂ (Г) определяется только матрицей В.

Окончательно мы получаем

(9)

При любом нахождение многогранника ζ₁(s) состоит в решении системы линейных неравенств, т.е. в выполнении конечного числа рациональных (арифметических) операций над элементами матрицы А. Точно так же выполнением конечного числа рациональных операций над элементами матрицы В может быть найдено множество ζ₂(t) при любом.

Следовательно, таким же конечно-рациональным путем находится каждое из пересечений и, и потому, в силу отмеченной конечности множества вариантов для спектров s и t и согласно формуле (9), - и все множество ζ(Г).

Хотя при сколько-нибудь больших значениях чисел m и n описанная процедура нахождения приемлемых (а по ним – и равновесных) ситуаций в биматричной игре является весьма громоздкой, при m = n = 2 для спектров стратегий каждого игрока оказывается не более трех вариантов, и приведенный способ представляется реально выполнимым геометрически. Мы займемся этим в следующей части.

7. Биматричные игры 2х2 и их решение.

Описываемая далее схема анализа 2 x 2-биматричных игр формально является частным случаем рассуждений способа описания ситуаций равновесия, и множество всех ситуаций равновесия в такой игре можно описать на основании формулы . Однако, как это нередко бывает, в частном случае 2 x 2 –биматричных игр представляется целесообразным не пользоваться окончательной формулой,- выведенной для общего случая, а проводить каждый раз все приведшие к ней рассуждения применительно к конкретной рассматриваемой игре.

Мы будем рассматривать 2 X 2-биматричную игру с матрицами выигрышей

(10)

соответственно игроков 1 и 2. Как и в случае 2 х 2-матричных игр, смешанные стратегии X и Y игроков полностью описываются вероятностями ξ и η выбора ими своих первых чистых стратегий (вторые чистые стратегии выбираются, очевидно, с вероятностями 1 — ξ и 1 —η). Поэтому ввиду 0≤ξ , η≤1 каждая ситуация в смешанных стратегиях в 2 х 2-биматричной игре геометрически представляется как точка на единичном квадрате (ситуации в чистых стратегиях суть вершины этого квадрата) .

Как и в случае матричных игр, мы опишем порознь множества приемлемых ситуаций для каждого из игроков, изобразим эти множества геометрически на единичном квадрате ситуаций, а затем найдем их пересечение.

Начнем с описания ситуаций, приемлемых в игре Г (А, В) для игрока 1.

Приемлемость ситуации (X, Y) для игрока 1 в игре Г (А, В) означает, что

A₁ Y^T ≤ XAY^T (11)

A₂Y^T ≤ XAY^T. (12)

Подчеркнем, что эти условия приемлемости никак не связаны с матрицей В выигрышей игрока 2. Поэтому они будут одинаковыми для всех биматричных игр с одной и той же матрицей выигрышей игрока 1; в частности, они совпадают с аналогичными условиями для случая матричной игры Г_А. Поэтому и множество ситуаций, приемлемых для игрока 1 в игре Г (А, В), будет совпадать с множеством приемлемых для него ситуаций в игре Г_А.

Множество ζ₁(Г) всех приемлемых для игрока 1ситуаций в игре Г_А (а тем самым и в игре Г (А, В)) есть либо трехзвенный (возможно, вырожденный) зигзаг, либо же квадрат всех ситуаций.

Именно, полагая, как и при анализе матричных игр, , мы получим, что при C≠0 множество ζ₁(Г) всех приемлемых для игрока 1 ситуаций состоит из точек трех типов:

(1,η), где ηС≥α

(0,η), где ηС≤α

(ξ,η), где ηС=α и ξ є [0,1]

При С=0 и α≠0 это множество будет иметь вид

(1,η), если a₂₂ > a₁₂

(0,η), если a₂₂ < a₁₂

Наконец, при C = 0 и α = 0 будет ζ₁(Г) – X x Y, т.е. приемлемыми для игрока 1 будут все ситуации.

Перейдем к описанию множества ζ₂(А, В) всех ситуаций, приемлемых в биматричной игре Г (A,B) для игрока 2.

Во-первых, это можно сделать, проложив аналогию с матричными играми, тогда в неравенствах XА₁ ≥ XАY^T, XА₂ ≥ XАY^T вместо матрицы А следует рассматривать матрицу —В.

Во-вторых, это можно сделать, перейдя в рамках игры Г (А, В) от игрока 1 к игроку 2 и заменив в связи с этим матрицу A в рассуждениях и соответственно в неравенствах A₁ Y^T≤ XAY^T и A₂Y^T ≤ XAY^T на матрицу В^T.

В обоих случаях мы получаем систему неравенств

XB₁ ≤ XBY^T , (13)

XB₂ ≤ XBY^T. (14)

В результате оказывается, что ζ₂(А, В) = ζ₂(- В) является, подобно ζ₁(А, В) = ζ₁(A), трехзвенным (возможно, вырожденным) зигзагом или же множеством всех вообще ситуаций.

Именно, положим D = b₁₁ – b₁₂– b₂₁ + b₂₂ , β = b₂₂ – b₂₁ . Тогда при D≠0 множество ζ₂(Г) будет состоять из точек трех типов:

(ξ,1), где ηD≥α

(ξ,0), где ηD≤α

(ξ,η), где ηD=α и η є [0,1]

При D = 0 и β≠0 это множество будет иметь вид

(ξ,1), если b₂₂ > b₂₁

(ξ,0), если b₂₂ < b₂₁

а при D=0и β = 0 — совпадать с множеством всех ситуаций X x Y.

Естественно, что в случае биматричной игры Г для взаимного расположения множеств ζ₁(Г) и ζ₂(Г) может представиться существенно больше комбинаций, чем в случае матричной игры.

В частности, в отличие от случая матричной игры, зигзаги ζ₁(Г) и ζ₂(Г) могут быть не только одинаковой, но и противоположной ориентации (рис. 3, а и б).

Рисунок 3.

В первом случае ζ(Г) = ζ₁(Г) ∩ ζ₂(Г) состоит из единственной точки, а во втором — из трех точек.

Ордината η* горизонтального звена зигзага ζ₁ (Г), как и в случае матричной игры Г_А , описывается формулой

Выражение же для абсциссы ξ * вертикального звена зигзага в ζ₂(A,B) получается из формулы путем замены в ней каждого a_ij на соответствующее — b_ij (фактически знаки в дроби останутся без изменений) . Таким образом,

Сравнение этих выражений с формулами и показывает, что в рассматриваемой биматричной игре в условиях ситуации равновесия во вполне смешанных стратегиях поведение игрока 2 совпадает с поведением игрока 2 в матричной игре с матрицей выигрышей А, а поведение игрока 1 — с поведением игрока 2 в матричной игре с матрицей выигрышей В.

Таким образом, описанное равновесное поведение игроков оказывается ориентированным не столько на максимизацию собственного выигрыша, сколько на минимизацию выигрыша противника. Так «антагонизм поведения»¹⁴ может возникать и при отсутствии «антагонизма интересов»¹⁵.

Обратим, наконец, внимание на следующее примечательное обстоятельство .

Пусть зигзаги приемлемых ситуаций для 2 X 2-биматричной игры Г(А, В) имеют вид, представленный на рис. 1. А или б (или же зеркальный по отношению к одной из этих картинок). Если теперь «слегка» изменить матрицы А и В, то и зигзаги «пошевелятся чуть-чуть», не изменив ни своей общей формы, ни взаимного расположения. В частности, их пересечение будет по-прежнему состоять из одной точки или из трех.

В этом месте мы встречаемся с весьма общей и глубокой теоретико-игровой закономерностью: если конечная бескоалиционная игра Г носит «общий» характер, т.е. форма и расположение множеств приемлемых ситуаций ζ_i(Г) для каждого из игроков не изменяется при достаточно малом изменении значений функций выигрыша игроков, то множество ζ(Г) ситуаций равновесия в этой игре (являющееся пересечением множеств ζ_i(Г)) конечно и насчитывает нечетное число точек.

7.1. «Семейный спор»

Два экономических партнера (игроки 1 и 2) договариваются о совместном проведении одного из двух действий, D₁ или D₂ , каждое из которых требует совместного участия обоих партнеров.

В случае совместного осуществления действия D₁ игрок 1 получает одну единицу полезности, а игрок 2 – две единицы. Наоборот, в случае совместного осуществления D₂ игрок 1 получает две единицы, а игрок 2 – лишь одну. Наконец, если игроки выполнят различные действия, то выигрыш каждого из них равен нулю.

D₁ D₂D₁ D₂

Решение данной биматричной игры в соответствии со сказанным выше¹⁶ дает нам С=3, α=2, η^*= 2/3. Поэтому ситуации, приемлемые для игрока 1, составляют зигзаг, охватывающий следующие точки:

(0,η) , где 0≤η≤⅔

(ξ, ⅔) , где ξ произвольно

(1,η) , где ⅔≤η≤1

Аналогично, D = 3, β= 1, ξ* = 1/3. Поэтому приемлемыми для игрока 2 будут ситуации

(ξ,0), где 0≤ξ≤1/3,

(1/3,η), где η произвольно,

(ξ,1), где 1/3≤ξ≤1.

Как видно из рис. 4, данная игра имеет три ситуации равновесия: (0,0), (1,1), (1/3,2/3).

Рисунок 4

Здесь ситуации (0,0) и (1,1) соответствуют одновременному выбору игроками своих вторых или, соответственно, первых чистых стратегий, т.е. договоренности о достоверных совместных действиях. Обычно так и понимаются всякого рода договоры.

Однако в нашем случае имеется еще третья ситуация равновесия, состоящая в выборе игроками некоторых вполне определенных смешанных стратегий. Формально ее можно считать основой возможного договора в не меньшей степени, чем первые две. Она даже «более справедлива», чем они, поскольку в ней оба игрока получают одинаковые выигрыши:

(1/3,2/3) А (2/3,1/3) ^T = (1/3, 2/3) В (-2/3, 1/3) ^T = 2/3.

Вместе с тем выигрыши каждого из игроков в этой ситуации равновесия меньше, чем в двух других ситуациях равновесия, где они соответственно равны 1 и 2 в первой ситуации и 2 и 1 — во второй.

Так сочетание устойчивости со справедливостью вступает в противоречие с сочетанием устойчивости и выгодности.

Ясно, что если игроки договорились бы играть оба, скажем, первую чистую стратегию, причем игрок 2 за получение большего выигрыша, чем игрок 1, заплатил бы ему 1/2, то выигрыш каждым полутора единиц можно было бы считать и выгодным, и справедливым. Однако в рамках теории бескоалиционных игр такого рода дележи не рассматриваются. Они изучаются в кооперативной теории игр.

Очевидно, проведенный анализ биматричной игры «семейный спор» с матрицами выигрыша

приложим и к более общим биматричным играм, и в том числе к играм Г (A, В) с матрицами выигрышей

, B=

При этом,очевидно, в каждой такой игре будут три ситуации равновесия: две в чистых стратегиях¹⁷, соответственно с выигрышами игроков а и с или b и d, и одна – в смешанных (ξ *, η *), где ξ * = d/(c + d), η* = b\(а + b).

Отметим, однако, специально тот частный случай, когда А = В, т.е. a = с и b=d. Тогда в игре Г(A, В) интересы игроков полностью совпадают. Тем не менее теоретико-игровая природа этого явления сохраняется; в такой игре по-прежнему имеются три ситуации равновесия: две в чистых стратегиях и одна — в смешанных.

Ясно, что при а > b оптимальная по Парето¹⁸ ситуация равновесия будет состоять из первых чистых стратегий игроков, а при а < b – из их вторых чистых стратегий. Тем самым для игр такого рода представляется естественным выбор игроками стратегий, уверенно дающих им наибольшие выигрыши. Соответствующую ситуацию равновесия здесь можно уже рассматривать не только как устойчивый вариант договора между игроками, но даже как результат их независимых самостоятельных действий.

Менее тривиальным оказывается положение дел, когда а=b. В этом случае игрок 1 при выборе им своей первой чистой стратегии не может быть уверен в выборе игроком 2 также первой чистой стратегии: тот может с такими же основаниями выбрать и вторую стратегию. Таким образом, здесь из всех мотивов действия остается лишь «антагонизм поведения», и разумным для игрока 1 оказывается выбор им смешанной стратегии (для которой здесь ξ = 1/2).

7.2. «Два бандита»

Игроками А и В являются преступники («бандиты»), находящиеся в предварительном заключении по подозрению в тяжком преступлении.

Прямых улик, однако, против них нет, и возможность их обвинения в значительной мере зависит от того, сознаются ли преступники сами.

Если они оба сознаются, то будут, несомненно, осуждены на длительный срок тюремного заключения, однако при этом признание учитывается как смягчающее обстоятельство (потери каждого из игроков в этом случае оценим в -8). Если они оба не сознаются, то за отсутствием улик обвинение в тяжком преступлении будет снято, но следователь сможет доказать их виновность в совершении менее значительного преступления, в результате чего оба получат некоторое наказание (потери составляют -1 для каждого).

Информация о работе Биматричные игры