Автор: Пользователь скрыл имя, 06 Февраля 2013 в 12:33, реферат
Цель моей курсовой работы заключается в том, чтобы научиться применять теорию игр в жизни, т.е. выбирать наиболее выгодные для себя стратегии или хотя бы беспроигрышные. А для этого мы рассмотрим раздел теории игр «Биматричные игры» и научимся их решать.
1. Введение
2. Общее введение в теорию игр
3. Биматричные игры
4. Оптимальность по Парето
5. Равновесие по Нэшу
6. Решение биматричных игр
7. Биматричные игры 2х2 и их решение
7.1. «Семейный спор»
7.2. «Дилемма заключенного»
7.3. «Зачет»
8. Почти антагонистические игры
8.1. «Борьба за рынки»
9. Заключение
10. Список литературы
Первая из таблиц описывает выигрыши игрока А, вторая — выигрыши игрока B. Обычно эти таблицы записывают в виде матриц
,
Здесь А — платежная матрица игрока А, а В — платежная матрица игрока В.
При выборе игроком А i-й стратегии, а игроком В — k-й стратегии их выигрыши находятся в матрицах выплат на пересечении i-x строк и k-х столбцов: в матрице А это элемент aik , а в матрице В — элемент bik.
Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна — матрица выплат игроку А, другая — матрица выплат игроку В. Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре, — биматричная.
Замечание, Рассматриваемые ранее матричные игры можно рассматривать, разумеется, и как биматричные, где матрица выплат игроку В противоположна матрице выплат игроку А:
или
.
Однако в общем случае биматричная игра — это игра с ненулевой суммой.
Тем не менее, нам кажется разумным время от времени сопоставлять наши рассмотрения с рассуждениями, проведенными ранее для матричных игр (особенно при попытках разрешения схожих проблем). Подобные сопоставления нередко оказываются одновременно и удобными и полезными. Конечно, класс биматричных игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения.
Существует ещё и алгебраическое представление биматричной игры:
Задача нахождения ситуаций равновесия бескоалиционной игры Г формата (m1,…mn) фактически состоит в решении системы m1 + . .. … + mn неравенств вида с m1,…,mn ограничениями неотрицательности и n ограничениями нормирования. Математически это сложно и громоздко. Лишь для отдельных сравнительно простых классов бескоалиционных игр ход решения этой задачи поддается элементарному описанию.
Именно одним из таких классов являются конечные бескоалиционные игры6 двух лиц. Пусть в такой игре игрок 1 имеет m чистых стратегий, а игрок 2 — n стратегий, и в каждой ситуации (i,j) игрок 1 получает выигрыш aij , а игрок 2 — выигрыш bij. Тогда значения обеих функций выигрыша игроков естественно расположить в виде пары матриц:
Поэтому такие игры называются биматричными. Биматричная игра с матрицами выигрышей А и В обозначается через Г (А , В) или через ГА ,В.
Смешанные стратегии7 в биматричных играх, как и в матричных играх, естественно понимать как векторы, составляющие фундаментальный симплекс. Если X и Y — соответственно векторы, описывающие смешанные стратегии игроков 1 и 2, то, как легко видеть,
H1(X,Y)=XAYT, H2(X,Y) = XBYT.
Определение ситуации равновесия8 для случая биматричной игры приобретает следующую формулировку. Ситуация (X, Y) в биматричной игре с матрицами выигрышей А и В является равновесной, если
Очевидно, при В = -A биматричная игра превращается в матричную, а соотношения (1) и (2) – соответственно в
(3)
Последнее неравенство равносильно XAYT и XАj , что вместе с (3) дает нам известное определение седловой точки9 в матричной игре.
Как и в случае антагонистических
игр, целью теории биматричных игр
является выработка принципов
Чаще всего под оптимальностью
подразумевают различные
В биматричных играх могут появляться ситуации, приемлемые, (т.е. выгодные и потому устойчивые) для каждого из игроков, могут априори оказываться в том или ином смысле невыгодными (и потому не устойчивыми)для игроков.
Один вариант устойчивости ситуации, отражающий черты ее выгодности, состоит в ее оптимальности по Парето.
Далее мне придется сравнить между собой ситуации по выигрышам, которые получают в них различные игроки. Для этого я введу следующие обозначения:
,
и будем, как обычно, полагать
НI(х)<НI(у), если при всех i є I;
HI(x)≤HI(y) если Hi(x)≤Hi(x) при всех i є I, но НI(х)≠ НI(у);
НI(х)≤ НI(у), если .
Определение. Ситуация х° в биматричной игре
Г =
называется оптимальной по Парето, если не существует ситуации xєx, для которой имеет место векторное неравенство.
Множество всех ситуаций в игре Г, оптимальных по Парето, обозначается через ζP(Г). Иными словами, в оптимальной по Парето ситуации игроки не могут совместными усилиями увеличить выигрыш кого-либо из них, не уменьшив при этом выигрыш кого-либо другого.
Формальное различие ситуации равновесия от ситуации, оптимальной по Парето: в первой ни один игрок, действуя в одиночку, не может увеличить своего собственного выигрыша; во второй — все игроки, действуя совместно, не могут (даже нестрого) увеличить выигрыш каждого.
Вопросы об оптимальных по Парето
ситуациях решаются в принципе
проще, чем аналогичные вопросы о ситуациях
равновесия. Это объясняется тем, что оптимальность
по Парето ситуации х определяется лишь положением векторного
значения Hi(x) в множестве всех допустимых векторов
выигрышей,
ϑ (Г) = {HI(x): xєx}
а для выяснения вопроса о равновесности ситуации требуется учитывать еще и зависимость каждой из компонент Hi(х) этого вектора от соответствующей переменной xi. Практически любое достаточно обозримое описание множества векторов выигрышей ϑ приводит к описанию векторов выигрышей в оптимальных по Парето ситуациях.
Так, в изображенном на рис.1 примере оптимальным по Парето ситуациям будут соответствовать все точки ϑ (Г), принадлежащие выделенными жирными линиями участкам "северо-восточной" границы ϑ (Г) .
В частности, для существования в игре Г оптимальной по Парето ситуации достаточно компактности множества ϑ (Г). Для этого же, в
свою очередь, достаточно, чтобы множество всех ситуаций х было компактным в некоторой топологии11, а все функции выигрыша Hi этой топологии были непрерывными.
Ситуация х называется ситуацией равновесия, если для любого игрока i є I и любой его стратегии xi є хi - выполняется неравенство .
Множество всех ситуаций равновесия в игре Г будем обозначать через ζ(Г). Очевидно,
.
Из определения видно, что в ситуациях равновесия и только в них ни один игрок не заинтересован в отклонении от своей стратегии. В частности, если ситуация равновесия оказывается предметом договора между игроками, то ни один из игроков не будет заинтересован в нарушении своих обязательств. Наоборот, если в договоре зафиксирована неравновесная ситуация., то по определению найдется хотя бы один игрок, который будет заинтересован в отклонении от нее и тем самым — в нарушении этого договора.
Равновесной стратегией игрока в бескоалиционной игре называется такая его стратегия, которая входит хотя бы в одну из ситуаций равновесия игры.
В случае антагонистической игры равновесные стратегии игроков совпадают с их оптимальными стратегиями. Для биматричных игр, напротив, понятие оптимальной стратегии игрока нередко вообще не имеет смысла: в таких играх оптимальными оказываются не стратегии отдельных игроков, а их сочетания, (т.е. ситуации) и притом для множества всех игроков сразу.
Поэтому в биматричных играх
как оптимальные следует
Значительная часть теории биматричных игр состоит в исследовании свойств их ситуаций равновесия и равновесных стратегий игроков, а также в разработка способов их нахождения.
Процесс нахождения ситуаций равновесия в биматричной игре часто называется решением игры.
Джорджем Нэшем было доказано существование ситуации равновесия в смешанных стратегиях для любой биматричной игры.
Теорема. В каждой биматричной игре
Г =
существует хотя бы одна ситуация равновесия (в смешанных стратегиях).
Доказательство. Если игрок i имеет в игре Г mi чистых стратегий, то множество Xi всех его смешанных стратегий, как уже неоднократно отмечалось, можно представлять как (mi — 1) -мерный симплекс. Поэтому всякую ситуацию
Х = (Х1,...,Хn)
в смешанных стратегиях можно рассматривать как точку в декартовом произведении X = Х1 x . . . x Хn симплексов смешанных стратегий. Это декартово произведение, очевидно, является выпуклым и компактным подмножеством евклидова пространства размерности m1 + ... + mn - n.
Положим теперь для произвольной ситуации X и любой чистой стратегии
,- игрока i
. (4)
Очевидно, все вводимые таким образом функции. принимают только неотрицательные значения.
Функция , показывает увеличение выигрыша игрока i в ситуации X, происходящее за счет замены его стратегии Xi, входящей в эту ситуацию, некоторой чистой стратегией . Уменьшения же выигрыша функция , не показывает, ибо в этом случае ее значение будет равно нулю.
Составим теперь для всевозможных i=1, …, n и j=1, …, mj числа вида
Все эти дроби, очевидно, неотрицательны, а каждая сумма вида
равна единице.
Следовательно, при фиксированных X и i дроби (5) можно понимать
как вероятности соответствующих чистых стратегий игрока i. Тем
самым каждый набор таких дробей для всех чистых стратегий можно понимать как смешанную стратегию игрока i.
Так как дроби (5) составляются для каждого игрока i є I, их совокупность определяет систему смешанных стратегий всех игроков, т.е. некоторую ситуацию в игре Г. Эта ситуация зависит от исходной ситуации X, являясь ее функцией. Будем обозначать ее поэтому через ψ(Х). Очевидно, что функция ψ осуществляет преобразование замкнутого выпуклого и ограниченного множества всех ситуаций X в себя.
Кроме того, эта функция является непрерывной функцией ситуации. Действительно, каждая компонента ситуации, являющейся значением функции ψ, есть дробь вида (5). В числителе этой дроби первое слагаемое есть сама компонента исходной ситуации и поэтому зависит от нее непрерывно.
Второе слагаемое, как видно из (4), есть комбинация из линейных функций Hi (X) и, постоянной 0 и операции взятия максимума (то, что функция шах { 0, х }является непрерывной, легко усмотреть из ее графика на рис.2. Следовательно, также является непрерывной функцией X.
Значит, числитель дроби (5) есть непрерывная функция X. Наконец, знаменатель этой дроби непрерывен и притом не может приближаться к нулю (его значения не меньше единицы). Таким образом, функция ψ является непрерывной.
Заметим, что принципиальная важность теоремы Нэша ограничивается вопросом существования ситуации равновесия. Непосредственно применять ее для нахождения таких ситуаций не удается, так как сама по себе она не является конструктивной, так как теорема Нэша не дает путей к нахождению ситуаций равновесия. Вместе с тем, все методы приближенного нахождения неподвижных точек в непрерывных отображениях компактов (особенно выпуклых) в себя могут быть использованы для приближенного решения биматричных игр.
6. Решение биматричных игр
Иногда анализ 2 X 2-матричных игр проводится
путем
составления точного описания множеств
ситуаций, приемлемых для каждо-
го из игроков (это описание проводится
на геометрическом языке, но,
очевидно, может быть представлено и в
чисто алгебраическом виде), и
нахождения пересечения этих двух множеств.
В принципе этот способ описа-
ния ситуаций равновесия может быть применен
и к матрич-
ным играм произвольного формата. Однако
он пока еще не нашел достаточ-
но наглядных средств выражения, которые
сделали бы его конкурентоспо-
собным среди других методов анализа матричных
игр.
Вместе с тем, как мы
сейчас увидим, применение способа описа-
ния ситуаций равновесия к анализу биматричных
игр и даже к нахождению их решений, правда,
весьма неэффективному, представляется
вполне целесообразным.
Пусть Г=Г(А,В)- m x n биматричная игра с матрицами выигрышей игроков:
(6)
Множество ζ1(Г) всех ситуаций, приемлемых для игрока 1 в этой игре, состоит из всех ситуаций (X, У), для которых выполняется система неравенств:
(7)
Далее я буду рассматривать случаи, соответствующие тому или иному спектру стратегии12 X.
Пусть. Тогда в (7) для по свойству дополняющей нежесткости13 должно выполняться точное равенство. Отсюда следует, что для любых двух смешанных стратегий X’ и Х'' обладающих одним и тем же спектром и дающих в паре с одной и той же стратегией Y приемлемые ситуации, должно быть X'AYT = X»AYT.
Таким образом, на множестве X(sx) всех стратегий игрока 1 со спектром sx величина ХАYT не зависит от X.