Автор: Пользователь скрыл имя, 01 Апреля 2013 в 14:12, курсовая работа
Выбранная тема "Матричные игры " изучается на стыке сразу двух взаимосвязанных дисциплин: математики и экономики. Для современного состояния науки характерен переход к глобальному рассмотрению проблем тематики «Матричные игры». Вопросам исследования посвящено множество работ. В основном материал, изложенный в учебной литературе, носит общий характер, а в многочисленных монографиях по данной тематике рассмотрены более узкие вопросы проблемы "Матричные игры". Однако, требуется учет современных условий при исследовании проблематики обозначенной темы.
Высокая значимость и недостаточная практическая разработанность проблемы "Матричные игры " определяют несомненную новизну данного исследования.
Введение…………………………………………………………………………2
Основная часть…………………………………………………………………..6
Теоретические основы темы «Матричные игры»……………………...6
2.1.1.Платежная матрица. Нижняя и верхняя цена игры……………...8
2.1.2. Решение матричных игр в смешанных стратегиях…………….11
2.1.3. Геометрическая интерпретация матричной игры 2*2…………14
2.1.4.Приведение матричной игры к задаче линейного
программирования………………………………………………………19
Практические основы темы «Матричные игры»……………………...23
Заключение……………………………………………………………………..31
Список использованной литературы…………………………………………32
Среди всех чисел bj выберем наименьшее и назовём b верхней ценой игры или минимаксным выигрышем (минимаксом). Это гарантированный проигрыш игрока В. Следовательно,
Стратегия, соответствующая минимаксу, называется минимаксной стратегией.
Принцип, диктующий игрокам выбор наиболее «осторожных» минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника.
Любая стратегия игрока В является минимаксной. Дополнив таблицу 1 строкой bj и столбцом ai, получим таблицу 2. На пересечении дополнительных строки и столбца будем записывать верхнюю и нижнюю цены игр.
Bi Aj |
B1 |
B2 |
ai |
A1 |
- 1 |
1 |
- 1 |
A2 |
1 |
- 1 |
- 1 |
bj |
1 |
1 |
a = -1 b = 1 |
Если верхняя и нижняя цены игры совпадают, то общее значение верхней и нижней цены игры a = b = n называется чистой ценой игры, или ценой игры. Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением, или решением игры. В этом случае игрок А получает максимальный гарантированный (не зависящий от поведения игрока В) выигрыш n, а игрок В добивается минимального гарантированного (вне зависимости от поведения игрока А) проигрыша n. Говорят, что решение игры обладает устойчивостью, т.е. если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.
Пара чистых стратегии Ai и Bj даёт оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент aij является одновременно наибольшим в своём столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой (по аналогии с поверхностью седла, которая искривляется вверх в одном направлении и вниз – в другом).
Обозначим А* и В* - пару чистых стратегий, на которых достигается решение игры в задаче с седловой точкой. Введём функцию выигрыша первого игрока на каждой паре стратегий: P(Ai, Bj) = aij. Тогда из условия оптимальности в седловой точке выполняется двойное неравенство: P(Ai, B*) £ P(A*, B*)£ P(A*, Bj), которое справедливо для всех i = 1,…,m; j = 1, …, n. Действительно, выбор стратегии А* первым игроком при оптимальной стратегии В* второго игрока максимизирует минимальный возможный выигрыш: P(A*, B*) ³ P(Ai, B*), а выбор стратегии В* вторым игроком при оптимальной стратегии первого минимизирует максимальный проигрыш: P(A*, B*) £ P(A*, B).
Если игра не имеет седловой точки, то применение чистых стратегий не даёт оптимального решения игры. Так в задаче 1 a ¹ b, седловая точка отсутствует. В таком случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.
Смешанной стратегией Sa игрока А называется применение чистых стратегий A1, A2, …, Ai, …, Am с вероятностями p1, p2, …, pi, …, pm, причём
сумма вероятностей равна 1: . Смешанные стратегии игрока А записываются в виде матрицы
или в виде строки SA = (p1, p2, …, pi, …, pm). Аналогично смешанные стратегии игрока В обозначаются:
где сумма вероятностей появления стратегий равна 1: .
Чистые стратегии можно
где a и b - нижняя и верхняя цена игры.
Справедлива следующая основная теорема теории игр – теорема Неймана. Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Пусть SA* = (p1*, p2*,…,рm*) и SB* = (q1*, q2*, … qn*) – пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Справедлива теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры n, если второй игрок не входит за пределы своих активных стратегий.
Эта теорема имеет большое
Рассмотрим игру размера 2×2, которая является простейшим случаем конечной игры. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.
Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр оптимальное решение существует и определяется парой смешанных стратегий SA* = (p1*, p2*) и SB* = (q1*, q2*).
Для того чтобы их найти, воспользуемся теоремой об активных стратегиях. Если игрок А придерживается своей оптимальной стратегии SA*, то его средний выигрыш будет равен цене игры n, какой бы активной стратегией ни пользовался игрок В. Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний выигрыш игрока А (оптимальная стратегия) будет равна n и для 1-й, и для 2-й стратегии противника.
Пусть игра задана платёжной матрицей
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1 (это соответствует 1-му столбцу платёжной матрицы Р), равен цене игры n:
a11p1* = a21p2* =n.
Тот же выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е. а12р1* = а22р2* = n. Учитывая, что р1* + р2* = 1, получаем систему уравнений для определения оптимальной стратегии SA* и цены игры n:
Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании SB* -оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры n, т.е.
тогда
оптимальная стратегия SB*(q1*,
Решение игры 2´2 допускает наглядную геометрическую интерпретацию. Пусть игра задана платёжной матрицей P=( ), где i, j = 1, 2. По оси абсцисс (рис.1) отложим единичный отрезок ; точка (х=0) изображает стратегию , а все промежуточные точки этого отрезка – смешанные стратегии первого игрока, причём расстояние от до правого конца отрезка – это вероятность стратегии , расстояние до левого конца – вероятность стратегии . На перпендикулярных осях I–I и II–II откладываем выигрыши при стратегиях и соответственно. Если второй игрок примет стратегию B1, то она даёт выигрыши и на осях I–I и II–II , соответствующие стратегиям и . Обозначим эти точки на осях I–I и II–II буквой . Средний выигрыш n1, соответствующий смешанной стратегии , определяется по формуле математического ожидания n1= и равен ординате точки , которая лежит на отрезке и имеет абсциссу (рис. 1).
Аналогично строим отрезок , соответствующий применению вторым игроком стратегии (рис. 2). При этом средний выигрыш n2= – ордината точки .В соответствии с принципом минимакса оптимальная стратегия такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке N – против стратегии , на участке – против стратегии ). Оптимальную стратегию определяет точка N, в которой минимальный выигрыш достигает максимума; её ордината равна цене игры ν. На рис. 3 обозначены также верхняя и нижняя цены игры и .
Применим геометрический метод для решения следующей задачи.
► Задача. Решить графически игру, заданную платёжной матрицей
Р е ш е н и е. Откладываем по оси абсцисс (рис. 4) единичный отрезок . На вертикальной оси I–I откладываем отрезки: 1.5, соответствующий стратегии , и = 3, соответствующий стратегии . На вертикальной оси II – II отрезок = 2 соответствует стратегии , отрезок = 2 соответствует стратегии (см. рис. 4). Нижняя цена игры = =1.5. Верхняя граница игры = =2, седловая точка отсутствует. Из рис. 4 видно, что абсцисса точки N определяет оптимальную стратегию , а ордината – цену игры ν. Точка N является точкой пересечения прямых и . Уравнение прямой , проходящей через точки (0;1.5) и (1;2):
Уравнение прямой , проходящей через точки (0; 3) и (1; 1):
Точка пересечения прямых является решением системы
Или x=0.6; y=1,8, т.е.
Таким образом, =0,6, =1-0,6=0,4; оптимальная стратегия =(0,6;0,4), цена игры ν = 1,8.
Геометрически можно также определить оптимальную стратегию игрока B, если поменять местами игроков А и В и вместо максимума нижней границы в соответствии с принципом минимакса (рис. 5) рассмотреть минимум верхней границы.
Абсцисса точки M определяет в оптимальной стратегии игрока B, ордината этой точки – цена игры. Прямая , проходящая через точки (0;1.5) и (1; 3), удовлетворяет уравнению
y = 1,5x + 1,5.
Прямая , проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению y = -x +2.
Координаты их точек пересечения М – это решение системы уравнений:
откуда x = 0,2; y = 1,8, т.е. = 0,2, = 1- = 0,8, x = y = 1,8, = (0.8; 0.2).
Оптимальное решение найдено.
Из решения этой задачи следует,
что геометрически можно
При наличии седловой точки графическое решение даёт варианты, изображённые на рис. 6 и 7. На рис. 6 наибольшей ординатой на ломаной обладает точка , поэтому оптимальной является чистая стратегия для игрока А ( – для игрока В), т.е. оптимальное решение: = (0; 1), = (0; 1). Игра имеет седловую точку = ν.
Чистая стратегия (рис. 7) не выгодна для игрока В, поскольку при любой стратегии игрока А она даёт последнему больший выигрыш, чем чистая стратегия . На основании принципа минимакса выделим прямую и на ней точку с наибольшей ординатой на оси I – I. Чистая стратегия является оптимальной для игрока А, а чистая стратегия – для игрока В. Оптимальное решение: = (0; 1), = (1; 0), цена игры ν = , т.е. имеется седловая точка.