Конечные матричные игры
2. Конечные матричные игры
2.1) Игра 2*xm
a)
1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки
| B1
| B2
| B3
| B4
| B5
| B6
| B7
| B8
| B9
| a = min(Ai)
| A1
| -10
| -6
|
|
|
|
| -15
| -12
|
| -15
| A2
| -16
| -2
|
| -10
|
|
|
| -14
| -5
| -16
| b = max(Bi)
| -10
| -2
|
|
|
|
|
| -12
|
| | Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = -15, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = -12. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах -15 ≤ y ≤ -12. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии). 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B2 (все элементы столбца 1 меньше элементов столбца 2), следовательно, исключаем 2-й столбец матрицы. Вероятность q2 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B3 (все элементы столбца 1 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B4 (все элементы столбца 1 меньше элементов столбца 4), следовательно, исключаем 4-й столбец матрицы. Вероятность q4 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B5 (все элементы столбца 1 меньше элементов столбца 5), следовательно, исключаем 5-й столбец матрицы. Вероятность q5 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B6 (все элементы столбца 1 меньше элементов столбца 6), следовательно, исключаем 6-й столбец матрицы. Вероятность q6 = 0. С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B9 (все элементы столбца 1 меньше элементов столбца 9), следовательно, исключаем 9-й столбец матрицы. Вероятность q9 = 0.
В платежной матрице отсутствуют доминирующие строки. Мы свели игру 2 x 9 к игре 2 x 3. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I. В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (16). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).
3. Находим решение игры в смешанных стратегиях. Математические модели пары двойственных задач линейного программирования можно записать так: найти минимум функции F(x) при ограничениях (для игрока II): 6x1 ≥ 1 x1+17x2 ≥ 1 4x1+2x2 ≥ 1 F(x) = x1+x2 → min найти максимум функции Z(y) при ограничениях (для игрока I): 6y1+y2+4y3 ≤ 1 17y2+2y3 ≤ 1 Z(y) = y1+y2+y3 → max Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы. Определим максимальное значение целевой функции Z(Y) = y1+y2+y3 при следующих условиях-ограничений. 6y1+y2+4y3≤1 17y2+2y3≤1 Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме). 6y1+y2+4y3+y4 = 1 17y2+2y3+y5 = 1 Решим систему уравнений относительно базисных переменных: y4, y5 Полагая, что свободные переменные равны 0, получим первый опорный план: Y0 = (0,0,0,1,1)
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y4
|
|
|
|
|
|
| y5
|
|
|
|
|
|
| Z(Y0)
|
| -1
| -1
| -1
|
|
| Переходим к основному алгоритму симплекс-метода. Итерация №0. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты. В качестве ведущего выберем столбец, соответствующий переменной y3, так как это наибольший коэффициент по модулю. Вычислим значения Di по строкам как частное от деления: bi / ai3 и из них выберем наименьшее: min (1 : 4 , 1 : 2 ) = 1/4 Следовательно, 1-ая строка является ведущей. Разрешающий элемент равен (4) и находится на пересечении ведущего столбца и ведущей строки.
Базис
| B
| y1
| y2
| y3
| y4
| y5
| min
| y4
|
|
|
|
|
|
| 1/4
| y5
|
|
|
|
|
|
| 1/2
| Z(Y1)
|
| -1
| -1
| -1
|
|
| | Формируем следующую часть симплексной таблицы. Вместо переменной y4 в план 1 войдет переменная y3. Получаем новую симплекс-таблицу:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 1/4
| 3/2
| 1/4
|
| 1/4
|
| y5
| 1/2
| -3
| 33/2
|
| -1/2
|
| Z(Y1)
| 1/4
| 1/2
| -3/4
|
| 1/4
|
| Итерация №1. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты. В качестве ведущего выберем столбец, соответствующий переменной y2, так как это наибольший коэффициент по модулю. Вычислим значения Di по строкам как частное от деления: bi / ai2 и из них выберем наименьшее: min (1/4 : 1/4 , 1/2 : 161/2 ) = 1/33 Следовательно, 2-ая строка является ведущей. Разрешающий элемент равен (161/2) и находится на пересечении ведущего столбца и ведущей строки.
Базис
| B
| y1
| y2
| y3
| y4
| y5
| min
| y3
| 1/4
| 3/2
| 1/4
|
| 1/4
|
|
| y5
| 1/2
| -3
| 161/2
|
| -1/2
|
| 1/33
| Z(Y2)
| 1/4
| 1/2
| -3/4
|
| 1/4
|
| | Формируем следующую часть симплексной таблицы. Вместо переменной y5 в план 2 войдет переменная y2.
Получаем новую симплекс-таблицу:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 8/33
| 17/11
|
|
| 17/66
| -1/66
| y2
| 1/33
| -2/11
|
|
| -1/33
| 2/33
| Z(Y2)
| 3/11
| 4/11
|
|
| 5/22
| 1/22
| Конец итераций: индексная строка не содержит отрицательных элементов - найден оптимальный план Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи. Окончательный вариант симплекс-таблицы:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 8/33
| 17/11
|
|
| 17/66
| -1/66
| y2
| 1/33
| -2/11
|
|
| -1/33
| 2/33
| Z(Y3)
| 3/11
| 4/11
|
|
| 5/22
| 1/22
| Оптимальный план можно записать так: y1 = 0, y2 = 1/33, y3 = 8/33 Z(Y) = 1•0 + 1•1/33 + 1•8/33 = 3/11 Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи. x1=5/22, x2=1/22 Это же решение можно получить, применив теоремы двойственности. Из теоремы двойственности следует, что X = C*A-1. Составим матрицу A из компонентов векторов, входящих в оптимальный базис.
Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:
Как видно из последнего плана симплексной таблицы, обратная матрица A-1расположена в столбцах дополнительных переменных. Тогда X = C*A-1 =
Оптимальный план двойственной задачи равен: x1 = 5/22, x2 = 1/22 F(X) = 1*5/22+1*1/22 = 3/11 Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков: qi = g*yi; pi = g*xi. Цена игры: g = 1 : 3/11 = 11/3 p1 = 11/3*5/22 = 5/6 p2 = 11/3*1/22 = 1/6 Оптимальная смешанная стратегия игрока I: P = (5/6; 1/6) q1 = 11/3* = 0 q2 = 11/3*1/33 = 1/9 q3 = 11/3*8/33 = 8/9 Оптимальная смешанная стратегия игрока II: Q = (0; 1/9; 8/9) Поскольку ранее к элементам матрицы было прибавлено число (16), то вычтем это число из цены игры. 32/3 - 16 = -121/3 Цена игры: v=-37/3 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (-10*0) + (-15*1/9) + (-12*8/9) = -12.333 = v M(P2;Q) = (-16*0) + (1*1/9) + (-14*8/9) = -12.333 = v M(P;Q1) = (-10*5/6) + (-16*1/6) = -11 ≥ v M(P;Q2) = (-15*5/6) + (1*1/6) = -12.333 = v M(P;Q3) = (-12*5/6) + (-14*1/6) = -12.333 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде: P(5/6,1/6) Q(0,0,0,0,0,0,1/9,8/9,0)
б)
Рассматриваем игру, после сведения ее к игре 2x3
Находим решение игры в смешанных стратегиях. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x n) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем нижнюю границу выигрыша B2NB3. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B2B2 и B3B3, для которых можно записать следующую систему уравнений: y = -15 + (1 - (-15))p2 y = -12 + (-14 - (-12))p2 Откуда p1 = 5/6 p2 = 1/6 Цена игры, y = -37/3 Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений, исключив стратегию B1, которая дает явно больший проигрыш игроку B, и, следовательно, q1 = 0. -15q2-12q3 = y q2-14q3 = y q2+q3 = 1 или -15q2-12q3 = -37/3 q2-14q3 = -37/3 q2+q3 = 1 Решая эту систему, находим: q2 = 1/9. q3 = 8/9. Ответ: Цена игры: y = -37/3, векторы стратегии игроков: Q(0, 1/9, 8/9), P(5/6, 1/6) 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (-10*0) + (-15*1/9) + (-12*8/9) = -12.333 = v M(P2;Q) = (-16*0) + (1*1/9) + (-14*8/9) = -12.333 = v M(P;Q1) = (-10*5/6) + (-16*1/6) = -11 ≥ v M(P;Q2) = (-15*5/6) + (1*1/6) = -12.333 = v M(P;Q3) = (-12*5/6) + (-14*1/6) = -12.333 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде: P(5/6,1/6) Q(0,0,0,0,0,0,1/9,8/9,0)
|