Игра nx2. Бескоалиционные игры
Игра nx2
a)
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Игроки
| B1
| B2
| a = min(Ai)
| A1
| -1
| -4
| -4
| A2
| -9
| -8
| -9
| A3
|
| -6
| -6
| A4
| -8
|
| -8
| A5
| -10
|
| -10
| A6
| -5
|
| -5
| A7
| -5
|
| -5
| b = max(Bi)
|
|
| | Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = -4, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 4. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах -4 ≤ y ≤ 4. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии). 2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. Стратегия A1 доминирует над стратегией A2 (все элементы строки 1 больше или равны значениям 2-ой строки), следовательно, исключаем 2-ую строку матрицы. Вероятность p2 = 0. Стратегия A4 доминирует над стратегией A5 (все элементы строки 4 больше или равны значениям 5-ой строки), следовательно, исключаем 5-ую строку матрицы. Вероятность p5 = 0. Стратегия A6 доминирует над стратегией A4 (все элементы строки 6 больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую строку матрицы. Вероятность p4 = 0. Стратегия A6 доминирует над стратегией A7 (все элементы строки 6 больше или равны значениям 7-ой строки), следовательно, исключаем 7-ую строку матрицы. Вероятность p7 = 0.
В платежной матрице отсутствуют доминирующие столбцы. Мы свели игру 7 x 2 к игре 3 x 2. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I. В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (6). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).
3. Находим решение игры в смешанных стратегиях. Математические модели пары двойственных задач линейного программирования можно записать так: найти минимум функции F(x) при ограничениях (для игрока II): 5x1+10x2+x3 ≥ 1 2x1+14x3 ≥ 1 F(x) = x1+x2+x3 → min найти максимум функции Z(y) при ограничениях (для игрока I): 5y1+2y2 ≤ 1 10y1 ≤ 1 y1+14y2 ≤ 1 Z(y) = y1+y2 → max Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы. Определим максимальное значение целевой функции Z(Y) = y1+y2 при следующих условиях-ограничений. 5y1+2y2≤1 10y1≤1 y1+14y2≤1 Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме). 5y1+2y2+y3 = 1 10y1+y4 = 1 y1+14y2+y5 = 1 Решим систему уравнений относительно базисных переменных: y3, y4, y5 Полагая, что свободные переменные равны 0, получим первый опорный план: Y0 = (0,0,1,1,1)
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
|
|
|
|
|
|
| y4
|
|
|
|
|
|
| y5
|
|
|
|
|
|
| Z(Y0)
|
| -1
| -1
|
|
|
| Переходим к основному алгоритму симплекс-метода. Итерация №0. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты. В качестве ведущего выберем столбец, соответствующий переменной y2, так как это наибольший коэффициент по модулю. Вычислим значения Di по строкам как частное от деления: bi / ai2 и из них выберем наименьшее: min (1 : 2 , - , 1 : 14 ) = 1/14 Следовательно, 3-ая строка является ведущей. Разрешающий элемент равен (14) и находится на пересечении ведущего столбца и ведущей строки.
Базис
| B
| y1
| y2
| y3
| y4
| y5
| min
| y3
|
|
|
|
|
|
| 1/2
| y4
|
|
|
|
|
|
| -
| y5
|
|
|
|
|
|
| 1/14
| Z(Y1)
|
| -1
| -1
|
|
|
| | Формируем следующую часть симплексной таблицы. Вместо переменной y5 в план 1 войдет переменная y2. Получаем новую симплекс-таблицу:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 6/7
| 34/7
|
|
|
| -1/7
| y4
|
|
|
|
|
|
| y2
| 1/14
| 1/14
|
|
|
| 1/14
| Z(Y1)
| 1/14
| -13/14
|
|
|
| 1/14
| Итерация №1. Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты. В качестве ведущего выберем столбец, соответствующий переменной y1, так как это наибольший коэффициент по модулю. Вычислим значения Di по строкам как частное от деления: bi / ai1 и из них выберем наименьшее: min (6/7 : 46/7 , 1 : 10 , 1/14 : 1/14 ) = 1/10 Следовательно, 2-ая строка является ведущей. Разрешающий элемент равен (10) и находится на пересечении ведущего столбца и ведущей строки.
Базис
| B
| y1
| y2
| y3
| y4
| y5
| min
| y3
| 6/7
| 34/7
|
|
|
| -1/7
| 3/17
| y4
|
|
|
|
|
|
| 1/10
| y2
| 1/14
| 1/14
|
|
|
| 1/14
|
| Z(Y2)
| 1/14
| -13/14
|
|
|
| 1/14
| | Формируем следующую часть симплексной таблицы. Вместо переменной y4 в план 2 войдет переменная y1. Получаем новую симплекс-таблицу:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 13/35
|
|
|
| -17/35
| -1/7
| y1
| 1/10
|
|
|
| 1/10
|
| y2
| 9/140
|
|
|
| -1/140
| 1/14
| Z(Y2)
| 23/140
|
|
|
| 13/140
| 1/14
| Конец итераций: индексная строка не содержит отрицательных элементов - найден оптимальный план Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи. Окончательный вариант симплекс-таблицы:
Базис
| B
| y1
| y2
| y3
| y4
| y5
| y3
| 13/35
|
|
|
| -17/35
| -1/7
| y1
| 1/10
|
|
|
| 1/10
|
| y2
| 9/140
|
|
|
| -1/140
| 1/14
| Z(Y3)
| 23/140
|
|
|
| 13/140
| 1/14
| Оптимальный план можно записать так: y1 = 1/10, y2 = 9/140 Z(Y) = 1•1/10 + 1•9/140 = 23/140 Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи. x1=0, x2=13/140, x3=1/14 Это же решение можно получить, применив теоремы двойственности. Из теоремы двойственности следует, что X = C*A-1. Составим матрицу A из компонентов векторов, входящих в оптимальный базис.
Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:
D = A-1 =
|
| -17/35
| -1/7
|
| 1/10
|
|
| -1/140
| 1/14
| | | | Как видно из последнего плана симплексной таблицы, обратная матрица A-1расположена в столбцах дополнительных переменных. Тогда X = C*A-1 =
(0, 1, 1) x
|
| -17/35
| -1/7
|
| 1/10
|
|
| -1/140
| 1/14
| | | | = (0;13/140;1/14)
| Оптимальный план двойственной задачи равен: x1 = 0, x2 = 13/140, x3 = 1/14 F(X) = 1*0+1*13/140+1*1/14 = 23/140 Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков: qi = g*yi; pi = g*xi. Цена игры: g = 1 : 23/140 = 140/23 p1 = 140/23*0 = 0 p2 = 140/23*13/140 = 13/23 p3 = 140/23*1/14 = 10/23 Оптимальная смешанная стратегия игрока I: P = (0; 13/23; 10/23) q1 = 140/23*1/10 = 14/23 q2 = 140/23*9/140 = 9/23 Оптимальная смешанная стратегия игрока II: Q = (14/23; 9/23) Поскольку ранее к элементам матрицы было прибавлено число (6), то вычтем это число из цены игры. 62/23 - 6 = 2/23 Цена игры: v=2/23 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (-1*14/23) + (-4*9/23) = -2.174 ≤ v M(P2;Q) = (4*14/23) + (-6*9/23) = 0.087 = v M(P3;Q) = (-5*14/23) + (8*9/23) = 0.087 = v M(P;Q1) = (-1*0) + (4*13/23) + (-5*10/23) = 0.087 = v M(P;Q2) = (-4*0) + (-6*13/23) + (8*10/23) = 0.087 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде: P(0,0,13/23,0,0,10/23,0) Q(14/23,9/23)
б)
Рассматриваем игру, после сведения ее к игре 3x2
Находим решение игры в смешанных стратегиях. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии B1, правый - стратегии B2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии B1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии B2. Решение игры (m x 2) проводим с позиции игрока B, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем верхнюю границу выигрыша A2NA3. Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A2A2 и A3A3, для которых можно записать следующую систему уравнений: y = 4 + (-6 - 4)q2 y = -5 + (8 - (-5))q2 Откуда q1 = 14/23 q2 = 9/23 Цена игры, y = 2/23 Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений, исключив стратегию A1, которая дает явно больший проигрыш игроку A, и, следовательно, p1 = 0. 4p2-5p3 = y -6p2+8p3 = y p2+p3 = 1 или 4p2-5p3 = 2/23 -6p2+8p3 = 2/23 p2+p3 = 1 Решая эту систему, находим: p2 = 13/23. p3 = 10/23. Ответ: Цена игры: y = 2/23, векторы стратегии игроков: P(0, 13/23, 10/23), Q(14/23, 9/23) 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (-1*14/23) + (-4*9/23) = -2.174 ≤ v M(P2;Q) = (4*14/23) + (-6*9/23) = 0.087 = v M(P3;Q) = (-5*14/23) + (8*9/23) = 0.087 = v M(P;Q1) = (-1*0) + (4*13/23) + (-5*10/23) = 0.087 = v M(P;Q2) = (-4*0) + (-6*13/23) + (8*10/23) = 0.087 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде: P(0,0,13/23,0,0,10/23,0) Q(14/23,9/23)
2.2)
Прибавим ко всем элементам матрицы 48, получим матрицу:
| F1
| F2
| F3
| F4
| F5
| F6
| F7
| F8
| F9
| F10
| F11
| F12
| E1
|
|
|
|
|
|
|
|
|
|
|
|
| E2
|
|
|
|
|
|
|
|
|
|
|
|
| E3
|
|
|
|
|
|
|
|
|
|
|
|
| E4
|
|
|
|
|
|
|
|
|
|
|
|
| E5
|
|
|
|
|
|
|
|
|
|
|
|
| E6
|
|
|
|
|
|
|
|
|
|
|
|
| E7
|
|
|
|
|
|
|
|
|
|
|
|
|
Составим пару взаимно-двойственных задач:
Решим вторую задачу симплекс методом
Для построения первого опорного плана, систему неравенств, приведем к системе уравнений путем введения дополнительных переменных
Матрица коэффициентов А системы уравнений будет иметь вид:
А=
A=
Базисные переменные это переменные, которые входят только в одно уравнение системы ограничений с коэффициентом 1.
Решим систему уравнений относительно базисных переменных q13, q14, q15, q16, q17, q18, q19
Пологая, что свободные переменные равны 0, получим первый опорный план
Q1=(0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1)
3. Бескоалиционные игры
3.1) В каждом столбце матрицы А выберем максимальный элемент. Их положение соответствует приемлемым ситуациям первого игрока, когда второй игрок выбрал стратегию j соответственно. Затем в каждой строке матрицы В выберем наибольший элемент. Их положение будет определять приемлемые ситуации второго игрока, когда первый выбрал стратегию j соответственно.
Позиции максимумов в столбцах матрицы А: (1,1), (2,2)
а11=-2; а22=2
Позиции максимумов в строках матрицы В: (1,1), (2,2)
b11=5; b22=4;
Пересечение множеств этих максимумов: (1,1), (2,2)
Таким образом, найдены две равновесные ситуации по Нешу (1,1), (2,2). Эти равновесные ситуации оптимальны по Парето. В равновесной ситуации (1,1) первый игрок выигрывает -2, а второй 5. В равновесной ситуации (2,2) первый игрок выигрывает 2, а второй игрок 4.
Если биматричная игра не имеет равновесных ситуаций в чистых стратегиях, то она неразрешима в чистых стратегиях. И тогда можно искать решение в смешанных стратегиях. Чтобы в биматричной игре пара (p, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение неравенств:
(p-1)(cq-2)≥0, p(cq-2)≥0, 0≤p≤1
(q-1)(Дp-β)≥0, p(Дp-β)≥0, 0≤q≤1, где
С=a11-a12-a21+a22
α=a22-a12
Д=b12-b12-b21+b22
β=b22-b21
C=-2-(-8)-(-13)+2=21
α=2-(-8)=10
Д=5-(-8)-1+4=16
β=4-1=3
(p-1)(21q-10)≥0 1) p=1, q≥
p(21q-10)≥0 p=0, q≤
=> 0≤p≤1, q=
(q-1)(16p-3)≥0 2) q=1, p≥
q(16p-3)≥0 q=0, p≤
0≤q≤1, p=
Рассматриваемая игра имеет единственную ситуацию равновесия (p*, q*), где оптимальными стратегиями по Нему являются: p*=( ); q*=(
Таким образом, она может быть реализована при многократном повторении следующим образом: первый игрок должен использовать чистые стратегии 1 и 2 с частотами и , а игрок два – чистые стратегии 1 и 2 с частотами . Любой игрок, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш.
Цена игры:
H= + +
Ha= + + + =-5
Hb= + + + =1
Цена игры для первого игрока: Ha=( )= -5
Цена игры для второго игрока: Hb=( )= 1
Смешанная стратегия для первого игрока p*=( ), для второго игрока q*=( ),
Выигрыш игроков в равновесной ситуации: f(p*, q*)=(-5 1
Множество всех реализуемых векторов выигрышей для игры имеет вид, изображенный на рисунке:
3.2)
| В1
| В2
| a=min(Ai)
| А1
| -2
| -8
| -8
| А2
| -13
|
| -13
| b=max(Bi)
| -2
|
|
|
Считаем, что игрок 1 выбирает свою стратегию так, чтобы получить максимальный выигрыш, а второй чтобы минимизировать выигрыш первого игрока. Находим гарантированный выигрыш, определяемый нижней ценой игры a=max(Ai)=-8, которая указывает на максимальную чистую стратегию А1
Верхняя цена игры b=min(Bi)=2.
В данном случае отсутствует седловая точка, так как a≠b, тогда цена игры находится в пределах -8≤y≤-2.
Находим решение игры в смешанных стратегиях.
Запишем систему уравнений
Для первого игрока:
=> => => => = =>
10y+130=22-11y
21y=-108
y= => p1= , p2=
Для второго игрока:
=> => =>
15y+120=12-6y
21y=-108
y= => q1= q2=
В итоге, цена игры y= , оптимальная смешанная стратегия игрока 1: p=( ), для второго игрока: q=( )
| B1
| B2
| a=min(Ai)
| A1
|
| -8
| -8
| A2
|
|
|
| b=max(Bi)
|
|
|
|
Находим гарантированный выигрыш, определяемый нижней ценой игры a=max(Ai)=1, которая указывает на максимальную чистую стратегию A2. Верхняя цена игры b=min(Bj) =4
Седловая точка отсутствует, так как a≠b, тогда цена игры находится в пределах 1≤y≤4. Находим решение в смешанных стратегиях.
Запишем систему уравнений:
Для первого игрока:
=> => =>
12y-12=16-4y
16y=28
y= =1 => p1= p2=
Для второго игрока:
=> => =>
3y+24=52-13y
16y=28
y=1 => q1= , q2=
В итоге, цена игры y=1 , оптимальная смешанная стратегия игрока 1: p=( ), смешанная стратегия игрока 2: q=( ; )
|