Хелпикс

Главная

Контакты

Случайная статья





Конечные матричные игры



2. Конечные матричные игры

2.1) Игра 2*xm

a)

1. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки B1 B2 B3 B4 B5 B6 B7 B8 B9 a = min(Ai)
A1 -10 -6 -15 -12 -15
A2 -16 -2 -10 -14 -5 -16
b = max(Bi) -10 -2 -12  


Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = -15, которая указывает на максимальную чистую стратегию A1.
Верхняя цена игры b = min(bj) = -12.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах -15 ≤ y ≤ -12. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B2 (все элементы столбца 1 меньше элементов столбца 2), следовательно, исключаем 2-й столбец матрицы. Вероятность q2 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B3 (все элементы столбца 1 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B4 (все элементы столбца 1 меньше элементов столбца 4), следовательно, исключаем 4-й столбец матрицы. Вероятность q4 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B5 (все элементы столбца 1 меньше элементов столбца 5), следовательно, исключаем 5-й столбец матрицы. Вероятность q5 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B6 (все элементы столбца 1 меньше элементов столбца 6), следовательно, исключаем 6-й столбец матрицы. Вероятность q6 = 0.
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B9 (все элементы столбца 1 меньше элементов столбца 9), следовательно, исключаем 9-й столбец матрицы. Вероятность q9 = 0.

-10 -15 -12
-16 -14


В платежной матрице отсутствуют доминирующие строки.
Мы свели игру 2 x 9 к игре 2 x 3.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (16). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).


3. Находим решение игры в смешанных стратегиях.
Математические модели пары двойственных задач линейного программирования можно записать так:
найти минимум функции F(x) при ограничениях (для игрока II):
6x1 ≥ 1
x1+17x2 ≥ 1
4x1+2x2 ≥ 1
F(x) = x1+x2 → min
найти максимум функции Z(y) при ограничениях (для игрока I):
6y1+y2+4y3 ≤ 1
17y2+2y3 ≤ 1
Z(y) = y1+y2+y3 → max
Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы.
Определим максимальное значение целевой функции Z(Y) = y1+y2+y3 при следующих условиях-ограничений.
6y1+y2+4y3≤1
17y2+2y3≤1
Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме).
6y1+y2+4y3+y4 = 1
17y2+2y3+y5 = 1
Решим систему уравнений относительно базисных переменных: y4, y5
Полагая, что свободные переменные равны 0, получим первый опорный план:
Y0 = (0,0,0,1,1)

Базис B y1 y2 y3 y4 y5
y4
y5
Z(Y0) -1 -1 -1


Переходим к основному алгоритму симплекс-метода.
Итерация №0.
Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
В качестве ведущего выберем столбец, соответствующий переменной y3, так как это наибольший коэффициент по модулю.
Вычислим значения Di по строкам как частное от деления: bi / ai3
и из них выберем наименьшее:
min (1 : 4 , 1 : 2 ) = 1/4
Следовательно, 1-ая строка является ведущей.
Разрешающий элемент равен (4) и находится на пересечении ведущего столбца и ведущей строки.

Базис B y1 y2 y3 y4 y5 min
y4 1/4
y5 1/2
Z(Y1) -1 -1 -1  


Формируем следующую часть симплексной таблицы. Вместо переменной y4 в план 1 войдет переменная y3.
Получаем новую симплекс-таблицу:

Базис B y1 y2 y3 y4 y5
y3 1/4 3/2 1/4 1/4
y5 1/2 -3 33/2 -1/2
Z(Y1) 1/4 1/2 -3/4 1/4


Итерация №1.
Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
В качестве ведущего выберем столбец, соответствующий переменной y2, так как это наибольший коэффициент по модулю.
Вычислим значения Di по строкам как частное от деления: bi / ai2
и из них выберем наименьшее:
min (1/4 : 1/4 , 1/2 : 161/2 ) = 1/33
Следовательно, 2-ая строка является ведущей.
Разрешающий элемент равен (161/2) и находится на пересечении ведущего столбца и ведущей строки.

Базис B y1 y2 y3 y4 y5 min
y3 1/4 3/2 1/4 1/4
y5 1/2 -3 161/2 -1/2 1/33
Z(Y2) 1/4 1/2 -3/4 1/4  


Формируем следующую часть симплексной таблицы. Вместо переменной y5 в план 2 войдет переменная y2.

 

Получаем новую симплекс-таблицу:

Базис B y1 y2 y3 y4 y5
y3 8/33 17/11 17/66 -1/66
y2 1/33 -2/11 -1/33 2/33
Z(Y2) 3/11 4/11 5/22 1/22


Конец итераций: индексная строка не содержит отрицательных элементов - найден оптимальный план
Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи.
Окончательный вариант симплекс-таблицы:

Базис B y1 y2 y3 y4 y5
y3 8/33 17/11 17/66 -1/66
y2 1/33 -2/11 -1/33 2/33
Z(Y3) 3/11 4/11 5/22 1/22


Оптимальный план можно записать так:
y1 = 0, y2 = 1/33, y3 = 8/33
Z(Y) = 1•0 + 1•1/33 + 1•8/33 = 3/11
Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи.
x1=5/22, x2=1/22
Это же решение можно получить, применив теоремы двойственности.
Из теоремы двойственности следует, что X = C*A-1.
Составим матрицу A из компонентов векторов, входящих в оптимальный базис.

A = (A3, A2) =
 


Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:

D = A-1 =
17/66 -1/66
-1/33 2/33
 


Как видно из последнего плана симплексной таблицы, обратная матрица A-1расположена в столбцах дополнительных переменных.
Тогда X = C*A-1 =

(1, 1) x
17/66 -1/66
-1/33 2/33
 
= (5/22;1/22)


Оптимальный план двойственной задачи равен:
x1 = 5/22, x2 = 1/22
F(X) = 1*5/22+1*1/22 = 3/11
Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:
qi = g*yi; pi = g*xi.
Цена игры: g = 1 : 3/11 = 11/3
p1 = 11/3*5/22 = 5/6
p2 = 11/3*1/22 = 1/6
Оптимальная смешанная стратегия игрока I:
P = (5/6; 1/6)
q1 = 11/3* = 0
q2 = 11/3*1/33 = 1/9
q3 = 11/3*8/33 = 8/9
Оптимальная смешанная стратегия игрока II:
Q = (0; 1/9; 8/9)
Поскольку ранее к элементам матрицы было прибавлено число (16), то вычтем это число из цены игры.
32/3 - 16 = -121/3
Цена игры: v=-37/3
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj ≤ v
∑aijpi ≥ v
M(P1;Q) = (-10*0) + (-15*1/9) + (-12*8/9) = -12.333 = v
M(P2;Q) = (-16*0) + (1*1/9) + (-14*8/9) = -12.333 = v
M(P;Q1) = (-10*5/6) + (-16*1/6) = -11 ≥ v
M(P;Q2) = (-15*5/6) + (1*1/6) = -12.333 = v
M(P;Q3) = (-12*5/6) + (-14*1/6) = -12.333 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде:
P(5/6,1/6)
Q(0,0,0,0,0,0,1/9,8/9,0)

 

б)

Рассматриваем игру, после сведения ее к игре 2x3

-10 -15 -12
-16 -14

Находим решение игры в смешанных стратегиях.
Решим задачу геометрическим методом, который включает в себя следующие этапы:
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2).
2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2.
Решение игры (2 x n) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет.
Выделяем нижнюю границу выигрыша B2NB3. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B2B2 и B3B3, для которых можно записать следующую систему уравнений:
y = -15 + (1 - (-15))p2
y = -12 + (-14 - (-12))p2
Откуда
p1 = 5/6
p2 = 1/6
Цена игры, y = -37/3
Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений, исключив стратегию B1, которая дает явно больший проигрыш игроку B, и, следовательно, q1 = 0.
-15q2-12q3 = y
q2-14q3 = y
q2+q3 = 1
или
-15q2-12q3 = -37/3
q2-14q3 = -37/3
q2+q3 = 1
Решая эту систему, находим:
q2 = 1/9.
q3 = 8/9.

Ответ:
Цена игры: y = -37/3, векторы стратегии игроков:
Q(0, 1/9, 8/9), P(5/6, 1/6)
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj ≤ v
∑aijpi ≥ v
M(P1;Q) = (-10*0) + (-15*1/9) + (-12*8/9) = -12.333 = v
M(P2;Q) = (-16*0) + (1*1/9) + (-14*8/9) = -12.333 = v
M(P;Q1) = (-10*5/6) + (-16*1/6) = -11 ≥ v
M(P;Q2) = (-15*5/6) + (1*1/6) = -12.333 = v
M(P;Q3) = (-12*5/6) + (-14*1/6) = -12.333 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Поскольку из исходной матрицы были удалены и столбцы, то найденные векторы вероятности можно записать в виде:
P(5/6,1/6)
Q(0,0,0,0,0,0,1/9,8/9,0)



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.