Хелпикс

Главная

Контакты

Случайная статья





Игра nx2. Бескоалиционные игры



Игра nx2

a)

Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Игроки B1 B2 a = min(Ai)
A1 -1 -4 -4
A2 -9 -8 -9
A3 -6 -6
A4 -8 -8
A5 -10 -10
A6 -5 -5
A7 -5 -5
b = max(Bi)  


Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = -4, которая указывает на максимальную чистую стратегию A1.
Верхняя цена игры b = min(bj) = 4.
Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах -4 ≤ y ≤ 4. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
2. Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Стратегия A1 доминирует над стратегией A2 (все элементы строки 1 больше или равны значениям 2-ой строки), следовательно, исключаем 2-ую строку матрицы. Вероятность p2 = 0.
Стратегия A4 доминирует над стратегией A5 (все элементы строки 4 больше или равны значениям 5-ой строки), следовательно, исключаем 5-ую строку матрицы. Вероятность p5 = 0.
Стратегия A6 доминирует над стратегией A4 (все элементы строки 6 больше или равны значениям 4-ой строки), следовательно, исключаем 4-ую строку матрицы. Вероятность p4 = 0.
Стратегия A6 доминирует над стратегией A7 (все элементы строки 6 больше или равны значениям 7-ой строки), следовательно, исключаем 7-ую строку матрицы. Вероятность p7 = 0.

-1 -4
-6
-5


В платежной матрице отсутствуют доминирующие столбцы.
Мы свели игру 7 x 2 к игре 3 x 2.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш.
Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В матрице присутствуют отрицательные элементы. Для упрощения расчетов добавим к элементам матрицы (6). Такая замена не изменит решения игры, изменится только ее цена (по теореме фон Неймана).


3. Находим решение игры в смешанных стратегиях.
Математические модели пары двойственных задач линейного программирования можно записать так:
найти минимум функции F(x) при ограничениях (для игрока II):
5x1+10x2+x3 ≥ 1
2x1+14x3 ≥ 1
F(x) = x1+x2+x3 → min
найти максимум функции Z(y) при ограничениях (для игрока I):
5y1+2y2 ≤ 1
10y1 ≤ 1
y1+14y2 ≤ 1
Z(y) = y1+y2 → max
Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы.
Определим максимальное значение целевой функции Z(Y) = y1+y2 при следующих условиях-ограничений.
5y1+2y2≤1
10y1≤1
y1+14y2≤1
Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме).
5y1+2y2+y3 = 1
10y1+y4 = 1
y1+14y2+y5 = 1
Решим систему уравнений относительно базисных переменных: y3, y4, y5
Полагая, что свободные переменные равны 0, получим первый опорный план:
Y0 = (0,0,1,1,1)

Базис B y1 y2 y3 y4 y5
y3
y4
y5
Z(Y0) -1 -1


Переходим к основному алгоритму симплекс-метода.
Итерация №0.
Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
В качестве ведущего выберем столбец, соответствующий переменной y2, так как это наибольший коэффициент по модулю.
Вычислим значения Di по строкам как частное от деления: bi / ai2
и из них выберем наименьшее:
min (1 : 2 , - , 1 : 14 ) = 1/14
Следовательно, 3-ая строка является ведущей.
Разрешающий элемент равен (14) и находится на пересечении ведущего столбца и ведущей строки.

Базис B y1 y2 y3 y4 y5 min
y3 1/2
y4 -
y5 1/14
Z(Y1) -1 -1  


Формируем следующую часть симплексной таблицы. Вместо переменной y5 в план 1 войдет переменная y2.
Получаем новую симплекс-таблицу:

Базис B y1 y2 y3 y4 y5
y3 6/7 34/7 -1/7
y4
y2 1/14 1/14 1/14
Z(Y1) 1/14 -13/14 1/14


Итерация №1.
Текущий опорный план неоптимален, так как в индексной строке находятся отрицательные коэффициенты.
В качестве ведущего выберем столбец, соответствующий переменной y1, так как это наибольший коэффициент по модулю.
Вычислим значения Di по строкам как частное от деления: bi / ai1
и из них выберем наименьшее:
min (6/7 : 46/7 , 1 : 10 , 1/14 : 1/14 ) = 1/10
Следовательно, 2-ая строка является ведущей.
Разрешающий элемент равен (10) и находится на пересечении ведущего столбца и ведущей строки.

Базис B y1 y2 y3 y4 y5 min
y3 6/7 34/7 -1/7 3/17
y4 1/10
y2 1/14 1/14 1/14
Z(Y2) 1/14 -13/14 1/14  


Формируем следующую часть симплексной таблицы. Вместо переменной y4 в план 2 войдет переменная y1.
Получаем новую симплекс-таблицу:

Базис B y1 y2 y3 y4 y5
y3 13/35 -17/35 -1/7
y1 1/10 1/10
y2 9/140 -1/140 1/14
Z(Y2) 23/140 13/140 1/14


Конец итераций: индексная строка не содержит отрицательных элементов - найден оптимальный план
Среди значений индексной строки нет отрицательных. Поэтому эта таблица определяет оптимальный план задачи.
Окончательный вариант симплекс-таблицы:

Базис B y1 y2 y3 y4 y5
y3 13/35 -17/35 -1/7
y1 1/10 1/10
y2 9/140 -1/140 1/14
Z(Y3) 23/140 13/140 1/14


Оптимальный план можно записать так:
y1 = 1/10, y2 = 9/140
Z(Y) = 1•1/10 + 1•9/140 = 23/140
Используя последнюю итерацию прямой задачи найдем, оптимальный план двойственной задачи.
x1=0, x2=13/140, x3=1/14
Это же решение можно получить, применив теоремы двойственности.
Из теоремы двойственности следует, что X = C*A-1.
Составим матрицу A из компонентов векторов, входящих в оптимальный базис.

A = (A3, A1, A2) =
 


Определив обратную матрицу D = А-1 через алгебраические дополнения, получим:

D = A-1 =
-17/35 -1/7
1/10
-1/140 1/14
 


Как видно из последнего плана симплексной таблицы, обратная матрица A-1расположена в столбцах дополнительных переменных.
Тогда X = C*A-1 =

(0, 1, 1) x
-17/35 -1/7
1/10
-1/140 1/14
 
= (0;13/140;1/14)


Оптимальный план двойственной задачи равен:
x1 = 0, x2 = 13/140, x3 = 1/14
F(X) = 1*0+1*13/140+1*1/14 = 23/140
Цена игры будет равна g = 1/F(x), а вероятности применения стратегий игроков:
qi = g*yi; pi = g*xi.
Цена игры: g = 1 : 23/140 = 140/23
p1 = 140/23*0 = 0
p2 = 140/23*13/140 = 13/23
p3 = 140/23*1/14 = 10/23
Оптимальная смешанная стратегия игрока I:
P = (0; 13/23; 10/23)
q1 = 140/23*1/10 = 14/23
q2 = 140/23*9/140 = 9/23
Оптимальная смешанная стратегия игрока II:
Q = (14/23; 9/23)
Поскольку ранее к элементам матрицы было прибавлено число (6), то вычтем это число из цены игры.
62/23 - 6 = 2/23
Цена игры: v=2/23
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj ≤ v
∑aijpi ≥ v
M(P1;Q) = (-1*14/23) + (-4*9/23) = -2.174 ≤ v
M(P2;Q) = (4*14/23) + (-6*9/23) = 0.087 = v
M(P3;Q) = (-5*14/23) + (8*9/23) = 0.087 = v
M(P;Q1) = (-1*0) + (4*13/23) + (-5*10/23) = 0.087 = v
M(P;Q2) = (-4*0) + (-6*13/23) + (8*10/23) = 0.087 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде:
P(0,0,13/23,0,0,10/23,0)
Q(14/23,9/23)

б)

Рассматриваем игру, после сведения ее к игре 3x2

-1 -4
-6
-5

 

Находим решение игры в смешанных стратегиях.
Решим задачу геометрическим методом, который включает в себя следующие этапы:
1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии B1, правый - стратегии B2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2).
2. На левой оси ординат откладываются выигрыши стратегии B1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии B2.
Решение игры (m x 2) проводим с позиции игрока B, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет.
Выделяем верхнюю границу выигрыша A2NA3. Максиминной оптимальной стратегии игрока B соответствует точка N, лежащая на пересечении прямых A2A2 и A3A3, для которых можно записать следующую систему уравнений:
y = 4 + (-6 - 4)q2
y = -5 + (8 - (-5))q2
Откуда
q1 = 14/23
q2 = 9/23
Цена игры, y = 2/23
Теперь можно найти минимаксную стратегию игрока A, записав соответствующую систему уравнений, исключив стратегию A1, которая дает явно больший проигрыш игроку A, и, следовательно, p1 = 0.
4p2-5p3 = y
-6p2+8p3 = y
p2+p3 = 1
или
4p2-5p3 = 2/23
-6p2+8p3 = 2/23
p2+p3 = 1
Решая эту систему, находим:
p2 = 13/23.
p3 = 10/23.

Ответ:
Цена игры: y = 2/23, векторы стратегии игроков:
P(0, 13/23, 10/23), Q(14/23, 9/23)
4. Проверим правильность решения игры с помощью критерия оптимальности стратегии.
∑aijqj ≤ v
∑aijpi ≥ v
M(P1;Q) = (-1*14/23) + (-4*9/23) = -2.174 ≤ v
M(P2;Q) = (4*14/23) + (-6*9/23) = 0.087 = v
M(P3;Q) = (-5*14/23) + (8*9/23) = 0.087 = v
M(P;Q1) = (-1*0) + (4*13/23) + (-5*10/23) = 0.087 = v
M(P;Q2) = (-4*0) + (-6*13/23) + (8*10/23) = 0.087 = v
Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно.
Поскольку из исходной матрицы были удалены строки, то найденные векторы вероятности можно записать в виде:
P(0,0,13/23,0,0,10/23,0)
Q(14/23,9/23)

 

2.2)

Прибавим ко всем элементам матрицы 48, получим матрицу:

  F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12
E1
E2
E3
E4
E5
E6
E7

 

Составим пару взаимно-двойственных задач:

 

 

Решим вторую задачу симплекс методом

Для построения первого опорного плана, систему неравенств, приведем к системе уравнений путем введения дополнительных переменных

Матрица коэффициентов А системы уравнений будет иметь вид:

 

А=

 

A=

Базисные переменные это переменные, которые входят только в одно уравнение системы ограничений с коэффициентом 1.

Решим систему уравнений относительно базисных переменных q13, q14, q15, q16, q17, q18, q19

Пологая, что свободные переменные равны 0, получим первый опорный план

Q1=(0,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1)

 

 

3. Бескоалиционные игры

А    
  -2 -8
  -13 -2
В    
  -8
 

                                                         

3.1) В каждом столбце матрицы А выберем максимальный элемент. Их положение соответствует приемлемым ситуациям первого игрока, когда второй игрок выбрал стратегию j соответственно. Затем в каждой строке матрицы В выберем наибольший элемент. Их положение будет определять приемлемые ситуации второго игрока, когда первый выбрал стратегию j соответственно.

Позиции максимумов в столбцах матрицы А: (1,1), (2,2)

а11=-2; а22=2

Позиции максимумов в строках матрицы В: (1,1), (2,2)

b11=5; b22=4;

Пересечение множеств этих максимумов: (1,1), (2,2)

Таким образом, найдены две равновесные ситуации по Нешу (1,1), (2,2). Эти равновесные ситуации оптимальны по Парето. В равновесной ситуации (1,1) первый игрок выигрывает -2, а второй 5. В равновесной ситуации (2,2) первый игрок выигрывает 2, а второй игрок 4.

Если биматричная игра не имеет равновесных ситуаций в чистых стратегиях, то она неразрешима в чистых стратегиях. И тогда можно искать решение в смешанных стратегиях. Чтобы в биматричной игре пара (p, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение неравенств:

(p-1)(cq-2)≥0, p(cq-2)≥0, 0≤p≤1

(q-1)(Дp-β)≥0, p(Дp-β)≥0, 0≤q≤1, где

С=a11-a12-a21+a22

α=a22-a12

Д=b12-b12-b21+b22

β=b22-b21

C=-2-(-8)-(-13)+2=21

α=2-(-8)=10

Д=5-(-8)-1+4=16

β=4-1=3

 

(p-1)(21q-10)≥0                                              1) p=1, q≥

p(21q-10)≥0                                                        p=0, q≤

                                               =>                   0≤p≤1, q=  

(q-1)(16p-3)≥0                                                2) q=1, p≥

q(16p-3)≥0                                                           q=0, p≤

                                                                             0≤q≤1, p=

Рассматриваемая игра имеет единственную ситуацию равновесия (p*, q*), где оптимальными стратегиями по Нему являются: p*=( ); q*=(

Таким образом, она может быть реализована при многократном повторении следующим образом: первый игрок должен использовать чистые стратегии 1 и 2 с частотами  и , а игрок два – чистые стратегии 1 и 2 с частотами . Любой игрок, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш.

Цена игры:

 

H= + +

 

Ha= + + + =-5


Hb= + + + =1

Цена игры для первого игрока: Ha=( )= -5

Цена игры для второго игрока: Hb=( )= 1

Смешанная стратегия для первого игрока p*=( ), для второго игрока q*=( ),

Выигрыш игроков в равновесной ситуации: f(p*, q*)=(-5  1

Множество всех реализуемых векторов выигрышей для игры имеет вид, изображенный на рисунке:

3.2) 

  В1 В2 a=min(Ai)
А1 -2 -8 -8
А2 -13 -13
b=max(Bi) -2  

 

Считаем, что игрок 1 выбирает свою стратегию так, чтобы получить максимальный выигрыш, а второй чтобы минимизировать выигрыш первого игрока. Находим гарантированный выигрыш, определяемый нижней ценой игры a=max(Ai)=-8, которая указывает на максимальную чистую стратегию А1

Верхняя цена игры b=min(Bi)=2.

В данном случае отсутствует седловая точка, так как a≠b, тогда цена игры находится в пределах -8≤y≤-2.

Находим решение игры в смешанных стратегиях.

Запишем систему уравнений

Для первого игрока:

   =>    =>    =>    =>  =   =>

10y+130=22-11y

21y=-108

y=   => p1= , p2=

 

Для второго игрока:

   =>    =>    =>

15y+120=12-6y

21y=-108

y=    => q1= q2=

В итоге, цена игры y=  , оптимальная смешанная стратегия игрока 1: p=( ), для второго игрока: q=( )

 

  B1 B2 a=min(Ai)
A1 -8 -8
A2
b=max(Bi)  

 

Находим гарантированный выигрыш, определяемый нижней ценой игры a=max(Ai)=1, которая указывает на максимальную чистую стратегию A2. Верхняя цена игры b=min(Bj) =4

Седловая точка отсутствует, так как a≠b, тогда цена игры находится в пределах 1≤y≤4. Находим решение в смешанных стратегиях.

Запишем систему уравнений:

Для первого игрока:

  =>    =>   =>    

12y-12=16-4y

16y=28

y= =1   => p1= p2=

 

Для второго игрока:

  =>   =>   =>

 

3y+24=52-13y

16y=28

y=1     => q1= , q2=

В итоге, цена игры y=1 , оптимальная смешанная стратегия игрока 1: p=( ), смешанная стратегия игрока 2: q=( ; )

 



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.