Вероятность того, что новый станок будет находиться в соответствующем состоянии равна 0,8; 0,15 и 0,05.
Состояние |
Замена | ||
0,8 | 0,15 | 0,05 | |
0,8 | 0,15 | 0,05 | |
0,8 | 0,15 | 0,05 |
Определить оптимальную политику ремонта или замены, максимизирующую суммарный доход.
Решение:
1. Рассчитаем значения доходы в зависимости от расходов на ремонт или замену:
Состояние |
Обычный ремонт |
Капитальный ремонт |
Замена | ||||||
-10 | -50 | ||||||||
-100 | -30 | -130 | -50 | -150 |
Чтобы рассчитать, например, для состояния 1 мы из 250 вычитаем соответствующие затраты (250-10 для обычного ремонта).
2. Вероятность каждого последующего выбора ремонта или замены в соответствующие состояния зависит только от того, в каком состоянии она находиться в данный момент. Так как станок может находиться в любом состоянии, то Марковская цепь будет обладать свойством эргодичности.
В результате предварительного анализа известны значения переходных вероятностей, связанные с данным выбором P(q)i,j, а также получаемые доходы от выпуска продукции с учетом затрат U(q)i,j.
Сведем все данные в одну таблицу:
Состояние i |
Выбор q | Вероятности перехода P(q)i,j | Значения дохода U(q)i,j | ||||
j=1 | j=2 | j=3 | j=1 | j=2 | j=3 | ||
0,8 | 0,2 | ||||||
0,9 | 0,1 | ||||||
0,8 | 0,15 | 0,05 | |||||
0,1 | 0,5 | 0,4 | |||||
0,5 | 0,4 | 0,1 | -10 | ||||
0,8 | 0,15 | 0,05 | -50 | ||||
0,1 | 0,9 | -100 | |||||
0,7 | 0,3 | -30 | -130 | ||||
0,8 | 0,15 | 0,05 | -50 | -150 |
Возьмем за начальное поведение q0=(1,1,1), т.е. для всех состояний используется обычный ремонт. Для выбранного поведения построим систему из n уравнений с n+1 неизвестными, используя формулу
где G – ожидаемый доход, Fi – составляющая суммарного дохода, определяемая начальным состоянием.
F1 + G = 0,8 [240 + F1] + 0,2 [140 + F2] + 0 [40 + F3] = 0,8 [240 + F1] + 0,2 [140 + F2] =
= 192 + 0,8 F1 + 28 + 0,2 F2 = 220 + 0,8 F1 + 0,2 F2
F2 + G = 0,1 [200 + F1] + 0,5 [100 + F2] + 0,4 [0 + F3] = 0,1 [200 + F1] + 0,5 [100 + F2] + 0,4 F3 =
= 20 + 0,1 F1 + 50 + 0,5 F2 + 0,4 F3 = 70 + 0,1 F1 + 0,5 F2 + 0,4 F3
F3 + G = 0 [100 + F1] + 0,1 [0 + F2] + 0,9 [-100 + F3] = 0,1 F2 + 0,9 [-100 + F3] =
= -90 + 0,1 F2 + 0,9 F3
F1 + G = 220 + 0,8 F1 + 0,2 F2
F2 + G = 70 + 0,1 F1 + 0,5 F2 + 0,4 F3
F3 + G = -90 + 0,1 F2 + 0,9 F3
Предположим что F2 = 0, тогда мы получим следующую систему уравнений:
F1 + G = 220 + 0,8 F1
G = 70 + 0,1 F1 + 0,4 F3
F3 + G = -90 + 0,9 F3
F1 + 70 + 0,1 F1 + 0,4 F3 = 220 + 0,8 F1
0,3 F1 + 0,4 F3 = 150
0,3 F1 = 150 - 0,4 F3
F1 = (150 - 0,4 F3) / 0,3 = 500 – 1,33 F3
G = 70 + 0,1 [500 – 1,33 F3] + 0,4 F3 = 70 + 50 – 0,13 F3 + 0,4 F3 = 120 + 0,27 F3
F3 + 120 + 0,27 F3 = -90 + 0,9 F3
0,37 F3 = -30
F3 = - 81,08
F1 = 500 – 1,33 * (-81,08) = 500 + 107,84 = 607,84
G = 120 + 0,27 * (-81,08) = 120 – 21,89 = 98,11
Выбранная политика дает доход равный 98 ден. единиц.
На каждом шаге итерационного процесса при различных выборах путем последовательных приближений определяется критерий для всех состояний и выборов ремонта или замены:
T1(1) = 0,8 [240 + 607,84] + 0,2 [140 + 0] + 0 [40 – 81,08] = 706,27
T1(2) = 0,9 [235 + 607,84] + 0,1 [135 + 0] + 0 [35 – 81,08] = 772,06
T1(3) = 0,8 [220 + 607,84] + 0,15 [120 + 0] + 0,05 [20 - 81,08] = 677,22
T2(1) = 0,1 [200 + 607,84] + 0,5 [100 + 0] + 0,4 [0 – 81,08] = 98,35
T2(2) = 0,5 [190 + 607,84] + 0,4 [90 + 0] + 0,1 [-10 - 81,08] = 425,81
T2(3) = 0,8 [150 + 607,84] + 0,15 [50 + 0] + 0,05 [-50 - 81,08] = 607,22
T3(1) = 0 [100 + 607,84] + 0,1 [0] + 0,9 [-100 - 81,08] = -162,97
T3(2) = 0 [70 + 607,84] + 0,7 [-30 + 0] + 0,3 [-130 - 81,08] = -84,32
T3(3) = 0,8 [50 + 607,84] + 0,15 [-50 + 0] + 0,05 [-150 - 81,08] = 507,22
Состояние i | Выбор q | Критерий Ti(q) |
706,27 | ||
772,06 | ||
677,22 | ||
98,35 | ||
425,81 | ||
607,22 | ||
-162,97 | ||
-84,32 | ||
507,22 |
Выбирая максимальное значение критерия для каждой состояния, мы получим оптимальное решение на данном шаге итерации.
Выберем максимальное из значений Ti(q) по q, получим улучшенное поведение q=(2,3,3), т.е. на основании уточнения, при нахождении станка в 1 состояние лучше выбрать капитальный ремонт, если станок находиться в 2 состоянии – замену на новый, если в 3 состоянии – замену на новый.
Постоим и решим новую систему уравнений, чтобы определить максимальный доход для полученного поведения системы:
F1 + G = 0,9 [235 + F1] + 0,1 [135 + F2] + 0 [35 + F3] = 0,9 [235 + F1] + 0,1 [135 + F2] =
= 211,5 + 0,9 F1 + 13,5 + 0,1 F2 = 225 + 0,9 F1 + 0,1 F2
F2 + G = 0,8 [150 + F1] + 0,15 [50 + F2] + 0,05 [-50 + F3] =
= 120 + 0,8 F1 + 7,5 + 0,15 F2 - 2,5 + 0,05 F3 =
= 125 + 0,8 F1 + 0,15 F2 + 0,05 F3
F3 + G = 0,8 [50 + F1] + 0,15 [-50 + F2] + 0,05 [-150 + F3] =
= 40 + 0,8 F1 - 7,5 + 0,15 F2 - 7,5 + 0,05 F3 =
= 25 + 0,8 F1 + 0,15 F2 + 0,05 F3
F1 + G = 225 + 0,9 F1 + 0,1 F2
F2 + G = 125 + 0,8 F1 + 0,15 F2 + 0,05 F3
F3 + G = 25 + 0,8 F1 + 0,15 F2 + 0,05 F3
Предположим что F2 = 0, тогда мы получим следующую систему уравнений:
F1 + G = 225 + 0,9 F1
G = 125 + 0,8 F1 + 0,05 F3
F3 + G = 25 + 0,8 F1 + 0,05 F3
Вычтем из второго уравнения третье:
F3 = -100
G = 225 – 0,1 F1
225 – 0,1 F1 = 125 + 0,8 F1 + 0,05 F3
-0,9 F1 – 0,05 F3 = - 100
0,9 F1 + 0,05 F3 = 100
0,9 F1 = 100 - 0,05 F3
F1 = (100 - 0,05 F3) / 0,9 = 111,11 – 0,056 F3
F1 = 111,11 – 0,056 * (-100) = 116,71
G = 225 – 0,1 * 116,71 = 213,33
Выбранная политика дает доход равный 213 ден. единиц (произошло увеличение дохода).
На каждом шаге итерационного процесса при различных выборах путем последовательных приближений определяется критерий для всех состояний и выборов ремонта или замены:
T1(1) = 0,8 [240 + 116,71] + 0,2 [140 + 0] + 0 [40 – 100] = 313,37
T1(2) = 0,9 [235 + 116,71] + 0,1 [135 + 0] + 0 [35 – 100] = 330,04
T1(3) = 0,8 [220 + 116,71] + 0,15 [120 + 0] + 0,05 [20 - 100] = 283,37
T2(1) = 0,1 [200 + 116,71] + 0,5 [100 + 0] + 0,4 [0 – 100] = 41,67
T2(2) = 0,5 [190 + 116,71] + 0,4 [90 + 0] + 0,1 [-10 - 100] = 178,36
T2(3) = 0,8 [150 + 116,71] + 0,15 [50 + 0] + 0,05 [-50 - 100] = 213,37
T3(1) = 0 [100 + 116,71] + 0,1 [0] + 0,9 [-100 - 100] = -180
T3(2) = 0 [70 + 116,71] + 0,7 [-30 + 0] + 0,3 [-130 - 100] = -84,32
T3(3) = 0,8 [50 + 116,71] + 0,15 [-50 + 0] + 0,05 [-150 - 100] = 113,37
Состояние i | Выбор q | Критерий Ti(q) |
313,37 | ||
330,04 | ||
283,37 | ||
41,67 | ||
178,67 | ||
213,37 | ||
-180 | ||
-84,32 | ||
113,37 |
Выбирая максимальное значение критерия для каждого состояния, мы получим оптимальное решение на данном шаге итерации.
Выберем максимальное из значений Ti(q) по q, получим улучшенное поведение q=(2,3,3), т.е. на основании уточнения, при нахождении станка в 1 состояние лучше выбрать капитальный ремонт, если станок находиться в 2 состоянии – замену на новый, если в 3 состоянии – замену на новый.
Мы получили ту же политику улучшения что и на предыдущем шаге, следовательно, данная политика будет являться оптимальной.
Ответ:
Оптимальная политика состоит в следующем:
Если станок находится в хорошем состоянии, то лучше использовать капитальный ремонт, если станок находится в удовлетворительном или плохом состоянии, то лучше использовать замену на новый.
Данная политика обеспечивает максимальный суммарный доход в 213 ден. единиц.
|
© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.
|
|