Хелпикс

Главная

Контакты

Случайная статья





Тема 12 Задача 3.. Решение задачи. Состояние. Обычный ремонт. Капитальный ремонт. Замена. Состояние. Обычный ремонт. Капитальный ремонт. Замена. Состояние



Тема 12 Задача 3.

 Решение задачи

Постановка задачи:

Станок может находиться в трех состояниях:

1 – хорошем, 2 – удовлетворительном, 3 – плохом.

Обеспечивает доход от выпуска продукции равный 250, 150 или 50 ден. единиц.

Соответствующие расходы равны:

Состояние Обычный ремонт Капитальный ремонт Замена

Переходные состояния при различных ремонтах равны:

Состояние

Обычный ремонт

Капитальный ремонт

0,8 0,2 0,9 0,1
0,1 0,5 0,4 0,5 0,4 0,1
0,1 0,9 0,7 0,3

Вероятность того, что новый станок будет находиться в соответствующем состоянии равна 0,8; 0,15 и 0,05.

Состояние

Замена

 
0,8 0,15 0,05
0,8 0,15 0,05
0,8 0,15 0,05

Определить оптимальную политику ремонта или замены, максимизирующую суммарный доход.

Решение:

1. Рассчитаем значения доходы в зависимости от расходов на ремонт или замену:

Состояние

Обычный ремонт

Капитальный ремонт

Замена

-10 -50
-100 -30 -130 -50 -150

Чтобы рассчитать, например, для состояния 1 мы из 250 вычитаем соответствующие затраты (250-10 для обычного ремонта).

2. Вероятность каждого последующего выбора ремонта или замены в соответствующие состояния зависит только от того, в каком состоянии она находиться в данный момент. Так как станок может находиться в любом состоянии, то Марковская цепь будет обладать свойством эргодичности.

В результате предварительного анализа известны значения переходных вероятностей, связанные с данным выбором P(q)i,j, а также получаемые доходы от выпуска продукции с учетом затрат U(q)i,j.

Сведем все данные в одну таблицу:

Состояние

i

Выбор

q

Вероятности перехода P(q)i,j

Значения дохода U(q)i,j

j=1 j=2 j=3 j=1 j=2 j=3
0,8 0,2
  0,9 0,1
  0,8 0,15 0,05
0,1 0,5 0,4
  0,5 0,4 0,1 -10
  0,8 0,15 0,05 -50
0,1 0,9 -100
  0,7 0,3 -30 -130
  0,8 0,15 0,05 -50 -150

 

Возьмем за начальное поведение q0=(1,1,1), т.е. для всех состояний используется обычный ремонт. Для выбранного поведения построим систему из n уравнений с n+1 неизвестными, используя формулу

где G – ожидаемый доход, Fi – составляющая суммарного дохода, определяемая начальным состоянием.

 

F1 + G = 0,8 [240 + F1] + 0,2 [140 + F2] + 0 [40 + F3] = 0,8 [240 + F1] + 0,2 [140 + F2] =

= 192 + 0,8 F1 + 28 + 0,2 F2 = 220 + 0,8 F1 + 0,2 F2

F2 + G = 0,1 [200 + F1] + 0,5 [100 + F2] + 0,4 [0 + F3] = 0,1 [200 + F1] + 0,5 [100 + F2] + 0,4 F3 =

= 20 + 0,1 F1 + 50 + 0,5 F2 + 0,4 F3 = 70 + 0,1 F1 + 0,5 F2 + 0,4 F3

F3 + G = 0 [100 + F1] + 0,1 [0 + F2] + 0,9 [-100 + F3] = 0,1 F2 + 0,9 [-100 + F3] =

= -90 + 0,1 F2 + 0,9 F3

F1 + G = 220 + 0,8 F1 + 0,2 F2

F2 + G = 70 + 0,1 F1 + 0,5 F2 + 0,4 F3

F3 + G = -90 + 0,1 F2 + 0,9 F3

Предположим что F2 = 0, тогда мы получим следующую систему уравнений:

F1 + G = 220 + 0,8 F1

G = 70 + 0,1 F1 + 0,4 F3

F3 + G = -90 + 0,9 F3

 

F1 + 70 + 0,1 F1 + 0,4 F3 = 220 + 0,8 F1

0,3 F1 + 0,4 F3 = 150

0,3 F1 = 150 - 0,4 F3

F1 = (150 - 0,4 F3) / 0,3 = 500 – 1,33 F3

 

G = 70 + 0,1 [500 – 1,33 F3] + 0,4 F3 = 70 + 50 – 0,13 F3 + 0,4 F3 = 120 + 0,27 F3

 

F3 + 120 + 0,27 F3 = -90 + 0,9 F3

0,37 F3 = -30

F3 = - 81,08

 

F1 = 500 – 1,33 * (-81,08) = 500 + 107,84 = 607,84

 

G = 120 + 0,27 * (-81,08) = 120 – 21,89 = 98,11

 

Выбранная политика дает доход равный 98 ден. единиц.

На каждом шаге итерационного процесса при различных выборах путем последовательных приближений определяется критерий  для всех состояний и выборов ремонта или замены:

 

T1(1) = 0,8 [240 + 607,84] + 0,2 [140 + 0] + 0 [40 – 81,08] = 706,27

T1(2) = 0,9 [235 + 607,84] + 0,1 [135 + 0] + 0 [35 – 81,08] = 772,06

T1(3) = 0,8 [220 + 607,84] + 0,15 [120 + 0] + 0,05 [20 - 81,08] = 677,22

 

T2(1) = 0,1 [200 + 607,84] + 0,5 [100 + 0] + 0,4 [0 – 81,08] = 98,35

T2(2) = 0,5 [190 + 607,84] + 0,4 [90 + 0] + 0,1 [-10 - 81,08] = 425,81

T2(3) = 0,8 [150 + 607,84] + 0,15 [50 + 0] + 0,05 [-50 - 81,08] = 607,22

 

T3(1) = 0 [100 + 607,84] + 0,1 [0] + 0,9 [-100 - 81,08] = -162,97

T3(2) = 0 [70 + 607,84] + 0,7 [-30 + 0] + 0,3 [-130 - 81,08] = -84,32

T3(3) = 0,8 [50 + 607,84] + 0,15 [-50 + 0] + 0,05 [-150 - 81,08] = 507,22

 

Состояние i Выбор q Критерий Ti(q)
706,27
  772,06
  677,22
98,35
  425,81
  607,22
-162,97
  -84,32
  507,22

 

Выбирая максимальное значение критерия для каждой состояния, мы получим оптимальное решение на данном шаге итерации.

Выберем максимальное из значений Ti(q) по q, получим улучшенное поведение q=(2,3,3), т.е. на основании уточнения, при нахождении станка в 1 состояние лучше выбрать капитальный ремонт, если станок находиться в 2 состоянии – замену на новый, если в 3 состоянии – замену на новый.

Постоим и решим новую систему уравнений, чтобы определить максимальный доход для полученного поведения системы:

 

F1 + G = 0,9 [235 + F1] + 0,1 [135 + F2] + 0 [35 + F3] = 0,9 [235 + F1] + 0,1 [135 + F2] =

= 211,5 + 0,9 F1 + 13,5 + 0,1 F2 = 225 + 0,9 F1 + 0,1 F2

F2 + G = 0,8 [150 + F1] + 0,15 [50 + F2] + 0,05 [-50 + F3] =

= 120 + 0,8 F1 + 7,5 + 0,15 F2 - 2,5 + 0,05 F3 =

= 125 + 0,8 F1 + 0,15 F2 + 0,05 F3

F3 + G = 0,8 [50 + F1] + 0,15 [-50 + F2] + 0,05 [-150 + F3] =

= 40 + 0,8 F1 - 7,5 + 0,15 F2 - 7,5 + 0,05 F3 =

= 25 + 0,8 F1 + 0,15 F2 + 0,05 F3

 

F1 + G = 225 + 0,9 F1 + 0,1 F2

F2 + G = 125 + 0,8 F1 + 0,15 F2 + 0,05 F3

F3 + G = 25 + 0,8 F1 + 0,15 F2 + 0,05 F3

 

Предположим что F2 = 0, тогда мы получим следующую систему уравнений:

F1 + G = 225 + 0,9 F1

G = 125 + 0,8 F1 + 0,05 F3

F3 + G = 25 + 0,8 F1 + 0,05 F3

 

Вычтем из второго уравнения третье:

F3 = -100

 

G = 225 – 0,1 F1

 

225 – 0,1 F1 = 125 + 0,8 F1 + 0,05 F3

-0,9 F1 – 0,05 F3 = - 100

0,9 F1 + 0,05 F3 = 100

0,9 F1 = 100 - 0,05 F3

F1 = (100 - 0,05 F3) / 0,9 = 111,11 – 0,056 F3

F1 = 111,11 – 0,056 * (-100) = 116,71

 

G = 225 – 0,1 * 116,71 = 213,33

 

Выбранная политика дает доход равный 213 ден. единиц (произошло увеличение дохода).

На каждом шаге итерационного процесса при различных выборах путем последовательных приближений определяется критерий  для всех состояний и выборов ремонта или замены:

 

T1(1) = 0,8 [240 + 116,71] + 0,2 [140 + 0] + 0 [40 – 100] = 313,37

T1(2) = 0,9 [235 + 116,71] + 0,1 [135 + 0] + 0 [35 – 100] = 330,04

T1(3) = 0,8 [220 + 116,71] + 0,15 [120 + 0] + 0,05 [20 - 100] = 283,37

 

T2(1) = 0,1 [200 + 116,71] + 0,5 [100 + 0] + 0,4 [0 – 100] = 41,67

T2(2) = 0,5 [190 + 116,71] + 0,4 [90 + 0] + 0,1 [-10 - 100] = 178,36

T2(3) = 0,8 [150 + 116,71] + 0,15 [50 + 0] + 0,05 [-50 - 100] = 213,37

 

T3(1) = 0 [100 + 116,71] + 0,1 [0] + 0,9 [-100 - 100] = -180

T3(2) = 0 [70 + 116,71] + 0,7 [-30 + 0] + 0,3 [-130 - 100] = -84,32

T3(3) = 0,8 [50 + 116,71] + 0,15 [-50 + 0] + 0,05 [-150 - 100] = 113,37

 

Состояние i Выбор q Критерий Ti(q)
313,37
  330,04
  283,37
41,67
  178,67
  213,37
-180
  -84,32
  113,37

 

Выбирая максимальное значение критерия для каждого состояния, мы получим оптимальное решение на данном шаге итерации.

Выберем максимальное из значений Ti(q) по q, получим улучшенное поведение q=(2,3,3), т.е. на основании уточнения, при нахождении станка в 1 состояние лучше выбрать капитальный ремонт, если станок находиться в 2 состоянии – замену на новый, если в 3 состоянии – замену на новый.

Мы получили ту же политику улучшения что и на предыдущем шаге, следовательно, данная политика будет являться оптимальной.

Ответ:

Оптимальная политика состоит в следующем:

Если станок находится в хорошем состоянии, то лучше использовать капитальный ремонт, если станок находится в удовлетворительном или плохом состоянии, то лучше использовать замену на новый.

Данная политика обеспечивает максимальный суммарный доход в 213 ден. единиц.



  

© helpiks.su При использовании или копировании материалов прямая ссылка на сайт обязательна.