Rozważając model semi-markowski można zastosować dwa kryteria
optymalności. Pierwsze z nich to kryterium średniej wypłaty na jednostkę
czasu. Drugie kryterium to kryterium uwzględniające stosunek oczekiwanej
wypłaty zgromadzonej do momentu n-tego skoku do oczekiwanego czasu jaki
upłynął do tego skoku. W pracy przy dość ogólnych założeniach
stabilności stochastycznej zostały pokazane dwa fakty:
(a) kryteria optymalności są sobie równe dla polityk stacjonarnych,
(b) optymalne polityki dla obu kryteriów są takie same.
Dowód twierdzeń opiera się na tw. Dooba o opcjonalnym stopowaniu
i elementach teorii odnowy.
|