PL
W pracy rozpatrujemy wieloetapowe, dyskretne, stochastyczne procesy decyzyjne. Dla decydenta interesujące może być nie tylko znalezienie strategii optymalnej, ale również kolejnych strategii, dla których wartość oczekiwana jest bliska wartości oczekiwanej strategii optymalnej, z dokładnością określoną przez decydenta. Celem artykułu jest zaproponowanie algorytmu pozwalającego na znalezienie strategii optymalnych i prawie optymalnych. Strategie optymalne znajdujemy, wykorzystując zasadę optymalności Bellmana. Proponowana w niniejszej pracy metoda polega na znalezieniu zbioru strategii optymalnych, a następnie rozszerzaniu tego zbioru o kolejne strategie prawie optymalne, które mieszczą się w obszarze zainteresowań decydenta. Nowe strategie generujemy poprzez zmianę decyzji w jednym stanie dla strategii zaakceptowanej wcześniej. Zaproponowany algorytm ilustrowany jest prostym przykładem liczbowym, wyjaśniającym jego działanie.