Počet záznamů: 1
Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains
- 1.0309471 - ÚTIA 2009 RIV CZ eng J - Článek v odborném periodiku
Sladký, Karel
Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains.
[Míry růstu a optimality v průměru v rizikových markovských rozhodovacích řetězcích.]
Kybernetika. Roč. 44, č. 2 (2008), s. 205-226. ISSN 0023-5954
Grant CEP: GA ČR(CZ) GA402/08/0107; GA ČR GA402/07/1113
Výzkumný záměr: CEZ:AV0Z10750506
Klíčová slova: risk-sensitive Markov decision chains * average optimal policies * optimal growth rates
Kód oboru RIV: BC - Teorie a systémy řízení
Impakt faktor: 0.281, rok: 2008 ; AIS: 0.202, rok: 2008
In this note we focus attention on characterization of policies maximizing growth rate of expected utility, along with average of the associated certainty equivalent, in risk-sensitive Markov decision chains with finite state and action spaces. In contrast to existing literature, the problem is handled by methods of stochastic dynamic programming on condition that the transition probabilities are replaced by general nonnegative matrices. Using the block-triangular decomposition of a collection of nonnegative matrices we establish necessary and sufficient condition guaranteeing independence of optimal values on starting state along with partition of the state space into subsets with constant optimal values. Finally for models with growth rate independent of the starting state we show how the method work if we minimize growth rate or average of the certainty equivalent.
V práci je charakterizována třída řízení, která maximalizuje míru růstu i průměrný růst přidruženého ekvivalentu za jistoty v rizikových markovských rozhodovacích řetězcích. Na rozdíl od literatury úloha je řešena metodami stochastického dynamického programování, kde matrice pravděpodobností přechodů jsou nahrazeny obecnými nezápornými maticemi. Využitím blokově trojúhelníkového rozkladu třídy nezáproných matic jsou nalezeny nutné a postačujících podmínky pro nezávislost optimálních hodnot na počátečním stavu, jakož i rozklad stavového prostoru na třídy s konstatními optimálními hodnotami. Pro modely, kde je míra růstu nezávislá na počátečním stavu, je v zhávěru práce ikázáno, jak lze výše uvedené metody modifikovat při hledání minimální míry růstu nebo odpovídajícího průměrného ekvivalentu za jistoty.
Trvalý link: http://hdl.handle.net/11104/0161594
Název souboru Staženo Velikost Komentář Verze Přístup 0309471.pdf 0 905.2 KB Vydavatelský postprint povolen
Počet záznamů: 1