Number of the records: 1
Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains
- 1.0309471 - ÚTIA 2009 RIV CZ eng J - Journal Article
Sladký, Karel
Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains.
[Míry růstu a optimality v průměru v rizikových markovských rozhodovacích řetězcích.]
Kybernetika. Roč. 44, č. 2 (2008), s. 205-226. ISSN 0023-5954
R&D Projects: GA ČR(CZ) GA402/08/0107; GA ČR GA402/07/1113
Institutional research plan: CEZ:AV0Z10750506
Keywords : risk-sensitive Markov decision chains * average optimal policies * optimal growth rates
Subject RIV: BC - Control Systems Theory
Impact factor: 0.281, year: 2008 ; AIS: 0.202, rok: 2008
In this note we focus attention on characterization of policies maximizing growth rate of expected utility, along with average of the associated certainty equivalent, in risk-sensitive Markov decision chains with finite state and action spaces. In contrast to existing literature, the problem is handled by methods of stochastic dynamic programming on condition that the transition probabilities are replaced by general nonnegative matrices. Using the block-triangular decomposition of a collection of nonnegative matrices we establish necessary and sufficient condition guaranteeing independence of optimal values on starting state along with partition of the state space into subsets with constant optimal values. Finally for models with growth rate independent of the starting state we show how the method work if we minimize growth rate or average of the certainty equivalent.
V práci je charakterizována třída řízení, která maximalizuje míru růstu i průměrný růst přidruženého ekvivalentu za jistoty v rizikových markovských rozhodovacích řetězcích. Na rozdíl od literatury úloha je řešena metodami stochastického dynamického programování, kde matrice pravděpodobností přechodů jsou nahrazeny obecnými nezápornými maticemi. Využitím blokově trojúhelníkového rozkladu třídy nezáproných matic jsou nalezeny nutné a postačujících podmínky pro nezávislost optimálních hodnot na počátečním stavu, jakož i rozklad stavového prostoru na třídy s konstatními optimálními hodnotami. Pro modely, kde je míra růstu nezávislá na počátečním stavu, je v zhávěru práce ikázáno, jak lze výše uvedené metody modifikovat při hledání minimální míry růstu nebo odpovídajícího průměrného ekvivalentu za jistoty.
Permanent Link: http://hdl.handle.net/11104/0161594
File Download Size Commentary Version Access 0309471.pdf 0 905.2 KB Publisher’s postprint open-access
Number of the records: 1