Počet záznamů: 1  

Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains

  1. 1.
    0309471 - ÚTIA 2009 RIV CZ eng J - Článek v odborném periodiku
    Sladký, Karel
    Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains.
    [Míry růstu a optimality v průměru v rizikových markovských rozhodovacích řetězcích.]
    Kybernetika. Roč. 44, č. 2 (2008), s. 205-226. ISSN 0023-5954
    Grant CEP: GA ČR(CZ) GA402/08/0107; GA ČR GA402/07/1113
    Výzkumný záměr: CEZ:AV0Z10750506
    Klíčová slova: risk-sensitive Markov decision chains * average optimal policies * optimal growth rates
    Kód oboru RIV: BC - Teorie a systémy řízení
    Impakt faktor: 0.281, rok: 2008

    In this note we focus attention on characterization of policies maximizing growth rate of expected utility, along with average of the associated certainty equivalent, in risk-sensitive Markov decision chains with finite state and action spaces. In contrast to existing literature, the problem is handled by methods of stochastic dynamic programming on condition that the transition probabilities are replaced by general nonnegative matrices. Using the block-triangular decomposition of a collection of nonnegative matrices we establish necessary and sufficient condition guaranteeing independence of optimal values on starting state along with partition of the state space into subsets with constant optimal values. Finally for models with growth rate independent of the starting state we show how the method work if we minimize growth rate or average of the certainty equivalent.

    V práci je charakterizována třída řízení, která maximalizuje míru růstu i průměrný růst přidruženého ekvivalentu za jistoty v rizikových markovských rozhodovacích řetězcích. Na rozdíl od literatury úloha je řešena metodami stochastického dynamického programování, kde matrice pravděpodobností přechodů jsou nahrazeny obecnými nezápornými maticemi. Využitím blokově trojúhelníkového rozkladu třídy nezáproných matic jsou nalezeny nutné a postačujících podmínky pro nezávislost optimálních hodnot na počátečním stavu, jakož i rozklad stavového prostoru na třídy s konstatními optimálními hodnotami. Pro modely, kde je míra růstu nezávislá na počátečním stavu, je v zhávěru práce ikázáno, jak lze výše uvedené metody modifikovat při hledání minimální míry růstu nebo odpovídajícího průměrného ekvivalentu za jistoty.
    Trvalý link: http://hdl.handle.net/11104/0161594
     
    Název souboruStaženoVelikostKomentářVerzePřístup
    0309471.pdf0905.2 KBVydavatelský postprintpovolen
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.