Počet záznamů: 1  

Identification of Optimal Policies in Markov Decision Processes

  1. 1.
    SYSNO ASEP0346161
    Druh ASEPJ - Článek v odborném periodiku
    Zařazení RIVJ - Článek v odborném periodiku
    Poddruh JČlánek ve WOS
    NázevIdentification of Optimal Policies in Markov Decision Processes
    Tvůrce(i) Sladký, Karel (UTIA-B) RID
    Zdroj.dok.Kybernetika. - : Ústav teorie informace a automatizace AV ČR, v. v. i. - ISSN 0023-5954
    46 2010, č. 3 (2010), s. 558-570
    Poč.str.13 s.
    AkceInternational Conference on Mathematical Methods in Economy and Industry
    Datum konání15.06.2009-18.06.2009
    Místo konáníČeské Budějovice
    ZeměCZ - Česká republika
    Typ akceCST
    Jazyk dok.eng - angličtina
    Země vyd.CZ - Česká republika
    Klíč. slovafinite state Markov decision processes ; discounted and average costs ; elimination of suboptimal policies
    Vědní obor RIVBB - Aplikovaná statistika, operační výzkum
    CEPGA402/08/0107 GA ČR - Grantová agentura ČR
    GA402/07/1113 GA ČR - Grantová agentura ČR
    CEZAV0Z10750506 - UTIA-B (2005-2011)
    UT WOS000280425000019
    AnotaceIn this note we focus attention on identifying optimal policies and on elimination suboptimal policies minimizing optimality criteria in discrete-time Markov decision processes with finite state space and compact action set. We present unified approach to value iteration algorithms that enables to generate lower and upper bounds on optimal values, as well as on the current policy. Using the modified value iterations it is possible to eliminate suboptimal actions and to identify an optimal policy or nearly optimal policies in a finite number of steps without knowing precise values of the performance function.
    PracovištěÚstav teorie informace a automatizace
    KontaktMarkéta Votavová, votavova@utia.cas.cz, Tel.: 266 052 201.
    Rok sběru2011
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.