Počet záznamů: 1  

A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion

  1. 1.
    SYSNO ASEP0432661
    Druh ASEPJ - Článek v odborném periodiku
    Zařazení RIVJ - Článek v odborném periodiku
    Poddruh JČlánek ve WOS
    NázevA Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion
    Tvůrce(i) Cavazos-Cadena, R. (MX)
    Montes-de-Oca, R. (MX)
    Sladký, Karel (UTIA-B) RID
    Celkový počet autorů3
    Zdroj.dok.Journal of Optimization Theory and Applications. - : Springer - ISSN 0022-3239
    Roč. 163, č. 2 (2014), s. 674-684
    Poč.str.11 s.
    Forma vydáníTištěná - P
    Jazyk dok.eng - angličtina
    Země vyd.US - Spojené státy americké
    Klíč. slovaStrong sample-path optimality ; Lyapunov function condition ; Stationary policy ; Expected average reward criterion
    Vědní obor RIVBB - Aplikovaná statistika, operační výzkum
    Institucionální podporaUTIA-B - RVO:67985556
    UT WOS000343160900017
    DOI10.1007/s10957-013-0474-6
    AnotaceThis note deals with Markov decision chains evolving on a denumerable state space. Under standard continuity compactness requirements, an explicit example is provided to show that, with respect to a strong sample-path average reward criterion, the Lyapunov function condition does not ensure the existence of an optimal stationary policy.
    PracovištěÚstav teorie informace a automatizace
    KontaktMarkéta Votavová, votavova@utia.cas.cz, Tel.: 266 052 201.
    Rok sběru2015
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.