Počet záznamů: 1  

Continuous Q-learning application

  1. 1.
    0103685 - UT-L 20040191 RIV CZ eng C - Konferenční příspěvek (zahraniční konf.)
    Věchet, S. - Krejsa, Jiří - Míček, P.
    Continuous Q-learning application.
    [Aplikace metody spojitého Q-učení.]
    Engineering mechanics 2004. Praha: Ústav termomechaniky AV ČR, 2004 - (Zolotarev, I.; Poživilová, A.), s. 307-308. ISBN 80-85918-88-9.
    [Engineering mechanics 2004. Svratka (CZ), 10.05.2004-13.05.2004]
    Výzkumný záměr: CEZ:AV0Z2076919
    Klíčová slova: Q-learnig * approximation
    Kód oboru RIV: JC - Počítačový hardware a software

    Standard algorithm of Q-Learning is limited by discrete states and actions and Q-functionis usually represented as discrete table. To avoid this obstacle and extendthe use of Q-learning for continuous states and actions the algorithm must bemodified and such modification is presented in the paper. Straightforward way isto replace discrete table with suitable approximator.

    Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
    Trvalý link: http://hdl.handle.net/11104/0010992
     
Počet záznamů: 1  

  Tyto stránky využívají soubory cookies, které usnadňují jejich prohlížení. Další informace o tom jak používáme cookies.