Number of the records: 1  

Continuous Q-learning application

  1. 1.
    0103685 - UT-L 20040191 RIV CZ eng C - Conference Paper (international conference)
    Věchet, S. - Krejsa, Jiří - Míček, P.
    Continuous Q-learning application.
    [Aplikace metody spojitého Q-učení.]
    Engineering mechanics 2004. Praha: Ústav termomechaniky AV ČR, 2004 - (Zolotarev, I.; Poživilová, A.), s. 307-308. ISBN 80-85918-88-9.
    [Engineering mechanics 2004. Svratka (CZ), 10.05.2004-13.05.2004]
    Institutional research plan: CEZ:AV0Z2076919
    Keywords : Q-learnig * approximation
    Subject RIV: JC - Computer Hardware ; Software

    Standard algorithm of Q-Learning is limited by discrete states and actions and Q-functionis usually represented as discrete table. To avoid this obstacle and extendthe use of Q-learning for continuous states and actions the algorithm must bemodified and such modification is presented in the paper. Straightforward way isto replace discrete table with suitable approximator.

    Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
    Permanent Link:

Number of the records: 1  

  This site uses cookies to make them easier to browse. Learn more about how we use cookies.