Počet záznamů: 1
Continuous Q-learning application
- 1.0103685 - UT-L 20040191 RIV CZ eng C - Konferenční příspěvek (zahraniční konf.)
Věchet, S. - Krejsa, Jiří - Míček, P.
Continuous Q-learning application.
[Aplikace metody spojitého Q-učení.]
Engineering mechanics 2004. Praha: Ústav termomechaniky AV ČR, 2004 - (Zolotarev, I.; Poživilová, A.), s. 307-308. ISBN 80-85918-88-9.
[Engineering mechanics 2004. Svratka (CZ), 10.05.2004-13.05.2004]
Výzkumný záměr: CEZ:AV0Z2076919
Klíčová slova: Q-learnig * approximation
Kód oboru RIV: JC - Počítačový hardware a software
Standard algorithm of Q-Learning is limited by discrete states and actions and Q-functionis usually represented as discrete table. To avoid this obstacle and extendthe use of Q-learning for continuous states and actions the algorithm must bemodified and such modification is presented in the paper. Straightforward way isto replace discrete table with suitable approximator.
Standardní algoritmus Q-učení je omezen na použití diskrétních stavů a akcí a Q-funkce je obvykle reprezentována diskrétní tabulkou. Aby bylo možno se tomuto omezení vyhnout a rozšířit použití Q-učení na spojité stavy a akce, bylo nutné algoritmus modifikovat. Tato modifikace je předmětem článku. Diskrétní tabulka je zde nahrazena vhodným aproximátorem.
Trvalý link: http://hdl.handle.net/11104/0010992
Počet záznamů: 1