Number of the records: 1
Algoritmický výběr dosažitelných preferencí
- 1.
SYSNO ASEP 0532021 Document Type V - Research Report R&D Document Type The record was not marked in the RIV Title Algoritmický výběr dosažitelných preferencí Title Algorithmic Selection of Feasible Preferences Author(s) Siváková, Tereza (CZ)
Kárný, Miroslav (UTIA-B) RID, ORCIDIssue data Praha: ÚTIA AV ČR, 2019 Series Research Report Series number 2384 Number of pages 39 s. Publication form Print - P Language cze - Czech Country CZ - Czech Republic Keywords decision-making ; probabilistic policies ; quantification of aims Subject RIV BC - Control Systems Theory R&D Projects LTC18075 GA MŠMT - Ministry of Education, Youth and Sports (MEYS) Institutional support UTIA-B - RVO:67985556 Annotation Tato bakalářská práce se zabývá teorií optimálního rozhodování pro diskrétní markovský rozhodovací proces z hlediska volby preferencí. Za pomoci plně pravděpodobnostního návrhu, který zavádí tzv. ideální distribuci chování, která přiřazuje vysoké hodnoty pravděpodobnosti preferovanému chování a malé hodnoty pravděpodobnosti nežádoucímu chování, se hledá optimální rozhodovací politika. Tato práce obsahuje návod k nalezení optimální ideální distribuce chování a přináší obecnější řešení než řešení dosud známá. Dále přidává možnost respektování další preference, a to na volbu akcí. Vlastnosti výsledného rozhodování jsou ilustrovány simulačními experimenty. Description in English This bachelor’s thesis studies the optimal decision making for a discrete Markov decision process with a focus on preferences. By using a fully probabilistic design that introduces the so-called ideal behavior distribution, which has high probability values of preferred behaviors and small probability values of inappropriate behaviors, an optimal decision policy has been found. The thesis constructs an algorithm for selecting the optimal ideal behavior distribution and provides a more general solution than published ones. The thesis also opens a possibility to specify further preferences on selected actions. Properties of the resulting decision making are illustrated on simulated examples. Workplace Institute of Information Theory and Automation Contact Markéta Votavová, votavova@utia.cas.cz, Tel.: 266 052 201. Year of Publishing 2021
Number of the records: 1