Fakultät für Informatik - Technische Universität München

Lehrstuhl für Effiziente Algorithmen

Die bibliographische Datenbank LEABib

Suchen • Liste der Journale • Liste der Serien • Liste der Konferenzen • Ausgewählte Publikationen	Hilfe

Suche: Citkey="Ryabko-Hutter/08"

Als [bib] [pdf] [ps] [dvi] [xml] herunterladen.

On the possibility of learning in reactive environments with arbitrary dependence

Publikation auswählen

Daniil Ryabko, Marcus Hutter

Theoretical Computer Science 405 (3), 2008, pp. 274-284

Editors G. Ausiello, D. Sannella

Publisher: Elsevier B.V.

Address: Amsterdam-Boston-Jena-London-New York-Oxford-Paris-Philadelphia-San Diego-St. Louis

Keywords: reinforcement learning, asymptotic average value, self-optimizing policies, (non) markov decision processes

URL: http://www.sciencedirect.com/science/article/B6V1G-4SV5V96-8/2/079cc0378afc27bf17ee41fb0e5d91ea