Informatik-Logo
Fakultät für Informatik - Technische Universität München

Lehrstuhl für Effiziente Algorithmen

TUM-Logo

Die bibliographische Datenbank LEABib


SuchenListe der JournaleListe der SerienListe der KonferenzenAusgewählte Publikationen Ausgewählte Publikationen Hilfe Hilfe
 
Suche: Citkey="Ryabko-Hutter/08"
Als [bib] [pdf] [ps] [dvi] [xml]  herunterladen.

On the possibility of learning in reactive environments with arbitrary dependence Publikation auswählen
Daniil Ryabko, Marcus Hutter

Theoretical Computer Science 405 (3), 2008, pp. 274-284

Editors  G. Ausiello, D. Sannella
Publisher:  Elsevier B.V.
Address:  Amsterdam-Boston-Jena-London-New York-Oxford-Paris-Philadelphia-San Diego-St. Louis
 
Keywords:   reinforcement learning, asymptotic average value, self-optimizing policies, (non) markov decision processes
 
URL:   http://www.sciencedirect.com/science/article/B6V1G-4SV5V96-8/2/079cc0378afc27bf17ee41fb0e5d91ea