Policy-Gradient Algorithms for Partially Observable Markov Decision Processes

Douglas A. Aberdeen

Ph.D. Thesis, The Australian National University (2003)

Google Scholar

Abstract

Research Areas

Machine intelligence