【强化学习】 1.4.0 “进化方法”和 “决策梯度方法” 概论

Abstract: 本文介绍强化学习中的一些局限(limitation)和机遇(scope),介绍进化方法和决策梯度方法的区别和优劣 Keywords: Evolutionary Method,进化方法,Policy Gradient Methods,决策梯度方法 ...

September 20, 2018 · 谭升