1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于iLSTD(λ)的ActorCritic学习 .pdf

论文研究基于iLSTD(λ)的ActorCritic学习 .pdf

上传者: 2019-09-15 11:28:29上传 PDF文件 463.81KB 热度 27次
基于iLSTD(λ)的Actor-Critic学习,冯涣婷,程玉虎,尽管策略梯度强化学习算法具有较好的收敛性,但是在梯度估计过程中方差过大,影响了算法的性能。为了提高策略梯度算法的收敛速度
下载地址
用户评论