1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于因果图的FMDP问题的任务层次图的动态优化方法 .pdf

论文研究基于因果图的FMDP问题的任务层次图的动态优化方法 .pdf

上传者: 2020-05-25 19:30:09上传 PDF文件 647.06KB 热度 16次
基于因果图的FMDP问题的任务层次图的动态优化方法,周建才,王红兵,分层强化学习(HierarchicalReinforcementLearning,HRL)是解决强化学习维数灾难问题的一种重要方法。分层强化学习的一个重要问题是任务的��
下载地址
用户评论