1. 首页
  2. 云计算
  3. mesos
  4. 论文研究 平均和折扣报酬准则下的逆向强化学习 .pdf

论文研究 平均和折扣报酬准则下的逆向强化学习 .pdf

上传者: 2020-12-13 14:06:28上传 PDF文件 542.22KB 热度 11次
平均和折扣报酬准则下的逆向强化学习,陶钊榕,陈智超,逆向强化学习是利用专家示教行为构建潜在报酬函数的过程。本文从性能灵敏度分析的角度研究了逆向强化学习的原理,通过分析专家策
下载地址
用户评论