1. 首页
  2. 数据库
  3. 其它
  4. drl_p2_continuous control 源码

drl_p2_continuous control 源码

上传者: 2021-04-27 09:25:01上传 ZIP文件 471.27KB 热度 8次
drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习”课程的项目2。 在此项目中,我们正在解决由控制双关节手臂的运动组成的触手环境。 通过在此双关节臂上执行操作,我们可以了解最佳控制策略。 为了执行此训练,我们使用深度确定性策略梯度(DDPG)算法。 我们在多主体情况下解决该算法,目标是使用20个主体,至少连续100次情节维持+30的奖励。 可以通过打开笔记本的Continuous_Control.ipynb并运行所有单元格来运行代码。 多代理到达环境 Reacher环境由多个机器人手臂的控制组成。 每个代理的观察空间大小为33,描述了机械臂的位置,旋转,速度和角速度。 作用空间大小为四,代表两个关节上的扭矩。 参考:
下载地址
用户评论