drl_p2_continuous control 源码

上传者：tire5935 2021-04-27 09:25:01上传 ZIP文件 471.27KB 热度 23次

drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习”课程的项目2。在此项目中,我们正在解决由控制双关节手臂的运动组成的触手环境。通过在此双关节臂上执行操作,我们可以了解最佳控制策略。为了执行此训练,我们使用深度确定性策略梯度(DDPG)算法。我们在多主体情况下解决该算法,目标是使用20个主体,至少连续100次情节维持+30的奖励。可以通过打开笔记本的Continuous_Control.ipynb并运行所有单元格来运行代码。多代理到达环境 Reacher环境由多个机器人手臂的控制组成。每个代理的观察空间大小为33,描述了机械臂的位置,旋转,速度和角速度。作用空间大小为四,代表两个关节上的扭矩。参考:

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

drl_p2_continuous control源码

drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习...

大小：471KB | 2021-04-27 09:25:01
Continuous Control项目二源码

连续控制项目2:训练深度确定性策略梯度-DDPG代理将双臂移动到目标位置。 1.环境在这个项目中...

大小：715KB | 2021-04-25 05:51:45
p2_continuous control Udacity深度强化学习NanoDegree项目2机械手臂控制源码

项目2:连续控制介绍对于此项目,您将使用环境。 ![训练有素的经纪人] [image1] 在这种...

大小：1.74MB | 2021-04-25 05:51:53
CIFAR DRL源码

适用于ICDCS 2021的CIFAR10和CIFAR100实验 Abstract Submissi...

大小：173.71MB | 2021-02-17 17:27:01
7DRL20217DRL2021源码

设置说明这不是一个完整的设置列表,因为除了我以外,还有谁要设置此设置? DL,安装Godot / ...

大小：2.9MB | 2021-04-06 09:59:33
7drl20217DRL条目源码

7drl2021 7DRL条目

大小：540KB | 2021-04-23 00:28:36
CNN DRL源码

适用于ICDCS 2021的CIFAR10和CIFAR100实验 Abstract Submissi...

大小：173.86MB | 2021-05-13 19:07:28
DDPG中文Continuous control with deep reinforcement learningCH

(DDPG 中文) 连续控制中文版

大小：0B | 2019-06-21 13:23:32
P2P as botnet command and control A deeper insight

The research community is now focusing on the inte...

大小：130KB | 2021-04-18 00:14:59
Continuous finitetime control for robotic manipulators with terminal sliding

终端滑模的经典文献，介绍了终端滑模和双幂次趋近律，很值得学习

大小：0B | 2018-12-27 21:52:28
spellweaver7drl7DRL2021源码

咒织者这是我的2021 7DRL条目。这是带有ASCII图形的经典流氓风格。图书馆它使用了V...

大小：72KB | 2021-03-15 23:44:09
DRL_miniproject源码

DRL_miniproject

大小：629KB | 2021-03-14 19:14:31
DRL_面试源码

Create React App入门该项目是通过。可用脚本在项目目录中,可以运行: yarn ...

大小：213KB | 2021-02-17 17:27:09
drl liquidation optimizer源码

债务清算优化器 Conda环境设置从environment.yml创建环境:从基本目录: cond...

大小：31.56MB | 2021-03-22 11:33:49
Continuous finite time control approach for series elastic actuator

Continuous finite-time control approach for series...

大小：1.97MB | 2021-02-22 06:16:40
Continuous nonsingular terminal sliding mode control for systems with mismatched

Continuous nonsingular terminal sliding mode contr...

大小：1.15MB | 2021-02-22 23:54:04