DDPG连续控制源码

上传者：gallery1517 2021-02-27 10:43:09上传 ZIP文件 1.27MB 热度 37次

Unity带有RL的Reacher环境解决方案介绍该项目是用于解决Unity v0.4环境的深度确定性策略梯度强化学习算法的实现。环境细节在这种环境下,双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步,将提供+0.1的奖励。因此,代理的目标是将其在目标位置的位置保持尽可能多的时间步长。观察空间由33个变量组成,分别对应于手臂的位置,旋转,速度和角速度。每个动作是一个带有四个数字的向量,对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。该环境由20个相同的代理组成,每个代理都有自己的环境副本。要考虑解决此环境,特工必须获得+30的平

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

DDPG连续控制源码

Unity带有RL的Reacher环境解决方案介绍该项目是用于解决Unity v0.4环境的深度...

大小：1.27MB | 2021-02-27 10:43:09
ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
SAP GRC中的连续控制监控.zip

在SAP GRC中进行连续控制监控是保证企业内部控制有效性的关键。本文提供了sap press do...

大小：6.89MB | 2023-08-30 11:57:17
基于PLC的煤矿选煤生产连续控制

本文通过简要介绍PLC与PLC的优势,对PLC在煤矿选煤生产中的控制方式及工作原理进行分析,并对PL...

大小：762KB | 2020-07-16 08:33:47
DCS系统中逻辑控制与连续控制结合应用实例.rar

DCS系统中逻辑控制与连续控制结合应用实例rar,DCS系统中逻辑控制与连续控制结合应用实例

大小：140KB | 2020-07-18 10:45:21
在连续控制系统中实现断续的前馈补偿控制

采用以时间最优为指标的断续控制器作为系统的前馈, 根据对象状态的条件, 判断和变换断续控制器的作用...

大小：241KB | 2021-02-17 20:06:16
西门子s7200正转连续控制电路

西门子s7200正转连续控制电路

大小：0B | 2018-12-25 03:55:17
Python MuJoCo物理模拟引擎连续控制任务强化学习算法包

MuJoCo物理模拟引擎连续控制任务强化学习算法包

大小：54KB | 2020-08-29 07:47:46
S7300使用SFB41FB41CONT C进行连续控制.pdf

使用SFB 41/FB 41 "CONT_C"进行连续控制，SFB/FB &qu...

大小：79KB | 2020-07-17 07:47:07
IPC DDPG UAV格式源码

IPC-DDPG-UAV格式

大小：3.19MB | 2021-03-02 16:32:45
udacity reacher Udacity深度强化学习纳米学位课程的连续控制项目学生在其中训练Unity Reacher手臂源码

持续控制项目在Udacity深度强化学习纳米学位计划中,持续控制是学生自己建立的第二个主要项目。 ...

大小：965KB | 2021-02-22 18:18:58
DDPG_update.py

在原文件的基础上，实现模型参数的保存、读取。不过要注意的是var参数会在开始阶段对动作选取产生影响，...

大小：0B | 2020-05-18 17:06:23
论文研究通过连续控制的一类输出耦合复杂网络的固定时间和有限时间同步

本文主要研究一类具有输出反馈节点的一般输出耦合复杂网络的时限和定时同步问题。提出了基于连续控制器策略...

大小：0B | 2020-05-30 14:18:36
5.ddpg.ipynb

关于ddpg的例子，适合初学者对深度强化学习ddpg的认识和了解

大小：0B | 2020-05-13 06:25:21
MATLAB实现DDPG算法在水箱控制中的应用

如何使用MATLAB编写代码实现DDPG算法在水箱控制中的应用。首先，我们详细讲解了DDPG算法的原...

大小：44.52KB | 2023-07-16 13:22:18
CNN加DDPG代码主要实现了倒立摆的控制

IusedtheCNN+DDPGrealizinginvertedpendulumcontrolpy...

大小：0B | 2019-09-28 16:52:37

DDPG连续控制 源码

DDPG连续控制源码