ddpg aigym:具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法源码

Name: ddpg aigym:具有深度强化学习的连续控制 在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法 源码
Rating: 4.5 (132 reviews)
Author: offensive5158

上传者：offensive5158 2021-04-23 02:30:56上传 ZIP文件 322.35KB 热度 132次

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lillicrap等人。) 如何使用 git clone https://github.com/stevenpjg/ddpg-aigym.git cd ddpg-aigym python main.py 培训期间一旦训练学习曲线 InvertedPendulum-v1环境的学习曲线。依存关系 Tensorflow(在tensorflow版本0.11.0rc0 ) OpenAi体育馆 Mujoco 产品特点批量归一化(提高学习速度) 梯度转换器(在arXiv中提供: ) 注意使用不同

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

ddpg aigym具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度DDPG算法源码

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lil...

大小：322KB | 2021-04-23 02:30:56
DeepReinforcementLearning DDPGfor RoboticsControl这是名为深度确定性策略梯度DDPG的深度强化学习算法的

DDPGforRoboticsControl 这是名为深度确定性策略梯度(DDPG)的深度强化学习算...

大小：20.38MB | 2021-02-27 10:43:08
DDPG_TF2KerasTensorflow2中的简单深度确定性策略梯度算法DDPG实现源码

DDPG_TF2 很难在TF2中找到简单整洁的DDPG实现,因此我做了一个。 DDPG DDPG是一...

大小：8KB | 2021-03-14 03:33:00
pytorch ddpg利用PyTorch实现深度确定策略梯度DDPG的实现.zip

pytorch-ddpg, 利用PyTorch实现深度确定策略梯度( DDPG )的实现在 PyT...

大小：1.84MB | 2020-08-20 03:56:27
DDPG连续控制源码

Unity带有RL的Reacher环境解决方案介绍该项目是用于解决Unity v0.4环境的深度...

大小：1.27MB | 2021-02-27 10:43:09
深度确定性策略梯度算法的Python实现

深度确定性策略梯度算法（Deep Deterministic Policy Gradient，简称D...

大小：7.14KB | 2023-07-04 02:58:55
售电公司竞价策略研究：基于DDPG算法的深度强化学习

基于DDPG算法的深度强化学习在售电公司竞价策略研究中的应用。电力市场中，售电公司需要针对竞标和报价...

大小：353.6KB | 2023-07-29 02:11:15
maddpg keras在Keras中实现多代理深度确定性策略梯度MADDPG算法源码

马迪克-凯拉斯在Keras中实现多代理深度确定性策略梯度(MADDPG)算法

大小：7.86MB | 2021-04-30 16:03:52
论文研究优化深度确定性策略梯度算法.pdf

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数...

大小：874KB | 2020-07-17 18:26:45
AC Gym适用于OpenAI Gym环境的PyTorch中流行的ActorCritic深度强化学习算法源码

该存储库结合了来自三个来源qv的代码,以获取详细信息: Pack Publishing的第19章斯...

大小：41KB | 2021-04-01 15:28:16
深度强化学习算法在MuJoCo机器人环境中的应用与比较（DDPG、TD3、SAC）

深度强化学习的 DDPG、TD3、SAC 这几套算法，放到 MuJoCo 环境里一跑，优劣立马就看出...

大小：643.26KB | 2025-06-10 08:48:36
driver_critic OpenAI Gym的CarRacing v0环境解决方案它使用深度确定性策略梯度算法源码

司机批评家 OpenAI Gym的CarRacing-v0环境解决方案。它使用DDPG算法(深度确定...

大小：377KB | 2021-04-08 11:28:05
OPENAI GYM强化学习问题源码

OPENAI健身房强化学习问题

大小：2KB | 2021-04-08 11:34:45
框架确定性在深度学习框架中提供确定性源码

TensorFlow确定性这个主要的README当前专注于TensorFlow的GPU确定性。有...

大小：74KB | 2021-02-17 05:25:36
确定性策略梯度算法简介

确定性策略梯度算法是一种在强化学习中广泛应用的方法。本文将介绍确定性策略梯度算法的基本原理和应用，包...

大小：335.61KB | 2023-10-14 17:01:52
强化学习OpenAI Gym环境理解和显示

强化学习——OpenAI Gym——环境理解和显示本文以CartPole为例。新建Python文...

大小：39KB | 2021-01-03 15:50:42

ddpg aigym:具有深度强化学习的连续控制 在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法 源码

ddpg aigym:具有深度强化学习的连续控制在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法源码