dueling_dqn_lunar_lander 源码

Name: dueling_dqn_lunar_lander 源码
Rating: 4.5 (38 reviews)
Author: qqemphasise93274

上传者：qqemphasise93274 2021-03-20 20:48:10上传 ZIP文件 2.05MB 热度 38次

通过优先体验重播深度Q网络概述在这个项目中,我们建立了一个使用Experience Replay作为强化学习代理的Dueling Deep Q网络,以解决OpenAI Gym中离散的Lunar Lander环境。这种环境的目标是使“月球着陆器”以零速度着陆在着陆垫上。当平均奖励为+200点时,认为此任务已解决。通过将q网络的q值分成两个称为状态值和动作优势的流,决斗深层q网络能够对q值进行更准确的预测。优先级的体验重播使网络可以选择和培训具有较高td错误的体验,从而使培训重点放在重要的体验上。该实现还使用固定的q目标和软更新网络来进一步稳定训练过程。 (此项目在python和tensorflow 2中实现,并且仅出于自我练习目的。) 依存关系 python 3.6.9 张量流2.2.0 OpenAI体育馆0.17.2 box2d-py 怎么跑运行Dueling_D

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

dueling_dqn_lunar_lander源码

通过优先体验重播深度Q网络概述在这个项目中,我们建立了一个使用Experience Replay...

大小：2.05MB | 2021-03-20 20:48:10
lunar lander源码

lunar-lander

大小：392KB | 2021-04-21 19:29:05
Lunar_Lander源码

Lunar_Lander

大小：736KB | 2021-04-19 03:43:50
matlab Lunar lander

the Lunar Lander game works as follows; the pilot ...

大小：436KB | 2020-09-11 13:58:47
3.dueling dqn.ipynb

关于dueling dqn的例子,适合初学者对深度强化学习dueling dqn的认识和了解

大小：100KB | 2020-08-18 21:31:59
lunar lander深入的Q学习登上月球源码

月球着陆器使用DQL解决LunarLander-v2 ![]( ) 入门要启动并运行本地副本,请...

大小：963KB | 2021-04-19 03:43:45
pyxel lander使用Python和Pyxel复古游戏引擎编写的Lunar Lander游戏致敬源码

皮克斯·兰德 Lunar Lander使用复古游戏引擎以Python编写的游戏致敬。特征程序图生...

大小：13KB | 2021-05-10 13:48:52
lander源码

lander

大小：67KB | 2021-04-21 19:28:59
微电网能量管理策略Dueling DQN应对光伏不确定性

微电网能量管理策略的 DQN 强化学习思路，挺适合用来搞光伏发电的场景优化，尤其在有储能设备的时候，...

大小：2.68MB | 2025-06-16 20:07:31
dqn代理源码

DQN代理VizDoom 此存储库包含接受过不同VizDoom场景培训的各种DQN代理。项目结构 ...

大小：69KB | 2021-02-22 01:20:24
lunar_merch源码

lunar_merch

大小：241KB | 2021-03-20 20:48:01
pytorch DQN DQN的Pytorch实现源码

pytorch-DQN DQN的Pytorch实现 DQN 最初的Q学习使用表格方法(有关更多详细信...

大小：1.5MB | 2021-04-26 23:59:02
Cartpole dqn源码

Cartpole-dqn

大小：3KB | 2021-02-23 06:48:25
lunar tour api源码

无服务器GraphQL NodeJS入门这是使用AWS Lambda来启动您的无服务器GraphQ...

大小：911KB | 2021-05-19 17:20:21
Missile control with DQN源码

海防环境的导弹目标选择任务流程介绍:敌方舰艇以固定阵型排列,我方18枚导弹依次选择攻击目标并以直线...

大小：80.67MB | 2021-03-14 19:14:34
Duling DQN

基于Tensorflow实现的深度强化学习算法（DuelingDQN），python3.0及以上，依...

大小：0B | 2019-06-03 21:59:50