1. 首页
  2. 网络技术
  3. 系统集成
  4. DQN算法实现精确登月小艇降落LunarLander-v2强化学习策略的PyTorch实践

DQN算法实现精确登月小艇降落LunarLander-v2强化学习策略的PyTorch实践

上传者: 2025-06-15 21:03:56上传 ZIP文件 409.44KB 热度 2次

强化学习里的DQN怎么用?LunarLander-v2 的精确降落例子讲得蛮细的。环境怎么设定、动作空间长啥样、三层神经网络怎么搭、经验回放怎么写,全都有。而且用的是PyTorch,上手还挺快。训练循环的细节,比如Huber 损失梯度裁剪这些也没落下,代码可以直接跑,适合边学边改。做项目或者论文展示,用它练练手还挺合适。

下载地址
用户评论