1. 首页
  2. 数据库
  3. 其它
  4. COAR_Fall2020 源码

COAR_Fall2020 源码

上传者: 2021-02-08 11:49:53上传 ZIP文件 316.7KB 热度 16次
COAR_Fall2020 在2020年秋季,我针对不同的算法进行了研究,旨在提高常规Q学习算法的效率。 我介绍了Double Q-Learning算法和Fitted Q-Learning算法。 双Q学习 有关Double Q-Learning算法的论文,请参见。 我的代码全部放在一个文件(DoubleQ_MPD.ipynb)中,并使用Uniform,Epsilon Greedy和Boltzmann行为策略(通常使用恒定步长= 0.1)来覆盖代码。 我使用迭代次数和运行时间来分析收敛速度与常规Q学习的差异。 使用这两种分析,我发现结果是不确定的。 拟合Q学习 可以在 中找到有关拟合Q学习算
下载地址
用户评论