1. 首页
  2. 数据库
  3. 其它
  4. 一份从代码出发的强化学习Q Learning入门教程请笑纳!

一份从代码出发的强化学习Q Learning入门教程请笑纳!

上传者: 2021-02-01 00:03:26上传 PDF文件 358.96KB 热度 9次
本文由机器之心编译(ID:almosthuman2014) 强化学习(RL) 强化学习是机器学习的一个重要领域,其中智能体通过对状态的感知、对行动的选择以及接受奖励和环境相连接。在每一步,智能体都要观察状态、选择并执行一个行动,这会改变它的状态并产生一个奖励。 马尔科夫决策过程(MDP) 我们将要解决「forest fire」的马尔科夫决策问题,这个在 python 的 MDP 工具箱(http://pymdptoolbox.readthedocs.io/en/latest/api/example.html)中是可以看到的。 森林由两种行动来管理:「等待」和「砍伐」。我们每年做出一个
下载地址
用户评论