1. 首页
  2. 编程语言
  3. Delphi
  4. 强化学习C++模拟.zip

强化学习C++模拟.zip

上传者: 2020-11-17 10:12:06上传 ZIP文件 2.12KB 热度 12次
简单的强化学习的C++模拟。 强化学习是机器学习的一个重要分支,是多学科多领域交叉的一个产物,它的本质是解决 decision making 问题, 即自动进行决策,并且可以做连续决策。 它主要包含四个元素,agent,环境状态,行动,奖励, 强化学习的目标就是获得最多的累计奖励。 简单来说,在结点0下有结点1和结点2两个分支,以此类推,在结点1,2和下依旧有两个结点3,4和5,6;总共有4层结点, 总共15个结点,而我们的目标是最后一个结点,也就是对走到最会一个结点的运行状态进行奖励。
下载地址
用户评论