1. 首页
  2. 数据库
  3. 其它
  4. 强化学习笔记(3) Monte Carlo和TD

强化学习笔记(3) Monte Carlo和TD

上传者: 2021-01-09 05:36:33上传 PDF文件 620.28KB 热度 7次
3_Monte-Carlo_RL 文章目录1.1. 前言1.1.1. 算法特性1.1.2. 目标1.2. 两种Monte-Carlo 估计价值函数1.2.1. First Visit1.2.2. Every Visit1.2.3. 小tips: Incremental Mean1.3. Monte Carlo Control (Approximate optimal policies)1.3.1. Over all idea2. Temporal-difference reinforcement learning (TD)2.1. 概念:2.2. MC和TDTD target、TD error
下载地址
用户评论