一类Markov 决策过程自适应决策的新方法 上传者:coosplax 2021-02-19 21:38:35上传 PDF文件 195.71KB 热度 24次 提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求 的决策精度对参数集进行有限分区,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计 参数所在的分区获得控制对 Markov 过程进行决策。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论