论文研究连续时间马尔可夫决策过程的方差优化

上传者：aaaaaafad 2020-05-27 03:05:17上传 PDF文件 398.41KB 热度 52次

本文考虑了连续时间马尔可夫决策过程中平均报酬的方差优化问题。假设状态空间是可计数的，而动作空间是Borel可测量的空间。本文的主要目的是在确定性平稳策略空间中找到方差最小的策略。与传统的马尔可夫决策过程不同，方差准则中的成本函数将受到未来行动的影响。为此，我们通过引入称为伪方差的概念将方差最小化问题转换为标准（MDP）。通过给出伪方差优化问题的策略迭代算法，推导了原始方差优化问题的最优策略，并给出了方差最优策略的充分条件。最后，我们用一个例子来说明本文的结论。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究连续时间马尔可夫决策过程的方差优化

本文考虑了连续时间马尔可夫决策过程中平均报酬的方差优化问题。假设状态空间是可计数的，而动作空间是Bo...

大小：0B | 2020-05-27 03:05:17
马尔可夫决策过程

本pdf文档讲述了马尔可夫决策过程的决策机理，实现建模的方法等，是做这方面研究的不二选择。

大小：0B | 2020-05-28 14:00:27
马尔可夫决策过程引论

马氏决策的好书，可用于Internet流量分析建模，无线网络资源分配建模

大小：0B | 2019-05-28 00:18:38
实用马尔可夫决策过程

实用马尔可夫决策过程: 马尔可夫决策详细解释,非常好的资料,大家值得一看,对学习马尔科夫非常有用处....

大小：0B | 2019-09-25 12:32:44
马尔可夫决策过程MATLAB代码

该资源可直接在MATLAB上运行,实例文件是MDP_main.m,子文件包括基于策略和基于价值的方法...

大小：3KB | 2020-11-10 02:11:58
马尔可夫决策过程电子书

马尔可夫是彼得堡数学学派的代表人物,以数论和概率论方面的工作著称.在数论方面,他研究了连分数和二次不...

大小：0B | 2019-09-10 04:09:17
马尔可夫决策过程自适应决策的进展

在介绍一般马尔可夫决策过程的基础上, 分析了当前主要马尔可夫过程自适应决策方法的基本思想、具体算...

大小：197KB | 2021-02-17 04:08:49
实用马尔可夫决策过程高清版

实用马尔可夫决策过程对于智能规划的学习有很大的帮助

大小：2.86MB | 2020-08-10 13:10:31
MDP马尔可夫决策过程MATLAB源码

这是2002年KevinMurphy等人写的matlab的mdp源码，可以直接调用其中的所有函数，另...

大小：0B | 2019-07-05 19:50:22
马尔可夫决策过程实例讲解.pdf

中文版的MDP详细讲解,包括公式的完整推导过程,内容详细,通俗易懂,是学习MDP和强化学习难得的参考...

大小：1.68MB | 2020-10-29 20:25:18
[免资源分]马尔可夫决策过程

大小：0B | 2018-12-08 16:37:50
大规模马尔可夫决策过程的算法

大小：0B | 2018-12-08 16:37:48
论文研究基于马尔可夫决策过程的接纳控制模型研究.pdf

针对异构网络中系统容量有限、资源利用率低的问题，在分析对比传统呼叫接纳控制模型的基础上，提出一种基于...

大小：0B | 2020-02-27 08:35:09
matlab开发马尔可夫决策过程摆度控制

matlab开发-马尔可夫决策过程摆度控制。建立了摆锤的马尔可夫决策过程模型，然后找到了摆锤的最优上...

大小：26KB | 2020-07-22 10:56:39
马尔科夫决策过程

大小：0B | 2019-01-14 02:46:16
马尔可夫决策过程理论与应用_13701577

马尔可夫决策过程理论与应用，刘克，曹平马尔可夫决策过程理论与应用_13701577

大小：0B | 2019-05-14 18:22:19

论文研究 连续时间马尔可夫决策过程的方差优化

论文研究连续时间马尔可夫决策过程的方差优化