论文研究基于iLSTD(λ)的ActorCritic学习 .pdf

上传者：weixin_39882200 2019-09-15 11:28:29上传 PDF文件 463.81KB 热度 42次

基于iLSTD(λ)的Actor-Critic学习，冯涣婷，程玉虎，尽管策略梯度强化学习算法具有较好的收敛性，但是在梯度估计过程中方差过大，影响了算法的性能。为了提高策略梯度算法的收敛速度

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

论文研究基于iLSTDλ 的ActorCritic学习.pdf

基于iLSTD(λ)的Actor-Critic学习，冯涣婷，程玉虎，尽管策略梯度强化学习算法具有较好...

大小：0B | 2019-09-15 11:28:29
论文研究全增量式自然梯度ActorCritic学习算法.pdf

全增量式自然梯度Actor-Critic学习算法，冯涣婷，程玉虎，尽管策略梯度强化学习算法具有较好的...

大小：0B | 2019-09-10 08:46:18
论文研究基于替代迹的蜂窝网信道分配ActorCritic算法.pdf

针对D2D混合蜂窝网络在进行信道分配时难以在较高信噪比条件下进行自动信道分配的问题，提出了一种基于替...

大小：0B | 2019-09-05 05:44:41
论文研究自适应重要采样ActorCritic算法.pdf

自适应重要采样Actor-Critic算法，冯涣婷，，在离策略Actor-Critic(AC)强化学...

大小：0B | 2020-04-20 10:59:35
论文研究基于FelderSilverman模型的在线学习风格研究.pdf

基于Felder-Silverman模型的在线学习风格研究，殷传涛，王晨煜，学习风格是个体在学习过程...

大小：0B | 2020-05-25 19:14:29
论文研究基于深度学习的手机应用分类研究.pdf

基于深度学习的手机应用分类研究，王超，张华，传统的手机应用分类无法分析中文复杂上下文环境，同时随着样...

大小：0B | 2019-12-30 20:35:11
论文研究基于深度学习的场景识别算法研究.pdf

基于深度学习的场景识别算法研究，姜轩，俎云霄，近几年，深度学习在计算机视觉领域取得了巨大的成就，场景...

大小：235KB | 2020-07-17 20:06:51
论文研究基于深度学习的视频行为识别研究.pdf

基于深度学习的视频行为识别研究，林闯，谢东亮，本文从视频行为识别模型实用性和识别性能综合考虑，研究设...

大小：861KB | 2020-07-17 11:44:25
论文研究基于在线学习的目标跟踪方法研究.pdf

针对视频目标跟踪问题，提出了一种基于co-training框架下的在线学习跟踪方法。该方法首先根据两...

大小：0B | 2020-01-05 14:21:37
论文研究基于集成学习的标题分类算法研究.pdf

标题分类是对一个标题性语句进行分类,通常这个标题是不超过20个字的短文本,内容精炼且概括性强。针对标...

大小：955KB | 2021-04-22 07:42:28
论文研究基于深度学习的哼唱检索算法研究.pdf

基于深度学习的哼唱检索算法研究,商迎新,刘刚,哼唱检索,作为一种新颖的音频数据检索方式受到了越来越多...

大小：303KB | 2021-04-17 22:40:31
论文研究基于核的学习机研究综述.pdf

近年来核学习机已经成为机器学习界的一个热点问题，并在许多领域中得到了成功应用；然而作为一种尚未成熟的...

大小：396KB | 2020-07-17 18:33:02
论文研究基于位置感知的泛在学习研究.pdf

基于位置感知的泛在学习研究,刘婷,葛君伟,泛在学习是普适计算环境下未来的学习方式,是一种任何人可以在...

大小：374KB | 2020-08-14 01:26:12
论文研究基于极限学习机的多网络学习.pdf

基于极限学习机的多网络学习,王建功,,与现有神经网络相比,极限学习机具有较快的学习速度以及良好的泛化...

大小：292KB | 2021-05-05 04:41:28
论文研究基于SVM主动学习的音乐分类.pdf

提出了一种改进的SVM（支持向量机）主动学习方法，通过多次迭代提供给用户信息量最大的样本并将其加入训...

大小：654KB | 2020-07-17 08:38:40
论文研究基于随机对策的团队CGA学习.pdf

分布式虚拟环境中，个体CGA通过学习来适应环境和团队中其他CGA，从而增强团队求解问题的能力，提高团...

大小：388KB | 2020-07-22 13:47:06