元学习的好奇心算法(Metalearning curiosity algorithms).pdf 上传者:qq_45867 2020-06-19 14:37:49上传 PDF文件 2.38MB 热度 35次 我们假设好奇心是进化过程中发现的一种机制,它鼓励个体在生命早期进行有意义的探索,从而使个体接触到能够在其一生中获得高回报的经历。我们将产生好奇行为的问题表述为元学习的问题之一:一个外环将在一个好奇心机制的空间中搜索,该机制动态地适应代理的奖励信号,而一个内环将使用适应的奖励信号执行标准的强化学习。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论