realworldrl_suite:真实世界的RL基准套件 源码
现实世界强化学习(RWRL)挑战框架 论文确定并描述了一组九个挑战,这些挑战当前阻止了强化学习(RL)代理在现实世界的应用程序和产品上使用。它还描述了一个评估框架和一组环境,可以评估RL算法对现实系统的潜在适用性。此后,又进行了 ,该实践实现了所描述的九个挑战中的八个(不包括可解释性),并分析了它们对各种最新RL算法的影响。这是用于执行此分析的代码库,也旨在作为针对这些挑战的易于重现的实验的通用平台,被称为realworldrl-suite (真实世界增强学习(RWRL)套件)。 当前,该套件由五个环境组成: 卡特波尔 沃克 四足 机械手(未经测试) 人形生物 该代码库当前的结构为: 环境/-扩展环境 utils /-用于日志记录和标准化评估的包装器类 分析/-用于训练代理和生成情节的笔记本 示例/-随机策略和PPO代理示例实现 docs /-文档 您可以将问题发送到Real-World
下载地址
用户评论