PacmanRL强化学习算法应用于Pacman游戏
吃豆子RL应用于Pacman游戏的强化学习算法。Pacman游戏是为Udacity类ud820的结果。可以在qlearningAgents.py文件中找到学习器。运行命令:
python pacman.py -p PacmanQAgent -x 800 -n 810 -l smallGrid
-l参数可以更改为使用其他地图(在布局文件夹中可用)。-p参数可以更改为使用其他类型的Q-learner。-x设置训练示例的数量。-n设置示例总数(训练+测试)。
学习者PacmanQAgent:基本的Q学习代理。它使用完整状态(整个地图),因此在使用大地图时不会缩放。
运行示例:
python pacman.py -g DirectionalGhost -p PacmanQAgent -x 800 -n 810 -l smallGrid
下载地址
用户评论