基于MultiAgent异步深度强化学习的居民住宅能耗在线优化调度研究.pdf
为促进居民用户柔性负荷高效参与需求响应,帮助
用户从被动角色转变为主动角色,实现需求侧最大效益。本文在智能电网环境下,根据用电设备的特性,以概率论
的角度对家电设备状态进行描述定义,基于异步深度强化
学习(asynchronousdeepreinforcementlearning,ADRL)进
行家庭能源管理系统调度的在线优化。学习过程采用异步
优势演员-评判家(asynchronousadvantageactor-critic,
A3C)方法,联合用户历史用电设备运行状态的概率分布,
通过多智能体利用CPU多线程功能同时执行多个动作的
决策。该方法在包括光伏发电、
下载地址
用户评论