1. 首页
  2. 数据库
  3. 其它
  4. pytorch学习笔记(十五)————动量与学习率衰减

pytorch学习笔记(十五)————动量与学习率衰减

上传者: 2021-01-16 23:11:56上传 PDF文件 834KB 热度 16次
pytorch学习笔记(十五)————动量与学习率衰减目录动量学习率衰减 目录 动量 从形式上看, 动量算法引入了变量 z充当速度角色——它代表参数在参数空间移动的方向和速率。速度被设为负梯度的指数衰减平均。名称 动量(momentum),相当于引入动量前的梯度概念,指示着loss在参数空间下一步要下降的方向和大小。 其中wk+1w^{k+1}wk+1表示更新后权重;wkw^{k}wk表示更新前权重;zk+1z^{k+1}zk+1代表动量,,α表示学习率 从公式zk+1=βzk+▽f(wk)z^{k+1}=βz^{k}+▽f(w^{k})zk+1=βzk+▽f(wk)可以看出,zk+1z^{
下载地址
用户评论