1. 首页
  2. 数据库
  3. 其它
  4. pytorch实现task3——过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶

pytorch实现task3——过拟合、欠拟合及其解决方案;梯度消失、梯度爆炸;循环神经网络进阶

上传者: 2021-01-10 22:15:47上传 PDF文件 72.64KB 热度 21次
过拟合、欠拟合及解决方案在之前自己已经使用较多较熟练,故跳过。 梯度消失、梯度爆炸 深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。 当神经网络的层数较多时,模型的数值稳定性容易变差。 在神经网络中,通常需要随机初始化模型参数。随机初始化模型参数的方法有很多。在线性回归的简洁实现中,我们使用torch.nn.init.normal_()使模型net的权重参数采用正态分布的随机初始化方式。不过,PyTorch中nn.Module的模块参数都采取了较为合理的初始化策略(不同类型的layer具体采样的哪一种初始化方法的可参考源代码),因此一般不用我们考虑。
下载地址
用户评论