梯度爆炸的主要原因深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

浏览量：2648 时间：2021-03-14 17:27:19 作者：admin

深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

梯度消失的根源-深层神经网络和反向传播。目前，神经网络的优化方法都是基于bp算法的思想，即根据损失函数计算的误差，采用梯度bp算法来指导深度网络权值的更新和优化。

梯度消失和梯度爆炸。在两种情况下，梯度消失经常发生，一种是在深网络中，另一种是使用不适当的损失函数，如sigmoid。梯度爆炸通常发生在深度网络初始值和权重过大时。神经网络的反向传播是将函数的偏导数逐层相乘。因此，当神经网络的层很深时，最后一层的偏差会因为乘以许多小于1的偏导数而变得越来越小，最后趋于0，导致浅层的权值不更新，即梯度消失。由于梯度爆炸的初始权值过大，前一层的变化比后一层快，导致权值增加和溢出，导致Nan值的产生。

使用sigmoid激活函数时，梯度消失问题更常见，而梯度爆炸问题只发生在非常窄的范围内。

解决梯度消失问题的方法：添加BN层、使用不同的激活函数（relu）、使用剩余结构、使用LSTM网络结构等

解决梯度爆炸问题的方法：添加BN层、使用不同的激活函数、梯度剪切（限制梯度范围），权重正则化，使用LSTM网络，重新设计网络模型（减少层，学习）率，批量大小）

欢迎讨论

人脑是怎么防止梯度消失和梯度爆炸的？

大脑中有近900亿个神经元。如此庞大的网络如何防止梯度消失和梯度爆炸？我认为，因为大脑不能一次激活所有的神经元，所以它把结果储存在远离大脑的地方。

人脑是如何工作的？

你给大脑一个图像，同时激活整个大脑吗？显然不是。大脑被分割了。然而，在遥远的地方存储信息只是人脑算法的一小部分，这与动物和人类惊人的识别能力无关。我认为更多的是关于短期记忆的储存（在它变成长期记忆之前）。

现在人们普遍认为人脑没有DNN这样的梯度返回机制。。。对生物学稍有了解就会发现神经元的传递是单向的。但是我们能有两个神经元，一个前馈一个反馈吗？目前的研究还没有发现。。。一般认为这一环节是一个循环结构（RNN）。其次，新生动物的比率可能不需要学习掌握很多基本的信息处理能力。例如，牛、羊和马生来就是要走路的。结果表明，它们的基因是预先编程的，具有一些基本的能力，如行走、运动和视觉，这是我们通过反向传播训练模型实现的。人类出生的原因看不清楚。现有的解释是，人类在出生时并没有完全发育，否则婴儿的头太大，无法顺利分娩。然而，大脑中肯定有一种机制来返回错误并改变突触重量。

是否存在通用的神经网络模型，可以处理图像，语音以及NLP？

对于目前的深度学习模型，虽然深度学习的目标之一是设计能够处理各种任务的算法，但是深度学习的应用还需要一定的专业化，目前还没有通用的神经网络处理模型。然而，每一种模式也在相互学习、相互融合、共同提高。例如，一些创新可以同时改进卷积神经网络和递归神经网络，如批量标准化和关注度。一般模型需要在将来提出。

图像和视频处理，计算机视觉，最流行的是CNN，卷积神经网络，它的变形和发展，CNN适合处理空间数据，广泛应用于计算机视觉领域。例如，alexnet、vggnet、googlenet、RESNET等都有自己的特点。将上述模型应用于图像分类识别中。在图像分割、目标检测等方面，提出了更有针对性的模型，并得到了广泛的应用。

语音处理，2012年之前，最先进的语音识别系统是隐马尔可夫模型（HMM）和高斯混合模型（GMM）的结合。目前最流行的是深度学习RNN递归神经网络，其长、短期记忆网络LSTM、Gru、双向RNN、层次RNN等。

除了传统的自然语言处理方法外，目前的自然语言处理深度学习模型也经历了几个发展阶段，如基于CNN的模型、基于RNN的模型、基于注意的模型、基于变压器的模型等。不同的任务场景有不同的模型和策略来解决一些问题。

王者荣耀S14上单英雄梯度排行公布，达摩、花木兰垫底，你怎么看？

感谢收看。欲知更多关于王者荣耀的信息，请关注王大哥。如果答案有帮助，请关注小编。如果您有不同意见，请在评论区留言。祝大家新年快乐，猪年快乐！

梯度爆炸的主要原因梯度消失的原因及解决方法遗传算法优化BP神经网络预测

上一篇分辨率和px的关系 lpmm与分辨率的关系

下一篇 python实现命令行工具 python实现简单对话

梯度爆炸的主要原因深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

人脑是怎么防止梯度消失和梯度爆炸的？

是否存在通用的神经网络模型，可以处理图像，语音以及NLP？

王者荣耀S14上单英雄梯度排行公布，达摩、花木兰垫底，你怎么看？

猜你喜欢

最新资讯

资讯排行

资讯分类

微信公众号

微信小程序

梯度爆炸的主要原因 深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？

人脑是怎么防止梯度消失和梯度爆炸的？

是否存在通用的神经网络模型，可以处理图像，语音以及NLP？

王者荣耀S14上单英雄梯度排行公布，达摩、花木兰垫底，你怎么看？

猜你喜欢

最新资讯

资讯排行

资讯分类

微信公众号

微信小程序

梯度爆炸的主要原因深度学习中的梯度消失和梯度爆炸是什么？有哪些方法可以解决？