双向lstm神经网络原理从RNN到LSTM，性能良好的神经网络到底是如何工作的？

2021-03-29

1867

从RNN到LSTM，性能良好的神经网络到底是如何工作的？RNN（递归神经网络），顾名思义，以先前的输出（隐藏状态）作为输入，形成一个循环。（RNN扩展，图像源：colah.github.io文件)上面

从RNN到LSTM，性能良好的神经网络到底是如何工作的？

RNN（递归神经网络），顾名思义，以先前的输出（隐藏状态）作为输入，形成一个循环。

（RNN扩展，图像源：colah.github.io文件)

上面的展开图清楚地显示了RNN的结构。不难发现RNN的结构与序列化数据是一致的。实际上，RNN实际上主要用于处理序列化数据。

基本上，不使用原始RNN，而是使用RNN的变体。

渐变裁剪可以缓解渐变爆炸，而RNN变体（如主流LSTM和Gru）可以缓解渐变消失。

（一般是sigmoid层）建模输入、输出和遗忘。

（图片来源：中新网/@左上角的蓝色是输入门，右上角的绿色是输出门，底部的红色是遗忘门。

是否存在通用的神经网络模型，可以处理图像，语音以及NLP？

对于目前的深度学习模型，虽然深度学习的目标之一是设计能够处理各种任务的算法，但是深度学习的应用还需要一定的专业化，目前还没有通用的神经网络处理模型。然而，每一种模式也在相互学习、相互融合、共同提高。例如，一些创新可以同时改进卷积神经网络和递归神经网络，如批量标准化和关注度。一般模型需要在将来提出。

图像和视频处理，计算机视觉，最流行的是CNN，卷积神经网络，它的变形和发展，CNN适合处理空间数据，广泛应用于计算机视觉领域。例如，alexnet、vggnet、googlenet、RESNET等都有自己的特点。将上述模型应用于图像分类识别中。在图像分割、目标检测等方面，提出了更有针对性的模型，并得到了广泛的应用。

语音处理，2012年之前，最先进的语音识别系统是隐马尔可夫模型（HMM）和高斯混合模型（GMM）的结合。目前最流行的是深度学习RNN递归神经网络，其长、短期记忆网络LSTM、Gru、双向RNN、层次RNN等。

除了传统的自然语言处理方法外，目前的自然语言处理深度学习模型也经历了几个发展阶段，如基于CNN的模型、基于RNN的模型、基于注意的模型、基于变压器的模型等。不同的任务场景有不同的模型和策略来解决一些问题。

入门机器学习该如何入手？

作为一名科技工作者和计算机专业教育家，让我来回答这个问题。

首先，机器学习是一个很好的选择。机器学习作为人工智能领域的六大研究方向之一，目前比较流行。而且，由于机器学习与人工智能领域的其他研究方向密切相关，因此机器学习通常是学习人工智能的第一步。

机器学习本身涉及六大环节，即数据采集、算法设计、算法实现、算法训练、算法验证和算法应用，因此学习机器学习可以从数据采集开始，然后逐步过渡到其他环节。在当今大数据时代，数据收集整理的方式越来越多，获取数据的方式也越来越多。我们可以从基本的数据库技术入手。其实，机器学习作为大数据分析的两种常用方式，大数据领域的从业者往往需要关注机器学习技术。

算法设计是机器学习的核心，因此算法知识的学习是机器学习的重点。学习算法知识可以从基本的常用算法入手，如决策树、朴素贝叶斯、支持向量机等算法需要重点学习。在学习算法的过程中，必须结合具体案例。算法的实现可以使用Python语言。目前，Python广泛应用于机器学习领域。

最后，对于目前的IT行业开发者来说，学习机器学习知识可以重点结合大数据和人工智能平台提供的开发环境，让他们有更好的学习体验，在一定程度上增强自己的实践能力。毕竟，未来大量机器学习的发展离不开平台的支持。

从RNN到LSTM，性能良好的神经网络到底是如何工作的？

是否存在通用的神经网络模型，可以处理图像，语音以及NLP？

入门机器学习该如何入手？

相关推荐