名词解释:LSTM(长短期记忆网络)。
高泽民。
LSTM的全称是长短期记忆网络,是一种基于循环神经网络的架构,它能够很好地解决循环神经网络中的梯度消失问题。梯度消失指的是循环神经网络在处理信息的时候,如果碰到的内容太长,在处理到后面内容的时候可能已经忘了前面提到的信息了,这会影响神经网络的训练效果。

LSTM架构在神经网络中增加了一个称作"细胞状态"的模块,这个模块像是一个记忆库,在训练过程当中这个模块能不断的对记忆库里的信息进行更新,增加新的记忆,删除不必要的旧的记忆。在处理长信息的时候细胞状态能够防止遗忘,实现更好的训练效果。
除了处理文本信息,LSTM在语音识别、手写识别、动作识别、机器人控制等方面也有非常广泛的应用。