本章介绍了几种循环神经网络,在NLP领域人们经常利用循环神经网络构建Encoder-Decoder模型来完成机器翻译、人机对话、自动摘要、语言识别等任务。但该模型有一个很大的问题,即在Encoder与Decoder之间只有一个向量C,无论Encoder的语句多长,都只能通过向量C传递给Decoder,这往往会导致信息的丢失。
为解决这一问题,人们引入了注意力机制。那么,什么是注意力机制?注意力机制是如何提升模型性能的?下章将详细说明。