深度学习与目标检测
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章 卷积神经网络

卷积神经网络被广泛用于处理图像识别和分类问题,在大型图像的处理方面有出色的表现。与全连接神经网络和循环神经网络相比,卷积神经网络使用卷积运算代替一般的矩阵乘法运算,因此在图像数据处理领域更具优势。

在第2章中,我们介绍了全连接神经网络,如图3.1所示。在本章中,我们将介绍卷积神经网络,如图3.2所示。在本质上,全连接神经网络和卷积神经网络的结构非常相似,都是由相邻的层构成的,且相邻层内的神经元节点都相连。它们的不同之处在于:在全连接网络中,前一层的每个节点都会与后一层的所有节点相连;在卷积神经网络中,相邻层之间只有部分节点相连。

图3.1 全连接神经网络

图3.2 卷积神经网络

在处理图像时使用卷积神经网络的原因,也恰恰在于卷积神经网络中只有部分节点相连。如果使用全连接网络对图像进行处理,会因为参数过多而出现计算速度慢、过拟合等问题。例如,第一个隐藏层中有400个节点,一幅图像的大小为32×32×3(3表示每个像素有R、G、B三个通道),那么仅输入就有3072个,而网格结构是全连接的,在第一个隐藏层中就有3072×400+400=1229200个参数——运算量巨大。

卷积神经网络是通过卷积来模拟特征,然后通过卷积的权值共享及池化操作来降低网络参数的数量级的。一个完整的卷积神经网络,通常包含输入层、卷积层、激活层、池化层和全连接层,针对图像分割和图像增强等应用,还可能包含反卷积层。在第2章中,已经对激活函数和全连接等操作进行了详细介绍。在本章中,将主要介绍卷积、池化、反卷积及典型的卷积神经网络实例。