上QQ阅读APP看书,第一时间看更新
1.15 迈向深度学习方式
实现手写数字识别时,我们得出的结论是,准确度越接近99%,改进难度就越大。如果需要更多的改进,肯定需要一个新的想法。
直观感受是,在目前为止的示例中,我们未利用到图像的局部空间结构。特别地,以下这段代码将表示每个手写数字的位图转换为一个平面向量,其中的局部空间结构(某些像素彼此更靠近)消失了:
然而,这不是大脑的工作方式。记住,我们的视觉系统基于多个皮层级别,每个级别会识别越来越多的结构化信息,同时还保留了局部性信息。首先看到单个像素,然后从中看到简单的几何形状,进而识别出越来越复杂的元素,比如物体、面部、人体、动物等。
在第4章中,我们将看到一种特殊类型的深度学习网络,称为卷积神经网络(Convolutional Neural Network,CNN),它既考虑保留图像中局部空间结构信息(不失一般性,具有空间结构的任何类型信息),又考虑通过渐进级别的抽象进行学习:经一层仅能学习一些简单模式;经多层能学习多种模式。在开始讨论CNN之前,我们需要详细讨论一些TensorFlow架构,并介绍一些机器学习的其他概念。这将是后续几章的主题。