21个项目玩转深度学习:基于TensorFlow的实践详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 总结

本章中首先介绍了MNIST数据集,以及如何使用TensorFlow把它读到内存中。接着通过一个简单的Softmax回归模型例子,学习如何使用TensorFlow建立简单的图像识别模型。虽然Softmax回归模型只能达到92%左右的准确率,但它让我们了解了使用TensorFlow处理问题的基本流程。最后,我们使用TensorFlow建立了有两层卷积层的神经网络,将MNIST的识别准确率提高到99%。

拓展阅读

✪ 本章介绍的MNIST数据集经常被用来检验机器学习模型的性能,在它的官网(地址:http://yann.lecun.com/exdb/mnist/)中,可以找到多达68种模型在该数据集上的准确率数据,包括相应的论文出处。这些模型包括线性分类器、K近邻方法、普通的神经网络、卷积神经网络等。

✪ 本章的两个MNIST程序实际上来自于TensorFlow官方的两个新手教程,地址为https://www.tensorflow.org/get_started/mnist/beginnershttps://www.tensorflow.org/get_started/mnist/pros。读者可以将本书的内容和官方的教程对照起来进行阅读。这两个新手教程的中文版地址为http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.htmlhttp://www.tensorfly.cn/tfdoc/tutorials/mnist_pros.html

✪ 本章简要介绍了TensorFlow的tf.Tensor类。tf.Tensor类是TensorFlow的核心类,常用的占位符(tf.placeholder)、变量(tf.Variable)都可以看作特殊的Tensor。读者可以参阅https://www.tensorflow.org/programmers_guide/tensors来更深入地学习它的原理。

✪ 常用tf.Variable类来存储模型的参数,读者可以参阅https://www.tensorflow.org/programmers_guide/variables详细了解它的运行机制,文档的中文版地址为http://www.tensorfly.cn/tfdoc/how_tos/variables.html

✪ 只有通过会话(Session)才能计算出tf.Tensor的值。强烈建议读者在学习完tf.Tensor和tf.Variable后,阅读https://www.tensorflow.org/programmers_guide/graphs中的内容,该文档描述了TensorFlow中计算图和会话的基本运行原理,对理解TensorFlow的底层原理有很大帮助。