上QQ阅读APP看书,第一时间看更新
第6章 计算机视觉初探
现在将考察对象从简单的比萨销量预测问题转移到图像识别问题上。我们将掌握机器学习的魔法,使用几页的篇幅构造一个关于图像分类的项目。
在本章及下一章的内容中,我们将把二元分类器应用到MNIST数据集上,它是一个关于手写体数字的样本数据库[1]。就在几年前,那时的机器学习系统还不能处理更加复杂的数据集,人工智能研究者便将MNIST数据集作为评价机器学习算法的一个基准。我们将在本章加入这些令人尊敬的研究者的行列。
“我不想再看到MNIST了!”
MNIST除了是行业中常见的评价基准之外,它还是有一点类似于“Hello,World!”这样的机器学习教程。事实上,如果你曾经接触过机器学习,那么就会在看到另一个基于MNIST的应用实例时翻白眼。为什么我就不能为这一章找到一个更为原始的样本数据集呢?
事实上,我选择MNIST数据集是因为它很普遍。虽然大多数教程在高级机器学习程序库的帮助下解决了计算机视觉中的很多问题,但是在这里我们将讨论机器学习程序中的每一行代码,所以最好别弄得那么复杂,应该使用一个简单的、文档齐全的数据集。此外,一个知名的数据集可以使你更容易地在网络上查找和比较其他与之相关的应用实例。
这将是我们第一次接触计算机视觉,所以从简单的内容开始。我们将从识别单个MNIST手写数字开始,并把更为通用的字符识别方法留到下一章。
[1] yann.lecun.com/exdb/mnist。