1.1 比较人工智能与传统机器学习
传统上,系统通过使用程序员编写的复杂算法实现智能。
例如,假设你想识别照片中是否包含狗。对于传统机器学习(ML)的设置,ML从业者或主题专家首先需要确定从图像中提取的特征。然后,他们提取这些特征,并通过一个编写良好的算法来破译给定的特征,从而判断这幅图像是否包含狗。图1-2说明了同样的思路。
图1-2
以图1-3所示样本为例。
图1-3
从图1-3所示的图片来看,一个简单的规则可能是,如果一个图像包含以三角形对齐的三个黑色圆圈,则它可能被归类为狗。然而,这条规则在应对如图1-4所示的有欺骗性的松饼特写时却失效了。
图1-4
当然,当你近距离观看除了狗脸以外的任何图片时,这条规则也会失效。因此,自然地,我们需要创建能够精确分类多种类型的人为规则数量可能是指数级的,尤其是当图像变得更加复杂的时候。因此,传统方法在非常受限的环境中很有效(比如,拍摄一张护照照片,所有的尺寸都被限制在毫米以内),而在不受约束的环境中,由于每张照片都存在很大差异,效果很差。
我们可以将同样的思路扩展到任何领域,比如文本或结构化数据。在过去,如果有人想通过编程来解决现实世界的任务,那么必须理解关于输入数据的所有内容,并且需要编写尽可能多的规则来覆盖每个场景。这种方法不仅乏味,而且不能保证所有的新场景都会遵循上述规则。
然而,通过利用人工神经网络,我们只需一步就能够做到这一点。
神经网络提供了结合特征提取(手工调整)和使用这些特征进行分类/回归的独特优势,几乎不需要手工特征工程。只需要标记数据(例如,哪些图片是狗,哪些图片不是狗)和神经网络架构这两个子任务。它不需要人类想出分类图像的规则,这样就消除了传统技术强加给程序员的大部分负担。
请注意,这里的主要需求是对于需要一个解决方案的任务,我们要提供大量样本。例如,在前面的案例中,我们需要将大量的狗和非狗的图片输入给模型,以便它学习特征。如何利用神经网络完成分类任务的高级视图如图1-5所示。
图1-5
在了解了神经网络比传统计算机视觉方法表现更好的基本原因后,下面我们将更深入地了解神经网络是如何工作的。