人人可懂的深度学习
上QQ阅读APP看书,第一时间看更新

1.7 本章小结及本书内容安排

本章在机器学习的大背景下介绍了深度学习。为此,本章的很多内容是关于机器学习的。特别地,本章介绍了函数的概念(即函数是从输入到输出的确定性映射)和机器学习的目标(即找到能与数据集中样本的输入特征到输出特征的映射相匹配的函数)。

在此背景下,深度学习被看成了机器学习的一个子领域,它聚焦于设计和评估当代神经网络的模型架构及训练算法。在机器学习中,深度学习的一大特别之处是它进行特征设计的方法。在大部分机器学习项目中,特征设计是一项人力密集型任务,它往往需要丰富的领域知识,需要投入大量时间和金钱。与此不同的是,深度学习能够从底层的原始数据学到有用的特征,以及从输入到输出复杂的非线性映射。尽管这样的能力依赖于大规模数据集,但是只要有大规模数据集,深度学习就常常比其他机器学习方法表现得更好。此外,也正是因为这种从大规模数据集中学习有用特征的能力,深度学习才能在解决机器翻译、语音处理以及图像或视频处理等复杂问题时生成非常精确的模型。某种意义上,深度学习释放了大数据的潜能。由此引发的最显著的影响是深度学习模型与消费产品的结合。然而,使用深度学习对海量数据进行分析也暗藏着对我们个人隐私以及公民自由的影响[24]。因此,理解深度学习是什么、它的工作原理以及它能做什么与不能做什么非常重要。本书剩余章节的内容安排如下:

  • 第2章介绍深度学习的一些基本概念,包括什么是模型,如何使用数据设置模型的参数,以及如何通过组合简单模型创建复杂模型。
  • 第3章介绍什么是神经网络,包括神经网络的工作原理,以及什么是深度神经网络。
  • 第4章介绍深度学习的历史。介绍的重点是在概念和技术方面对机器学习领域的发展起了重要作用的主要突破。这一章特别介绍了深度学习近年来能够发展得如此迅速的背景和原因。
  • 第5章以目前最流行的卷积神经网络和循环神经网络这两种深度神经网络架构为例介绍深度学习领域的现状。卷积神经网络是处理图像和视频数据的理想方法,而循环神经网络则是处理像音频、文本和时序数据这样的序列数据的理想方法。弄清楚这两种网络架构之间的异同既能帮助我们理解如何根据特定类型数据的特点设计深度神经网络,又能帮助我们认识到神经网络架构设计中有多少可能。
  • 第6章介绍神经网络的训练方法,即梯度下降和反向传播算法。对这两种算法的理解能够让你真正了解人工智能。例如,为什么当有了足够数据时,对于明确定义的问题中的特定任务,计算机经训练后能够比人类做得还好,但是让人工智能实现更加通用形式的智能却依然是一个尚未解决的挑战。
  • 第7章展望深度学习领域的未来。这一章总结了当前推动深度学习发展的主要趋势,以及这些趋势在未来几年将会如何影响深度学习的发展。这一章还讨论了深度学习领域面临的一些挑战,特别是如何理解和解释深度神经网络的运行机理。