机器学习编程:从编码到深度学习
上QQ阅读APP看书,第一时间看更新

第4章 超空间

我们在前两章解决了一个简单的问题,实现了对一家餐厅比萨销量的预测。然而,大多数有趣的实际问题都包含多个输入变量。即使对于预测比萨销量这样一个简单的问题,也不太可能仅仅依赖于座位预订数量这个数据。例如,虽然这家餐厅得到了和昨天一样多的座位预订数量,但是如果今天镇上来了很多的游客,那么就有可能卖出更多数量的比萨。

如果比萨销量预测这种简单的问题都包含很多变量,那么可以想象一下,当我们进入像图像识别这种复杂的领域时,需要考虑多少个变量。只支持一个变量的学习程序永远不可能解决这类复杂的问题。如果想要解决这类问题,就必须对我们的程序进行升级,使其能够支持多个输入变量。

我们可以从包含多个输入变量的样本数据中学到一种线性回归模型的增强版本,即多元线性回归。本章将扩展我们的程序以支持多元线性回归模型,同时还会补充一些数学技巧,包括一些有用的矩阵运算和几个NumPy函数。那么,让我们开始吧!

难啃的一章

对于大多数读者而言,本章可能是全书中最困难的一章。产生困难的原因主要有两个。首先,接下来的几页是相对复杂的数学内容。第二,本章虽然代码不多,但很深奥。我们甚至在某处使用几乎两页的篇幅来解释一行代码。

不要让这些挑战阻碍你的学习进程。本章中的概念和技术对机器学习而言非常关键,非常值得学习。你也可以这么想:在学完这一章之后,本书的其余部分就会看起来简单不少!