机器学习公式详解(第2版)
上QQ阅读APP看书,第一时间看更新

1.3 假设空间

本节的重点是理解“假设空间”和“版本空间”,下面以“房价预测”举例说明。假设现已收集到某地区近几年的房价和学校数量数据,希望利用收集到的数据训练出能通过学校数量预测房价的模型,具体收集到的数据如表1-1所示。

表1-1 房价预测

基于对以上数据的观察以及日常生活经验,不难得出“房价与学校数量成正比”的假设。若将学校数量设为,房价设为,则该假设等价表示学校数量和房价呈的一元一次函数关系,此时房价预测问题的假设空间即为“一元一次函数”。在确定假设空间以后,便可采用机器学习算法从假设空间中学得模型,即从一元一次函数空间中学得能满足表1-1中数值关系的某个一元一次函数。学完第3章的线性回归可知,当前问题属于一元线性回归问题,根据一元线性回归算法可学得模型为

除此之外,也可以将问题复杂化,假设学校数量和房价呈的一元二次函数关系,此时问题变为线性回归中的多项式回归问题,按照多项式回归算法可学得模型为。因此,以表1-1中的数据作为训练集可以得到多个假设空间,且在不同的假设空间中都有可能学得能够拟合训练集的模型,我们将所有能够拟合训练集的模型构成的集合称为“版本空间”。