1.2 机器学习的意义
机器学习的意义大体可以分为以下两种:
● 理解事物发展的道理;
● 对未来的状况进行预测。
两者是辩证统一的,但是在实践中却往往有所偏向,因此可以将机器学习分为可解释型(interpretable)和可预测型(predictable)。下面我们对这两种类型进行说明。
● 可解释型机器学习。英国统计学家George Box曾经说过一句至理名言,即“所有模型都是错误的,但是其中一些是有用的”(All models are wrong, but some are useful)。因为现实中,不同因素之间的关系是错综复杂的,因此在现实中往往很难提炼出理想的模型。尽管如此,通过机器学习来建立统计模型,依旧能够帮助我们更好地理解事物之间的关系。举例来说,一个城市的PM 2.5值可能受到多个因素的影响,包括气温、风力、降水、城市建筑的结构等。我们可能无法单纯用这些解释性因子来构建一个可完美预测PM 2.5值的模型,但是通过机器学习我们能够知道哪些影响因素可能起到主导作用,而哪些因素相关性不大。
● 可预测型机器学习。在实践中,有很多预测性高的模型属于“黑箱模型”(Black Box Model),如神经网络模型、SVM模型等。尽管我们可以看到这些模型的参数,但我们很难直接利用这个模型对一个过程背后的发生机制进行详尽的解释。这些模型往往把预测精度放在第一位,而暂时忽略其可解释性。举例来说,我们可以选取上百个与股票价格有关的特征,然后通过深度学习的方法获得一个复杂的模型,从而对未来的股价进行预测。尽管这个模型极其复杂,以至于我们无法理解它为什么如此有效。但是它对未来股价的预测要比其他模型都好,因此在金融行业高频交易的场景中能够得到应用。
根据上面的介绍,我们可以发现,在可预测型机器学习中,应用价值往往高于理解本身。而在可解释型机器学习中,探明事物发展的机理高于一切,否则没有任何意义。在理想的状态下,两者应该是统一的,也就是机器学习获得的模型既具有高度的可解释性,又具有精确的预测性,这是机器学习领域的一个重要课题。