R语言临床预测模型实战
上QQ阅读APP看书,第一时间看更新

1.1.4 随机森林

随机森林是有监督的学习方法。在预测模型的构建过程中,通过随机森林可以同时生成多个预测模型,并将模型的结果汇总以提升准确率。

随机森林涉及对样本和自变量进行抽样,从而生成大量的决策树。对每个样本来说,所有决策树依次对其进行预测,预测结果的众数或平均数作为这一样本的最终预测结果。生成决策树未用到的样本也可以由决策树估计,与其真实结果比较,即可得到带外误差。当没有验证数据时,这是随机森林的一大优势。