上QQ阅读APP看书,第一时间看更新
3.1.3 模型性能的评估
如果使用算法来进行交易的话,小瓦最关心的就是模型是否可以准确地预测出股票的涨跌或者涨幅。实际上,模型是不可能做到百分之百准确的,这就需要我们对模型的性能进行评估,以便找到最可用的模型。要达到这个目的,我们就需要将掌握的数据集(dataset)拆分为训练集(trainset)和验证集(testset),使用训练集训练模型,并使用验证集来评估模型是否可用。
举一个例子,假如小瓦有某只股票100天的价格数据,就可以将前80天的数据作为训练集,将后20天的数据作为验证集,同时评估模型分别在训练集与验证集中的准确率。如果模型在训练集中的得分很高,而在验证集中的得分很低,就说明模型出现了过拟合(over-fitting)的问题;而如果模型在训练集和验证集中的得分都很低,就说明模型出现了欠拟合(under-fitting)的问题。
要解决这些问题,小瓦就需要调整模型的参数、补充数据,或者进行更细致的特征工程。随着小瓦工作的继续深入,我们会一起来探索详细的解决方案。