系统优化与进阶之道:大规模复杂场景下的技术创新实录
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

未来规划

在采访的最后,我们与这个团队交流了一些未来的规划与想法。

研发人员谢年韬告诉我们,团队目前使用的周期性检测算法仍然是基于传统机器学习的算法,而传统机器学习算法对于周期性检测不够灵活,且存在准确度方面的瓶颈。所以,他们正在尝试使用卷积神经网络(CNN)的方法来有效地压缩数据长度,并且从曲线相似度的视角进行判定。

其次,目前使用的预测算法基于已有数据的周期是年,需要客户有三年及以上的历史数据。也就是说,目前使用的算法对于数据长度是非常敏感的。对此,他们已经开始尝试使用循环神经网络(RNN)去训练数据,该方法对数据的长度没有要求,也不需要流量的周期必须以年为单位。

在基于深度学习的序列到序列(Sequence-To-Sequence)模型中,FreeWheel的编码器(Encoder)可以对人工设置的任意时间序列长度的流量数据进行编码操作,通过解码器(Decoder)得到一个固定长度的流量预测序列,有更强的适应性和拟合能力。

对于未来,FreeWheel也有一些期许:

(1)从现有的业务层面来看,运用更成熟的技术,通过使用对数据长度不那么敏感的算法,提升对于历史数据没有三年之久的情况的预测;

(2)在周期性检测环节和视频聚类环节上,使用效果更好的算法,达到更好的预测效果;

(3)在业务发展的层面来看,让项目的整个流程上更加灵活。因为不同客户的视频属性差别很大,他们不应该局限于在客户级别做预测,而是考虑不同维度特征的提取和融合。