构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

3.5.4 数据清洗

基于内容的推荐算法依赖于标的物相关的描述信息,这些信息更多的是以文本的形式存在,这就涉及自然语言处理了,文本中可能会存在很多歧义、符号、脏数据,我们需要事先对数据进行很好的处理,才能让后续的推荐算法产生好的效果。