构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

4.7.5 冷启动问题

前面在讲协同过滤算法的缺点时讲到协同过滤算法会存在严重的冷启动问题,主要表现在如下3个方面。

1.用户冷启动

所谓用户冷启动就是新用户没有太多的行为,我们无法为他计算个性化推荐。这时可行的推荐策略是为这类用户推荐热门标的物、通过人工编排筛选出的标的物。如果用户只有很少的行为,协同过滤效果也不好,这时可以采用基于内容的推荐算法作为补充。

2.标的物冷启动

所谓标的物冷启动就是指新的标的物加入系统,没有用户操作行为,这时协同过滤算法也无法将该标的物推荐给用户。可行的解决方案有如下三个。

第一个方案:这类标的物可以通过人工曝光到比较好的推荐位(如首页)上,在尽量短的时间内获得足够多的用户行为,这样就可以“启动”协同过滤算法了。这里有一个比较大的问题是,如果该标的物不是主流的标的物、不够热门,放在好的位置不光占用资源,还会影响用户体验。

第二个方案:在推荐算法上做一些策略,可以将这类新的标的物以一定的概率混杂在用户的推荐列表中,让这些标的物有足够多的曝光机会,在曝光过程中收集用户行为,同时该方法也可以提升用户推荐的多样性。

第三个方案:这类标的物也可以通过基于内容的推荐算法分发,第3章已经讲过内容推荐,这里不再赘述。

3.系统冷启动

所谓系统冷启动,就是该产品是一个新开发不久的产品,还在发展用户初期阶段,这时协同过滤算法基本无法起作用,最好采用基于内容的推荐算法或者直接利用编辑编排一些多样性的优质内容作为推荐备选推荐集。等用户规模、用户行为足够多后再启用协同过滤算法。