信息流推荐算法
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 信息流产品推荐系统的构成

前面介绍过内容分发是信息流生态的核心模块之一,它承载了对内容供给与流量曝光之间信息过载问题的解决,内容分发的效率和质量直接决定了信息流生态的健康度和发展潜力。

信息流产品的内容分发模式通常包括:推荐、搜索、投放、推送、订阅等。每一种分发模式都有着各自不同的价值:“投放”是指外部的广告投放,目的是以外部引流的方式促进用户增长,“搜索”承接的是存量用户的确定性需求,“推送”是为了唤起低活和沉默用户,以及事件驱动的内容运营,“订阅”是用户主动发起的内容接收方式,可以帮助KOL建立和运营个人品牌,而“推荐”则承担了在用户需求不确定、关注点较模糊、个体偏好差异大的情况下的内容个性化分发的角色。在推荐系统分发内容的过程中,它依赖的外部系统及与各个外部系统之间的交互关系如图1-3所示。

图1-3 信息流产品推荐系统架构

这些外部系统各自分工,从不同角度为推荐系统提供技术和数据支撑。

1)日志系统:订阅和收集用户的实时反馈行为日志,为后续的用户理解及内容排序提供“原材料”。用户与信息流产品的交互行为经过日志系统处理生成固定格式的数据流,对接大数据平台。

2)大数据平台:承接日志系统实时处理流式数据,同时也承担实时和离线数据加工工作,为后续机器学习平台的用户理解及内容排序提供结构化数据。

3)内容平台:内容库,推荐物品的内容池,提供推荐的“内容来源”。内容一般由平台或者创作者(商家)上传,经过必要的审核机制后入库。内容入库后,会进行相应的内容理解,比如视频内容会基于多模态技术提取内容标签,电商商品会建立品类、品牌、价格等标签体系,这些标签体系是推荐算法重要的物品特征。

4)机器学习平台:推荐算法的“大脑”,负责基于大数据平台和内容平台提供的结构化数据进行内容理解、用户理解及推荐模型的训练。