现代推荐算法
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 推荐系统是什么

推荐系统是一种从成千上万的物料中选出满足用户需求的部分并进行分发的系统。下面分别从物料和产品的角度来阐述到底什么是推荐系统。

这里的物料通常指的是推荐内容,如图1-1所示。

图1-1 推荐内容

(1)图文是最容易产生、也是数量最多的内容。图文一直是互联网内容的主流,如人人网、微博。即使近年来短视频发展迅猛,用户对于图文的需求也没有减少。无论是官方媒体,还是自媒体,图文仍然是主战场。需要说明的是,图文feed流可以自然地插入视频,像在图1-2所示新闻平台的产品界面及形态中就有很多视频。手机百度、今日头条都是以图文为主的平台。

(2)PGC(Professional Generated Content)视频主要指由专业的生产者产出的视频。典型的以PGC为主的是西瓜视频、爱奇艺等平台。

(3)UGC(User Generated Content)视频指普通的生产者生产的内容。一个用户拍好一段短视频并把它发布出来,都可看作UGC的领域。UGC和PGC的边界并不清晰,当普通用户得到关注,慢慢变成头部作者的时候,他的作品也就变成了PGC作品。抖音、快手都是典型的UGC平台。

图1-1的分类基本是按照目前常见的产品形态来分类的。PGC、UGC的概念划分与图文、视频的划分之间相互独立(在图文的应用里面,这两类是混合在一起的),为了便于理解,这里只是依据目前主流的产品形态进行划分。

图1-2 新闻平台的产品界面及形态

接下来从产品的角度,查看一个典型的推荐产品包括哪些要素。图1-2所示为典型App的图文界面,以此为代表介绍所有的要素。

将界面按功能分为几种要素。

(1)内容区:界面中最主体的区域,占据了绝大多数空间。在这里看到的是文章的预览或缩略,用户点击后就可以抵达详情页。常见形式包括大图(标题在上,图片填满页面宽度)、小图(标题在左侧,图片的高度和文本的高度一致)和组图(标题在上,三张图填满页面宽度)。

(2)搜索区/热点入口:与网页搜索相似。

(3)强插环节:与个性化无关的一个区域,存在的理由可能是时事热点、政策方针等。

(4)标签:一般会写上作者的名字,并且附带评论数或播放数等信息,有时也会用“热点”“活动”等字样覆盖。

(5)广告区:严格意义上不算一个区,广告可以出现在任何内容可以出现的地方。上面的大图、小图、组图都可以被广告性质的内容所取代,点击自然内容进去的详情页也可以出现广告。但要注意,广告的密度一般有限,假如一个屏幕有四五条内容,广告最多占据一条,否则会影响用户体验,而且一定得打上“广告”标签。

在推荐系统中,用户可以读到感兴趣的内容,这些内容是由有同样背景或同样爱好的作者生产的。因此,推荐系统其实是连接作者和用户的一个中间媒介

在本书中,把用户称作“消费者”,把作者称为“生产者”。这里的“消费”并不是指“付费”,而是指内容的“消费”。

既然推荐系统是一个中间媒介,那么它都有哪些作用,可以达到什么样的目的呢?

从消费者的角度来看,推荐系统就是把消费者想看的东西给他们,如对于喜欢看游戏的消费者,可以推荐各种主播的技术视频;对于想买手机的消费者,可以推荐性价比高的手机,让消费者省事。

从生产者的角度来看,推荐系统需要让他们发挥更大的价值,如帮助新疆的水果商家找到客户;让大多数短视频作者有曝光度,增强他们的创作欲望。

根据实际业务及业务发展阶段的不同,推荐系统需要在消费者和生产者之间平衡:在初始阶段,为了有限满足消费者对推荐内容的质量和新鲜度的需求,要把最好的内容展现出来;在内容足够丰富时,考虑生产者的长尾效应,让一些不那么热门的内容得到展示可能更为重要。

在推荐系统中,推荐的主体可以分为自然内容和赢利内容两种。自然内容指的是那些不以赢利为目的的内容,也是最常见和最主要的形式;而赢利内容则是第三方为了获取收益投放的内容,最典型的就是广告。

广告的推送本身也属于推荐,典型的方式有两种:第一种是在开屏或固定位置放置,这种一般是追求品牌效应的品牌广告,以合约的形式完成;另一种是针对某个位置,众多广告主来竞价,即效果广告,追求短期内的转化(商品购买、游戏下载等)。

近年来,有更多其他形式的内容出现在各类平台上,如直播。有的直播是先打造主播的个人品牌,然后逐渐转向变现;而电商类直播则更直接地带货。再比如本地生活的相关内容,其本质也是向商家导流的。