中国影视产品网络满意度研究(2020)
上QQ阅读APP看书,第一时间看更新

第二节 监测对象及数据来源

由于我们监测、研究的领域是娱乐行业,语义分析的词库和算法均针对娱乐内容,产生的数据体量庞大。考虑到系统的负载能力,监测对象有选择地集中在以下两个方面:一是视频娱乐产品,包括电视剧、电影、电视综艺、网络综艺、网剧、网络大电影等;二是以演艺明星为主体的媒介人物。

一 监测对象

一是电视剧。系统自2016年6月开始监测在上星频道黄金时间(19:30—22:30)首播和重播的电视剧。2017年上星频道共54个,其中中央电视台15个,省级卫视38个,中国教育1个。监测的时间是电视剧播出前7天至电视剧最后一集播出后7天。

二是网剧。系统自2018年8月开始监测爱奇艺、优酷视频、腾讯视频、芒果TV、搜狐视频五家视频网站上首播的网剧。监测的时间是网剧上线前7天至网剧最后一集上线后7天。先台后网播出的归为电视剧,先网后台播出的归为网剧,台网同时播出的同时归入电视剧、网剧。

三是电视综艺节目。系统自2016年6月开始监测在上星频道黄金时间(19:30—22:30)首播的电视综艺节目。2017年上星频道共54个,监测的时间是节目播出前7天至节目最后一期播出后7天。2016年10月18日,考虑系统容量以及重播类综艺节目的播出不稳定等原因,暂停监测重播类综艺节目。

四是网络综艺节目。系统自2017年5月开始监测爱奇艺、芒果TV、搜狐视频、腾讯视频、优酷五家视频网站上首播的综艺节目,2018年开始用PP视频替换乐视。监测的时间是节目上线前7天至最后一期上线后7天。先台后网播出的归为电视综艺,先网后台播出的归为网络综艺,台网同时播出的同时归入电视综艺、网络综艺。

五是电影。系统自2017年5月开始监测院线上映的电影。由于电影上映的时间长度不等,我们的监测时间是30天,具体为电影上映前7天,加上映后23天。

六是网络电影。系统自2019年3月开始监测爱奇艺、优酷、腾讯上线的网络大电影,监测周期是30天,具体为上线前7天,加上线后23天。

七是明星。系统2017年1月开始监测明星。演艺明星是公众媒介人物,具有文化产品的属性。明星与电视剧、综艺、电影等文化内容产品,电视台、视频网站等媒体和影视制作、艺人经纪公司等有耦合关系。因此我们将明星作为一类特殊的文化产品,加以监测和评价。监测名单数量为100人,评价对象人选根据基础榜单数据的变动或增补每年更新一次。明星的监测周期均为1年,从当年1月1日到12月31日。

2020年仍然监测100位明星。根据艺恩明星商业价值、精硕科技(AdMaster)的商业明星价值榜、凯度(Kantar)的明星商业影响力、尼尔森网联的代言人传播力综合指数、艾漫明星商业价值、骨朵热度指数六项数据筛选。数据来源多元是选择2020年明星监测对象的一个重要特征,另一个重要特征是包含了态度指标。除骨朵热度指数外,其他五个指标均含有豆瓣评分、微博内容评论正负向、网络口碑、风险系数、美誉度、正能量指数、口碑指数等指标。

艺恩公司收集了3105名明星的相关数据[2]。艺恩的明星商业价值指数由专业度和关注度两个指标确定。专业度包括明星为主演电影的票房、豆瓣评分,主演视频节目的播映热度,作品相关微博内容评论正负向,代言品牌数量和品牌热度,获奖数量等。关注度包括明星的百度搜索指数,百度新闻指数,今日头条新闻数,微博的转发量、评论量、点赞量、粉丝量、话题量、贴吧关注数量等。根据艺恩2019年6月20到12月19日的数据,明星中商业价值指数最高的是杨幂(88.617),最低的是魏仲洲(0.868)。

AdMaster精硕科技开发了代言人选择评估模型(CSI),定期公布明星商业价值榜单TOP30。CSI从吸睛指数(荧屏活跃度、搜索指数)、品牌助力(代货指数、品牌资产提升力)与社交影响力(社交热度、网络口碑、圈粉力)三个维度,七个细分指标,并引入了风险系数,综合计算得出结果。AdMaster将明星产生的风险事件类型归为7类,分别为政治、违法、涉毒、出轨、种族主义、绯闻、性取向,并根据算法得出该明星的风险指数。这样的风险评估体系在2019年的重要性尤为凸显。2019年8月1日、10月27日、11月20日、12月19日分别公布2019年1—6月、7—9月、10月、11月的榜单[3]。1—6月榜单的前100明星CSI的均值为100,7—9月、10月、11月榜单前200明星的CSI的均值分别为92、93、99,四个榜单共包含49位明星。榜单中商业价值最高的是肖战(124.33),最低的是周杰伦(98)。因该榜单的数值较大,同其他榜单产生明显差距,我们通过转换,从榜首到榜尾的商业价值从100递减到52。

凯度(Kantar)力图推出更为客观真实的明星商业影响力衡量系统——CelebrityZ(中国),定期发布明星商业影响力排行榜。从2011年开始凯度持续追踪研究提升明星代言的投资回报率。2018年,CelebrityZ 2.0基于全球广告营销业界广为认可的BrandZ品牌资产模型,叠加明星的专业成就(如明星的作品数量、票房表现、奖项情况等),从美誉度、区隔度、传播力、号召力等维度衡量其价值。2019年3月,凯度发布明星商业影响力TOP100榜单[4]。排名第一的是赵丽颖,排名第100的是苏炳添,商业价值指数从100递减到1。

尼尔森网联“广告代言人传播力综合指数”体系根据监测广告代言人的年度传播影响力(电视节目收视率、电视晚会贡献率、电影票房、视频播放量、微博粉丝量、贴吧粉丝量等)、舆情影响力(微博季度舆情指数、新闻网站舆情指数)、搜索影响力(百度指数、搜狗指数、360指数等)、正能量指数(新闻报道正负面、微博评论正负面、论坛讨论正负面等)和广告价值指数数值计算得出[5]。根据2019年5—10月前50位明星的数据计算[6],共107位明星入榜。榜单中商业价值最高的是杨紫(93.36),最低的是古力娜扎(85.52)。

北京艾漫数据科技股份有限公司提供明星商业价值榜,每月公布排名前10的明星相关数据。明星商业价值指数由明星热度指数、口碑指数、专业指数、代言指数加权计算得出。热度指数是媒体报道和大众热议的程度,包括媒体指数、讨论指数、粉丝指数、搜索指数。口碑指数由明星公益口碑指数、婚姻爱情指数、言行指数、外形指数、性格指数五个维度正负极性讨论量及时尚指数综合加权计算。专业指数由参演作品的市场贡献率、专业好评、获奖情况等指标加权计算。代言指数由代言的品牌级别、数量、效果等指标加权计算。根据艾漫数据公司官网收集2018年8月到2019年11月艺人商业价值指数,共有27位明星进榜,其中迪丽热巴16个月均榜上有名,唐嫣、李易峰、黄子韬、邓超等4位明星仅有1个月上榜[7]。其中,商业价值最高的是肖战(96.02),最低的是王一博(92.18)。

骨朵热度指数排行榜综合反映艺人的实时全网影响力情况。热度值愈高,该明星整体声量和市场影响力就越大。主要选取全网受众对于该艺人的关注、互动、热议,媒体曝光,粉丝贡献等多维度脱水数据建立指数模型。每月公布前50名明星的热度。使用2019年1—11月的数据计算[8]。11个月中,有91位明星上榜,指数最高的是肖战(79.47),最低的是阿云嘎(45.56)。

对六个来源的榜单数据进行简单平均计算并排序,再根据进入榜单的数量进行调整。刘诗诗、李沁、王凯进入5个来源的榜单,李宇春、范丞丞、王嘉尔、黄景瑜进入4个来源的榜单,而陈小春、李连杰、吴秀波、韩庚、莫文蔚、吴尊、巩俐仅进入艺恩榜单。

表1-2 2020年监测明星名单

表1-2 2020年监测明星名单续一

表1-2 2020年监测明星名单续二

表1-2 2020年监测明星名单续三

对比2019年,监测名单更新了40位明星,由陈奕迅、成龙、范丞丞、冯绍峰、高圆圆、古天乐、郭碧婷、黎明、李沁、林允、李荣浩、李现、梁朝伟、林俊杰、刘烨、马丽、孟美岐、戚薇、沈腾、宋佳、孙怡、唐艺昕、佟大为、王宝强、王丽坤、王一博、肖战、林志颖、谢霆锋、辛芷蕾、杨烁、姚晨、姚明、张柏芝、张若昀、张天爱、周杰伦、周迅、朱亚文、郭富城,替换了白敬亭、陈立农、陈乔恩、大张伟、范冰冰、韩庚、胡可、黄轩、蒋欣、靳东、井柏然、景甜、鞠婧祎、雷佳音、李冰冰、李小璐、刘若英、柳岩、罗晋、马思纯、马苏、倪妮、秦岚、吴京、吴奇隆、吴秀波、吴尊、徐熙娣、徐峥、许魏洲、薛之谦、张杰、张钧甯、张韶涵、张馨予、赵薇、赵又廷、郑恺、钟汉良、韩东君。

二 数据来源

研究数据来源于网络,根据设置关键词,确定监测对象,利用计算机爬虫技术,从互联网上收集监测对象的信息。目前主要的数据来源有七个方面:

一是网络新闻。网络新闻主要是传统主流媒体在互联网上平台传播的新闻内容,采集的信息比较全面。

二是论坛。收集论坛和贴吧上的信息,获得的信息也比较全面。

三是微博。收集新浪微博的信息,由于信息量大,采用随机技术取得20%左右的信息,获得的信息不全面,但可视为随机数据,用以代表总体。

四是弹幕。收集视频网站上弹幕的信息。目前抓取优酷视频、腾讯视频、搜狐视频网站的弹幕。

五是微信。收集微信公众号上的信息,2019年10月以后微信数据缺失。

六是视频评论。收集视频网站上的评论信息,目前仅抓取优酷网站的评论。

七是豆瓣评论。收集豆瓣电影网的评论信息。

三 数据处理原则

(一)平权原则

一条新闻、论坛、微博、弹幕、微信、视频网址评论、豆瓣评论均代表个人的观点或态度,其权重没有差异。因此褒贬值计算简单算术平均。

(二)加权计算公式

新闻褒贬值=新闻褒贬值之和/新闻条数

论坛褒贬值=论坛褒贬值之和/论坛条数

微博褒贬值=微博褒贬值之和/微博条数

弹幕褒贬值=弹幕褒贬值之和/弹幕条数

微信褒贬值=微信褒贬值之和/微信条数(2018年开始使用)

评论褒贬值=评论褒贬值之和/评论条数(2018年开始使用)

豆瓣评论褒贬值=豆瓣评论褒贬值之和/豆瓣条数(2019年开始使用)

综合褒贬值=(新闻褒贬值×新闻条数+论坛褒贬值×论坛条数+微博褒贬值×微博条数+弹幕褒贬值×弹幕条数+微信褒贬值×微信条数+评论褒贬值×评论条数+豆瓣评论褒贬值×评论条数)/(新闻条数+论坛条数+微博条数+弹幕条数+微信条数+评论条数+豆瓣条数)

由于弹幕数据的来源不全,且数量巨大,对褒贬值的影响大,因此2019年月度排行榜褒贬值计算中,综合褒贬值不包含弹幕。


[1] 欢迎使用“浙江传媒学院视频监测与分析系统”网址是http://112.11.126.99:8089/event.html,用户名和密码相同,为cmxy001或cmxy002。

[2] 数据来源,2019年12月20日从试用的艺恩数据http://endata.com.cn/User/Login中收集。

[3] 数据来源,对应时间的微信公众号:AdMaster。

[4] 凯度,CelebrityZ明星商业影响力榜单(附100强完整榜单),微信公众号,凯度,2019-03-05。

[5] 尼尔森网联,广告代言人的商业价值评估是行业可持续发展的新起点,微信公众,尼尔森网联媒介研究,2019-05-15。

[6] 数据来源,尼尔森网联公司提供2019年5月至10月,每月前50位明星的数据。

[7] 数据来源,2019年12月20日从艾漫数据官网https://www.chinaindex.net/#/actor/index收集。

[8] 数据来源,2019年12月20日从骨朵官网https://d.guduodata.com/?type=actor&categ ory=screen_actor上收集。