1.3 情感分析的应用
情感分析具有广阔的应用前景,可以产生巨大的经济效益和社会效益。
1.3.1 商业领域
网购在生活中愈发普遍,人们通过C2C(如淘宝网、易趣网等)和B2C(如京东网、亚马逊等)形式的电子商务平台购买商品后,可以写下对商品的评论。Joshua-Porter在Designing for the Social Web一书中描述了一种“亚马逊效应”。他在研究中观察到,人们总是从亚马逊开始他们的在线购物(在中国,人们也往往是从淘宝开始他们的在线购物),原因在于人们更想通过其他购买者的评论了解产品的“真相”,而不是商家广告对产品天花乱坠式的描述。大部分的网上购物者更加相信购买过该商品的买家的评价,而非商家的主动推销。
美国Hayneedle公司在展示了用户反馈后,交易额增长了26%。根据PowerReviews的报告[1],这个数字可能更高。有一个有趣的现象是,负面评价并不总是坏事,就如谷歌的零售业咨询总监John McAteer所说:“没有人会相信所有的正面评价。”在没有差评的时候,浏览者会假设有人刻意伪造了评价。人无完人——产品和服务也是如此。
对于消费者而言,通过查看产品评论可以了解商品质量、售前售后服务等各个方面,从而做出购买决定。在虚拟的购物环境中,信任的建立显得尤为重要。Bickart等人[14]的研究表明,从网上获取的来自其他消费者的信息比商业途径的网络信息更易引发消费者对产品的兴趣,因为来自其他消费者的信息是相对中立的,没有商业诱导性。
对于商家而言,可以通过跟踪用户对产品的反馈意见来改进产品的质量或服务。获得有质量的评价有助于降低退货率(现在大部分电商都支持7天无理由退货),也有助于优化销售策略,将经营重点从评价低的产品转移到受欢迎的品类上来。此外,顾客的反馈还可以保持产品页面的持续更新,因为用户对于过期的评价会缺乏信任。另外,商家还可以通过分析在线评论信息和观点信息,获得消费者的行为特征,预测消费者的购买偏好,从而进行个性化的商品推荐。
因此,无论是商家还是潜在消费者都希望能通过一种方法来帮助他们自动对大量的产品评论进行处理。情感分析技术非常适用于电商领域,可以对产品评论进行有效的组织分类和观点挖掘,如从评论文本中分析用户对“数码相机”的“变焦”“价格”“大小”“重量”“闪光”“易用性”等属性的情感倾向性。
1.3.2 文化领域
从文化生活的角度看,情感分析技术可以挖掘用户对图书、影视等文化传媒的褒贬观点,实现影评、书评等资源的自动分类,有利于用户快速浏览正反两方面的评论意见,减少观看影视或者选择读物时的盲目性。
随着大量图书的出版和大量电影的上映,可供读者和观众利用的资源越来越多,但由于同类图书或电影过多,致使读者和观众难以选择。信息化的快速发展和Web 2.0、Web 3.0等社交网络的兴起,越来越多的用户利用互联网记录自己对事物的评价,比如各种电影网站、读书网站等,这样就形成了庞大的评论数据集。以豆瓣网为例,截止到2017年,豆瓣读书评分9分以上,且评价数超过1000的作品至少有1000多本。基于庞大的用户群产生的大量的评论信息,用其他读者对图书的评价和感兴趣程度为读者提供阅读推荐,成为推广文化、提高图书阅读率的一种重要手段。因此,基于书评或影评的文化产品推荐是一个具有实际应用价值的研究。
根据目前主流的趋势,推荐系统主要分为以下几种:基于内容的推荐、协同过滤推荐、基于知识的推荐等。其中,协同过滤推荐算法是目前应用最广泛的推荐算法,一般分为两类:基于用户的协同推荐和基于物品的协同推荐。然而,现有的推荐系统大多不考虑用户的情感特征。而相关研究成果[15]表明,情感对用户行为和喜好的决定有着非常重要的作用,在信息推荐过程中充分考虑用户的情感倾向可以更好地适应用户的个性化需求,以更好地实现个性化推荐服务。
对于特定领域,比如电影,会有很多专有的特征词,以及特有的评价情感词,如何获取这些领域特有的特征词和情感词,是特定领域情感分析的关键。比如,Turney在文献[16]中提到情感词“unpredictable”在电影领域的评论中可能是褒义的,说明情节跌宕起伏,不容易猜到结局;而在汽车领域的评论中则可能是贬义的,如果汽车任何一项功能不可预测则会险象环生。因此,在针对特定领域进行情感分析时,要充分考虑领域依赖性。
1.3.3 社会管理
从社会管理的角度看,情感分析能够帮助管理者更快地了解群众对各类管理措施的意见,从而根据群众反馈对管理措施进行调整和修改;政府部门可以借此了解各个方面的公众舆论和社会意见,妥善对待网络舆情,这对准确把握社会脉搏,建设和谐社会有着重要意义。
从古代的“防民之口甚于防川”,到现在网络时代的“每个人都有了自己的麦克风”。互联网为社情民意的表达提供了平台,体现用户意愿、评论和态度的网络舆情也愈发受到重视。所谓网络舆情,就是对社会热门问题持有不同看法的网络舆论,是社会舆论的一种表现形式,也是公众通过互联网对现实生活中某些热点、焦点问题发表具有较强影响力、倾向性的言论和观点。网络舆情的两个重要特点就是网络非理性情绪和群体极化。许多非理性的情绪,如仇富、仇官、反权力、反市场等,借助暴力性和娱乐化的网络表达强化,使得人们变得更加情绪化和极端化。网民的非理性情绪,对社会稳定有潜在威胁,值得警醒。另一种特征“群体极化”是由美国教授Cass R. Sunstein提出的,就是“团队成员一开始就有某种方面的潜在倾向,在讨论之后,人们朝着所倾向的方向继续移动,最后形成极端的观点”。例如,最初群体中成员的意见都比较保守,在经过了群体的商议后,决策就可能会更加保守;相反,若个体成员意见倾向于冒险化,则经商议后的群体决策就可能会更趋向于冒险。舆情分析就是通过收集和整理民众态度,发现相关的意见倾向,从而客观反映出舆情状态。社会的安全管理需要不断关注网络舆情动向,并及时正确引导网络舆论方向,保证社会的长治久安。然而,各种渠道得到的信息庞杂,只靠人工方法进行甄别无法应对海量信息。因此,研发精确有效的情绪分析系统,实现对舆情信息的自动处理,对维持社会稳定有着非常重要的意义。
1.3.4 信息预测
情绪分析在态势预测中扮演着重要的角色。在美国大选期间,通过挖掘和分析民众在Twitter上对各竞选团队的评论[17],制定针对摇摆州(美国大选中的一个专有名词,指竞选双方势均力敌,都无明显优势的州)的特定宣传政策,从而提高己方的民意支持率。在2011年意大利议会选举和2012年法国总统大选过程中,用情感分析计算出了政治领导候选人的Twitter支持率[17],对选举预测具有重要意义。情感分析还可用于对政策性事件的民意预测,比如延迟退休的年龄等,为国家相关政策的制定提供辅助支撑。随着信息预测的应用内容越来越丰富,情感分析技术愈发受到重视。情感分析技术通过分析互联网新闻、博客等信息源,可以较为准确地预测某一事件的未来走势,无论是在政治、经济领域,还是在日常生活中,都具有重大意义。
情感分析在金融预测中也有着巨大的应用潜力,引起了研究者们的兴趣。美国印第安纳大学和英国曼彻斯特大学的学者发现一个有趣的现象[18]:Twitter可以从一定程度上预测3到4天后的股市变化。他们将情绪分为冷静、警惕、确信、活力、友善和幸福六类,若将其中的“冷静”情绪指数后移3天,竟与道琼斯工业平均指数(DJIA)惊人的相似。研究者们推测:在股票市场中,微博上对某只股票的议论可以在很大程度上左右投资者的行为,因而进一步影响股市变化的趋势。
2012年5月,世界首家基于社交媒体的对冲基金Derwent Capital Markets在屡次跳票后终于上线。它会即时关注Twitter中的公众情绪进而指导投资。基金创始人Paul Hawtin表示:“长期以来,投资者普遍认为金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。”Twitter每天浩如烟海的推文,使得一直为金融市场的非理性举动所困惑的投资者,终于有了一扇可以了解心灵世界的窗户。基于Twitter的对冲基金Derwent Capital Markets在首月的交易中已经盈利,它以1.85%的收益率,让平均数只有0.76%的其他对冲基金相形见绌。类似的工作还有预测电影票房等[19],均是将公众情绪与社会事件对比,发现一致性,并用于预测。
1.3.5 情绪管理
用户在微博、社区和论坛中的社交活动都是现实生活对网络社会的映射,这些社交网站中储存了大量的用户个人言论。由于用户的情感与其所关注的话题通常具有较强的相关性,分析用户发布的言论可以较为准确地获得人们的生活状态和性格特点。Golder等人[20]通过研究Twitter用户在昼夜和不同季节所展现的情绪节奏[20],包括用户在工作、睡觉等不同时间段内表现的情绪,绘制出心情曲线,从而了解人们的精神状态。Kim等人[21]通过研究也发现人们的情绪在6点、11点、16点和20点达到了高峰[21],并总结了用户一天中的情绪总体走向。利用这些研究成果,公司可以了解员工的工作状态,从而更有效地制定工作计划。此外,Zhou等人[22]对不同行业名人的微博进行分析[22],统计名人所发微博中各类情绪的比例,分析出不同名人的性格、关注点和个人喜好。随着时代的进步和社会的发展,人们对自我关注的需求不断提高。通过对用户进行情感和情绪分析可以让用户更加了解自我,从而找到更加适合自己的方式去学习、工作和生活,情绪管理领域在未来将拥有更广阔的应用市场。
1.3.6 智能客服
随着人机交互技术的进步,对话系统正逐渐走向实际应用,尤其是智能客服系统受到了很多企业的关注。近年来,许多中大型公司都已经构建了自己的智能客服体系,例如京东的JIMI和阿里巴巴的AliMe等。智能客服系统旨在解决传统客服需要大量人力的状况,实现在服务效率和服务质量两个维度上的整体提升。初代智能客服系统主要面对业务内容,针对高频的业务问题进行回复解决,此过程依赖于业务专家对高频业务问题答案的归纳整理,主要的技术点在于精准的用户问题和回复内容之间的文本匹配能力。新型的智能客服系统除了解决高频业务问题之外,还需要智能导购能力、情绪预测能力、公关处理能力、娱乐互动能力等。其中,情感作为人类的基本特征,已经在智能客服系统中被重视和应用,比如智能客服系统需要具备一定的共情能力,才能给用户提供更好的交流体验。此外,智能客服系统还可以及时感知用户的负面情绪并转人工服务,从而避免投诉与纠纷。总之,让智能客服更懂人类情感,将提高客户对智能客服机器人的整体满意度。