1.5 机遇和挑战
随着大数据时代的到来,网络上积累的信息资源越来越多,信息总量呈指数级增长。与此同时,随着多媒体融合、深度学习发展、特定主题挖掘和多语言协同等研究热点的兴起,给文本情感分析带来了新的挑战和机遇。
(1)面向大数据的文本情感分析
大数据技术的发展使数据的收集变得非常容易且成本低廉,对海量的信息数据进行挖掘,可以获得巨大的产品或服务价值。然而收集的数据大多以非结构化文本形式存储,且噪声较多,在对文本数据进行情感分析时,主流方法的时间复杂度和空间复杂度较高,难以满足训练大规模数据的需求,需要提出面向大数据的并且具有增量学习能力的文本情感分析方法。
(2)多媒体融合的情感分析
传统的情感分析主要关注文本,然而图片等多媒体通常可以比文本表达更明显的情感状态,即所谓的“一图胜千言”。此外,另一种情感信息表达的主要载体——语音,也可以很好地反应用户的当前情感状态。因此,随着图像、音频等不同类型社交网络数据的不断增长,各种类型的用户数据相结合的研究将具有更好的应用前景。
(3)多语言情感分析
随着文化交流的增加,多种语言的网络信息相互影响与融合。现有工作主要针对单一语言,而在单一语言情感分析中所收集到的训练语料和情感词典,难以在多语言的环境中直接使用。对于多语言情感分析,在解决情感分析任务的基本问题时,还需要借助机器翻译、双语词典等外部资源,很容易引入翻译错误,还有文化偏差等因素的存在,这些都对多语言情感分析提出了更大的挑战。此外,不同语言情感分析的语料资源也存在不均衡性,对于一些低资源语种的情感分析则更加困难。
(4)深层意图理解
虽然目前深度学习在文本情感分析上取得了巨大的突破,然而对人类情感的深层理解仍需要复杂知识的支持,实现从理解字面意思到言外之意的跃迁。比如,在社交媒体中,讽刺是比较常见的表达方式,往往被人们用来表达和文本字面相反的情感。此外,目前的技术还很难捕捉字面之外的深层意图,比如有些话题在当前文本中只字未提却能让人展开丰富联想。要实现深层意图理解,不仅需要对内容发起人进行画像分析,还需要引入常识、事理、心理等各种知识进行推理,是一项更难、更综合的任务。