前言
文本情感分析是自然语言处理、人工智能与认知科学等领域的重要研究方向之一。通过计算机自动进行文本情感分析的研究始于20世纪90年代,早期研究以文本情感分类为主,即把文本按照主观倾向性分成正面、负面和中性三类。其中正面类别是指文本体现出支持的、积极的、喜欢的态度和立场,负面类别是指文本体现出反对的、消极的、厌恶的态度和立场,中性类别是指没有偏向的态度和立场。随着互联网的飞速发展,人们越来越习惯于在社交网络上发表主观性言论。社交网络中的大量用户生成数据为情感分析提供了新的机遇,同时也带来了新的挑战。
从内容的角度看,很多言论所蕴含的情感是隐式的,而机器很难从表面文字推理言外之意;从用户的角度看,每个人的性格不同导致情感表达的方式也不同,所以要考虑用户特征进行个性化情感分析,不能一概而论;从语料的角度看,对于低资源领域或者任务,已有的数据驱动模型难以取得令人满意的效果;从鲁棒性和安全性的角度看,现有的深度学习模型很容易受到不易觉察的对抗攻击,从而产生错误的情感预测。因此,传统的文本情感分析方法已经难以满足复杂网络数据的分析需求。此外,随着个性化推荐、用户画像分析、对话机器人等新技术和新应用的兴起,相关的情感分析技术也需要不断升级,从而提供更加智能化、更加人性化、更加共情的情感分析服务。
本书针对以上挑战,全面系统地介绍高级文本情感分析的核心技术与应用实践。本书包括五个部分:第一部分介绍文本情感分析的研究背景、研究现状和基础技术;第二部分从内容语义理解的角度出发,介绍基于隐式表达的讽刺检测技术;第三部分从用户个性化建模的角度出发,介绍多轮对话中的情绪分析技术;第四部分介绍小样本场景下的立场检测解决方案;第五部分介绍对抗攻击场景下的情感分类防御技术。
本书可以为人工智能、机器学习、自然语言处理和社会计算等领域的从业者和科研人员提供一些前沿视野及相关理论、方法和技术,如基于隐式表达的讽刺检测、面向个性化的多轮对话情绪分析、小样本场景下的立场检测等,也可作为相关专业高年级本科生或研究生的参考教材。
由于作者水平有限,因此尽管尽了最大的努力,但书中依然难免存在疏漏和错误之处,敬请广大专家、读者批评指正。
作者
2023年1月