1.2.6 信息抽取应用
信息抽取是构建知识图谱的核心技术之一,其广泛应用于智慧金融、智慧医疗、智能制造、智慧教育等领域。本节以信息抽取在金融领域的应用为例,进行简单的介绍。
1)智慧金融
信息抽取在智慧金融中的应用可分为金融监管、金融机构应用。金融监管是指国家金融监管机构对金融市场及相关机构与个人的监督管理;金融机构应用是指金融参与者利用知识图谱技术实现的风险预测、智能营销等应用。金融服务是指金融机构面向企业或公众提供的智能化金融服务。
2)金融监管
信息抽取在金融监管领域的应用包括资本市场监管、新型金融智能监管、债券市场风险监管、个人信用反欺诈、反洗钱。基于信息抽取的资本市场监管从企业关系分析出发,探索企业及其关联方在资本市场的行为表现,结合舆情事件的传递效应,构筑资本市场中的知识图谱,全方面识别企业行为风险,实现资本市场的风险监管与预警。基于信息抽取的新型金融智能监管系统紧扣新金融行业特点,运用信息抽取技术构建新型金融企业的实体风险画像,通过对全国所有企业信息的大数据挖掘分析,识别出新金融业态的企业,根据新金融业态企业的行业分类、风险特征、数据维度构建分行业的不同风险类型的特征风险模型,并按照风险指数等级进行分级管理。基于信息抽取的债券市场风险监管通过构建包括债券发行人的产业链上下游关系、投融资关系、债券发行人的信用状况、债券发行人日常经营状况、投融资关系等信息在内的知识图谱,提前判断企业经营效益,推理挖掘隐含的关联方资金占用倾向、洗钱骗税倾向等问题,对可能的违规行为进行提前预警,从而实现对信用评级的及时调整。基于信息抽取的个人信用反欺诈,通过构建已知的主要欺诈要素(包括手机号码、账号和密码、地理位置等)的关系图谱,全方位了解借款人风险数据的统计分析,基于信息抽取挖掘疑似欺诈用户,并对疑似欺诈用户进行规则判定、图谱验证、欺诈判定等,对潜在的欺诈行为做出及时而迅速的反应。基于信息抽取的反洗钱系统充分运用大数据技术中的分析和图挖掘技术,基于客户标签、画像开展客户立体化识别,并结合互联网大数据、第三方场景的数据等进行图层构建,对企业的关联网络特征进行图编码,并基于图层数据搭建目标企业关联概率网络,对图层进行叠加得到知识图谱,对企业关联结构进行深度解析,实现对隐性风险结构及关联主体的深度挖掘,以全息式多维度实时监控企业洗钱风险。
3)金融机构应用
信息抽取在金融机构应用领域的应用包括风险预测、智能投顾与智能投研、智能营销、智能搜索和可视化。风险预测基于多维度的数据建立客户、企业和行业间的知识图谱,从行业关联的角度预测行业或企业在未来可能面临的风险。风险预测包括两部分内容,其一是对潜在风险行业进行预测,其二是对潜在风险客户进行预测。在潜在风险行业预测方面,基于多维度数据对行业进行细分,依托行业信息、贷款信息等数据建立起的行业之间的知识图谱,可以发现不同行业间的关联程度。智能投顾是指根据投资者不同的理财需求,通过算法和产品搭建数据模型,实现传统上由人工提供的理财顾问服务。智能投顾可分为机器导向、人机结合及以人为主三种模式,且人机结合将是投顾未来的发展趋势。智能投研是指利用大数据和机器学习,对数据、信息、决策进行智能整合,并实现数据之间的智能化关联,从而提高投资者的工作效率和投资能力。智能投顾是近年来证券公司应用大数据技术匹配客户多样化需求的新尝试之一,目前已经成为财富管理新蓝海。信息抽取能够整合更丰富、更全面的用户信息,根据精准营销的不同角度设定不同类别的场景标签,通过知识图谱技术提供的分类标准,进行客户的标签化分类工作,建立合理的客户类型初分体系;同时结合黑白名单技术,对客户进行判断,对客户质量进行筛选与把控,并最终实现互联网金融产品推荐、客户准入、客户跟踪管理等高级营销策略。