1.2.3 数据互联的发展与困境
从1.2.2节的案例中可以看出“数据孤岛”现象对人工智能的进一步发展产生了负面影响。鉴于此,不同国家的政府、大型企业和组织正在试图打破“数据孤岛”的壁垒,进行数据互联以获得更为丰富的数据,促进自身发展。数据互联技术在不同领域之间发展得参差不齐,依旧面临许多亟待解决的问题。本节将以医疗、金融、教育领域为例,详细地讲解数据互联共享的发展与困境。
1.医疗领域
健康医疗大数据作为基础性战略资源,得到了全世界各国政府的重视:欧美、日本等较多国家都已将其列为大力发展的战略领域。我国发布的《“健康中国2030”规划纲要》明确提出“推进健康医疗大数据应用”。2016年,国务院办公厅发布的《关于促进和规范健康医疗大数据应用发展的指导意见》指出,要大力推动政府健康医疗信息系统和公众健康医疗数据互联融合、开放共享。医疗领域的数据互联可以分为三类。①政府主导的互联互通。例如,英国政府主导的英国国民健康服务(National Health Service,NHS)的信息网络NHS.net、加拿大政府创建的全国性互联互通的电子健康档案系统(Interoperable Electronic Health Records,IEHR)、美国的国家健康信息网络(Nationwide Health Information Network,NHIN)等。但由于缺乏强有力的政策支持以及互联互通的国家技术标准,这些数据互联政策的推进一波三折。②企业主导的互联互通。穿戴设备的出现,让企业采集用户的健康数据变得容易。例如,苹果的Apple Watch、小米手环。不同的可穿戴设备可以收集用户某一方面的健康数据,自动上传并储存在设备制造商的数据库中。但由于竞争关系的存在,不同厂商之间往往缺乏数据互联的意愿,公众健康数据难以被整合,如何最大化其价值仍是难点。③研究机构主导的互联互通。例如,美国的退伍军人健康信息交换(Veterans Health Information Exchange)、印第安纳健康信息交换(Indiana Health Information Exchange)、美国FDA哨点系统(Sentinel)等研究机构都参与了数据互联的项目。但如何实现持续、互联、实时的数据安全性监测,如何处理跨机构、多个来源、具备不同特征的数据,仍是研究机构的核心目标和挑战之一。
2.金融领域
金融数据的互联共享,正引发全球金融领域的变革,各国政府都纷纷推出相关法律促进金融数据共享。英国政府竞争和市场委员会(Competition and Markets Authority,CMA)于2016年主导了Open Banking计划,鼓励银行业数据互通,并于2018年开始在英国各大银行逐步实现;欧盟于2016年通过PSD2(Payment Service Directive 2)法令,规定从2018年1月13日起欧洲银行必须把支付服务和相关客户数据开放给第三方服务商。美国消费者金融保护局(Consumer Financial Protection Bureau,CFPB)于2016年11月就金融数据共享广泛征求社会意见,并于同年10月发布金融数据共享的9条指导意见;澳大利亚于2017年8月发布Review into Open Banking in Australia(Issue Paper),规划了金融数据共享的宏伟蓝图。新加坡、韩国、日本等国也纷纷推出金融共享的战略计划,希望通过金融数据共享推动传统银行、金融科技公司更深层次的协作和竞争,最终追求用户利益最大化。
3.教育领域
教育领域的数据互联也不断发展,但依旧面临诸多难题。2014年1月,为促进高等教育不断进步,美国教育部等机构联合开放教育数据。2014年3月,欧盟正式启动为期两年的OpenEdu项目,旨在研究开放教育战略。共建共享教育数据,再通过互联网整合和优化配置,这些举措让优质教育资源形成一种流动的良性循环,使更多群体从中受益,但是教育数据的共享互联依旧面临着数据隐私、数据安全等问题。
面对数据互联共享的诸多难题,联邦学习无疑是一把利器。它可以建立起事前发现和事后干预的风险识别模型,帮助我们破除“数据孤岛”问题的负面影响,并针对金融领域、互联网领域高发的职业信贷欺诈、网络刷单、非法套利等违规行为对症下药,从根本上解决“数据孤岛”问题。对于用户而言,“数据孤岛”的破解可以使个体得到全方位的金融数据评估,有效资产配置和规划不再受限;对于企业而言,完整、全面的数据结合大数据分析和人工智能等先进的技术可以帮助企业挖掘出新的商机与数据价值;对于社会而言,数据数量和质量的提高提升了机器学习、人工智能项目的效果上限,社会更加智能化。联邦学习的出现,对“数据孤岛”的破除,可以帮助用户、企业、社会达到多方共赢的局面。
在1.2.4节中,我们将进一步解读联邦学习在解决“数据孤岛”问题上发挥的具体优势。