2.3.3 大数据的应用案例
大数据无处不在,应用于包括智慧城市、金融、医疗、汽车、餐饮、电信、能源和娱乐等在内的社会各行各业。下面介绍面向智慧城市数据融合共享的大数据治理平台、蚂蚁金服“数巢”大数据智能服务平台、某公司AEOS运营管理平台以及咸阳市精准扶贫大数据平台。
1. 面向智慧城市数据融合共享的大数据治理平台
(1)平台介绍 大数据治理平台立足于国内智慧城市建设需求,采用开放、先进的互联网和大数据技术,遵循国家智慧城市顶层设计指南数据架构标准和信息技术服务治理数据治理规范设计,构建从数据采集、治理、融合到应用再生产的闭环式全生命周期管理,并利用大数据资源服务总线技术构建跨部门和跨业务的资源服务体系,充分发挥城市大数据资源的服务能力,为城市决策和各委办局构建具有实战应用价值的大数据应用,为办公协调应用、决策保障应用、政务服务应用、社会管理应用、民生服务应用和企业服务应用提供数据服务技术支撑。
(2)平台内容 平台主要完成以下内容:
1)数据采集。采用统一的信息资源标准和技术规范标准,建设多元数据采集系统,支持将政务数据、行业数据、互联网数据和其他各类不同来源的数据资源采集并存储到数据全图,为数据挖掘和数据共享提供基础资源。
2)数据全图。包括各类数据汇聚形成的归集库、标准化和“一数一源”梳理后的中心库,以及数据加工处理后生成的各类基础库和主题库数据资源;提供城市级数据全图,扩大数据采集范围,实现全市的跨部门、跨平台和跨应用系统的数据采集;全面整合结构化数据及半结构化数据,实现分布式、异构、异源数据的集成整合,为数据的互联互通及数据驱动应用智能化提供支持。
3)数据治理管理平台。实现对汇聚到大数据平台的数据进行集中治理和管控,针对数据特点,内置7种建库标准,包括字段标准、元数据模型、数据质量标志等,并基于标准管理子系统,加强了数据标准化和统一化;通过数据稽核,对已经接入的数据进行稽核,保持数据的完整性、一致性、准确性和时效性;通过元数据管理的血缘/影响分析功能,快速定位数据问题,加强了对数据处理流畅的管控;内置5种核检维度和30多个质量校验规则,通过数据质量子系统为数据管控能力及数据质量的提高提供长期稳定的服务和支撑,促进数据价值的发挥。
4)数据资源目录。针对所有委办局、资源中心已有和生成的数据资源统一编目形成的数据资源目录,用于数据检索、共享、开发使用与管理;实现自动化数据资源发现及主动数据资源注册功能,并提供智能判断资源的唯一性和资源质量,确保数据资源的质量;支持自动编目和手工编目,实现对目录服务中心的目录内容和目录服务运行的管理;通过自动化接口封装,对共享库中的数据进行快速封装并提供应用,形成数据共享支撑能力;通过数据共享门户,对数据字典、数据名目、数据来源情况和数据调用情况等,进行统一可视化展示。
(3)应用成果 为了有效解决企业扶持资金重复申报,申报后效果难以追踪的问题,构建统一的高质量大数据中心势在必行。通过汇集融合全委38套业务系统数据,并融合多个部门的数据,结合互联网数据构建统一的法人库和项目库,通过大数据治理平台构建统一的数据标准、统一的数据融合机制和数据质量评价机制,并通过平台化进行落地保证,支撑项目申报唯一性自动识别,企业项目资助后持续跟进效果评估,确保政府扶持资源使用效率和效果。
大数据治理平台助力主管部门实现了“一体高效运行”,即将原3个信息系统整合为一体的智慧服务平台。从数据采集和归集分析应用,对数据全生命周期进行高效治理,为“信息孤岛”的打通以及实现“一数全面汇聚”奠定了坚实基础。
2. 蚂蚁金服“数巢”大数据智能服务平台
(1)平台介绍 蚂蚁金服“数巢”大数据智能服务平台(以下简称数巢智能服务平台)可以在安全、可信、公允的数据环境中完成数据共享,解决了数据共享与隐私数据保护的问题;并能够提供数据交换、数据连接、数据加工、数据挖掘等一站式数据服务能力,覆盖了大数据探索和研究的全链路需求。
数巢智能服务平台的技术架构如图2-14所示。
该平台上线以来,帮助金融机构进一步释放了数据价值,产生了较好的经济社会价值。
(2)平台的技术创新点 数巢智能服务平台帮助不同机构在满足用户隐私保护、数据安全和政府法规的要求下进行数据联合使用和建模,破解了数据共享和隐私保护难以平衡的难题,打破了数据孤岛,发挥了数据核变效应,具体有以下功能创新点:
1)防止数据滥用。基于安全沙箱、多方安全协议技术、可信执行环境技术和远程认证技术,确保数据只能按约定好的行为进行使用,避免数据滥用。
图2-14 数巢智能服务平台的技术架构
2)隐私保护。基于SGX硬件加密技术、可信计算集群化技术和主键保密技术等,确保数据无法被平台或者其他参与方窥探,避免隐私泄露。
3)易用性。多数据源接入、实现可视化建模、模型一键发布部署以及完备的应用程序编辑接口可支持发起训练任务等。
(3)平台的应用实践情况 数巢智能服务平台通过多方数据安全高效融合共创的方式,全面连接数据、渠道、客户及合作伙伴等创造商业价值。
在银行业应用中,数巢智能服务平台搭建了一套基于多方安全计算技术下的数据融合、联合建模以及模型发布一体化平台方案,为蚂蚁微贷与银行的合作提供更完备的大数据风控能力支持。该联营合作模式,在具备用户端授权及隐私数据受保护的前提下,实现了双方丰富变量的融合建模,帮助银行提升了风控效果以及数据处理的能力,符合政策监管要求,助力行方实现科技自主。
在保险行业应用中,数巢智能服务平台为蚂蚁保险与传统保险公司的联合运营提供精准权益策略,提供高风险识别率的安全合规共享环境,孵化的车险可以显著提升车险的差异化权益能力,在通过用户购险前的授权条件下,帮助保险制定更好的销售策略。从车险定价模型实际评测的效果看,通过双方和其他合作方数据,车险根据“从人”(从车主信息)因素能够细分为不同风险的用户,对车主进行精准画像和风险分析,实现“千人千面”的精准权益策略。
3. 某公司AEOS运营管理平台
(1)平台介绍 流程是主线,数据是核心,集成是关键,应用是目的。以AEOS运营管理体系为指导,梳理公司关键业务流程,运用数据仓库和大数据分析等手段提高数据的关联重用与价值挖掘。基于数据驱动业务的原则,建成了一套面向公司决策层、车间管理层和生产业务层于一体的运营管理平台,将管理要求真正输送到末梢。同时,开展了航空发动机动态关键路径分析、零件期量标准计算与优化、安全库存动态预测等大数据分析应用,有针对性地调整和优化了生产业务过程,达到了提质增效的目的。
某公司AEOS运营管理平台架构如图2-15所示。
图2-15 某公司AEOS运营管理平台架构
(2)平台实施内容和效果 平台实施内容和效果如下:
1)构建业务主题数据库,逐步实现企业数据资产管理与建设。以工业互联网和业务运营数字化为基础,参考《信息技术大数据参考架构》和《信息技术数据质量评价指标》等国家标准,通过采集、清洗、整合产品的结构化和非结构化数据,建立基于大数据存储计算架构的业务主题数据仓库和数据集市,建设公司企业级的数据中心,全面将数据作为资产展开管理,以经营管理、产品设计、生产制造、供应商管理和服务保障业务为分析目标,发挥数据的价值,将数据变为信息、变为知识,提高决策准确性和预见性。
2)梳理公司共性业务,打造公司级一体化业务平台。同一个公司的不同车间、不同加工中心,业务也不尽相同,各中心为满足自身业务所需,建设了各自的业务系统,造成了现阶段烟囱式的信息化架构。通过对公司各加工中心的共性与个性的业务进行统筹与拆分,将共性业务汇聚,构建了覆盖多个加工中心的一体化业务应用平台,集中将共性的、关键的业务数据和分析过程统一调用展示,更好地沉淀和整合了业务能力,增加了分析服务的重用。
3)利用大数据技术开展工业大数据应用试点。通过零件生产周期相关数据的积累、统计和挖掘,优化公司生产周期期量标准,指导生产计划精确排产和异常订单追溯。一方面,将发动机业务信息与订单交付周期进行关联梳理统计,利用大数据可视化技术,建立产品关键路径动态分析展现方法,实现某类型发动机及单台发动机动态关键路径识别与剩余加工周期分析,帮助生产管理人员准确识别管控关键点,及时调整生产管控策略。另一方面,根据需求量、供应商交付周期和期望服务水平,分析当期库存对生产需求的满足情况,构建基于业务机理指导的安全库存预测模型,有效减少生产缺货情况,实现了库存的精细化管理。
随着公司信息化应用的不断深入,数据已成为其重要资产,是未来面向智能工厂转变的重要基础。基于数据建立的运营管控平台将不断向横向与纵向扩展,直至覆盖公司全部经营管理、产品设计、生产制造、供应商管理和服务保障等各个业务领域。项目的落地实施为行业内AEOS运营管理体系实施做出了示范,支持向国防装备精密制造型企业进行应用推广。
4. 咸阳市精准扶贫大数据平台
(1)平台背景 咸阳市积极响应国家号召,将脱贫攻坚作为首要政治任务和第一民生工程,大力推进精准扶贫,打造全市统一的“精准扶贫大数据平台”,解决了扶贫基础数据掌握不全面、扶贫对象识别不准确、帮扶施策不科学、缺乏动态监管和智能分析等问题,脱贫工作取得显著成效。
咸阳市精准扶贫大数据平台业务场景如图2-16所示。
图2-16 咸阳市精准扶贫大数据平台业务场景
(2)平台建设 为实现“六个精准”,咸阳市精准扶贫大数据平台一方面需要采集全市各类扶贫基础数据,另一方面需要汇聚公安、财政、教育、人社、卫生、民政、住建和国土等相关部门业务数据,再将两类数据进行比对,围绕咸阳市建档立卡贫困户进行逐人核查,从而发现存在矛盾数据的贫困户,将这些问题分发到镇到村,安排人员跟踪核查问题,确保实际情况与“国网系统”记录、纸质档案、贫困群众口述和帮扶队员掌握情况“五个一致”。
咸阳市精准扶贫大数据平台界面如图2-17所示。在贫困户筛查的过程当中,数据发挥了核心作用。
(3)平台的创新应用 围绕“精准识别、精准投放”的工作思路,平台将陕西省政务云平台区块链数据服务引入精准扶贫,各部门数据无须上传至中心数据库,使用沙盒模式比对数据,获取结果后沙盒数据自动销毁,最大限度地保障数据安全使用,保证数据权属不变。
同时,对“精准扶贫”从认定、帮扶,到施策、脱贫的全流程都记录在区块链上,不可篡改,方便业务部门对扶贫工作全面监管,防止弄虚作假、徇私舞弊。针对贫困原因,对扶贫资源进行针对性按需投放,从根本缓解致贫因素;扶贫资金的使用可追溯,使扶贫更加精准、高效、透明、公正。
图2-17 咸阳市精准扶贫大数据平台界面
咸阳市精准扶贫大数据平台逻辑架构如图2-18所示。
图2-18 咸阳市精准扶贫大数据平台逻辑架构
(4)平台实施效果 通过精准扶贫大数据平台的应用,咸阳市将社保、工商、税务、银行和公安等15个部门的67项数据上链,实现扶贫信息全程可溯、可管、可控,精准定位贫困户42155户,贫困人口123379人;实现扶贫资金低成本、高效率覆盖;通过人工智能筛选比对,发现问题数据55577条,与扶贫办等部门对接反馈相关结果,全面核查整改。政务云+区块链+人工智能的数据共享应用模式,服务了咸阳近500万人口,市县镇三级720多个部门,这一平台是运用大数据解决百姓民生难点、痛点问题,化解社会关注的焦点、热点工作的有效手段,能够起到积极推动和促进为民服务水平、提升社会治理能力的双重作用。