数据开放浪潮
上QQ阅读APP看书,第一时间看更新

第二章 数据开放发展现状

继美国2009年发布上线数据开放平台之后,数据开放已在全球范围内迅速推进。本章将从宏观上对全球和我国数据开放发展现状进行介绍,勾勒出国际、国内数据开放整体发展水平。

第一节 国际数据开放发展现状

《2018年联合国电子政务调查报告》调查追踪了各国通过政府网站、专门的门户网站和开放式政府数据(OGD)目录向公众提供开放数据的进展情况。2018年,拥有OGD门户网站的国家的数量达到139个,占联合国成员国的72%,与2014年的46个国家和2016年的106个国家相比,进步显著(见图2-1)。

图2-1 2014~2018年全球数据开放平台国家数增长趋势

目前,各国政府已经普遍认识到数据开放的重要性,通过构建国家信息制度和基础信息资源体系,从政策、立法、技术、产业等多个层面对于公共数据开放共享进行系统干预。从世界范围来看,美国在公共数据开放领域一直充当着倡导者和先行实践者的角色。2009年,美国最先建立政府数据门户网站(Data.gov),以促进数据的进一步开发利用。随后,数据开放运动在其他国家迅速发展,英国(Data.dc.uk)、加拿大(Data.gc.ca)、巴西(Dados.gov.br)、澳大利亚(Data.gov.au)、新西兰(www.data.govt.nz)等国家相继建立网站,以便于公众获取公共数据,并将开放公共数据行动纳入国家发展战略。各国开放公共数据的现状如下。

一 门户网站为开放公共数据提供有效载体

各国普遍采取建设统一的开放数据门户网站的做法。比较常见的途径是构建数据收集、管理、开放、查询、下载、再利用的官方平台,如美国、英国、印度、新加坡等。其中,印度、新加坡是在全国范围内统一整合各部门各地区的数据集,简称域名带有“数据”(Data)、“政府”(Gov)字样的国家开放数据门户网站;美国、英国除了拥有全国性的开放数据门户网站外,也有单独的地区性的开放数据门户网站。

二 开放公共数据经济价值日益凸显

通过开放多样化的数据,各国涌现出数据存储、数据托管、数据挖掘、数据咨询等新的数据产业。开放数据满足社会不同领域的需求,推动传统行业的发展。国际经验表明,互联网、商业智能、咨询服务、零售业受益最大,医疗、卫生、交通、物流甚至生物科技、天文等领域也从数据开发应用中获益。开放公共数据为企业带来了新的商业发展机遇。同时,开放公共数据降低了个人创业成本,便利创业渠道,有效推动社会大数据应用创新,为大众创业提供机会。美国Data.gov上线后,美国依托开放公共数据成立了许多大数据初创企业,创造了众多就业岗位,带来了良好的经济和社会效益。

三 数据应用向公共服务领域延伸

公共数据的开发应用有利于改善公共服务。根据公开数据开发的第三方网站或手机应用软件,从公开数据中发现社会需求,通过拓展有关生活、安全和发展等民生类数据集的广度和深度,为公众生活提供全方位的信息支持,使公众分享开放公共数据的红利。政府作为开放公共数据的重要主体,也将开放公共数据行为本身视作服务民生的一种新型手段,增强在公共政策、舆情监控、犯罪预测、反恐等领域的数据能力,提升社会服务能力。

四 开放公共数据政策法规体系逐步形成

各国都在积极建立适合本国国情的开放公共数据政策法规体系。大多数法规明确提出开放公共数据的义务(不包括涉及国家安全内容),并注重个人隐私权的保护。美国采用了成文立法和政策保障双重工具来推进公共数据的开放,以法规形式保障公民的数据权、规定开放公共数据的原则及范围,相关法规包括《信息自由法》《隐私权法》《阳光下的政府法》《电子信息自由法》《数据质量法》《开放政府法》等。英国、日本等国家政府也不断完善开放公共数据的政策法规体系,循序渐进地引导和支持开放公共数据运动。

五 开放公共数据呈现国际协作趋势

各国政府通过成立开放数据联盟,扩大数据存量,实现更大范围的开放共享。例如,2011年9月,美国、英国、挪威、南非、巴西、墨西哥、印度尼西亚、菲律宾八国成立了“开放政府合作联盟”(Open Government Partnership,简称OGP),签署《开放政府宣言》,旨在通过政治领导、技术支持、公共投资,以及政府与社会组织间的协同合作等形式帮助联盟国家加快开放数据进程,推动全球更多的国家和地区的数据开放。

第二节 我国数据开放发展现状

在全球数据开放运动的大背景下,上海市政府大胆尝试,于2012年推出了我国首个公共数据开放平台(https://data.sh.gov.cn/)。在上海之后,我国陆续有北京、湛江等地也建设了自己的开放网站,在2015年国家出台《促进大数据发展行动纲要》(国发〔2015〕50号)以后,全国数据开放平台呈现爆发式增长,从2017年的22个增至2018年的60个,到2020年3月,我国已有109个中央部委、省级、副省级和地级政府上线了数据开放平台。目前各地已经认识到数据开放的价值和意义,正积极推进公共数据开放相关工作,公共数据开放平台建设已成为数字政府建设的标配。国内各地数据开放平台上线趋势如图2-2所示。

图2-2 2012~2020年国内各地数据开放平台上线趋势

注:2020年数据为截至3月的数据。

截至2020年3月,我国已有54.83%的省级行政区、66.67%的副省级行政区和25.52%的地级行政区推出了政府数据开放平台。东南沿海地区的平台已逐渐相连成片,并向内陆地区不断扩散。山东省级及16个地市已推出数据开放平台;江苏省级及南京、无锡、泰州、扬州、苏州等11个地市推出了数据开放平台;广东省级及广州、深圳、佛山、江门、湛江等12个地市推出了数据开放平台;贵州省级及贵阳、同仁、遵义等6个地市推出了数据开放平台。在长三角地区的江苏、安徽、浙江和西南地区的贵州、四川,地级平台不断上线并相连成片。

在建设模式方面,目前,我国省级开放平台主要有两种。第一种是省统一建设,例如山东省是由省级政府建设统一开放平台,为各地市提供数据存储、安全和门户个性化定制的服务,各地市只需要使用省平台统一分配的账户进行开放数据的填报和信息维护工作。这种模式的特点是,建设成本低,标准统一,便于管理,同时对省级平台的统筹协调、技术管理、安全保障等要求较高。第二种是省市独立建设,省、市分别建设各自的开放网站,平台及数据相互之间没有关联,这种模式目前在各地建设开放平台时普遍存在。

在平台功能方面,各地已建的公共数据开放平台基本都包括数据目录预览、数据分类检索、数据详情、数据下载、接口服务、互动交流等功能,部分地方在此基础上,增加了地图服务、数据可视化分析大屏、分析工具、智能客服等功能。在数据检索上,大部分地方的开放平台能够提供基本的数据检索服务,部分省市检索维度丰富,支持按领域、按场景、按主题、按行业、按提供单位、按数据格式、按开放类型等多维度检索,帮助用户快速定位开放数据。在数据获取上,多数省市的数据开放平台需要用户登录注册后才可获取无条件开放数据,提高了用户获取开放数据的门槛。在互动交流上,多数平台支持数据申请、意见建议和数据咨询等功能,但及时反馈用户诉求的省市不多。

在开放数据方面,全国开放数据集总量从2019年上半年的62801个增长到2019年10月的71092个,增幅一成多。开放数据集的容量与2019年上半年相比,增幅约27%。各地平台在数据数量上差异显著,超过三成的地方平台上开放的数据集总量超过1000个,有一成多的平台上开放的数据容量超过1亿个,但仍有近两成的平台上开放的数据容量在10万及以下。在开放数据质量上,约35%的地方平台提供了优质数据集,但优质API接口仍屈指可数,各地提供的API接口普遍存在调用难度高,能调取的数据容量小,更新频率低等问题。在开放数据标准上,开放授权协议仍未得到足够重视,超过四成的地方平台缺少专门的数据开放授权协议,仅有26%的地方平台在提供的授权协议中明确授予了用户免费获取、不受歧视、自由利用、自由传播和分享数据的权利。不到两成的地方平台为数据集标示了多种开放类型,例如普遍开放和有条件开放。只有不到两成的地方平台上开放的数据集全部符合非专属格式的标准。在开放数据覆盖面上,只有不到一成的地方平台开放的数据集覆盖了所有重要主题,只有不到一成的地方平台上开放了所有的常见数据集。来自市场监管部门的数据集总数最多,首次超过统计部门。在开放数据持续性上,能持续新增数据和保持动态更新的地方平台仍然偏少,只有不足一成的地方平台能在近两年半以来的每个季度都持续上线新增数据集。2019年第二、三季度,近四成的地方没有更新数据集。