数据可视化:从小白到数据工程师的成长之路
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3 主动公开的数据

随着网络和数据库技术的飞速发展,公开的数据变得简洁而方便,价格越来越低,甚至免费。主动公开意味着数据已经发布于网络上,只要不侵犯国家安全、用户隐私和商业机密,任何团体和个人都可以查看数据,在知识共享许可协议下对数据进行利用和再利用,让开放的数据产生更大的社会价值、经济价值和公共价值。

2.3.1 我国政府数据

2015年9月5日,国务院发布了《促进大数据发展行动纲要》,首次在国家层面推出了“公共数据资源开放”的概念,将政府数据开放列为了中国大数据发展的十大关键工程。《促进大数据发展行动纲要》明确,“2018年底前建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等重要领域实现公共数据资源合理适度向社会开放。到2020年,培育10家国际领先的大数据核心龙头企业,500家大数据应用、服务和产品制造企业。”

依据条例规定,我国政府部门应当主动向社会公开政府数据,任何公民、法人或者其他组织均可以任意查询和使用数据,不受限制。在2015年以前,我国一些地方政府就已经开放了政府数据,如广州市政府数据统一开放平台[20]、北京市政务数据资源网[21]、上海市政务数据服务网[22]等。

随后,北上广等城市开始印发通知,加大开发数据的力度并制定目标。2016年8月3日,北京市人民政府印发了《北京市大数据和云计算发展行动计划(2016—2020年)》的通知,提出“到2020年北京市要实现公共数据开放单位超过90%,数据开放率超过60%。”2016年9月15日,上海市人民政府印发了《上海市大数据发展实施意见》,确立了上海大数据发展目标是“到2020年,政府数据服务网站开放数据集超过3000项、建成3家大数据产业基地、培育和引进50家大数据重点企业、大数据核心产业产值达到千亿级别。”2017年1月7日,广州市人民政府发布了《广州市人民政府办公厅关于促进大数据发展的实施意见》,明确提出“促进数据资源共享开放流通,释放重要生产力,加快政府数据汇聚共享,释放政府数据红利,鼓励社会数据共享共用,促进商业数据交易流通。”我国部分政府开放数据资源见表2.3。

表2.3 我国部分政府开放数据资源

随着国家和政府对数据开放的重视,开放数据的应用开始逐渐增多。2015年,在中国工业设计研究院、开放数据中国、上海交通大学、复旦大学、美蒽朗公司等机构的合作下,与上海市政府协作,以政府—社群共建的模式推出了上海开放数据应用创新大赛(SODA)。

虽然我国对政府数据开放工作非常重视,但因为数据的搜集、整理、核实和发布等需要大量的工作,所以我国全面的、各级政府数据开放还需要一定的时间。政府开放数据的维护也是一项日常工作,需要专门的技术人才完成。

虽然我国的政府数据开放工作还在进行中,但我国的专项数据发展得较早,可以通过这类网站获取相应的数据。例如,我国天气类数据可以通过国家气象数据中心[23]、中国气象局公共气象服务中心[24]、中国环境监测总站[25]等,以及各省、市、自治区气象部门的网站获取。

2.3.2 国际组织数据

国际组织主要涉及国家层面的数据。常见的国际组织包括联合国及其下设机构、世界经贸组织、世界银行或者比较专业、有针对性的国际组织等,见表2.4。

表2.4 常见国际组织数据资源

2.3.3 科研机构及第三方数据公司

随着数据再利用方法的多样化及效率的提高,科研机构及第三方公司也在搜集和开放数据。很多科研机构和大学建立了数据平台,如百度数据开放平台(是百度公司基于百度网页搜索的开放平台)。数据堂公司提供语音、图像、文本、交通等多种数据,且可以根据用户需求提供定制化收费数据服务。

表2.5 常见科研机构及第三方数据资源