引言
中国自然地理环境复杂,受季风气候影响显著,自然灾害种类多、频率高、强度大、灾情重。在中国悠久且连续的历史长河中,应对水、旱等各种自然灾害的威胁和挑战始终是社会发展的重要组成部分,相关记载史不绝书,也为现代历史灾害和气候变化研究提供了丰富而庞杂的灾害史料。20世纪20~30年代,竺可桢、邓拓等学者就已开始在挖掘和整理中国灾害史料的基础之上研究中国历史气候变化[3]、灾害史[4]。1949年后,在相关行政管理部门和科研机构的组织或资助下,我国对灾害史料挖掘整理的力度更是前所未有,不同研究团队在全国范围对流传下来的文献史料中的灾害记录和信息进行了大规模的搜集、整理和汇编工作,不仅包括水灾、旱灾、地震、潮灾、疫灾等自然灾害信息,也包括这些灾害的社会影响和人类因应的资料,并形成各种或专门或综合、或区域或全国的灾害汇编资料集。这些资料为相关生产建设和科学研究提供了有效的支撑。随着信息化时代的到来,数字化的灾害史料的挖掘整理更加便捷,被挖掘整理的灾害史料也越来越多,工作重点逐渐转移到如何有效地管理这些已被挖掘整理的灾害史料上。
自计算机技术普及之后,我国学者一直致力于探索如何进行历史灾害大数据的数字化、信息化管理,使其克服纸本资料集或地图集在容纳历史灾害记录方面的局限性,并能够长期、重复地被更多研究者使用,把研究者从查找和摘录原始灾害记录中解放出来,相应的,建设了一批与历史气候变化和灾害相关的数据库。早期的工作主要通过对灾害记录进行数字编码,解决存储空间有限的问题。例如,林振杰和郑斯中于1989年设计了一套编码程式以记录灾害发生的起始时间、地点、灾情种类及严重程度、参考文献等要素,并规定了标准编码表,以对大气圈、水圈、动植物、人类及政府响应等文字描述进行数字编码;[5]郑景云等于1992年针对民国时期的历史档案设计了自然灾害史料数据库的结构,数据库主要包括地点、持续时间、天气状况、受灾程度、受灾范围、收成状况、人类响应措施、文献出处等字段,并提出对灾害史料逐条分解和统一编码的方法;[6]王静爱等于1995年论述了中国自然灾害数据库的建立与应用,该数据库由中国自然致灾因子数据库、中国省级报刊所载自然灾害(1949~1990)数据库、中国农村自然灾害灾情数据库、中国历史自然灾害数据库和中国行政区划(县级单元)空间数据库五个子数据库组成。[7]后期的数据库基于地理信息系统(GIS)技术,兼顾资料与数据的存储、检索、处理和空间分析功能,例如,国家气象局建设的“中国历史气候基础资料系统”、中国科学院地理科学与资源研究所建立的“历史环境变化数据库”[8]、中国水利水电出版社的“中国经典水利史料数据库”[9]等。这些数据库或在灾种选择方面较为有限,主要集中于水灾、旱灾、地震等几种重大灾害;或在史料来源方面有一定的局限性;或在自然与社会要素之间各有侧重。大体来说,已有的数据库,在数据库设计思路、子数据库结构、史料信息的字段编码处理、数据库功能等方面为未来的数据库建设提供了很好的借鉴和基础,但在灾害史料的丰富性与均一化处理、更完善合理的数据库结构、灾害指标序列的提取、自然灾害本身与人类响应过程信息的融合等方面仍有进一步探讨、发展的空间。主要表现在:(1)已有数据库,其目标所指均非灾害研究,因而在资料的取舍方面各有侧重;(2)数据源各不相同,所据资料或以自行整理的史料为主,或以他人的工作为前提,都有较大局限性;(3)现有数据库建设中未能体现资料校核、考证和比勘的过程,原始资料一经录入,一般不再进行校核、考证;(4)从原始资料整理到数据库之间缺少一个过渡环节,即原始文献资料的信息集成,难以实现真正的资源共享,形成资料基础的累积性机制。[10]
依托国家社科基金重大项目“清代灾荒纪年暨信息集成数据库建设”(No.13&ZD092),中国人民大学清史研究所、北京师范大学地理科学学部、中国政法大学人文学院和南开大学历史学院等,以清代为中心,联合设计研发了“清代自然灾害信息集成数据库”。该数据库借助地理信息系统(GIS)和网络技术,集多源史料、科学处理、开放共享等多元功能于一体,全面收录涵盖灾害发生完整过程的记录和信息,亦即包括从天气、地质等自然变异现象到成灾过程,乃至对人类社会影响较大的综合性历史灾害大数据,能够更好地满足大数据时代下对历史自然变化(如气候变化)、灾害分异、灾害影响与应对、防灾减灾应用等多方面研究的资料需求。[11]