2.4 自然灾害数据库的特征
自然灾害数据库具备一些基本特征:①数据库的设计与实施要有机制上的保障;② 数据库规范化程度要高,必须有明确的数据收录标准,这样既有利于减少冗余数据,又有助于提高数据的利用效率;③ 数据库需要非常重视国际通用模式,在数据结构、检索条件、查询结果等方面均有统一格式。如查询条件以时间、区域、灾种为主;查询结果显示为表格;以超链接形式查看原始数据等。
(1)数据范式。在数据库理论中,关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。满足最低要求的叫第一范式,简称1NF。在第一范式中满足进一步要求的为第二范式,其余以此类推。一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合(见图2.2)。
图2.2 各种范式之间的关系
自然灾害数据库的数据范式并不完全等同于数据库理论中的概念,更大程度上是规范化的意思,也可以说是满足某些特定条件的一种内在结构。如某一时期内某种自然灾害所造成的损失,这一系列限定因子或实际要求就是自然灾害数据库范式的基本内容。
(2)数据结构。数据结构是计算机存储、组织数据的方式,通常是指相互之间存在一种或多种特定关系的数据元素的集合。一般情况下,精心选择的数据结构可以带来最优效率,这意味着更高的运行或者存储效率,以及高效的检索算法和索引技术。
对自然灾害数据库来说,应重视对灾害发生、发展过程的描述,以及与灾害相关信息的管理,如城市基础设施、社会经济文化、风险意识与交流等。具体的讲,可以为自然灾害数据库设定六个灾害特征类:基本属性、时间、地点、影响、伤亡损失和辅助信息。具体数据结构如表2.1所示。
表2.1 自然灾害数据库的数据结构
(3)时空数据模型。时空数据模型是一种有效组织和管理时空数据,属性、空间和时间语义更完整的地理数据模型。一个合理的时空数据模型必须考虑三个要素:节省存储空间、加快存取速度和表现时空语义。时空语义包括地理实体的空间结构、有效时间结构、空间关系、时态关系、具体事件等。
时空数据模型特点是语义更丰富、对现实世界的描述更准确,其物理实现的最大困难在于海量数据的组织和存取。该技术的本质特点是“时空效率”。当前主要的时空数据模型包括空间事件立方体模型(space-time cube);序列快照模型(sequent snapshots);基图修正模型(base state with amendments);空间时间组合体模型(space-time composite)。
自然灾害数据库需要保存并有效地管理自然灾害数据,必然涉及时空数据的组织与操作,这与时空数据模型的关注点十分吻合。将时空数据模型引入自然灾害数据库中,可以提供静态和动态两种数据建模手段,模拟自然灾害事件的发生和终止,还可以揭示致灾因子与承灾体在时间和空间上的相关性,有效地表达时空拓扑关系。
(4)数据共享机制。自然灾害数据库的数据共享机制可以分为四个层次。即第一层次,全社会免费共享;第二层次,请求应答式共享;第三层次,协议共享;第四层次,有偿共享。在实际应用中,第一和第二层次的共享最为常见,一般的国际级自然灾害数据库都会采用这两种方式。但在一些国家级、地区级以及专业部门的自然灾害数据库中,有时会采用第三层次共享,以保证自然灾害数据只在某一范围内交换和流动。只有当自然灾害数据十分重要或涉密时,才会采取最高层次的有偿共享方式,这种情况只出现于少数自然灾害数据库。