1.3 地理信息系统(GIS)
1.3.1 GIS的概念
GIS(Geographic Information System)即地理信息系统,是以地理空间数据库为基础,在计算机软、硬件的支持下,用于空间和地理有关的数据的采集、存储、提取、检索、分析、显示、制图,实现综合管理和分析应用的技术系统。GIS 可应用于测绘、勘探、管线、水利、环保、军事、资源利用、城市规划和管理、土地利用与管理、自然灾害预测、人口统计等领域。GIS 是空间数据的管理系统,是空间数据和属性数据的综合体。它可以管理海量数据,浏览、查询,进行空间分析(路径分析、包含分析、断面分析、格网分析、专业分析、生成数字模型、制图等)。从系统论和应用的角度出发,地理信息系统被分为4个子系统,即计算机硬件和系统软件、数据库系统、数据库管理系统,以及应用人员和组织机构。
GIS 融合了多门学科成果,包括计算机科学、地理学、测绘遥感学、环境科学、城市科学、信息论、应用数学、管理科学等。它的主要任务是空间分析,具有知识维、逻辑维、时间维的三维结构。从学术观点来看,人们对 GIS有三种观点[2]:地图观,数据库观,以及空间分析观。它们分别来自景观、制图学派,计算机学派,地理学派。而GIS的空间分析功能是它与CAD、MIS等系统的主要区别之一,也是GIS理论和技术方法发展的动力。
1.3.2 GIS的发展与应用现状
GIS始于20世纪60年代的加拿大与美国[10] ,而后许多国家相继投入了大量的研究工作。1963年,加拿大学者R. F. Tomlinson首先提出了地理信息系统这一概念,并开发出了世界上第一个地理信息系统(CGIS)。随着计算机软、硬件和通信技术的不断进步,地理信息系统的理论和技术方法已得到了飞速的发展,其研究和应用已渗透到自然科学及应用技术的很多领域,并日益受到各国政府和产业部门的重视。自20世纪80年代末,地理信息的处理、分析手段日趋先进,GIS技术日臻成熟,已广泛地应用于环境、资源、石油、电力、土地、交通、公安、急救、航空、市政管理、城市规划、经济咨询、灾害损失预测、投资评价、政府管理和军事等与地理坐标相关的几乎所有领域。
中国地理信息系统协会(GIS协会)于1994年4月25日在北京成立。1996年在美国成立了开放地理信息联合会(Open GIS Consortium,OGC),现有十几个国家的100多个成员,主要研究和建立了开放式地理数据交互操作规程(Open Geodata Interoperability Specification,OGIS)。美国ESRI是目前唯一支持全系列操作系统的GIS厂商,其ArcGIS系列是当今世界最完整的全系列GIS平台,包括ArcInfo、ArcEditor、ArcⅤiew、ArcExplorer、ArcIMS、ArcSDE、ArcServer、ArcGIS Engine、MapObjects 等;美国的 MapInfo 公司的 MapInfo Professional、MapInfo ProServer、MapInfo MapX、SpatialWare等;制图和GIS分析软件AutoCAD Map2000;美国Intergraph MGE大型GIS系统等。我国的GIS软件,有TITAN GIS系列,GeoStar系列,MapGIS系列,GROW企业级GIS应用平台,SuperMap系列,MapEngine系列等。
经过“九五”科技攻关,国产地理信息系统软件产品和软件产业从无到有,从小到大,取得了长足的进步。在地理信息系统软件平台方面,“九五”期间已经成功研制开发了两个成熟的基础软件产品和一个应用开发平台,在市场上占有一定的份额,有相当的知名度。例如,基础软件TITAN GIS可对数字、文字、地图、遥感图像、GPS定位数据等多源地学数据进行有效的采集和一体化管理、综合空间分析和可视化表示,已经形成了一个完整、成熟的地理信息系统基础软件,每年销售上百套。整体水平与国外同类软件相当。特别是它的空间分析性能,较国外优秀软件有明显的优势。又如,基础软件GeoStar 具有面向对象的空间数据管理,包括数据采集、转换、处理、查询、分析、制图等功能。它的DEM处理能力,在精度方面已经超过国外同类优秀软件,在我国1∶10000七大江河流域DEM数据生产上发挥了重要的作用。除了基础软件,AM/FM应用开发平台 Grow 具有大数据量管理和高效的实时三维显示,具备动态拓扑实时重构、面向对象建模、支持网络浮动用户管理与设备全生命周期管理、与实时通信底层紧密耦合等。AM/FM 领域特殊要求的功能,可以在广域环境中组织多级分布式多用户协同工作,整体技术上达到国际先进水平,在多次与国外软件竞标中获胜。在空间数据获取和加工生产方面,数据加工软件TITAN ScanIn、Geoway、EPS2000系列和数字正射影像处理软件TITAN Image、PhotoMapper等支持地图扫描数字化、野外直接采集数字化地理数据、利用卫星和航空遥感图像生产数字正射影像图,形成了完整的空间数据采集、加工生产平台,基本上占领了我国空间数据生产方面的地理信息系统软件市场。在地图出版领域,国产地图出版软件“方正智绘”和MapCAD在功能和性能上已经超过了国外同类软件,牢牢地占据了国内工程地图出版市场。此外,在地理信息系统互联网应用方面,国产软件已经填补了国内在这一领域的空白,已经广泛地应用于国内地理信息发布、交通旅游、房地产销售和物流配送等方面,在奥运申办、数字北京、昆明世博会等工作中产生了很大的影响。GeoBeans、Geosurf、AF InternetGIS等是其中的佼佼者。另外,大型组件式GIS软件TITAN GIS等已形成了GIS软件系列,尤其适于作为二次开发平台。
1.3.3 GIS的发展趋势
GIS 发展的重要趋势是与全球定位系统(GPS)和遥感(RS)的集成,从而构成实时、动态的GIS。GPS为GIS的快速定位和更新提供手段,遥感技术的多谱段、多时相、多传感器和多分辨率的特点,为 GIS 不断注入“燃料”,反过来又可利用 GIS 支持从遥感影像数据中自动提取语义和非语义信息。
3S技术整体结合所构成的系统是高度自动化、实时化的GIS系统。这种系统不仅具有自动、实时地采集,处理和更新数据的功能,而且能够分析和运用数据,为各种应用提供科学的决策咨询,并回答用户可能提出的各种复杂问题。GIS 技术依托的主要工具和平台是计算机及其相关设备。进入20世纪90年代以来,随着计算机技术的发展,计算机微处理器的处理速度越来越快,性能价格比更高,其存储器能实现将大型文件映射至内存的能力,并且能存储海量数据。此外,随着多媒体技术、空间技术、虚拟实景、数字测绘技术、数据仓库技术、计算机图形技术、三维图形芯片、大容量光盘技术及宽频光纤通信技术的突破性进展,特别是消除数据通信瓶颈的卫星互联网的建立,以及能够提供接近实时对地观测图像的高分辨、高光谱、短周期遥感卫星的大量发射,这些为GIS技术的广泛深入应用展示了更加光明的前景。同时,也使当前的GIS无法满足信息时代、数字时代的要求,目前GIS总体上呈现网络化、开放性、虚拟现实、集成化、空间多维性、数据标准化、系统智能化等发展趋势。
随着计算机硬件性能的提高以及面向对象、网络和数据挖掘等主流IT技术的发展,在科技部有关部门的倡导下,目前国内学术界又提出了第4代GIS技术[11]的概念。第4代GIS技术将主要包括以下特点:
(1)支持“数字地球”或“数字城市”概念的实现,从二维向多维发展,从静态数据处理向动态发展,具有时序数据处理能力;
(2)基于网络的分布式数据管理及计算、WebGIS 和 B/S 体系结构,用户可以实现远程空间数据调用、检索、查询、分析,具有联机事务管理(OLTP)和联机分析(OLAP)管理能力;
(3)面向空间实体及其相互关系的数据组织和融合,具有矢量和遥感影像数据互动等多源数据的装载与融合能力,多尺度比例尺数据无缝融合、互动;
(4)具有统一的海量数据存储、查询和分析处理能力、基于空间数据的数据挖掘和强大的模型支持能力;
(5)具有与其他计算机信息系统的整体集成能力。例如,与MIS、ERP、OA等各种企业信息化系统的无缝集成;微型、嵌入式GIS与各种掌上终端设备集成,如PDA、手机、GPS接收设备等。
(6)具有虚拟现实表达及自适应可视化能力,针对不同的用户出现不同的用户界面及地图和虚拟现实效果。
1.4 空间信息技术集成及应用
1.4.1 空间信息系统集成的原理与方法
系统是指有组织的或被组织化的整体(韦氏大辞典),集成的本意是指异构或分布对象之间的互操作。系统集成则是为实现某一目标而形成的一组元素的有机结合,而系统本身又可作为一个元素单位参与多次组合的过程。信息系统是一种由人、计算机(包括网络)和管理规则组成的集成化系统,信息系统集成是指按照用户需求,对众多的技术和产品进行合理选择,最佳配置各种软件和硬件产品与资源,组合成完整的、能够解决客户具体应用需求的集成方案,使系统的整体性能最优。
空间信息系统是信息系统的一种,其集成工程遵循信息系统集成的一般性原理和方法,一般实现过程为:定义集成接口关系—— 进行集成变换操作—— 进行整体优化处理。定义集成接口关系是系统集成的关键技术,包括软硬件接口,系统—子系统级—模块级递阶控制接口,机—机接口,人机接口等,这些接口对应关系全部可以连接为同构/异构、集中/分布,以及同步/异步三大关系的组合描述。集成变换操作就是指对可采用的技术标准与规范做出正确的选择,选用成熟的集成支持产品,引用与集成需求相关的操作机制,制作与操作条件和控制约束相适应的变换处理规则。整体优化处理是通过建立各种操作规范,采取有效的工程措施和人机协调描述,生成可重用的优化算法,验证集成应用开发的完备性和集成运行环境的适应性,从而实现集成系统的整体优化。
集成现实世界的过程、机理模型,并对其进行分析、模拟和预测是GIS区别于一般管理信息系统的重要特征。从技术角度,目前已有的GIS平台与模型的集成模式主要有以下几种方式:
(1)基于中间接口或Import/Export数据交换方式;
(2)利用GIS软件内嵌的二次开发语言,在GIS内部开发实现模型驱动程序;
(3)在程序开发语言中调用GIS组件,并在程序中与模型系统融合;
(4)Client-Server集成方式;
(5)基于面向服务架构(Service-oriented Architecture,SOA)的空间信息服务方式。
上述集成模式各有优缺点,选择哪种应根据实际应用需求而定。
1.4.2 空间信息技术集成概念
这里所说的集成由英文“Integration”一词翻译而来,包含有“使完整、整合、融合、合而为一”等含义,其核心含义是要在不同的部分之间建立一种有机的联系。有学者认为,这种联系有多种实现方式,不同实现方式之间联系的紧密程度和性质会有差异,实现的代价和针对的应用目的也不同,这种联系的差异可以从广度、深度和同步性三个方面来探讨。
广度是指建立了联系的子系统或要素的多少,包括三种两要素集成方式(RS+GIS/RS+GPS/GIS+GPS)和一种九要素集成方式(RS+GIS+GPS)深度是指联系的紧密程度,包括三个层次,即数据层次的集成、平台层次的集成和功能层次的集成。
(1)数据层次的集成,是通过数据的传递来建立子系统之间的联系,此时平台处于分离状态,数据传递要通过网络或人工干预完成,故效率较低;
(2)平台层次的集成是在一个统一的平台中分模块实现两个以上子系统的功能,各模块共用同一用户界面和同一数据库,但彼此保持相对的独立性;
(3)功能层次的集成是一种面向任务的集成方式,此种集成方式同样要求平台统一、数据库统一、界面统一。不同的是,它不再保持子系统之间的相对独立性,而是面向应用设计菜单、划分模块,往往在同一模块中包括了属于不同子系统的功能实现。
同步性是指系统处理数据的时效与现势性,即数据获取与数据处理的时间差,包括完全同步、准同步和非同步三种方式。
(1)完全同步是指数据获取与数据处理同时进行,此方式下数据采集是一个连续的不间断过程,并且要求数据处理的速度与数据采集的速度严格匹配;
(2)准同步是在数据获取与数据处理之间存在一定的时间差,造成该时间差的原因是数据处理的速度与数据采集的速度不能严格匹配,进而使得数据采集不是连续进行而是在两次采集之间存在一定的时间间隔;
(3)非同步是指数据获取与数据处理之间存在较长的时间间隔。造成这种间隔的原因是数据获取与传递的过程太长(如统计资料和RS影像),有时是由于目前尚不能克服的技术上的一些限制(如用载波相位法解算的定位数据)。
应该指出,同步与准同步方式不仅要求数据处理平台集成,同时也要求数据采集平台集成,故实现的代价较高,通常只用于需要实时监控和快速反应的紧急事件如救灾抢险、交通或战场指挥等。在大多数情况下,非同步方式都能满足应用要求,且成本远低于同步、准同步方式,是一种恰当的选择[12]。
1.4.3 空间数据集成
在地球信息科学领域,“集成”一词最常见的使用方式是“空间数据集成”,是指将不同来源、格式、特点性质的地球空间数据有机地集成到逻辑上或物理上的数据集中。其实质是对已有的数据集按照某种特定要求加工、重新组织的过程,将数据的形式特征(如格式、单位、投影等)和内部特征(特征、属性、内容、综合度等)全部或部分地调整、转化、合成、分解等,以形成充分兼容的数据集(库),这种集成充分考虑了数据的属性、时间和空间特征、数据自身及其表达的地理特征和过程的准确性。集成的数据来源包括数字化地图数据、实测数据、试验数据、GPS数据、遥感数据、统计数据等。从数据集成的类型及实际应用中数据集成的需求,可以将地球空间数据集成可分为4大类,即区域集成、专题集成、时间集成和数据综合集成。
空间数据集成研究主要包括基础理论研究和应用研究两方面。前者侧重于数据集成机理及集成过程中诸多问题的研究,如地球空间数据表达、误差传递及数据质量控制、多尺度数据处理等。后者则侧重于数据集实体建设研究,是指将空间数据集成的理论和方法运用于不同的领域,整合该领域内多元化、多尺度的空间数据,建立一体化集成的空间数据集,为该领域的空间数据检索、信息分析、知识发现、决策支持提供依据。本章所要建立的欧亚大陆山地垂直带谱数据库即属于后者,是一种面向专题的空间数据集成。
空间数据集成涉及空间数据获取、预处理、转换、集成等多个过程。这些过程所包含的一系列技术流程,包括数据采集、尺度变换、格式转换、空间建模、精度评价、质量检验、综合集成等构成了空间数据集成的技术体系。空间数据集成的最终目的是建立无缝数据集(库),其最终成果表现为对集成对象的空间、时间和属性上无间断连续性表达的空间数据库实体,因此空间数据库在整个技术体系中居于核心地位。
最早的空间数据库是文件式数据库,这种数据库只能利用自定义结构和操作的文件系统对非结构化的空间数据进行管理,空间与属性数据间通过标识码建立联系,这在当时数据规模不大,逻辑关系不甚复杂的应用中基本能够满足需求。20世纪80年代中期到90前代初期,随着RDBMS的成熟与普及,GIS软件开始利用关系型数据库管理系统来管理结构化的属性数据,而非结构的空间数据仍然只能用文件系统来管理。此时,GIS对属性数据的操纵能力有所增强。20世纪90年代,空间数据的爆炸式增长为空间数据库提出了新的要求,开始出现基于关系型数据库管理系统(RDBMS)或面向对象的数据库管理系统(OODBMS)的空间数据存储与管理解决方案,出现了所谓的“空间数据库”技术。空间数据库管理系统即是空间数据库理论、方法的技术实现和应用载体,它充分利用了商用数据库管理系统的技术优势,面向海量空间数据管理提供空间数据引擎及其应用接口系统,为上层的各种空间应用提供一套统一的访问与管理空间数据接口,屏蔽各种RDBMS的差异、实现同构分布式空间数据库的位置透明性,如图1-1所示。
图1-1 空间数据库在空间数据集成体系中的位置
目前,空间数据库管理系统基本上是通过在 ORDBMS 之上扩展空间数据引擎来实现的。空间数据引擎是一种处于应用程序和数据库管理系统(DBMS)之间的中间件技术,在用户和空间数据库之间提供了一个开放接口。用户可通过空间数据引擎将不同形式的空间数据提交给DBMS,由DBMS统一管理。同样,用户也可以通过空间数据引擎从 RDBMS 中获取空间类型的数据,并转化为客户可以使用的格式。因此,RDBMS 实质上是空间数据的容器,而空间数据引擎就是空间数据出入该容器的通道。近十年来,各种空间数据引擎如雨后春笋般地成长起来,较为成熟的有ESRI公司的ArcSDE、Oracle公司的 Spatial Cartridge、IBM 公司的 DB2 Spatial Extender、Informix 公司的 Spatial DataBlade等。本文所要建立的垂直带谱空间数据库也将基于空间数据库技术来实现。
1.4.4 空间信息系统集成的模式
1)RS与GIS集成
RS与GIS的集成是“3S”集成中最重要和最核心的内容。实际上,早在“3S”集成的概念出现之前,学术界已对RS与GIS的集成进行了充分而深入的探讨,在许多方面已经形成共识。RS与GIS集成的基本出发点是:RS可为GIS的数据更新提供稳定、可靠的数据源,而GIS可以为RS影像提供区域背景信息,提高其解译精度。在航空遥感时代,典型的作业方式是先将航片解译成图,然后数字化进入 GIS,尽管这种方式效率不高,但由于航空遥感覆盖周期长,影像数量少而数据分辨率高,手工作业的低效率引起的矛盾并不明显。进入航天遥感时代,遥感影像的数量猛增而分辨率大大降低,上述矛盾变得尖锐。人们开始尝试用计算机图像处理系统自动处理RS影像并将结果传输到GIS中,再进一步形成集成的思路。RS与GIS可以在数据、平台和功能三者之中的任一层次上进行集成,其目标是非实时数据处理,故通常采用非同步方式。数据结构的转换曾经是集成的难点之一,因为早期的GIS大多采用矢量数据结构,而RS采用栅格数据结构记录。绝大部分 GIS 中现已能够处理矢量、栅格两种数据格式,此问题基本解决。集成的另一难点是RS影像信息的自动识别和提取,该问题仍未能彻底解决。
2)GIS与GPS集成
GIS 和 GPS 集成是利用 GIS 中的电子地图结合 GPS 的实时定位技术为用户提供一种组合空间信息服务方式,通常采用实时集成方式。严格地说,GPS提供的是空间点的动态绝对位置,而GIS提供的是地球表面地物的静态相对位置。二者通过同一个大地坐标系统建立联系。在实际应用中,在非集成方式下使用GIS和GPS技术常常产生以下两方面的问题:
(1)在实地位置和图上位置之间建立联系只能靠目测估计,速度慢、准确性差;
(2)在动态定位或者缺乏参照物的场合,由于不能确定实地位置与图上位置之间的对应关系,只能靠目测来获得测点周围地物的相对位置,受人眼视野窄、不能定量等因素的影响,靠目测获得的测点周围地物的相对位置在信息量、准确性等方面存在严重不足。所以,在电子导航、自动驾驶、公安侦破、实时数据采集和更新等既需要空间点动态绝对位置又需要地表地物静态相对位置的应用领域,GIS与GPS集成几乎是一种必然的选择。具体地说,存在以下几种集成模式:
(1)单机定位+栅格式电子地图;
(2)GPS单机定位+矢量电子地图;
(3)GPS差分定位+矢量/栅格电子地图。
3)RS与GNSS集成
GNSS和RS集成的主要目的是利用GNSS的精确定位功能解决RS定位困难的问题,既可以采用同步集成方式,也可以采用非同步集成方式。传统的遥感对地定位技术主要采用立体观测、二维空间变换等方式,采用地—空—地模式先求解出空间信息影像的位置和姿态或变换系数,再利用它们来求出地面目标点的位置,从而生成 DEM 和地学编码图像。但是,这种定位方式不但费时费力,而且当地面无控制点时更无法实现,从而影响了数据实时进入系统。GNSS强大的定位功能为RS影像的实时处理与快速编码提供了可能,其基本原理是采用 GNSS/INS方法,将传感器的空间位置和姿态参数同步记录下来,通过相应软件,快速产生直接地学编码。
4)空间信息技术集成
空间信息技术整体集成包括以 GIS 为中心的集成方式和以 GNSS/RS 为中心的集成方式。前者的目的主要是非同步数据处理,通过利用GIS作为集成系统的中心平台,对包括 RS 和 GNSS 在内的多种来源的空间数据进行综合处理、动态存储和集成管理,同样存在前文所说的数据、平台(数据处理平台)和功能三个集成层次,可以认为是 RS与GIS集成的一种扩充。后者以同步数据处理为目的,通过RS和GNSS提供的实时动态空间信息结合GIS的数据库和分析功能为动态管理、实时决策提供在线空间信息支持服务。该模式要求多种信息采集和信息处理平台集成,同时需要实时通信支持,故实现的代价较高。加拿大的车载“3S”集成系统(ⅤISAT)和美国的机载/星载“3S”集成系统是后一种集成模式比较成功的两个实例。
1.4.5 空间信息技术集成的应用
由于RS、GIS和GNSS在功能上的互补性,各种集成方案通过不同的组合取长补短,不仅能充分发挥其各自的优势,而且能够产生许多新的功能。如果说RS、GIS和GNSS三种技术的单独应用提高了空间数据获取和处理的精度、速度和效率,那么3S集成除了在以上三方面更进一步以外,其优势还表现在其动态性、灵活度和自动化等方面。所谓动态性是指数据源与现实世界的同步性、不同数据源之间的同步性,以及数据获取与数据处理的同步性;灵活度是指用户可以根据不同的应用目的来决定相应的数据采集和数据处理,建立二者之间的联系及反馈机制,从而以最恰当的方式完成指定的任务;自动化是指集成系统能够自动完成从数据采集到数据处理的各个环节,不需要人工干预。这三种优势不同程度地反映在各种具体的集成模式中。3S集成已经在测绘制图、环境监测、战场指挥、救灾抢险、公安消防、交通管理、精细农业、地学研究、资源清查、国土整治、城市规划,以及空间决策等一系列领域获得了广泛的应用,可以肯定,未来其应用领域将进一步拓展。但无论其应用领域如何广泛,也无论其应用领域在未来如何拓展,3S集成本质上是三种对地观测技术的集成,它所能提供的是不同层次的空间信息服务,服务内容会随着具体的应用场合的不同而改变,但不会超出以下五个层次的组合:(1)直接信息服务,包括原始遥感影像、GNSS 定位信息和 GIS 数据库中存储了的信息;
(2)复合信息服务,包括带有 RS 影像或地图背景的解算好的 GNSS 定位信息,经过处理带有地学编码的遥感影像或同时包含RS和GIS信息的影像地图;
(3)查询信息服务,包括从空间位置到空间属性的双向查询以及二者的联合查询,此处空间位置可由RS、GIS或GNSS任意一种方式指定;
(4)计算信息服务,包括由GIS计算所得的空间目标本身的长度、面积、体积,或其相互之间的距离和空间关系等;
(5)复杂信息服务,包括利用空间分析和模型得到的各种结果,如最短路径或交通堵塞时的替代路线、污染物泄漏或管线断裂影响范围、自然灾害灾情实时估算等。
显然,上述5种信息的实时或非实时组合可以应用于测绘制图、环境监测、战场指挥、救灾抢险等多个领域。