重复数据删除技术:面向大数据管理的缩减技术
上QQ阅读APP看书,第一时间看更新

2.4.1 直接连接存储

直接连接存储是指外部数据存储设备(如磁盘阵列、磁带机等)直接连接在服务器内部总线上,数据存储设备是整个服务器结构的一部分,同样服务器也担负着整个网络的数据存储任务。DAS是最简单和最常见的存储结构,如图2-14所示。它以主机为中心,各种块存储设备通过SCSI、IDE、ATA等I/O总线直接与主机连接。DAS将存储设备通过SCSI接口或光纤通道直接连接到一台服务器上。存储设备可以与多个服务器连接,如果一台服务器出现故障,仍可以通过其他服务器来存取数据。但这种存储方案中的存储设备都直接连接到服务器,随着存储设备和服务器数量的增加,DAS存储方式将导致网络中存储孤岛数量激增,存储资源利用率低,不利于对其进行集中管理。在DAS存储方式下数据共享和存储设备的扩展能力受到了很大的限制。同时,数据存储都由与存储设备相连的服务器来完成,对服务器的性能也造成了一定的影响。

图2-14 DAS存储结构

DAS数据存储方式主要应用于服务器在地理位置上比较分散,很难通过远程连接进行互联时,DAS数据存储是比较好的解决方案,甚至可能是唯一的解决方案。对于小型网络,由于网络规模较小,数据存储量小,数据访问频率不是太高,对服务器造成的性能下降不明显,DAS数据存储将是一种比较经济的解决方案。在一些特殊的数据库应用和应用服务器上,它们需要直接连接到存储器上,因此需要使用DAS数据存储解决方案。

DAS具有简单、可靠、易安装、成本低等特点,主要用于小规模的网络存储应用。DAS的一个重要特征是将存储设备与主机捆绑在一起,这种连接上的限制带来诸多弊端,如:存储容量受限于主机I/O总线支持的设备数量,存储资源的利用率低,维护困难、管理难度大,存储数据的可用性差。DAS依赖服务器主机操作系统进行数据的I/O读写和存储维护管理,数据存取要求占用服务器主机资源的20%~30%。DAS的数据量越大,存取时间就越长,对服务器硬件的依赖性和影响就越大。DAS与服务器主机之间的连接通道通常采用SCSI连接,SCSI通道将会成为I/O瓶颈;服务器主机SCSI ID资源有限,能够建立的SCSI通道连接有限。无论DAS还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的集群,或存储阵列容量的扩展,都会造成业务系统的停机,从而给企业带来经济损失,对很多行业的关键业务系统是不可接受的。