3.3 存储资源池设计
3.3.1 存储需求分析
在云计算、大数据、人工智能、物联网、5G等新一代信息技术推动下,从“互联网+医疗”“AI+大健康”到“5G+智慧医疗”,新一代医院数据中心将支撑医院信息化建设由数字化向智能化发展,这个过程中,医院信息化业务对存储系统也提出了更高的要求。
(1)高性能业务处理需求
新一代医院数据中心的核心关键应用,如事务性(on-oine transaction processing,OLTP)数据库、分析型(on-line analysis processing,OLAP)数据库、混合负载(hybrid transaction and analytical process,HTAP)数据库等复合型IO负载的应用,对存储系统的每秒读写次数(IOPS)处理能力、响应延迟时间、数据一致性保障有极高的要求;虚拟化平台、云桌面、云平台、大数据分析等多样的工作负载,对存储系统的随机业务访问能力提出一定的性能要求。
(2)海量数据存储需求
随着新一代医院数据中心的落地应用进程加速发展,海量、多元、非结构化将是新时代下医疗数据的新常态。在这个趋势下,也催生了对医疗信息系统产生的海量多模态非结构化数据文件进行快速检索、归档和长期保存的需求,最终实现海量历史非结构化医疗数据文件的自动化管理,释放宝贵的影像系统在线存储资源,减少业务系统的在线存储压力,以达到快速响应操作的目的。
(3)多云环境云业务支撑需求
随着新一代医院数据中心的医疗云业务发展,基于公有云、私有云、混合云的多云环境平衡发展建设理念越来越迎合新一代医院数据中心的需求,而多云环境下的数据治理一直都是痛点,因此,采用标准化的存储容器接口,支持云、核心或边缘部署是多云环境存储系统的趋势。
(4)医疗大数据业务支撑需求
新一代医院数据中心的医疗大数据平台,需对患者个人全生命周期中,由免疫、体检、门诊、住院等就医活动所产生的大量数据进行分析加工。医院数据中心通过以医疗大数据为基础的人工智能平台,利用AI服务器超强算力,结合人工智能算法,进行数据挖掘与处理、自动学习数据特征、构建医学智能模型。通过此平台,促进医疗数据利用,助力临床业务智能化和数据驱动的医学研究,为医疗智能服务提供准备数据基础,打通数据流程,提供技术支撑,推动疾病精准预测、临床决策支持、精准医疗、移动健康、医学影像分析等智能应用服务的落地应用,促进智慧医疗发展。面向大数据业务的5V特征存储系统需提供大容量、多元化、快速响应的数据存储、服务与处理能力。
(5)容灾备份需求
新一代医院数据中心涵盖系统多、类型复杂、关键性程度不一,对于数据的灾难恢复目标也有不同的要求。因此,针对不同恢复目标的业务要采取不同的灾备技术,同时根据医院数据中心重要程度,考虑建立同城灾备数据中心,必要时规划包含异地灾备中心的两地三中心灾备方案。
(6)统一存储管理需求
新一代医院数据中心采用模块化方式部署存储资源,涉及不同类型的存储设备,若仅通过单设备管理软件进行维护,将耗费大量的人力物力,因此,需要有易操作、易维护的统一管理软件,能够满足存储资源池整体快速部署实施需求和智能实时监控需求。
3.3.2 存储关键技术
针对新一代医院数据中心多元化业务存储需求,部署统一的存储资源池,构建增值业务的统一存储服务模式,不仅能够有效支撑新一代医院数据中心的业务需求,提供新业务快速部署的能力,更有利于业务平台的统一整合和大数据挖掘。根据以上业务需求,建议采用高性能的集中存储和多元性统一的分布式存储来支撑整个存储资源池设计,以下分别对集中存储和分布式存储技术特性进行说明。
3.3.2.1 集中存储技术
所谓集中式存储系统就是指由一台或多台主计算机组成中心节点,数据集中存储于这个中心节点中,并且整个系统的所有业务单元都集中部署在这个中心节点上,系统所有的功能均由其集中处理。也就是说,集中式系统中,每个终端或客户端仅负责数据的录入和输出,而数据存储与控制处理完全交由主机来完成。
集中式系统可进一步采用全闪存阵列提高性能,闪存阵列性能高,总体拥有成本低,具有较高的投资回报率。能够解决医院高峰期I/O处理瓶颈问题。使用全闪存阵列以后,相同容量下能比传统的存储设备节省更多空间和能耗,降低系统数据等待时间,提高医院系统运行效率。在业务高峰期,可以提高业务负载。如果将全闪存阵列用于信息系统缓存,可以提高整个存储系统的性能,提高医院信息系统整体运行效率。
(1)集中式存储优点
● 部署简单,无需考虑多个节点之间的分布式协作问题;
● 数据传输速度快,传输损耗低,传输稳定;
● 对数据库、虚拟化环境等结构化数据支持性好;
● 存储稳定性冗余性强,对于需要存储高可用、高性能的核心业务支持好;
● 安全性强,存储自身结构决定了存储内部数据的防入侵防病毒能力;
● 数据自动分层节约成本;
● 容灾及存储双活特性强大,可通过硬件完全满足核心业务的容灾需求;兼容性高,可以同时支持多种传输协议,例如光纤通道(fiber channel,FC)、互联网小型机接口(internet small computer system interface,iSCSI)、网络附属存储(network attached storage,NAS)等,不需要为某个业务新增相关硬件;
● 与虚拟带库联动性强,部分集中式存储具备无需备份软件直接备份数据至虚拟带库的能力,大幅度减少备份成本和备份时间。
(2)集中式存储缺点
● 对文本、图片、视频、音频等非结构数据支持能力相对较低,不适合海量非结构化数据的存储与访问;
● 前期投入相对较大;
● 横向扩容能力相对较低(若采用全闪架构则容量提升很多);
● 对非结构化数据支持无法达到几十PB级别。
(3)适用场景——交易数据、高频次改变、低延迟的数据
● 业务系统数据库;
● 虚拟化环境操作系统。
3.3.2.2 分布式存储技术
(1)分布式架构
将数据分散存储在多台独立的设备上,采用可扩展的系统架构,利用多台存储服务器分担存储负荷,不但提高了系统的可靠性、可用性和存取效率,同时也易于扩展。
分布式存储的前、后端网络是分离的:后端网络用于传送存储集群节点内部交换流量,前端网络用于应用主机访问存储集群。前后端网络隔离,从安全性和性能方面都是一种很好的考量。
(2)分布式存储优点
● 分布式存储系统易于安装和部署,管理使用也很方便;
● 分布式存储系统可以3节点起步,成本较低;
● 分布式存储系统对非结构数据存储可扩展性强;
● 能够支撑海量数据的存储,单一命名空间下,支撑拍字节(petabyte,PB)级数据存储;
● 分布式存储系统具有极高的横向扩展能力,存储容量不断扩展的同时,性能随节点数增多而增加,随时管理动态的业务需求,响应业务变化;
● 高可靠的数据存储,针对PB级数据存储提供更高效、快速的备份、恢复能力。
(3)分布式存储缺点
● 由于分布式存储数据通过普通数据网络传输,因此,易受网络上其他流量的影响。当网络上有其他大数据流量时会严重影响系统性能;
● 由于分布式存储的特点,存储空间为文件系统类型,对计算机病毒的防御能力低;
● 由于存储数据通过普通数据网络传输,因此,容易产生数据泄露等安全问题;
● 存储只能以文件方式访问,而不能像普通文件系统一样直接访问物理数据块,因此,会在某些情况下严重影响系统效率,对结构化数据的承载支持不佳,比如大型数据库就不能使用分布式存储;
● 由于分布式存储的底层设计原因,对于容灾的支持能力还不能达到集中式统一存储的级别;
● 传统业务如果需要迁移至分布式存储,可能需要重新开发或者采用支持分布式存储的专用软件。
(4)适用场景——文件数据共享
● 文本、影音等数据;
● 非结构化数据备份;
● 数据共享。
3.3.2.3 备份和容灾技术
《信息安全技术信息系统灾难恢复规范》(GB/T 20988—2007)规定了信息系统灾难恢复应遵循的基本要求,适用于信息系统灾难恢复的规划、审批、实施和管理,并参照国际标准SHARE78的7个层级定义,确定了符合中国国情的6级灾备能力等级要求。下面,概括性地介绍各个层级的内容:
1级:数据定时备份+异地存放;
2级:数据定时备份+异地设备冷备;
3级:数据定时备份+异地部分业务热备接管;
4级:数据定时备份+异地业务热备接管;
5级:数据实时备份+异地业务热备接管;
6级:零数据丢失+远程自动接管支持。
根据以上业务分级和恢复目标要求,针对核心业务系统,采用存储数据双活的方式来实现业务平台的持续可用;针对重要业务系统,建议采用主流成熟的备份系统进行定时备份保护;针对一般业务系统可根据业务数据的重要度,采用定时备份或者不备份策略。
如果到更高级别的容灾要求,双活数据中心可在现有存储平台进行升级,即两地利用存储平台的双活同步机制,结合应用系统的集群应用,可实现两地同时进行业务的负载分担,确保关键应用平台在数据中心级别灾难的情况下,仍然可以持续提供业务支撑服务。在异地构建第三灾备中心实现两地三中心,保障业务的连续。
3.3.2.4 统一存储管理技术
由于新一代医院数据中心存储环境中设备类型多、数量大,应用多样化,网络环境复杂以及虚拟化技术的使用,从而导致集中存储管理的难度提升了一个层次,但也体现出了集中管理的必要性和重要意义。如何在复杂的网络环境下实现数据中心统一存储管理,是目前数据中心建设面临的新挑战。
(1)软件定义存储系统
软件定义存储系统为平台核心技术,通过该系统将物理存储资源池化、抽象化、标准化,并提供基于资源池预定义的存储自动化服务。存储资源的池化和抽象化可根据数据中心存储服务目录进行配置,存储自动化服务由基于抽象的资源池封装提供,存储资源标准化在自动化服务策略中配置,使存储自动化服务符合数据中心的存储规划和运维规范。另该系统还支持多租户、计量、自服务等云计算特性。
“存储资源管理系统”从物理存储和“软件定义存储系统”中抽取信息,以提供多维度(指物理存储、存储资源池等)详细的配置管理等。
(2)存储资源统一管控
支持多租户设计和存储服务的定制化,可为不同部门指定不同租户,设定不同的存储服务和存储配额。可在用户界面中查看各自的存储服务内容,并根据需要申请相应的存储服务。内置审批流程,管理员在收到存储服务请求时,可进行审批操作。
对不同存储阵列采用相应的接口程序来保证异构存储阵列接入,优先采用行业标准接口。通过将异构存储资源抽象化,将设备级的操作封装成面向存储资源的操作,并能自动执行从创建、变更到回收的整个存储生命周期流程。管理员也可以从平台中添加、调配、管理和共享存储资源。
(3)自动化配置与智能管理
实现从存储、SAN交换机、服务器端到端的存储自动化调配。实现基于策略的存储资源自动化,设定不同的存储供给策略来满足规划和标准化要求,使得配置符合存储最佳实践,同时通过自动化消除由于手工操作给整个存储资源的稳定性带来的风险。
基于存储系统运行、故障、应用等日志数据,基于算法模型,可构建故障预测模型,基于预测进行主动运维,提高系统稳定性。
(4)统一监控管理
通过周期性数据采集,通过统一监控管理平台,进行全局存储信息集中展示,自动展现最新存储资源性能、健康状态等,协助管理人员定位分析问题。系统能够展现告警信息、故障分析信息、智能预测信息和性能分析信息,辅助管理人员进行系统运维决策。
(5)多套存储平台统一管理
● 统一入口,存储平台精细管理;
● 嵌入式设计,对外始终只呈现一个系统页面;
● 标签栏切换式操作,多设备间自如切换。
(6)AI智能预测
● 基于神经网络算法和先进训练模型,保证足够的磁盘样本数,覆盖各类故障类型;
● 磁盘故障预测,满足磁盘故障预警;
● 被动运维变为主动运维,大幅增强系统稳定性。
(7)智能化存储平台管理
● 中英文图形化界面展示,全局信息集中展示;
● 告警信息汇总,故障分析定位;
● 容量智能预测,性能瓶颈分析。
3.3.3 存储资源池设计
面对新一代医院数据中心业务多元化趋势,合理规划存储设备,统一部署存储资源池,构建增值业务的数据存储服务模式,是新一代医院数据中心智慧化建设的必然要求。存储资源池系统架构应采用模块化思路进行开放架构设计,包含全闪存阵列、分布式存储系统、容灾备份存储系统等设备,采用统一存储管理平台进行智能运维管理,按需灵活分配存储资源,充分发挥各模块的存储资源优势。
全闪存阵列,针对闪存介质特性进行了从全闪存存储架构、效率到可靠性的全面优化,具备极致的IOPS、极低的延迟、极高的带宽,适用于数据库、虚拟化平台、云平台、大数据分析等数据随机访问业务,让性能不再成为瓶颈。
分布式存储系统,采用通用服务器的Scale Out方式进行容量扩展,具备海量数据存储能力;前后端网络采用高速网络互连,保障海量数据快速吞吐和响应延迟;一套系统内提供文件、块、对象、大数据等多种存储服务,支持多种接口对接,可以实现多元化数据服务能力、多云间数据快速流动和智能化数据管理。
容灾备份技术按应急保障措施按照由低到高程度主要分为双机、集群、备份、应急、容灾几个层次,根据医院不同应用系统的容灾备份级别要求,选择相应的容灾备份策略进行数据安全防护。
统一存储管理平台面向存储资源池的多设备进行智能管理,采用大数据和AI技术,构建智能化运维管理平台,实现对存储系统自动化部署、状态监测、容量预测、性能优化、远程巡检、故障诊断、磁盘故障预测、资产管理等智能化运营,解决IT系统运维难题,提高运维效率,降低运维成本,优化用户体验,保障业务连续性,提供一体化的智能运维综合解决方案。