3.2 云计算数据中心分类
在数据中心规划时,业界一般会首先考虑数据中心的定位,机房(机楼)的定位决定了数据中心的规模和建设条件。机房的分类主要根据机房的硬件设施,结合软件设施进行分类。这里主要介绍GB 50174-2017和TIA/EIA-942的IDC机房分类。
在数据中心建设过程中,业界可以根据机房的建设目标按照分类要求建设,即机房分类作为机房建设的输入条件,也可能机房先建设好了,根据分类标准归类。在制定数据中心建设方案时,业界需要关注客户业务需求,分析机房的分类规划,作为机房硬件设备配置的输入条件。
3.2.1 GB 50174-2017机房分级
数据中心机房应划分为A 、B 、C 三级。设计时应根据机房的使用性质、管理要求及其在经济和社会中的重要性确定所属级别。
符合下列情况之一的数据中心机房应为A 级:(1)电子信息系统运行中断将造成重大的经济损失;(2)电子信息系统运行中断将造成公共场所秩序严重混乱。A 级电子信息系统机房内的场地设施应按容错系统配置,在电子信息系统运行期间,场地设施不应因操作失误、设备故障、外电源中断、维护和检修而导致电子信息系统运行中断。
符合下列情况之一的电子信息系统机房应为B 级:(1)电子信息系统运行中断将造成较大的经济损失;(2)电子信息系统运行中断将造成公共场所秩序混乱。B 级电子信息系统机房内的场地设施应按冗余要求配置,在系统运行期间,场地设施在冗余能力范围内,不应因设备故障而导致电子信息系统运行中断。
不属于A 级或B 级的电子信息系统机房为C 级。C 级电子信息系统机房内的场地设施应按基本需求配置,在场地设施正常运行情况下,应保证电子信息系统运行不中断。
本标准与TIA/EIA-942的区别主要在于等级的划分,A级对应TIA/EIA-942的Tier 4,B级对应TIA/EIA-942的Tier 2,C级对应TIA/EIA-942的Tier 1,Tier 3基本归类为A级。
3.2.2 TIA/EIA-942机房分级
1.Tier 1机房:基本的机房基础设施
(1)基本配置要求
Tier 1机房定义为基本配置机房。基本配置机房内的计算机设备具有无备援容量的电力配送和制冷组件,具有单一或无备份电力配送和制冷分配路径来供应计算机设备。即使有UPS或者发电机,也是单模块系统,具有多处单故障点。
(2)性能确认
具有足够的空间容量满足机房设备安装的需求;或许有(也许没有)架空地板;系统故障会影响大部分基础设施系统中的计算机设备、系统和用户体验。
(3)操作影响
机房运行易受已计划活动和计划外的活动影响。计划内和计划外的活动都会很容易引起机房整体运行中断。
机房基础设施(系统、组件或分配路径等元素)中断或故障将会影响机房计算机设备的运行。
对于机房基础设施各组件的人为操作错误或自然故障将导致整个数据中心运行中断。
为了实现预防性的维护和维修,基础设施需完全地手动关闭。一般情况下,基础设施每年需要完全关闭一次,确保安全地进行必要的预防性保养和维修工作;紧急情况下,可能需要更频繁的系统关闭;如未定期维修,将大大增加意外中断的风险,以及后续出现严重故障的可能性。
Tier 1数据中心机房的可用性为99.671%。
2.Tier 2机房:具冗余组件级机房基础设施
(1)基本要求
Tier 2机房具有一些冗余的部件或备援容量组件。具有部分备援容量的电力配送和制冷组件,具有单一或部分备援电力配送和制冷分配路径来供应计算机设备。UPS和发电机的设计容量是N+1,且为单回路设计,因此有单点中断可能。
(2)性能确认
冗余部件或备援容量组件可以有计划地从服务中删除,不会导致机房整体运行中断。
数据中心配备架空地板。
对关键分配路线和其他基础设施维护仍需要程序化地关闭设备。删除分配路线或其他备援组件仍需要关闭部分工作的计算机设备。
(3)操作影响
机房运行易受已计划活动和计划外的活动所影响。计划内和非计划性的活动引起数据中心中断的可能性小于Tier 1级数据中心。计划外的活动会很容易引起机房整体运行中断。任何计划外的冗余部件失效也许会影响计算机设备。计划外之任何冗余系统中断或故障将会影响计算机设备。
机房基础设施组件的人为操作错误也许会导致机房整体运行中断。
机房基础设施各组件的人为操作错误或自然故障将导致机房整体运行中断。
机房基础设施每年必须完全关闭一次,确保安全地进行必要的预防性保养和维修工作;紧急情况下可能需要更频繁的系统关闭;如未定期维修,将大大增加意外中断的风险,以及后续出现严重故障的可能性。
Tier 2数据中心的可用性为99.741%。
3.Tier 3机房:可并行维护级机房基础设施
(1)基本要求
Tier 3机房具有冗余部件和备援容量组件;具有多个独立的备援电力配送和制冷分配路径来供给计算机设备;任何时候只需要一个分配路径即可供给计算机设备。
所有的IT设备都是双电源的。数据中心的容错电力遵循规范(版本2.0)所定义的,且正确安装并与该机房基础设施的拓扑架构兼容。任何传输设备,如使用点开关则必须纳入不符合本规范的计算机设备内。
(2)性能确认
每个在分配路径中的部件或组件的备份容量部件或组件,都可以有计划地从服务中移除,不会造成任何计算机设备中断。
当备援组件因任何原因导致从服务中被删除时,要有足够的永久备份容量以满足机房的需求。对于大型系统,这意味着是两个独立的通路,必须有充足的处理能力和配电通路,允许在一条通路承担负载工作的同时,另外一条通路进行维护和测试。
(3)操作影响
操作人员可以在不引起计算机硬件运行中断的情况下,进行所有计划内的现场活动。计划性的活动包括:保护性和程序式的维护、维修和组件替换,增加或者减少与处理能力相关的部件,对部件和系统测试,节能改造活动以及更多的活动。
机房整体运行易受计划外活动影响。任何计划外活动(如操作错误或者设施部件自然故障)导致的容量系统中断或失效,将会影响计算机设备或机房的整体运行。任何计划外之容量组件或分配要素中断或失效,也许会影响计算机设备。机房基础设施组件的人为操作错误也许会导致机房设备运行中断。
计划内的机房基础设施维修,可以使用备援容量部件和备份分配路径来安全地替代维修设备执行任务。
在维修期间,损坏的风险可能会升高(此类保养状况不会使正常运作达成之等级评定无效)。
在客户的业务需求允许增加成本进行更高级保护时,Tier 3数据中心机房通常可以升级到Tier 4级数据中心机房。
Tier 3数据中心机房的可用性为99.982%。
4.Tier 4机房:容错级机房基础设施
(1)基本要求
Tier 4机房:容错级机房具有多个独立的、完全隔离的备份容量组件系统,具有独立、多样化的有效分配路径,同时为计算机设备供应电力配送和制冷分配。备份容量组件及多元化分配路径,须配置成N的容量,在基础设施发生任何故障时可以提供计算机设备电力和冷却。
所有的IT设备是双电源的,机房容错电力遵循规范(版本2.0)所定义的并且正确安装,须与该机房基础设施的拓扑架构相同。传输设备如使用点开关,必须纳入不符合本规范的计算机设备内。
基础设施的备份系统和备份分配路径必须完全地彼此隔离(隔间),以防止任何单一事件同时影响主用/备份系统或分配路径。
连续冷却是必需的。
(2)性能确认
任何基础设施主用/备用系统及其组件,任何基础设施主用/备用分配路径及其组件的单一故障不会影响到计算机设备的运行。系统会自动自我恢复,以防止故障进一步影响到该机房的整体运行。
每个在分配路径中的备份系统及其组件,都可以有计划地从服务中移除,不会对计算机设备和机房整体运行造成任何影响。
当备份系统及其组件,或分配路径因任何原因从服务中被移除时,机房基础设施有足够的容量,可以满足机房正常整体运行的需求。
(3)操作影响
数据中心机房运行不会受计划内事件的影响。Tier 4机房的基础设施的性能和能力可以保证任何计划内活动不会引起关键负载的中断。
数据中心机房运行不会受任何单一计划外活动的影响。数据中心基础设施的容错能力可以为基础设施提供能忍受至少一次的最糟糕的情况——计划外故障或非关键性负载事件的冲击能力。这需要同时工作的两条配送途径,通常是双系统(S+S)的配置;从电力角度考虑,需要两个独立的(N+1)UPS系统。
计划内的机房基础设施维修,可以使用备份系统及其部件和备份分配路径来安全地替代维修设备执行任务。在维修期间,如果备份系统及其部件和备份分配路径关闭,会因基础设施其他分配路径发生故障导致计算机设备损坏以及机房整体运行中断的风险相对升高(此类保养配置不会使正常运作达成的等级评定无效)。
根据消防和供电安全规范要求,由于火灾报警或灭火行动启动了紧急停电程序(EPO),导致停机事件的发生,这可能导致机房运行中断。
全面地达到Tier 4级机房的要求并不容易,需要较大的投资和较长的时段。以下几个要素是Tier 4机房的特征要求:(1)至少3 000 m2以上;(2)70~80个经验丰富的专业化管理人员;(3)独立建筑且功能分区;(4)双系统,双信道甚至多信道备份;(5)可用性达到99.995%。