所谓灾难恢复中心,就是客户除了拥有一套完整的计算机网络系统(称它为生产中心)之外,另外建立一套计算机网络系统。这套系统能在突发性灾难发生,造成生产中心停止工作时,迅速并及时地接管原来运行在生产中心的所有或部分业务,达到减少或避免灾难事件发生时所造成的损失,为企业用户提供完善、优质服务的目的。
建立灾难恢复中心,有非实时和实时两种模式。
非实时模式,就是利用磁带备份技术,计算机中心人员每天定时备份生产机中心数据,并及时送往灾难恢复中心,尽量保证灾难恢复中心拥有生产中心的最新数据,一旦灾难发生,灾难恢复中心可将业务在较短的时间内恢复运作。这模式的特点是在数据备份问题上技术难度不大,但很难保证生产中心与备份中心间数据的实时性一致。
实时模式,就是在生产中心和灾难恢复中心之间通过通信线路,利用数据实时备份,将生产中心主机的数据实时送往灾难恢复中心,保证生产中心与备份中心间数据一致。当灾难发生,生产中心陷于瘫痪时,灾难恢复中心在最短的时间内,接管所有或部分业务,恢复系统正常运作。
对于以上所定义的各种故障及灾难,灾难恢复中心建设的设计目标是:灾难或其他不可抗拒的事件发生时,最大程度地保护所有系统数据的安全,几十分钟至几小时内恢复所有外界与系统主机的连接并正常运作。
上述恢复时间是指从确认生产中心切换至灾难中心到灾难中心接替生产中心工作的时间。
上述目标的实现以以下两个主要方面为前提条件:
第一,实现灾难恢复的主要步骤及操作模式。包括:由灾难中心主管确认灾难的确发生;在灾难中心主机作断点分析,查明交易情况;完成网络物理切换(手工或自动);启动灾难中心主机应用系统(手工或自动);主机系统重新与分行连线,完成灾难中心切换任务(自动)。
第二,灾难恢复有关制度及运作模式的建立。包括灾难恢复的运作完全采用实时自动方式,及灾难恢复的运作采用人工干预与部分自动相结合的方式。
灾难恢复中心的设备
方案一:采用两台IBM企业存储服务器(ESS)作为灾难恢复的主要设备,一台放在生产中心,另一台放在灾难恢复中心。两台IBM企业存储服务器之间由光纤连接,距离最远可达4000公里,两台IBM企业存储服务器均配置PPRC(点到点远程拷备)功能,网络间采用经IBM公司认证的CNT公司网络延展器UWO。
IBM公司的企业存储服务器(ESS)还支持使用电信线路。采用IBM公司认证的扩展器,可以使用电信线路,如ATM、E1、T1等,采用这种方案,可以实现灾难恢复中的最高层次,Tie 6级的容灾。该容灾方式与主机平台、数据库软件、应用软件无关,可以跨平台实施。
方案二:生产系统采用IBM公司的企业存储服务器(ESS),同时,采用IBM公司的光纤通道存储磁盘阵列FAStT500,利用RS/6000内的镜像功能,实现数据容灾。该方案的缺点是距离只有10公里,而且由于由主机来实现镜像功能,要占用一部分主机资源,而且距离越远,性能下降越大。
方案三:生产系统采用IBM公司的企业存储服务器(ESS),同时,采用IBM公司的LTO大型磁带库,将数据每天备份到磁带库中,将磁带异地保存,这种方式的级别只有Tie 3。