数据集中备份容灾系统方案
目前,越来越多的集团企业依赖信息系统支撑其关键业务的开展,越来越多的企业在逐步重视容灾技术,将其作为企业在遭受灾难经历后保证企业尽快恢复业务的重要手段。但实际上,容灾(DT,Disaster Tolerance),或者灾难恢复(DR,Disaster Recovery)是企业保证其业务信息系统实现不间断运行的主要技术手段。企业的最终目的是实现业务连续性(BC,Business Continuity),即当企业面临危机和灾难时,能及时恢复正常,把损失降低到最低限度,保证业务的高可用性。许多企业发现,要尽可能地保证企业业务的连续性,仅仅在技术层面考虑是不够的,还需要制定和管理一系列方法、策略、流程、条件以及部门和人力资源调配方案等等,因此,现在大部分企业在业务连续性的层面上进行统一规划和实施。
具体来说,业务连续性是一种由计划和执行过程组成的策略,其目的是为了保证企业包括生产、销售、市场、财务、管理以及其他各种重要的功能完全在内的运营状况百分之百可用。相比之下,灾难备份只是一种尽可能减少宕机损失的工具或者策略。不过,灾难备份是业务连续性的基础,没有前者,后者就是空中楼阁,但是如果一个灾难备份系统使数据恢复正常的时间过长,那也就不存在所谓的业务连续性了,缩短这个时间,就是业务连续性的目标,消除这个时间,则是业务连续性的终极目标。
所谓灾难,通常指关键业务的信息服务中断,且中断的时间让人不能忍受。引起灾难的因素很多,可以是小系统中的硬件故障,还可以是因火灾、飓风、地震而引起的数据处理设备的损坏,只要造成了关键业务的中断,都是灾难。容灾就是为恢复计算机系统提供的保障,这些保障包括备份中心、备份设备和备份数据等。
从以上对容灾系统特点分析可以看出,目前系统还无法完成现有状况下的备份和容灾要求,其设计已经不能满足企业级用户日益缩减的备份窗口下海量数据的容灾备份需求,随着业务的发展,数据量将会更加庞大,以上问题也将日益突出,因此我们从容灾技术路线的比较来分析如何有效的解决以上问题
1.1 容灾技术的比较及选择
以下是对主要远程数据复制技术的一个初步归纳,对比列表如下: 远程容灾技术 RPO RTO 优势 可以透过缺点 厂商设置采用同步存储层 复制技术 根据应方式复制数据用系统的高时,数据损失可用管理方量近似为0 式确定。 应用直接实现技术壁垒,不容灾功能,提同厂商的存储供很高的性设备不能进行能。广泛采用 复制。 开放性好,可以在各采用采用同步交换层 复制技术 方式复制数据时,数据损失量近似为0 根据应用系统的高可用管理方式确定。 种存储设备之间进行数据复制;能够在不占用主机资源的情况下实现高效的数据复制 In-band方式,需要占用业务数据传输带。采用Out-of-band的方式则没有此问题。 需要在主与卷管理软件有关,卷卷管理器层 管理软件实现复制技术 同步传输一般比较困难,异步传输数据损失量会比较大 机端加载卷管不要求本理软件; 根据应地和远端的存要求本地用系统的高储系统同构,和远端的主机可用管理方实现起来成本系统同构;不式确定。 也较低。 能保障不同卷之间的一致性,数据丢失量可能较大 每一种应用都配置自己使用应用的数据复制方应用程序层 复制技术 受应用系应用系程序自己的功案,在管理程统数据规则影统恢复时间能进行数据复度和开销上都响。 短。 制,没有对任是比较大的。何系统的依赖 数据丢失量可能较大
根据用户的实际情况,应该从对RPO,RTO的要求来考虑。用
户目前构建容灾系统面临的最大挑战是如何依据现有网络环境和容灾目标,构建一个切实可行的性价比突出的解决方案。采用传统技术和思路,无法实现2-4Mb链路下的海量数据容灾建设目标。因此,我们建议选择具备重复数据删除技术的磁盘备份设备构建灾备系统,从根本上解决海量数据容灾系统对带宽的高要求。
因此,结合前面所论述的数据容灾系统概况,考虑到距离远和现有带宽的限制,建议用户采用备份设备(即存储层)的容灾路线,基于可以有效缩减容灾链路带宽需求的重复数据删除技术的数据复制容灾方式。
根据以上分析,我们建议采用来自EMC的领先容灾解决方案DataDomain的三台DD产品搭建本次容灾系统。
1.2 数据容灾备份架构规划
1.2.1
容灾备份逻辑拓扑图
1.2.2
方案总体描述
通过在三个数据中心配置EMC DataDomain产品作为备份设备,配备EMC NetWorker备份软件,完善构建本地备份系统。这些DataDomain又可同时互为远程容灾设备。
整体方案采用基于磁盘介质、具备超高压缩能力(20:1)的DataDomain公司的
DD600系列虚拟磁带库产品作为核心备份设备
在北京数据中心配置DataDomainDD600;负责完成本地的数据备
份,并接收成都和宜昌的容灾数据
在成都数据中心配置DD600产品;负责完成本地的数据备份,并
接收北京和宜昌的容灾数据
在宜昌数据中心配置DD600产品;负责完成本地的数据备份,并
接收北京和成都的容灾数据
在各个数据中心配置EMC NetWorker备份软件,结合DataDomain虚
拟磁带库,利用先进的D-D备份架构,构建成面向快速恢复的数据备份容灾系统
所有应用服务器可以将数据按照既定策略高速备份到虚拟磁带库
或NAS方式提供的专用卷上 备份和恢复的效率提高5-10倍
1.3 备份策略
对数据进行备份,是出于保证数据的安全性、对系统信息做历史记录、在灾难发生时恢复系统等多方面考虑的。若要详细、历史的记录数据,并在特定情况下恢复特定时期的数据,就要保证数据备份的频率、以及备份介质上数据的保存时间符合预期设计的目标。
考虑到用户的具体情况,建议分为以下几种情况考虑备份策略: 1.3.1
操作系统和应用软件的备份策略
主机上的操作系统及其配置文件以及应用软件的安装文件和配置文件,是业务系统正常运转的基础,如果系统出现故障,重新安装配置系统的周期很长,为了能够快速的恢复系统,需要对这部分数据进行备份,并且应该选择完全备份。由于操作系统的数据在正式投入生产后,更改变化的频率很低,故采用每月备份一次的自动备份策率,此外在系统初次安装完成以及每次配置改动后,应由系统管理员手动执行一次。
具体的策略如下:
策略名称 备份对象 OS 操作系统及其配置文件以及应用软件的安装文件和配置文件 备份方式 安装完成后及每一次设置更改后,手动进行一次全备份; 每月进行一次全备份 保留时间 离线制作周期 1.3.2
12个月 1个月 数据文件的备份策略
在一些主机上的文件系统上,存有与日常业务相关的数据文件,这些业务数据文件通常变化比较频繁,需要自动化的备份策略予以保护。具体的备份策略视文件系统的大小、更新频率及速率以及系统的RPO和RTO而定,推荐的常用备份策略如下: 策略名称 备份对象 备份方式 Data _Files 文件系统中的业务数据 周日晚进行一次全备份; 周一到周六,每晚一次增量备份 保留时间 36月 离线制作周期 1个月 1.3.3
Oracle、Sybase、SAP等关系型数据库的备份策略
建议对Oracle、Sybase、SAP等关系型数据库采用每周日晚做完全备份,周一至周六晚做增量备份的策略。这样的策略考虑到Oracle、Sybase、DB2、SQL
Server等关系型数据库保留着各数据中心的最关键业务的数据,周一至周六晚上的增量备份可以缩短备份的时间并可以减少对磁盘和磁带的使用,结合每个周日晚上的全备份,可以保障快速恢复数据到用户指定的时间点并且最经济的利用了磁带库。 策略名称 备份对象 备份方式 Oracle、Sybase、SAP等关系型数据库 Oracle、Sybase、SAP等关系型数据库文件 周日晚进行一次全备份; 周一到周六,每晚一次增量备份 保留时间 12月 离线制作周期 1个月
以上策略可根据具体情况调整。
1.4 备份数据保护流程
备份流程
首先在各数据中心分别建设数据备份系统,采用EMC DataDomain的DD600系列产品作为备份数据存储介质,采用EMC NetWroker作为备份软件。各个数据中心根据各自应用系统情况,制定备份策略,先做本地备份,然后根据通过现有联网结构以及DataDomain产品自身具有的异地复制功能,分别将备份数据复制到容灾信息中心。通过以上工作,各数据中心备份数据都在网络中保留有两份副本。
恢复流程
当数据中心出现异常情况导致数据丢失,首先可以通过本地备份存储器上获得备份数据来重建系统和恢复业务,如果本地备份数据也遭到破坏,则可以从容灾中心获得备份数据来重建系统并恢复业务。
1.5 数据容灾系统建设说明
1.5.1
数据容灾原理示意图
1.5.2
容灾方案描述
通过在各个备份点分别配置不同的DataDomain产品,充分利用该产品远程复制功能,建立起备份容灾系统。
基于DataDomain构建全省数据容灾架构
在北京数据中心配置DataDomainDD600;
宜昌数据中心配置DD600;
成都数据中心配置DataDomainDD600
每个地方先用本地的DataDomain进行数据备份,然后将最新的全
备份数据传到各自的容灾中心;
大大节省容灾线路的带宽:因为DataDomain具有独特的超高数据
压缩能力(20:1以上),进行远程数据复制时,只传送改变了的数据单元,所以进行容灾数据传送时,对线路带宽的要求很低(第一次传送除外),现有的10Mb SDH线路完全够用;如果没有容量优化功能,在10Mb带宽(4500MB/hr)线路上传送2000GB数据需要接近20天,如果采用容量优化技术,只传送改变了的数据单元。按20:1的压缩能力算,只需传送100GB数据,仅仅需要1天的时间。所以采用DataDomain容量优化技术至少可节约95%的带宽和时间。
1.5.3
大大节省容灾线路的带宽
因为DataDomain具有独特的超高数据压缩能力(20:1以上),进行远程数据复制时,只传送改变了的数据单元,所以进行容灾数据传送时,对线路带宽的要求很低(第一次传送除外);
如果没有容量优化功能,在2Mb带宽(900MB/hr)线路上传送2000GB数据需要约20天:
10Mb/s = 10*3600/8 (MB/hr) =900MB/hr = 4.5GB/hr
传送2000GB数据所需时间 Time=2000GB/4.5GB (hr)= 18.5天
如果采用容量优化技术,只传送改变了的数据单元。按20:1的压缩能力算,只需传送100GB数据,仅仅需要1天的时间。所以采用DataDomain容量优化技术至少可节约95%的带宽和时间。
此外,重复数据删除产品应具备远程链路带宽调整能力,可以根据用户的实际情况,限制不同时段、不同复制策略对带宽的需求。因此除为避免第一次全备份数据复制的时间过长,需要分配较多带宽以外,其他数据复制对于带宽需求可以根据实际情况任意调整。
另外,为防止链路的抖动、异常中断等情况,重复数据删除产品还应具备断点续传能力,避免该种情况下的网络资源浪费。
1.5.4
远程容灾策略
本地备份的数据定期传到容灾中心,建议按以下策略进行: 策略名称 容灾对象 方式 DR 本地备份数据 每周日或每天将本地最新的全备份数据远程拷贝到容灾中心 保留时间 36周 离线制作周期 1个月
因篇幅问题不能全部显示,请点此查看更多更全内容