SAN环境下数据备份和远程容灾技术研究论文

时间:2021-04-16 10:04:55 论文 我要投稿

SAN环境下数据备份和远程容灾技术研究论文

  摘 要:针对目前的备份技术存在的问题,提出将多种数据备份技术、备份技术和容灾技术相互结合运用于数据保护中。通过多种备份技术的结合运用,可以达到减小数据备份窗口、缩短备份数据恢复时间的目的。通过把容灾技术和快照技术的结合运用,可以最大程度地避免用户的物理错误和逻辑错误。

SAN环境下数据备份和远程容灾技术研究论文

  关键词:SAN;LAN-Free;快照;备份技术;容灾技术

  中图分类号:TP309 文献标识码:A 文章编号:

  1.引言

  近年来,数据已经成为企业内IT系统架构的核心和关键。一方面,数据的存储架构必须满足海量数据存储发展的要求,以SAN(Storage Area Network)为代表的存储结构已经成为主流的存储架构。另一方面,客户对数据的安全性提出了更高的要求,因此数据备份技术和容灾技术已经成为数据保护的主要手段和方法。 一般将备份技术应用在对本地数据的保护上,而对于数据和应用的异地保护,通常使用容灾技术。实际上这两种技术不是彼此矛盾的,完全可以通过备份、容灾结合系统实现两种技术的完美结合。本文通过设计BADR(Backup & Disaster Recovery)系统,实现容灾技术和备份技术的完美结合。

  2.系统概述

  本系统主要考虑数据的安全性和完整性,同时结合备份技术和容灾软件而设计。由于这套系统既有备份的功能,又有容灾的功能,故将这套系统定义为BADR系统。

  BADR系统从功能上说有两部分组成,一部分是系统备份,通过设计备份策略、编写备份脚本程序,实现数据的本地备份和异地备份。备份策略主要包括数据库的全备份和增量备份。通过备份脚本,确保离线的数据保存在磁带机中。该系统的另外一部分是容灾功能,可以在本地生成生产卷的快照(或克隆),通过编写的同步脚本实现快照(或克隆)从本地到异地的传输。BADR系统既可以保护一段时间内的数据,又可以保护某一个时间点的数据。BADR系统的示意图如图1所示。

  图1 BADR系统拓扑图

  BADR系统逻辑层次上从低到高依次为存储层、基于存储的软件、光纤交换层、主机卷管理器层、数据层和应用层。下面依次说明各层实现的功能。

  存储层:由两个磁盘阵列系统组成,存储层存放系统的核心数据,是整个系统的基础;

  基于存储的软件:这一层由多个内嵌存储的软件构成,其中包括生成快照和克隆的软件;

  光纤交换层:由光纤交换机、主机HBA卡等组成,这层主要担任数据的传输的任务;

  主机卷管理器:这层负责组织、管理主机硬盘的容量空间;

  数据层:主要存放所有数据,包括数据库的数据,操作系统的数据;

  应用层:在本系统中主要指主机端运行的数据库,

  系统由SAN网络、以太网络组成。SAN网络由磁盘阵列系统、磁带库和两台光纤交换机组成。把两台磁盘阵列系统称为磁盘阵列A和磁盘阵列B,磁盘阵列A作为本地设备,磁盘阵列B和磁带库作为异地设备。在系统中把磁盘阵列A称为生产端,把磁盘阵列B称为备份端。在以太网络上,连接多台服务器(包括Window服务器、Unix服务器)。在备份客户端安装数据库,数据库的容量达到200G。这些服务器充当生产主机和备份客户端。

  在磁盘阵列上安装快照软件和容灾软件,由快照软件生成生产卷的快照,由容灾软件完成在两台磁盘存储设备之间卷级别的数据复制。两端数据的一致性通过卷级别的数据复制得到了保证。磁带库连接到SAN网络,用来备份在磁盘阵列生成的快照。在备份服务器安装备份软件的服务器端,通过备份服务器端管理所有的备份作业和磁带库。

  系统的主要实现通过磁盘快照技术、SAN备份技术和容灾技术。系统完成的主要功能有:

  (1)通过备份软件对服务器运行的'数据库做全备份,将该全备份集备份到磁带机上;对数据库在盘阵上的数据源Lun做快照,然后使用备份软件将快照备份到磁带机上。

  计算并对比两种方法的时间。为了验证备份的完整性,分别测试将磁带机上数据库的全备份和快照Restore到原数据库,测算两种方法所用的时间。

  (2)通过利用容灾软件,将磁盘阵列A的快照镜像到磁盘阵列B中。通过将该Lun绑定到主机端,来确认两端数据的完整性。

  (3)使用容灾软件,将磁盘阵列A的生产卷的克隆镜像到磁盘阵列B中。通过将该Lun绑定到主机端,来确认两端数据的完整性。

  3. BADR系统的模块设计

  BDAR系统由三个模块组成,即:快照备份模块、镜像快照模块和镜像克隆模块。

  快照备份模块实现两种备份技术的组合应用。首先使用基于LAN-Free的磁带备份技术对客户端的数据库作全备份,随后使用磁带机上的全备份集对数据库做Restore;第二组中先对数据库的数据源Lun做快照,然后利用LAN-Free备份技术将该快照备份到磁带库中,随后Restore该快照到生产机上运行的数据库中,使用数据库的回滚功能(Rollback)恢复数据库到某个时间点。

  镜像快照模块实现容灾技术和快照技术的结合应用。在磁盘阵列A端对某个被镜像的Lun做的快照,可以通过容灾软件镜像到磁盘阵列B端。这样就保存了源端的Lun的某个状态。当然也可以使用LAN-Free技术把这个快照备份到磁带机上。快照具有数据量小的特点,一般快照只有源卷的20%大小,这样通过容灾软件传送的话,传送的数据量不大。本地模拟环境下传送20M的快照数据用时大约5分钟。在数据被容灾软件复制到异地后,通过备份软件备份该快照的镜像到磁带机。容灾软件具有反向同步功能,即把原来的备份端提升为生产端,从新的生产端向原来的生产端实时复制。当生产端出现故障后,可以先把快照使用Lan-free技术恢复到备份端盘阵,再使用容灾软件复制回生产端。这种数据保护方式的最大好处是在在生产端出现故障时,由于有生产端的快照存放在异地,可以使用这个快照恢复生产端数据到生成快照的时间点。快照被容灾软件镜像,也可以对该镜像进行备份。这样做带来的好处是备份过的快照又完全可以恢复到磁盘阵列B上,通过容灾软件还可以还原回生产端,也就是磁盘阵列A上。

  镜像克隆模块将生产卷的克隆通过容灾软件镜像到备份端,然后再通过备份软件备份到磁带机上。这种技术是对生产卷的整个卷做了实时复制。由于克隆数据量要远大于快照,所以传送耗时要长。此外,克隆所需的空间是和源卷一样大小。容灾软件可以进行增量拷贝,就是把数据的改变量也同步到备份端的盘阵空间上。这样通过容灾技术,在备份端的磁盘空间总是保存最新的生产端数据卷状态。

  如果空间允许,可以保留生产卷的两个副本,即本地的克隆卷通过容灾软件复制到备份端磁盘空间的镜像卷和本地克隆卷的镜像卷。尽管占用较多的空间,但是对于关键应用和关键数据来说,以空间的代价带来数据的安全也是值得的。

  在数据备份和恢复过程中,如果结合使用盘阵的快照技术和LAN-Free技术,可以明显提高备份速度。相对单纯使用LAN-Free备份,这种两种技术结合使用带来的好处是显而易见的。它能明显提高备份速度,大大降低备份窗口的大小。在进行数据恢复时,时间也可以明显缩短。

  将快照技术和容灾技术结合使用,可以保证在生产端出现问题时,利用已经备份在备份端磁带库中的生产卷快照,迅速恢复生产卷数据的状态。

  4.BADR系统实现

  系统实现主要通过两个软件工具,即RMAN备份脚本和CLI软件工具。RMAN是数据库提供的备份标准接口,通过编写RMAN工具来完成快照的备份和恢复;CLI软件工具是磁盘阵列提供的软件接口工具,通过CLI编写程序完成快照的生成和启动过程。下图是系统实现的框图:

  图2 系统实现框图

  利用RMAN进行备份恢复的条件是:

  (1)建立一个recovery_catalog,存放RMAN使用和维护的目标数据库的信息,RMAN使用这些信息去决定如何执行备份和恢复的请求。

  (2)目标数据库必须是在archivelog模式下运行。只有这样,日志才能归档,而RMAN正是利用归档日志进行数据恢复,所以这是一个必备条件。同时archivelog模式也是数据库在线备份的必备条件。

  (3)RMAN备份中,如果采用磁带机备份,需要安装第三方介质管理库(MML)。恢复管理器保存在RMAN中注册的全部数据库的记录。当RMAN被用来启动备份或恢复数据库时,它将目标数据库与恢复目录中可用的数据库ID进行验证。如果条件一致,RMAN对目标数据库至少建立两个通道,其中一个通道只是对目标数据库的一个远程调用,使用PL/SQL接口来执行备份与恢复操作。

  使用备份软件对数据库做全备份,见图3。

  图3 数据库全备份

  如上图所示,数据库在备份软件的控制下,备份到EXB-220磁带机中。备份方式采用数据库全备份方式,数据库容量约为200GB,完成备份所需时间为两个小时。

  参考文献:

  [1] 杨浩谰,黄开莉.存储区域网技术研究[J].北京:通信技术,2005,51(43):94-96

  [2]Richard Barder.Paul Massiglia.存储区域网络精华-深入理解SAN[M].舒继武译,北京:电子工业出版社,2005年:204

【SAN环境下数据备份和远程容灾技术研究论文】相关文章:

大数据环境下的数据安全研究论文10-30

云计算环境下大规模数据处理技术研究论文11-07

大数据环境下云会计的论文06-10

分析论文:云计算环境下大数据06-26

云计算环境下的数据挖掘研究论文10-28

云计算环境下的分布存储技术研究论文11-06

大数据环境下的知识管理论文文12-11

数据库安全技术研究与用法的论文11-07

大数据时代数据管理技术研究综述论文10-28