作者将本文同时发布到:EMC中文支持论坛 https://community.emc.com/docs/DOC-24116


介绍


本文整理了EMC中文论坛第三期的专家问答“Data Domain虚拟带库(VTL)的部署和实施”精华问题。原问答贴地址:https://community.emc.com/message/661694#661694


详细信息


问题1请问目前DD 国内外客户是怎么使用的?一般是使用VTL/OST或者使用NFS/CIFS 共享方式?


回答:关于DD如何使用的问题,在我们的全球用户当中,你说的几种方法都有。当然每个用户的需求不一样,或者已有的环境不一样 ,这样就导致了不同的使用方法。就技术上讲,VTL是走光纤协议的,其他的都是走网络协议的。如果你现在已经有SAN环境了,而且备份服务器已经有光纤卡了(有多余的光纤口,我们主张用专有的FC口连DD)你可以考虑用VTL,达到理想的备份速度。当然你也可以考虑网络(OST/CIFS/NFS),当然还是得看你们的数据量,我们建议,即使是走网络,最好是走备份专用网络,这样也不会影响你的生产网或者办公网。

最后还是取决于你们的备份环境还有备份数据量。CIFS多用于WINDOWS备份服务器,和你们的企业AD域可以结合。NFS用于UNIX系统,而OST适用于任何备份服务器,而且目前OST支持10G的备份网络,非常的高效。


问题2国内使用OST多吗?如果使用OST需要注意哪些方面的问题,EMC是否有专业团队负责实施?


回答:国内也有一定的用户用OST,目前我们OST支持Netbackup ,backup exec 以及EMC networker三种备份软件。而且目前我们正在推广RMAN+OST备份,不需要备份软件介入。OST的备份性能很好,可以减少网络带宽。我们EMC有专业的团体实施。


问题3可否详细介绍一下RMAN+OST备份?


回答:Oracle server 通过LAN 链接DD,当然server要安装我们DDBOOST的插件。所有备份的数据就会记录到RMANCATALOG里面,甚至我们可以复制到DR数据中心的DD里面,RMAN服务器也会记录这些复制的数据。这点对于DBA来说特别的灵活已经易管理。我们知道有些公司备份是专门的管理员来管理的,这样就免去了这个环节。而且服务器端只发送唯一的数据,大大地减少了对带宽的利用从而提高了备份的速度。


问题4恢复数据时是否要先对数据解压缩,恢复时传输的数据量是否为去重之前的数据量?


回答:由于我们的产品用的是重复删除技术,所以所有的数据只存在一份在DD里(严格上说是每个颗粒化的数据切片)只存在一份。所以是一个树形结构的文件系统,恢复的时候会根据索引把数据重构出来,数据是去重之前的。


问题5如果做双备份域,怎样才能让DD复制过去的数据立刻被备份软件可见及可用?


回答:关于你这个问题分几点:

1.如果你用的是OST,那么所有的复制数据的信息会记录在备份软件的catalog,所以备份服务器会记录所有的索引。这也正是很多客户选择OST的原因之一。

2.如果你用的是VTL,需要两个域都配置成VTL的环境。VTL的数据复制是基于磁带为单位的,所以一个文件就是一盒磁带。如果你要备份软件识别复制的数据,只要在DD里将这些磁带导入到带库,这样的话备份软件就会识别。

3.假如你用的是NFS或者CIFS,和VTL类似,把这些数据放在目的端DD的一个share里面,然后就可以允许目的端的备份服务器访问了,这样的话备份软件也可以访问这些数据了,当然前提是备份软件里配置好备份服务器已经连接他的DD share


问题6OST的话,备份服务器是1台是吧?在配置上NW NBU有什么特殊的么?


回答:其实OST的话,只是媒体服务器多装一个插件而已,并无太大的区别,应该是TCP/IPclient/server的通信模式。NW已经集成了OST的插件,无需另外安装。


问题7虚拟带库 只支持EMC自己的backup软件吗? 虚拟带库增加通道时有license限制吗?


回答:我们的VTL可以适用于任何的备份软件。关于你说的增加信道有没有LICENSE的限制,据我所知应该是没有的,但是具体你得咨询软件提供商。


问题8VTL会不会出现物理带库中出现的比如磁带损坏,机械臂损坏这样的错误呢?


回答:一般这个问题都是SCSI通信过程中出现的问题,但并不像物理的那样物理损坏,而是逻辑上的错误。如果你配置得当,这种问题是可以避免的。


问题9目前DD boost在国内的部署情况如何?听介绍说DD boost软件配合DD,能大幅增加备份吞吐量和减少所需的网络带宽,想大致了解下就这两点来说是如何实现的?DD boost在部署上有什么需要特别注意的地方吗?


回答:DD BOOST是个很成熟的技术,是最早赛门铁克公司开发的OST 协议(Open Storage technology) ,当然我们DD在这基础上继续发扬光大,集成了具有DD特色的高效备份--减少带宽以及高吞吐量。但是目前我们只支持EMC networkerAvamar 和赛门铁克的备份软件。国外的用户特别倾向于这种备份,在国内的话,我们可以看到上升的势头还是很明显的,因为他部署比较方便,都是基于网络的。

DD BOOT是依靠DD独特的去重算法,在客户端只发送DD 内没有的数据片段,也就是说源端消重加上数据进入DD后的再次压缩。想象一下,客户端有100G的数据,实际通过网络传输的只有   10G,大大减少了网络开销以及提高了备份速度。


问题10如果我的DD可用容量为9T,那我在创建虚拟带库的时候该如何规划,如单盘虚拟出来的磁带为400G,那是否为该创建的磁带数为22盘呢?


回答:你的算法是基于没有重复删除技术的VTL。但是我们DD有数据重复删除,因此可以建更多的磁带。那么具体怎么算,首先你要明确你需要多少大的容量来存储/保护你的数据周期。(过期时间是多少),然后再除以数据的压缩率,就是说你的数据变化率。


问题11DD本身(或是结合其他工具或软硬件)是否提供对虚拟带库工作状态的完善的监控机制或监控功能,例如监控备份的完成情况,监控底层磁盘的工作状态,报警等?有的话,能稍微介绍下吗?


回答:EMCDPA软件能够满足所有以上的要求。


问题12为什么我们要强调一个主机光纤口专门用于一个DD的光纤口?


回答:我想这是一个不仅仅是DD,而且应该是所有的厂商都强调的,就是主机HBA不建议共享给多个存储。因为如果共享的话,难免会出现FC通信过程中I/O处理不过来而出现timeout,这个时候一旦主机没有及时收到确认包的话,会触发reset(target resetlun reset)从而会导致备份失败或者一些主机报错,如磁带设备offline等等。

我们不推荐共享的方式,我相信任何其他的厂商也不推荐。我们看到过很多的问题,我想用FC analyser抓包可以看出哪里出问题,但肯定是FC协议成面的。但是我想肯定是不同厂商的设备对FC协议开发上有细微的区别导致的,从而会使得主机的HBA做出不正确的判断对于接收到的一个设备的SCSI命令,然而对于其他的设备会产生影响。举2个例子:当VTL和存储阵列共享的时候,大部分情况是OK的,但是有时候后主机会侦测到带库的序列号是存储的LUN的设备ID,从而导致I/O错误。第二个例子是,VTL和物理带库或者不同厂商的VTL连在一个HBA,这种出问题的概率会很高。经常会触发主机target reset或者lun reset,甚至严重的会HBA reset ,所以后果很严重。


应用于


EMC Data Domain