您当前的位置: 首页> 网络培训

热门推荐

 

精选推荐

 
CommVault:不做一体机硬件,去重何处加强?

发布时间:2020-08-27

  早在2000年,当我在一家代理刻录机、盘片(CD-R/RW)等光磁记录产品的公司时,老板曾给我介绍数据存储备份市场——而那时也是第一次听说CA和Legato这两家软件厂商。一晃过去了十几年,Legato已经被EMC收购,除了合并Veritas之后市场份额较大的赛门铁克之外,一些新兴厂商也层出不穷。而我觉得企业级数据保护市场,有点像FC HBA领域的Emulex和QLogic那样,是个不算太大的圈子。为什么这样说呢?

  可能有不少人知道,以CDP(持续数据保护)闻名的飞康(FalconStor),其创始团队来自当初的CA ARCserve。据了解,他们认为传统的备份方式有许多不足,于是干脆放弃而搞起了CDP,事实则证明各有各的市场。而当笔者与一位来自赛门铁克的同行谈起CommVault(慷孚)这家公司时,他表示“那是从我们这里出去的人搞的…”。先不讨论青出于蓝是否胜于蓝的问题,CommVault连续数年的增长并在市场中站稳脚跟,证明他们有自己的成功之处。按照行业内普遍认同的观点,一些创新在初创厂商往往更容易实现,因为大公司有遗留产品和用户使用习惯的包袱,面对变革时难免要瞻前顾后。

  在上周采访CommVault中国区技术总监蔡报永先生之前,我从他的简历中看到了“SYMANTEC”的字样,当然他是在2011年加入CommVault的。而这次交流的重点,就是在今年2月底发布的最新版本一体化数据管理软件平台Simpana 10。

  笔者最大的收获——也就是本文的重点,在于Simpana 10更新的第四代重复数据删除技术。

  与硬件结合的快照:从SnapProtect到IntelliSnap

  ChinaByte比特网:在Simpana 10中,快照管理功能改名叫做IntelliSnap技术,有消息说是因为CommVault将其前身SnapProtect商标使用权卖给了NetApp。那么两者在未来的发展方向上有什么不同吗?

  蔡报永首先证实了这个说法,他还表示SnapProtect未来还是会由CommVault参与开发和支持。

  CommVault的快照技术,可以与IBM、戴尔、NetApp、惠普、EMC、Nimble Storage、HDS(日立数据系统)和富士通等品牌阵列上的快照功能配合使用。其目的在于通过服务器上软件代理协同的方式,来保护阵列上应用程序、数据库、文件系统和虚拟机的数据。进一步,还可以通过快照来创建备份。CommVault在Simpana 10中提出了ContentStore(内容存储库的概念),其中的存储介质可以是磁盘、磁带,也可以到云存储中。

  上表右侧为IntelliSnap支持的硬件阵列,其中有点意思的是仍被称为“Oracle/Sun LSI Arrays”,估计是因为他们与NetApp Engenio系列的OEM合作是从在LSI时代开始。左边支持的文件系统包括Windows、Linux和UNIX,数据库有DB2、微软SQL Server和Oracle,应用软件包括Lotus Notes、Exchange Server、SharePoint Server和SAP,还有VMware和Hyper-V虚拟机。

  增强邮件和医疗归档:用户需要一体化方案

拥有授权的员工,可以通过Outlook插件对他们的归档邮件进行原生Exchange访问。

  Simpana是将备份和归档等功能作为单一平台下的不同组件,而上图体现出了OnePass与Exchange的整合。除了邮件归档,Outlook插件还可以实现在客户端直接对ContentStore中数据归档层的访问。

  在Simpana 10发布的新闻稿中,我们看到:“CommVault首次针对医疗工作者的数据需求,帮助他们实现快速搜索和获取图片归档与通信系统(PACS)中的影像以及ContentStore中的电子档案,即使处理的数据来自多个PACS平台。通过一个集中式归档,医疗人员能够同时支持DICOM (Digital Imaging and Communications in Medicine) 和非DICOM数据,从而帮助医疗提供商提升效率,并控制数据管理的成本。”

  也就是说,CommVault开始进入医疗数据归档软件领域的竞争中,深入行业的做法能够挖掘更多的用户需求,也可能说明原有备份功能的用户希望有统一的供应商解决方案。

  第四代重复数据删除:并行、SSD hash加速

  在我们翻译的“IDC:2012年4季度全球专用备份设备市场增长9.7%”中,可以看到赛门铁克在PBBA领域的显著增长。结合硬件的NBU 5200和BE 3600系列的成功,主要得益于原有备份软件的用户基础。而这样做也有代价——失去了像戴尔这样的合作伙伴,这可能就是CommVault坚持做一家软件公司的原因(通过戴尔这个渠道的销售曾占到CommVault整体收入的1/4)。如今戴尔收购的AppAssure和Quest都有数据保护软件,而CommVault与他们的合作仍然保持。

  尽管没有做像赛门铁克那样的软硬件备份一体机,但CommVault也在加强他们软件对应的功能。Simpana 10带来的第四代重复数据删除技术提出了并行去重的概念(目前支持2节点),由于没找到合适的示意图,下面我们拿曾经在《重复数据删除竞争白热化:软硬结合成关键》一文中参与对比,同样为双节点的IBM TS7650G ProtecTIER来做个参考。

IBM ProtecTIER HYPERFACTOR重复数据删除示意图

  我们看到左边是介质服务器,数据由它们写到ProtecTIER目标端去重网关设备上——也就是中间的双线内重复数据删除引擎,经过处理后存放在单一存储库(全局文件系统)上。

  由于CommVault实现的是在介质服务器和源端(备份代理)的软件去重,所以它的双节点就相当于把中间那两个引擎换成了Simpana介质服务器,左边直接就是应用服务器,右边应该是共享的磁盘阵列。

  目前赛门铁克NetBackup 7.5和运行该版本软件的NBU 5220能够支持全局重复数据删除,但看资料需要配合使用多节点的NBU 5000系列目标端去重硬件设备,而不能在通用硬件上实现。而目标端设备方面,惠普StoreOnce B6200可以扩展到4个节点对,而高端VTL厂商Sepaton也是Scale-out(横向扩展)最多8个节点。CommVault未来应该可以扩展到2节点以上。

  在回答笔者的问题时,蔡报永表示:“CommVault的多节点去重可以针对单一任务(备份数据流),容量和性能都有加强。根据生成hash(哈希值)的奇偶性随机分配到A/B两个节点,进行重复数据删除处理再写入后端共同连接的盘阵。”根据我的理解,这应该是使用到了源端重复数据删除,因为数据在发送到介质服务器之前,就已经生成过hash了。那么如果只使用介质服务器去重的话,情况应该有所不同,但估计也能多节点并行操作。

  有了双节点之后,CommVault的介质服务器+去重也具备了高可用功能。因为在每个节点上只存放hash库而没有实际数据,在出现单节点故障时备份数据流可以由另一个节点承担,与本地的hash进行对比并写入后端存储。在故障节点恢复后再重建上面的hash库。

  ChinaByte比特网:我们看到Simpana 10的增强功能包括SSD的支持,这个是为了存储重复数据删除元数据、备份索引等用途吗?

  蔡报永:“没错,SSD就是在使用重复数据删除功能时,推荐来存放hash去重库的。”

  上表来自CommVault的资料,最左边一列是4种重复数据删除(介质服务器)节点类型,Sm(小)、Med(中等)、Lar(大)和XL(超大)。对应的依次是推荐的DDB(去重数据库?)卷大小、估计的后端大小(物理存储容量/RAID保护前?)、估计的前端大小(RAID保护后的物理存储容量?),以及配置举例。

  最右边一列,应该就是重复数据删除hash存储库的所在。从小到大分别为4-8个15K RPM SAS/FC硬盘做RAID 10,而最上面则有2种配置:Fusion ioDrive2 785GB PCIe 2.0 x4 MLC SSD;或者4个SSD(NAND闪存驱动器)容量600GB,加上配置为RAID 5 3+1(热备)的旋转硬盘。

  对于SSD用于加速去重的hash(元数据),尽管笔者在这方面不够专业,但也能想起这些年来了解到的昆腾Dxi系列重复数据删除阵列,以及亲手测试过的Exar BitWackr加速卡+软件(来自收购的Hifn)方案。毕竟内存的单位容量成本较高,而且是易失性存储介质,因此用闪存来处理这种需要大量随机访问的用途相当合适。

  蔡报永表示:“使用硬盘存放hash的话,一般情况下我们支持最大不超过7亿条记录,按照128KB的数据块来计算就是90TB的容量。而这个数据块大小可以根据需要在8-256KB之间调节。”为了控制hash比对的数据量规模(应该还有避免哈希冲突),每个重复数据删除存储库的大小有一定的限制,超过之后会将这个hash库封存。新写入的数据会重建一个新的hash库进行比对和存储。

  对于CommVault能够将去重之后的数据,无需恢复到原始状态就可以归档到磁带/云存储,蔡报永解释道:“我们是将索引和数据写在一起的,因此在恢复时不一定要经过生成备份并存放hash的介质服务器。相比之下,由于赛门铁克的备份索引与去重后的数据分开存放,因此单独将精简状态的数据写到磁带是不行的,并且在异地恢复时,需要Master Server上的Catalog文件才能进行。”

  希望本文内容能给大家带来帮助。如有不准确之处欢迎指正。

* 本文为ChinaByte比特网原创内容,版权所有,转载请注明出处和原文链接,未经授权请勿用于商业用途。

上一篇: 艾瑞咨询:2019年Q3中国第三方支付行业数据(附下载)
下一篇: 百度新闻怎么发布网站 网络新闻发布平台哪家好?

Copyright © 2012-2020(tech.pinshuirizhutea.com) 版权所有 Powered by 万站群

本站部份内容来源自网络,文字、素材、图片版权属于原作者,本站转载素材仅供大家欣赏和分享,切勿做为商业目的使用。

如果侵害了您的合法权益,请您及时与我们,我们会在第一时间删除相关内容!