当前位置:文档之家› NAS虚拟化

NAS虚拟化

存储经理人

更多精彩原创内容:

ILM重获新生!

未来的发展方向:主存储重复数据删除 十大存储网络优化秘籍

读者们给他们的中端存储阵列评分

RAID仍然是一种有效的数据保护技术2010年9月刊

NAS

虚拟化

文件存储已经失宠,而大多数NAS法随

着数据的长而不断扩大规模。

是时候考虑虚拟化你的NAS存储了。

TechTarget 中国《存储经理人》2010年9月刊 1

TechTarget

中国《存储经理人》2010年9月刊 2

目 录 刊首寄语 走向“云存储” (3)

总编看存储

ILM 重获新生! (5)

存储战争

未来的发展方向:主存储重复数据删除 (9)

NAS 虚拟化 (12)

十大存储网络优化秘籍 (25)

质量颁奖五: 中端存储阵列 (34)

业界观察

备份前端技术的发展趋势 (44)

存储厂家开始堆栈化 (49)

存储调查

RAID 仍然是一种有效的数据保护技术 (53)

我们的编辑团队 (55)

联系我们 (58)

【刊首寄语】

走向“云存储”

近一段时间,存储界最热闹的事情莫过于两大IT巨头——惠普与戴尔——竞购3PAR了。8月16日,戴尔宣布以每股18美元、总价11.5亿美元收购存储厂商

3PAR。本以为就是一个简单的收购,却没料到一星期后惠普突然杀出来,并提出

16亿美元收购3PAR。所有人马上意识到,这将是存储界收购的又一重大事件,

并对惠普与戴尔的竞购给予高度关注。随着惠普与戴尔一次又一次的提高收购价,

各种分析、评论,猜测也扑面而来。其中最让人好奇的就是3PAR究竟为何物,它

有怎样不可替代的优势以致两大厂商为它“大打出手”。最终这场竞购之战以惠普

的23.5亿美元收购价结束。(详见专题《双雄争霸惠普与戴尔竞购3PAR》

https://www.doczj.com/doc/066509647.html,/microsites/2010hpanddell/index.html)战争背后的原因是什么?这家成立于1999年的存储公司3PAR,在高端存储领域有所表现,通过软硬件以及虚拟化技术帮助企业有效地存储和管理数据。对于

戴尔来说,自08年1月份完成Equallogic收购后,戴尔拥有了中低端存储产品,

而在中高端领域,戴尔却一直以代理EMC的产品为主,而3PAR定位于高、中端存

储,可以弥补戴尔的不足。对于惠普呢?一是怕戴尔日后对其造成威胁,另一方面

3PAR的高端对惠普也非常有利。

TechTarget 中国《存储经理人》2010年9月刊 3

其实,更深层的原因是未来趋势的云计算。尽管戴尔和惠普都提供存储解决方案,但没有制造出专门针对云计算的产品。购买一家已经生产云存储产品的企业,是他们进入云计算最快捷的方式。厂商们开始争相走向云存储。

未来几年内,归档或长期存储需求有可能将成为焦点,而未来的云存储解决方案很可能会极大地改善或改变你目前的长期存储实践。在我们看来,这些改变和改善将给核心的业务功能、IT服务提供和总拥有成本带来巨大的影响。

刘平

TechTarget中国存储网站编辑TechTarget 中国《存储经理人》2010年9月刊 4

TechTarget 中国《存储经理人》2010年9月刊

5

ILM 重获新生!

“信息生命周期”(information lifecycle management )这个名词在诞

生之初就好像有治疗失眠的功效,甚至缩写“ILM ”也没有在我们这个喜欢缩写

的行业中流行起来。几年前,如果和一名存储经理提到“ILM ”,得到的反应要

么是疑惑的目光,要么是冰冷的沉默,或者两者兼有。

但是,根据数据目前的使用价值(或者使用时间),将数据流动到最适合的

存储介质,这样的概念难道听上去不令人振奋

吗?大家现在都是艰苦作战,数据量越来越大,

预算却不断缩减。难道你不想保证资金没有浪

费到价值甚微、却保存在昂贵存储设备的数据

上? 很多IT 部门的确关心并且仔细琢磨把数据

放到何处。你听不到太多有关“ILM ”的谈话,

但是,这其实就是ILM 。ILM 这一概念源于主流世界的分层存储管理(HSM)理念,最初推出时,更多的人似乎关注于数据的价值,而不是数据的理想位置。

“信息生命周期管理”未曾得到重视,而一度销声匿迹。但如今归

来,重新冠名,目的更现实!

【总编看存储】 虽然在公共场合提到“ILM ”,仍然不为熟知,但无论你如何称呼它(存储分层或

智能存储管理),它

已经归来。

结果,数据分类(data classification)变成了一个新的流行词,随之涌现出一些数据分类技术公司。该技术的前提是:对数据的了解不应局限于数据何时创建、何时修改或数据大小。这些信息是有用,但如果真想合理地利用数据,就需要了解该数据更多的信息情报。

人们常说知道得越多越好。既然如此,为什么不干脆打开数据文件,看一下里面的内容呢?毕竟,如果不知道数据真正价值所在,就无法判断数据是否应该放在重要的位置,还是某些近线系统或者角落。不过,业务部门就需要参与,这正是ILM逐渐销声匿迹之时。

是金子总会发光。如今ILM回来了!虽然在公共场合提到“ILM”,仍然不为熟知,但无论你如何称呼它(存储分层或智能存储管理),它已经归来。这一次的区别是我们集中精力解决问题。我们更加密切地关注数据存放的地点。之前我们花了太长的时间希望找到完美的解决方案,结果却忘记了其实应该考虑那些不错或者至少快捷的解决方案。

但是,这样的解释有点过于简单。ILM之所以能够重获新生,是因为现在把数据存储到哪里比以前有更多的选择。固态存储可能是ILM重生的催化剂。当固态存储开始进入企业存储系统时,有关如何决定何种应用使用这种昂贵闪存技术的争论就一直没有中止过。但是固态存储者称不提每GB需要多少钱,而应该想想每次I/O的花费。这又为争论增加了一个新的话题。最终,有人意识到,与其TechTarget 中国《存储经理人》2010年9月刊 6

TechTarget 中国《存储经理人》2010年9月刊

7

把数据“停泊”在固态存储中,为什么不让数据只要有需求就来固态存储“转悠

转悠”?

然后,动态和自动地转移数据的想法随

之诞生。忘掉打开文件或者索引内容;我们

只需要看数据使用的频率和速度。并非所有

公司都有应用或资金在存储三角的顶部增加

一个很昂贵的存储层,但是同样的原则可以

使用到数据的转移中,如从SAS 到SATA 。可

能背后没有复杂的数据分类,但这是一个实

用的解决方案。 企业日益重视的云存储也提供了另一种解决方式。聪明的创业公司如

StorSimple 和Nasuni 已经推出产品,几乎将云无缝地和数据中心存储进行集成。

现在还有LTO-5,磁带突然再度火起来。LTO-5有3TB 的存储容量和

240MBps 的传输速率(都具有压缩能力),无疑可以加强磁带作为一种可靠存

储层的地位。

如果你的存储厂商没有提供某种形式的自动数据移动,问他们什么时候将提

供。正如精简配置已经深入大多数企业存储系统,数据减少技术也随后即至,自

并非所有公司都有应用或资金在存储三角的顶部增加一个很昂贵的存储层,但是同样的原则可以使用到数据的转移中,如从SAS 到SATA 。

动分层将成为存储厂商系统管理套件的一个基本部分。如果不是的话,你可能就要考虑换厂商了。

(作者:Rich Castagna 译者:谢小丽)TechTarget 中国《存储经理人》2010年9月刊8

TechTarget 中国《存储经理人》2010年9月刊

9

未来的发展方向:主存储重复数据删除

10年前,数据量是10TB 的数据中心为数不多。而现在,数据超过100TB

甚至10PB 的数据中心比比皆是。在未来的10年,数据还会持续的增长,EB 级

别数据中心肯定会出现,并且会成为主流。事实上,曾有一位客户告诉笔者,三

年以后他们的数据就会达到EB 级别。 随着数据的持续增长,现在的存储系统肯定无

法满足需求。那如何来解决这个问题呢?使用新技

术是这个问题最好的答案。硬盘的密度会继续增加,

这样在固定空间内就可以存储更多的数据。虽然容

量大的硬盘会影响应用程序的性能,但智能的分层功能会将高速的硬盘和大容量的硬盘分隔开,这样系统的性能问题和容量问题都

能完美的解决。

还有一些其他的存储优化技术,例如自动精简配置功能,可以将你的存储空

间利用率最大化。使用传统的存储技术,在已分配的空间中,大约有50%到70%空间得不到使用,在白白浪费。使用自动精简技术就可以提高存储空间的使用比

自动分层和精简配置工具可以帮助用户处理日益增长的数据,但这

显然还不够,主存储重复数据删除功能同样非常重要。 【存储战争】 随着数据的持续增长,现在的存储系统肯定无法满足需求。

率。在PB级别的数据中心中,如果将上面的数字降低到20%,那将会节省相当多的空间。在1PB的存储环境中,使用自动精简配置,可以节约大约300TB到500TB的空间。如果是10PB的环境,将会节约3PB到5PB的空间。

另外一个技术是主存储重复数据删除。即使是适中比率的重复数据删除都可以节省相当多的资金。如果你的数据占用的空间是100TB,使用这种技术可以非常容易的将使用空间减少到50TB。2:1的压缩比率是非常容易实现的,如果比率达到5:1呢?将会有80TB的空间可以节省下来。在1PB的数据中心中,保守的估计会节省500TB的空间(2:1比率),乐观的话就可以达到800TB (5:1比率)。10PB的数据可以节省到8PB。

不但可以节省资金成本,还可以大幅度降低软件维护的费用,即使在人员成本方面,也可以得到优化,如果再考虑到电量,散热所节省的费用的话,主存储重复数据删除完全可以改变整个IT的格局。

如果上面所提到的优点都能实现的话,你肯定想马上就部署这项新技术。然而现实并没有那么乐观,因为它仍然有一些不容忽视的问题需要解决,例如: 它会对性能造成影响,这是客户无法接受的。不但可以节省资金成本,还可以大幅度降低软件维护的费用。

TechTarget 中国《存储经理人》2010年9月刊10

?主存储重复数据删除可能需要更多的内部资源(例如,内存和CPU),而有些客户却由于当初的设计缺陷而无法满足这个条件。

?即使没有内部资源问题,一些存储系统需要更改现有的架构才可以部署重复数据删除,对一些客户来说,这个过程可能需要很长一段时间或者

根本就不可能实现。

?无论厂家如何宣传,主存储重复数据删除仍然是一项复杂的技术,大部分的厂家的产品并不成熟。

?如果有意外出现,那后果是不可设想的,所以在选择供应商时,一定到慎之又慎。

截至目前为止,有两个厂家提供了主存储重复数据删除设备。不过这些产品的可扩展性和性能都存在问题,因此其他的厂家并没有效仿。今年年底到2011年会有更多的产品出现。

重复数据删除是虚拟化的一种,笔者认为以后它将像今天的服务器虚拟化一样,会更加广泛的应用与各种数据中心中。数据日益增加是不可改变的事实,我们需要新的技术来解决这个问题,希望重复数据删除不会让我们失望。

(作者:Tony Asaro 译者:曹同举)TechTarget 中国《存储经理人》2010年9月刊11

NAS

虚拟化

目前,各个领域的非结构化数据正在以飞快的速度增长,已经成为了一个IT部门的巨大挑战。大量的市场调查公司的统计数据都显示出同样的图景:在大多数公司

中,非结构化数据相比于结构化数据来讲已经明显占了上风,整个企业各处都充斥着

非结构化数据,各类文件服务器或者NAS设备上,都是这些数据的长久定居场所。

TechTarget 中国《存储经理人》2010年9月刊12

如何管理这些数据已经成为一个急待解决的痛点,管理成本飞涨。

我们到底应该怎样这种左右为难的境地当中的呢?显而易见,一方面,我们可以很容易的利用Windows或者Linux的文件服务器再加上直连存储系统或者SAN存储系统来构建出一台文件服务器来存放非结构化数据。另一方面,我们还有传统的纵向(Scale-Up)扩展方式的NAS系统,但是却不可横向(Scale-Out)扩展,扩展能力受限。比如,NetApp在发布Ontap 8之前是并没有先进的集群以及单一命名空间的产品的,唯一的扩展方式就是再购买一台更大容量和性能的Filer (NetApp的NAS设备)或者干脆部署一台独立的NAS以脱离当前的NAS系统。

数据存储行业已经很深刻的认识到这个情况,很多厂商都已经采取了不同的策略推出了文件系统和NAS虚拟化产品,这些产品能够帮助用户解决当前面临的棘手问题。虽然这些产品被宣称可以解燃眉之急,但是市场反应还是比较冷淡。“块级别的虚拟化用了10年才得以深入人心,” Stillwater, Minn.-based StorageIO Group 公司的创办者以及高级咨询师Greg Schulz这样说道,“NAS虚拟化仍然处于早期阶段,在被人广为采用之前,会经历一段很长的时间。”

对文件访问的四种虚拟化方式

在后端的文件存储层与客户端之间嵌入一个逻辑层次,这种虚拟化文件访问的方法被认为是应对非结构化数据所带来的挑战的一种最保险的方式。与块级别的虚TechTarget 中国《存储经理人》2010年9月刊13

拟化类似,实现文件访

一种,相反,我们有多

种架构和方法来在文件

虚拟化市场上角逐。

1. 文件系统的虚

拟化(整合)是文件虚

拟化的方式之一。站在

一个较高的角度来审视

的话,文件系统虚拟化

相当于将多个独立的文

成为一个大的文件系统

池,而客户端访问这个

池的时候就像在访问一

个单一的单元,感觉不

到底层的多个独立文件

系统的存在。换句话说,客户端所看到的是一个单一命名空间而不是底层的文件存

TechTarget 中国《存储经理人》2010年9月刊14

TechTarget 中国《存储经理人》2010年9月刊

15

储。底层的文件存储可以是一台独立的NAS 设备,或者一批不同类型的文件服务器

和NAS 设备。文件系统虚拟化有针对性的解决

了两个主要问题:它给用户提供了一个单一的

虚拟文件存储空间;它提供了其他的存储管理

功能比如在线数据迁移以及文件路径固定化处

理(当文件在底层各个存储空间内移动的时候

对上层客户端透明)。 文件系统虚拟化的一个最大好处便是它可

以被方便的部署在现存的环境中同时不会对现

存的服务器以及NAS 设备产生影响。当然,也有一些劣势,即文件虚拟化并不能够

简化对底层各个文件存储空间实体的管理操作。

2.集群文件系统是文件虚拟化的另外一种方式。集群文件系统可以说是下一代

NAS 系统中的一部分,它的机制可以突破传统纵向(scale-up) 架构的NAS 系统所

带来的限制。集群文件系统一般由提供块级访问的存储节点(典型情况下起配3个

节点)组成,通过简单的向系统中增加更多的节点,整个系统可以扩展到PB 级的

文件存储容量。集群文件系统将所有节点粘合了起来,对外向客户端提供一个全局

的单一命名空间。提供基于集群文件系统的NAS 厂商的代表有:FalconStor

Software 公司的HyperFS (OEM 自中国国内的集群文件系统厂商:蓝鲸

文件系统虚拟化的一个最大好处便是它可以被方便的部署在现存的环境中同时不会对现存的服务器以及

NAS 设备产生影响。

BWFS), Hewlett-Packard (HP) 公司的StorageWorks X9000 Network Storage Systems, IBM’s Scale Out Network Attached Storage (SONAS), Isilon Systems 公司, Oracle公司的Sun Storage 7000 Unified Series, Panasas 公司, Quantum公司的StorNext 以及Symantec公司的FileStore。

3.集群NAS系统是文件虚拟化的第三种方式。集群NAS系统的架构囊括了基于集群文件系统的NAS系统的多个好处。与基于集群文件系统的NAS系统所不同的是,集群NAS系统并不是在所有节点上都承载同一个单一文件系统,而是在每个节点上都维护各自独立的文件系统,然后在高层将这些独立的文件系统进行松耦合,对外表现为同一个根路径入口,供客户端来访问。从某种意义上讲,集群NAS属于一种将横向(scale-out)技术、多节点存储架构与文件系统整合者三个角色结合起来的合体。除了可以整合异构文件系统之外,它还可以整合本地存储节点上的文件系统。BlueArc公司的Titan以及Mercury系列的横向架构的NAS是集群NAS的典型代表。

4.NAS网关可以看做一种文件系统虚拟化设备。部署于块级存储系统前端,NAS网关可以凌驾于块级存储之上而提供NFS和CIFS协议的数据访问。这种网关设备大多数NAS厂商都提供,它通常可以允许将第三方经过认证的块级存储设备进行整合虚拟化,然后形成一个单一命名空间。

TechTarget 中国《存储经理人》2010年9月刊16

NAS系统以及基于集群文件系统的NAS网关,或者集群NAS架构都属于下一代的NAS系统,而且与现存的传统文件存储不相容,通常这些新架构的系统会与当前现存系统并行运行或者直接替代后者。所以,这些系统会有些难于部署,以及在成本上高于文件系统虚拟化产品。然而,管理一台独立的NAS设备而不是被文件系统虚拟化产品所整合起来的多个文件存储设备,其在所耗费的额外精力和成本上的好处也是不可小视的。

文件系统虚拟化产品应用场合以及选择标准

TechTarget 中国《存储经理人》2010年9月刊17

TechTarget 中国《存储经理人》2010年9月刊

18 在很多情况下,直接使用横向(scale-out )架构的NAS 系统来替代现有的文

件存储系统并不是一个好选择。能够将不同类型的文件存储系统整合成一个大的单一命名空间的文件系统虚拟化产品与传统NAS 系统以及横向(scale-out )的NAS 系统应当是一种互补的关系,尤其是在将传统文件存储转向新类型存储的期间。“很多用户购买了NAS ,目的是得到一些诸如复制、归档以及快照等的增值功能,但是他们并不对所有文件都是用这些功能。” AutoVirt 公司的市场副总裁Brian Gladstein 这样说道,“我们可以让这些客户将现

存的低端文件存储与更高速更强的文件存储系统

混合使用,同时给他们提供一个单一命名空间。” 即便是对于一些可以将他们的非结构化数据

集中存储到支持单一命名空间的中心NAS 设备的

公司,也不可避免的存在一些并没有被整合进来

的NAS 孤岛。这些孤岛可能是存放有部门私有数

据,或者被认为是一些不值得存放在相对较昂贵

的NAS 设备上的数据。文件系统虚拟化产品则允

许将这些不怎么受待见的数据与NAS 设备一起整合成为一个全局命名空间。文件系统虚拟化的第二种使用场合是数据迁移。在导致数据从一个物理位置被迁移到另外一个物理位置所发生的众多原因中,主要的三个

即便是对于一些可以将

他们的非结构化数据集

中存储到支持单一命名空间的中心NAS 设备的公司,也不可避免的存在一些并没有被整合进来的NAS 孤岛。

原因是:获得了新数据、存储基础架构升级以及数据重分布项目。因为文件虚拟化产品可以实现对不同类型的文件存储的虚拟化访问,所以这些产品就可以提供天然的数据迁移方案。另外一个应用场景则是自动分级存储。可以在文件虚拟化产品内嵌入一个可以根据不同元数据类型比如最后访问时间、文件尺寸及类型等而定义数据迁移规则的引擎,这样可以实现将对应的数据迁移到合适的存储层级中。

文件虚拟化产品有两种交付形态:独立的物理设备或者独立的软件产品。以软件形式交付的文件虚拟化产品,其优势则是提供非常灵活的部署以及对硬件的自由选择,而且这种形态交付的产品具有很低的厂商依赖性。相反的,以独立物理设备交付的文件虚拟化产品,一般会以一个整合的、经过性能优化以及其他优化的产品包形式交付,由于硬件和软件皆由同一家厂商提供,所以兼容性的风险也就降低了。

在比较不同的文件系统虚拟化产品时,虚拟化所作用的层次也是一个很重要的选择标准。比如,Microsoft的Distributed File System(DFS)提供了一种共享模式的虚拟化;诸如F5 Netword公司的ARX系列则提供文件级别的虚拟化。

是否能够方便的部署也是另外一个重要的标准。理想状况下,文件虚拟化产品的部署应当对客户端的改变很小,以及对后端文件存储系统中的文件数据不应当予以改变。

所支持的文件系统也必须考虑。有些系统只支持CIFS,像F5的ARX以及EMC TechTarget 中国《存储经理人》2010年9月刊19

公司的Rainfinity同时支持CIFS以及NFS,这种支持对于Windows、Linux的混合环境很受用。如果对应的产品支持数据迁移以及自动分级存储,那么一个良好设计的策略引擎是非常重要的。

文件系统虚拟化产品样例

多个厂商都提供了文件系统虚拟化产品,而这些产品的背景以及模块都不同。

AutoVirt文件虚拟化软件:像微软的DFS一样,AutoVirt是一个运行在Windows服务器上的独立软件产品。

AutoVirt全局命名空间使用CIFS协议来与文件服务器、客户端以及DNS交互。当某个客户端要求访问某个文件的时候,DNS设备将会解析出对应的目标存储设备。全局命名空间作为一个中间人的角色存在,它嵌在客户端以及DNS之间。使用AutoVirt全局命名空间,客户端的快件方式都指向这个空间,这个空间掌握着所有网络上的文件的位置,同时通过DNS的帮助来向客户端提供查询。

AutoVirt可以在不影响客户端的情况下透明的引入,直接接管现存的文件系统共享空间。虽然这个动作可以手动执行,但是AutoVirt提供一个数据自动发现服务来自动的发现现存的文件存储空间然后透明的全局命名空间引入。这一点与微软的DFS不同,后者需要在客户端配置新的DFS共享信息,而不是透明的让客户端继续

访问数据。

TechTarget 中国《存储经理人》2010年9月刊20

相关主题
相关文档 最新文档