本文作者为Noemi Greyzdorf,他是IDC的研究经理。
今天,IT 机构面临的最大挑战之一是非结构数据成指数倍数的增长。造成这种趋势的原因主要是因为企业业务的驱动所造成的,例如需要保留数据、越来越多的信息被创建成数字形式以及不断增长的Web 2.0应用等等都带来了对存储能力的大量需求。典型的实例来自金融服务、生物工程技术、媒体和娱乐等行业。
存储行业正尝试着应对这种新状况,为此开发了文件系统软件产品,它可以满足对可伸缩性、容量优化、独立的全局命名空间和数据可用性的需要,并且所定的价格不会超出IT 预算。
传统上采用文件系统的两个主要环境包括:企业高性能计算和文件共享。HPC 环境使用专门的硬件和软件,最近已经移到了带有分布式文件系统的基于Linux的平台,从而支持并行处理。在企业方面,发生的重大改变就是如何提供文件系统服务,以及他们还必须应对什么样的挑战。另外有一种单独形式的文件系统(诸如Windows或基于目标的文件系统设备---通常指NAS)支持文件共享和文件保存与打印服务。但是,不同的机构有不同的需要,为了满足这些具体的需要,各位经理人开始考虑采用新的方法。
"全球网络存储工业协会(Storage Networking Industry Association,SNIA)"是这样定义文件系统的:它是"在一个或多个物理或虚拟磁盘的地址空间上使用结构方法的软件组件。"一般而言,文件系统分为独立的和分布式的两种。
独立的文件系统既可以与操作平台(例如Windows上的NTFS)直接连接,也可以直接连接到为特定目标建立的文件系统(例如网络应用设备)。分布式文件系统既是联合的(说它是联合的因为一个管理节点跟踪所有元数据,并且一组结点提供数据。)又是集群式文件系统(说它集群是因为元数据和I/O处理在集群中平均地分布在所有节点上)。部署合适的文件系统可以使IT机构更有能力管理他们的非结构化数据资产。
独立的文件系统
独立的文件系统提供文件共享服务,通常与存储设备捆绑在一起,通过NFS 或 CIFS协议进行存取。最典型的独立的文件系统是Windows上的NTFS。NTFS和Windows服务器会在同时买到(它们会安装在一起)。Windows服务器通常用于文件共享和文件归档与打印服务。当需要更多的容量时,需要购买新的运行NTFS的服务器并且为用户分配空间。NetApp平台是独立式文件系统的另一个实例。NetApp公司将其文件系统与存储设备安装在一起提供,通过NFS 或CIFS执行存取,通常将其称之为NAS设备。
在很多机构内,基于文件的数据增长给存储经理们带来了管理问题(例如,可能有太多的服务器用作文件服务器,致使经理们要花费大量的时间处理数据迁移、容量配置和性能负载平衡等事务)。
分布式:联合文件系统
为了完成文件归档、打印与文件共享工作,IT 机构正面临着要管理很多文件服务器的挑战,他们的目标将是找到简化文件迁移和容量再分配等任务的方法,并且还需要找到提高容量使用率的方法。IT经理们正在寻找简便的方法管理他们的基于文件的环境。
一种解决方法是文件虚拟化,这种技术可以为所有的文件提供一个独立的固定点。一个典型的部署就是将文件虚拟化系统部署成很多文件服务器或NAS设备的前端。在这个文件系统上,支持用户共享;无论在后台的硬件中怎样移动数据,文件的目录结构和位置都不发生改变。文件虚拟化软件基于根据策略定义的特征管理文件的物理位置。
文件虚拟化是联合文件系统的很好的实例。实现文件虚拟化可以自动化处理不同平台间的文件迁移、快照、复制,以及存储分层。虚拟化文件服务使企业机构能够选择使用其它厂商的产品,并且部署省钱的数据可用性、业务连接性和可伸缩性功能。
集群文件系统
还有一些层面的市场需求是文件不只要支持员工间共享数据而且还要支持关键的业务智能,这些业务智能可以使该机构不同于他的竞争对手,或者可以为管理审核人员或投资商提供必要的信息。这类基于文件的数据可以长期保存并且必须具备高可用性和完整性。在这样的环境下,要具有可伸缩性、可用性和易于使用等功能同时还要保持较低的成本是很困难的。
Federated FS可以通过文件虚拟化利用现有投资(文件服务器或NAS设备),从而能够战胜这个困难。文件虚拟化软件可以集中管理现有文件资源、简化迁移、提高可伸缩性、并且简化环境的整体管理。但是,随着性能需求的不断提高,联合文件系统的结构可能成为瓶颈。
代替文件服务器/NAS环境
解决这个难度不断加大的、基于文件的数据的管理困难的另一种方法是替代文件服务器/NAS环境。新的解决方案涉及一个不同的联合式文件系统结构,它可以通过限制客户机与进行元数据查询的主节点间的交换最小化元数据节点的性能影响。因为只有少量的数据不得不进行交换,因此性能影响是最小的。 还有一种方法是集群文件系统,这种方法具有并行处理能力,并且管理控制每一个新增加的服务器节点。在该结构体系中,可以将文件移动到不同的存储层,同时不会影响到终端用户。
文件系统软件正在成为数据中心设施中一个重要的组件。对于那些依靠保存和提供基于文件数据作为他们的主要收入来源的机构来说,这是特别实用的。这些机构包括提供图片服务的站点、提供流视频和为个人数据提供在线存储空间的机构。
数据中心经理正在努力抑制基于文件的数据扩张,为此,他们考查了提供增值功能的文件系统软件开发商,他们提供的增值功能不只有助于管理、控制和保护数据,并且还可以最小化其对数据中心操作的影响。自动的迁移、存储分层、存储优化(例如,压缩和重复数据删除)和安全等功能对用电和冷却消耗、数据保存和保护以及管理环境所需要的人力资源都产生了十分重要的影响。
结论