|
一、误操作类 误删除、误格式化、误分区、误克隆等; 二、破坏类 病毒分区表破坏、病毒FAT、BOOT区破坏、病毒引起的部 分DATA区破坏; 三、软件破坏类 Format、 Fdisk、 IBM-DM、PartitionMagic、 Ghost等(注!冲零或低级格式化后的硬盘将无法修复数据); 四、硬件故障类 0磁道损坏、硬盘逻辑锁、操作时断电、硬盘芯片烧毁、软盘/光盘/硬盘无法读盘;磁盘阵列崩溃,数据库损坏
五、加密解密 Zip、 Rar、 Office文档、windows2000/XP系统密码。
六、数据修复时间: 软件故障数据恢复 1~5小时 硬件故障数据恢复 1天~2天 硬盘开盘数据恢复 1天~3天 服务器数据恢复2小时~3天 RAID0数据恢复 2小时~3天 RAID5数据恢复 2小时~3天 磁盘阵列柜数据恢复 2小时~3天
|
|
|
|
|
|
|
|
文件系统基础知识(一)-亿嘉湖南数据恢复基础《七》 | 出处:ChinaUnix 加入时间:2007-04-03 | <FONT color=#008000 size=2> 文件系统是操作系统的一个重要组成部分,通过对操作系统所管理存储空间的抽象,向用户提供统一的、对象化的访问接口,屏蔽对物理设备的直接操作和资源管理。 <BR> 根据计算环境和所提供功能的不同,M. Satyanarayanan[1]将文件系统划分为四个层次,从低到高依次是:(a) 单处理器单用户的本地文件系统,如DOS 的文件系统;(b) 多处理器单用户的本地文件系统,如OS/2 的文件系统;(c) 多处理器多用户的文件系统,如UNIX的本地文件系统;(d) 多处理器多用户的分布式文件系统。本地文件系统(Local File System)是指文件系统管理的物理存储资源直接连接在本地节点上,处理器通过系统总线可以直接访问。分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。上述按照层次的分类中,高层次的文件系统都是以低层次的文件系统为基础,实现了更高级的功能。比如(b) 需要比(a)多考虑并发控制(Concurrency Control),因为可能存在多个处理器同时访问文件系统的情况;(c) 需要比(b) 多考虑数据安全访问方面的设计,因为多个用户存在于同一个系统中,保证数据的授权访问是一个关键;(d) 需要比(c) 多考虑分布式体系结构带来的诸多问题,比如同步访问(synchronous access)、缓冲一致性(cache coherency)等。随着层次的提高,文件系统在设计和实现方面的难度也会成倍的提高。但是现在的分布式文件系统一般还是保持与最基本的本地文件系统几乎相同的访问接口和对象模型,这主要是为了向用户提供向后的兼容性,也保持原来的简单的对象模型和访问接口。但这并不说明文件系统设计和实现的难度没有增加。恰恰由于对用户透明地改变了提供结构,满足用户的需求,以掩盖分布式文件操作的复杂性,大大增加了分布式文件系统的实现难度。 <BR> 计算机技术在飞速的发展,摩尔(Moor)定律似乎在未来的若干年内仍将有效:计算机的处理器速度在不断地提高,计算机存储器的容量和传输速度在非常规地发展,计算机网络的吞吐量更是在跳跃式地增加。在计算机的性能不断提升的同时,计算机部件的平均价格却在不断下降。用户可以用更小的成本,购买更好更快更稳定的设备。存储系统,文件系统面临的新的挑战也随之而来:如何管理更多的设备,提供更好的性能,更加有效地降低管理成本等。各种新的存储技术和分布式文件技术都被不断地设计和实现出来,以满足用户日益增长的需求。因此有必要简要回顾分布式文件系统发展的历史,分析对比当前主流的分布式文件系统在体系结构、缓存一致性、安全等方面的长处和不足。 </FONT><BR> <SPAN style="FONT-SIZE: 13px"><FONT color=blue><FONT color=red>文件系统最初是用来管理本地磁盘,提供用户访问接口。某些数据的集合叫做一个“文件(file)”,并赋予每一个文件一定的属性以标识该数据集合的某些属性。文件按照树(tree) 结构层次进行管理和检索。最初的文件系统只能管理本地磁盘空间。主机之间的文件共享与传输则通过文件传输协议[2](FTP- filetransfer protocol)实现。但FTP没有提供与本地文件系统一致的访问接口和对象模型。 <BR> 随着计算机应用范围的扩展,通过文件访问接口在不同主机之间共享文件的需求日益增强。在二十世纪70年代就出现了最初的分布式文件系统的尝试[3]。到了二十世纪八十年代中期,网络文件系统(NFS-Network File System)[4][5]的出现使得分布式文件系统逐渐发展并应用到各个领域。从早期的NFS到StorageTank,分布式文件系统在体系结构、系统规模、性能、可扩展性、可用性等方面经历了较大的变化。下面分为几个阶段介绍分布式文件系统的发展过程。 <BR>2.1 1980-1990 <BR> 早期的文件系统以NFS 和AFS(Andrew File System)最具代表性,对以后的文件系统的设计也最有影响。 <BR> NFS从1985年出现至今,已经经历了四个版本的更新,被移植到了几乎所有主流的操作系统,成为分布式文件系统事实上的标准。NFS利用Unix系统中的虚拟文件系统(VFS- Virtual File System)机制,将客户机对文件系统的请求,通过规范的文件访问协议和远程过程调用,转发到服务器端进行处理;服务器端在VFS之上,通过本地文件系统完成文件的处理,实现了全局的分布式文件系统。Sun公司公开了NFS的实施规范,互联网工程任务组(The Internet Engineering Task Force,IETF)将其列为征求意见稿(RFC-Request for Comments) ,这很大程度上促使NFS的很多设计实现方法成为标准,也促进了NFS的流行。NFS也在不断地发展,在第四版中,提供了基于租赁(lease)的同步锁和基于会话(session) 语义的一致性等。 <BR> Carnegie Mellon University 在1983 设计开发的AFS [6][29] 将分布式文件系统的可扩展性放在了设计和实现的首要位置,并且着重考虑了在不安全的网路中实现安全访问的需求<BR>[31],因此它在位置透明、用户迁移、与已有系统的兼容性等方面进行了特别设计。AFS具有很好的扩展性,它能够很容易地支持数百个节点,甚至数千个节点的分布式环境[30] 。同时,在大规模的分布式文件系统中,AFS利用本地存储作为分布式文件的缓存,在远程文件无法访问时,依然可以部分工作,提高了系统可用性[32]。后来的Coda File System[7][33] 、Inter-mezzo File System[8]都受到AFS 的影响,更加注重文件系统高可用性(HighAvailability)和安全性,特别Coda在支持移动计算方面做了很多的研究工作。 <BR> 此外,SpriteFile System也是早期比较有特色的分布式文件系统,它是Sprite Network Operation System 的组成部分[40],为分布式计算环境提供(全局?)全局文件访问。与NFS相比,Sprite File System 在服务器端和客户端都设置缓存,大大提高了系统性能[38,41]; 它通过简单的读写锁来保证整个系统缓存一致性,并且通过和虚拟存储部分交互,尽量多地缓存数据[39]。它允许应用程序通过文件系统接口访问远程主机上的I/O 设备,突破了NFS和AFS在这些方面的限制,真正实现了位置透明。 <BR> 早期的分布式文件系统一般以提供标准接口的远程文件访问为目的,在受网络环境、本地磁盘、处理器速度等方面限制的情况下,更多地关注访问的性能和数据的可靠性。 AFS在系统结构方面进行了有意义的探索。它们所采用的协议和相关技术,为后来的分布式文件系统设计提供了很多借鉴。 <BR>2.2 1990-1995 <BR> 二十世纪九十年代初,随着磁盘技术的进步,单位存储的成本在不断下降。随着Windows的出现,极大地推动了处理器的发展和微机的普及;互联网的出现和逐渐普及,使得在网络中传输实时多媒体数据的需求和应用逐渐流行起来。大规模的并行计算和数据挖掘等应用也需要大容量高速度的分布式存储环境。 <BR>面对广域网和大容量存储应用的需求,借鉴当时先进的高性能对称多处理器的设计思想,University of California at Berkeley 设计开发的xFS[9]克服了以前的分布式文件系统一般都是运行在局域网(LAN)上的弱点,同时还很好地解决了在广域网上进行缓存以减少网络流量的难题。它所采用的多层次结构很好地利用了文件系统的局部访问的特性,无效写回(invalidation-based write back)缓存一致性协议,减少了网络负载。对本地主机和本地存储空间的有效利用,使它具有较好的性能。 <BR> Tiger Shark[34,35,36]并行文件系统是针对大规模实时多媒体应用设计的。它采用了多种技术策略保证多媒体传输的实时性和稳定性:采用资源预留和优化的调度手段,保证数据实时访问性能;通过加大文件系统数据块的大小,最大限度地发挥磁盘的传输效率;通过将大文件分片存储在多个存储设备中,取得尽量大的并行吞吐率;通过复制文件系统元数据和文件数据克服单点故障,提高系统可用性。 <BR> 基于虚拟共享磁盘Petal[10]的Frangipani[11]分布式文件系统采用了一种新颖的系统结构——分层次的存储系统。Petal提供一个可以全局统一访问的磁盘空间。 Frangipani基于Petal的特性提供文件系统的服务。这种分层结构使两者的设计实现都得到了简化。在Frangipani 中,每一个客户端也是文件系统服务器,参与文件系统的管理,可以平等地访问Petal提供的虚拟磁盘系统,通过分布式锁实现同步访问控制。分层结构使系统具有很好的扩展性,可以在线动态地添加存储设备、增加新用户、备份等,同时系统具有很好的机制来处理节点失效、网络失效等故障,提高了系统的可用性。 <BR> Slice File system(SFS)[44]考虑标准的NFS在容量、性能方面存在的限制,采用在客户机和服务器之间架设一个μproxy中间转发器,以提高性能和可扩展性。它将客户端的访问分为小文件、元数据服务、大文件数据三类请求。通过μproxy将前两种请求转发到不同的文件服务器上,将后者直接发送到存储服务器上。这样SFS系统就可以支持多个存储服务器,提高整个系统的容量和性能。μproxy根据请求内容的转发是静态的,对于整个系统中负载的变化难以做出及时的反应。 <BR> 由于应用对性能的需求,在这个阶段,分布式文件系统采用了多种方法提高系统性能,比如多级的缓存策略、资源管理的优化、采用多个存储设备、更好的调度算法等。同时,Frangipani的分层设计思想、SFS系统结构对后来的文件系统结构设计都有较大的影响。 <BR>2.3 1995-2000 <BR> 在这个阶段,计算机技术和网络技术有了飞速的发展,单位存储的成本不断降低。这些为信息数字化提供了坚实的基础。而数据总线带宽、磁盘速度的增长无法满足应用对于数据带宽的需求,存储子系统成为计算机系统发展的瓶颈。 <BR>网络技术的发展和普及应用极大地推动了网络存储技术的发展,基于光纤通道(FiberChannel)的SAN(StorageArea Storage,存储区域网),NAS(NetworkAttached Storage, 网络附连储存)得到了广泛的应用。这也推动了分布式文件系统的研究。这个阶段,出现了多种体系结构,充分利用了网络技术。 <BR> Global File System(GFS)[12][13]吸取了对称多处理器(SMP)系统设计和实现的原理,将系统中的每一个客户机类比于SMP中的一个处理器。客户机间没有任何区别,可以平等地访问系统中的所有存储设备,就像处理器可以机会均等地访问主存一样。这样的设计可以更好地利用系统中的资源,消除单个服务器带来的性能瓶颈和单点失效问题。因为客户端之间无需通信,可以很好地消除客户机失效带来的威胁。GFS采用特殊设计的DLOCK锁机制来同步多个客户机对同一设备的访问,具有很高的效率[12]。 <BR> General Parallel File System(GPFS)[14]是从Tiger Shark 发展过来的,是目前应用范围较广的一个系统。在系统设计中采用了多项先进技术。它是一个共享磁盘(shared-disk)的分布式并行文件系统,客户端采用基于光纤通道或者iSCSI与存储设备相连,也可以通过通用网络相连。GPFS 的磁盘数据结构可以支持大容量的文件系统和大文件,通过采用分片存储、较大的文件系统块、数据预读等方法获得了较高的数据吞吐率;采用扩展哈希(extensible hashing)技术来支持含有大量文件和子目录的大目录,提高文件的查找和检索效率。GPFS采用不同粒度的分布式锁解决系统中的并发访问和数据同步问题:字节范围的锁用于用户数据的同步,动态选择元数据节点(metanode)进行元数据的集中管理;具有集中式线索的分布式锁管理整个系统中空间分配等。GPFS采用日志技术对系统进行在线灾难恢复。每个节点都有各自独立的日志,且单个节点失效时,系统中的其他节点可以代替失效节点检查文件系统日志,进行元数据恢复操作。GPFS还有效地克服了系统中任意单个节点的失效、网络通信故障、磁盘失效等异常事件。此外,GPFS支持在线动态添加、减少存储设备,然后在线重新平衡系统中的数据。这些特性在需要连续作业的高端应用中尤为重要。 <BR>HP公司的DiFFS[15]和SGI公司的CXFS[19]都是基于SAN的分布式文件系统。DiFFS通过将存储系统划分成不同的区域,把对资源的共享访问冲突限制在各个区域内部,来解决机群文件系统的可扩展性问题。DiFFS采用了动态分配策略、SoftUpdates[8]和文件级的负载平衡等多项技术。CXFS是在XFS[47]的基础上开发的。它实现了元数据服务器内置的失效接替和恢复功能;采用快速元数据算法,包括优秀的缓存机制,精心组织的存储结构和优化的搜索算法,来提高元数据访问性能。CXFS采用令牌(token)来管理和控制元数据和数据的访问,采用了多人读一个人写的策略保证数据和元数据的一致性。CXFS 客户机通过SAN直接访问文件数据,具有很好的传输效率。 <BR> 此外,还有多种体系结构,如EMC的HighRoad[49],SUN的qFS[50],XNFS[51]等。数据容量、性能和共享的需求使得这一时期的分布式文件系统管理的系统规模更大、系统更复杂,对物理设备的直接访问、磁盘布局和检索效率的优化、元数据的集中管理等都反映了对性能和容量的追求。规模的扩展使得系统的动态性如在线增减设备、缓存的一致性、系统的可靠性的需求逐渐增强,更多的先进技术应用到系统实现中,如分布式锁、缓存管理技术、SoftUpdates技术、文件级的负载平衡等。 <BR>2.4 2000 以后<BR> 随着SAN和NAS两种体系结构逐渐成熟,研究人员开始考虑如何将两种体系结构结合起来以充分利用两者的优势;另一方面,基于多种分布式文件系统的研究成果,人们对体系结构的认识不断深入,Grid的一些研究成果等也推动了分布式文件系统体系结构的发展。,这一时期,IBM的StorageTank,Cluster 的Lustre,Panasas 的PanFS,蓝鲸文件系统(BWFS) 是这种体系结构的代表。而且随着信息数字化的深入,各种应用对存储系统提出了更多的需求: <BR> a. 大容量(Capacity),现在的数据量比以前任何时期更多,生成的速度更快; <BR> b. 高性能(High Performance),数据访问需要更高的带宽; <BR> c. 高可用性(High Availability),不仅要保证数据的高可用性,还要保证服务<BR> 的高可用性。 <BR> d. 可扩展性(Scalability),应用在不断变化,系统规模也在不断变化。这就要<BR><BR>求系统提供很好的扩展性,在容量、性能、管理方面都能适应应用的变化。 <BR> e. 可管理性(Manageability),随着数据量的飞速增长,存储的规模越来越庞大,存储系统本身也越来越复杂,这给系统的管理运行带来了很高的维护成本。 <BR> f. 按需服务(On-Demand),能够按照应用需求的不同提供不同的服务,如不同的应用,不同的客户端环境,不同的性能等。 </FONT></FONT></SPAN> | 返回列表 | | 上一篇: | 下一篇: | 打印此页 关闭此页 |
|
|
|