存储技术概述; 1.1当代数据存储需求
平均而言,数据产生的年增长率已超过了50%,对于需要长期保存且易于读取数据的需求也在不断增长。同时,信息技术的预算也在不断增长。这其中主要包括服务器、网络、存储以及个人终端的花费。据估计,在整个信息技术的投资预算中存储的相关部分约占四成。
数据主要由个人和各种实体(如公司企业、政府机关、学校、社会团体等)产生。;;; 1.3数据的类型及存储演变
存储数据可以分为结构化和非结构化两种基本类型。结构化数据是指形式上整齐且有良好的组织的数据,这些数据一般存储于数据库或者电子表单中。根据研究机构的调查,目前大约80%以上的企业信息都是非结构化数据。常见的非结构化数据有论文、音/视频资料、账单、网页、支票、电子邮件等。;数据的存储实际上经历了一个演变过程。在计算机系统发展的早期,对于数据的计算和存储只能选择集中化模型。在这种模型情况下,处理和获取数据都集中在适当的位置。该模型使得新的应用开发与利用得不到较快发展。系统对数据的存取可以依据商业需求进行预测,在这种系统下,通常认为计算能力比实时存取数据能力更加重要。在集中化系统中,用户通过终端连接到主机上并通过主机访问内部或外部的存储设备。随着网络技术的进步,客户端/服务器模型开始流行,逐步形成了分散式的存储模型。在这种分散式存储模型中,企业内的业务单元能够访问自己的服务器和存储器。这样,应用程序就不再排队等待数据的获取和程序的执行了。;但是,分布式存储导致了信息的分段化。这样也会对信息处理和分布管理的均衡性带来一定困难。面对这些分布式存储的需求,网络存储的概念也随之出现。简单地讲,在网络存储系统中生产部门拥有自己的客户端、服务器和存储器集合,财务部门也拥有自己的客户端、服务器和存储器,人力资源部门同样具有自己的客户端、服务器和存储器。网络存储实际上也可以看做集中化存储方式,而且这种方式是目前最好的信息存储形式。网络存储解决方案的主要优点体现为在每一种情况下,数据都是集中定??并保存在磁盘存储系统上的。网络存储实现了连接多个计算机到一个中央位置以利用数据的存储和获取,数据能实现更容易的管理、共享和保护,而且数据具有非常高的可用性。; 1.4数据增长率和管理数据的挑战
全球范围内信息的快速增长比率是显而易见的,图1.2给出了截至2005年磁盘阵列数据的年增长比率。2005年前信息年平均增长约60%,而2005年后增长率超过了七成。
如此快速的增长给信息管理带来了严重的困难。数据存储整合到集中的阵列上仅仅是整体信息管理的一部分。信息管理主要面临以下几方面的挑战:
(1)存储容量的规划。
(2)数据的分类。
(3)数据可用性支持。
(4)信息的安全性。;; 1.5数据存储解决方案
大量的数据存储于硬盘、磁带以及光盘上。每一种存储介质都提供进行特定数据存取需要的解决方案。包含磁盘阵列和网络技术的网络存储已经成为大多数商业数据存储需求的主要解决方案。
在硬盘系统演变的早期,磁带是主要的数据存储介质。有些用户或许曾见过具有数个磁带驱动器的计算中心的照片。这些磁带驱动器排列在支架上,操作员则忙于将成卷的磁带安装或者卸载到这些驱动器上。通常我们把磁带驱动器和磁带的集合称为带库,而把光盘和光驱的集合称为自动唱片点唱机(Jukeboxes),硬盘的集合称为磁盘阵列。目前,在主要;的数据存储方案中,磁带往往作为二级存储使用。光盘集合则用于存储那些长期内容不变的数据。磁盘阵列存储可以立即获取在线数据。
相比较磁盘阵列而言,磁带非常便宜。在记录信息方面,磁带使用读/写磁头将单位信息记录在磁带表面的磁介质上,并且记录工艺技术也在不断改进,提供了更高的存储容量、读/写可靠性和性能。;随着光盘的出现,人们拥有了随机数据获取以及数据写保护的手段。大量光盘装配到类似自动点唱机式的设备中,这样就能够为集中获取的存储提供大容量阵列式解决方案。而单张光盘的容量仍然与磁带和磁盘的容量有巨大差距。光盘数据存储具有以下应用特征:
(1)在小型单用户的计算环境中非常流行。
(2)个人经常用光盘作为存储共享数据甚至备份的解决方案。
(3)光盘有时也被应用程序用作分布式介质,或者作为将少量数据从一个自我包含的系统传送到其他系统的方式。;磁盘驱动器自出现起就是备受欢迎的数据存储方式。数据的急速增长导致了各种介质存储阵列的发展。阵列能使数据并发地由多个服务器获取。磁盘阵列甚至智能磁盘阵列快速成长,逐渐成为有效的大容量数据存储解决方案。按照磁盘发展的历史情况,我们主要考察的磁盘存储方案有:直接获取存储设备(DASD)、磁盘簇系统(JBOD)、磁盘阵列以及智能磁盘阵列。
图1.3给