摘 要:本文旨在探讨基于SAN存储架构下海量信息管理的思路。首先介绍了当今主流的三种存储架构方式以及它们各自的特点,其中着重介绍了存储区域网(SAN)存储架构,包括SAN存储架构的优势及应用;紧接着介绍了海量信息管理现状,基于SAN存储架构的海量信息管理的实现思路,包括SAN信息管理过程以及管理软件的功能需求。
关键词:存储区域网(SAN);海量信息;管理
1. SAN存储架构简述
1.1 数据存储结构方法介绍
随着Internet发展,当今的信息数据量呈几何级速度增长,这些数据不仅包括传统的文本、图像,还包括语音、视频等多媒体数据,如何安全存储所需的信息数据并进行管理值得研究思考。
当今主流存储架构主要有DAS、NAS和SAN。
(1)DAS叫直连方式存储,全称是Direct Attached Storage。在这种方式中,存储设备通过电缆直接连接到服务器,I/O请求直接发送到存储设备。DAS的适用环境包括服务器在地理分布上十分分散,存储系统必须被直接连接到应用服务器上,包含很多数据库应用和应用服务器在内、需要直接连接到存储器上。
(2)NAS又叫网络附属存储,它将独立、分布的数据整合成大型、集中化管理的数据中心,以适用于不同主机和应用服务器进行访问。NAS能够支持多种协议,也能够支持各种操作系统,所以NAS的性能优势是进行一些小文件级的共享存取。
(3)SAN叫存储区域网络,是通过专用高速网将一个或多个网络存储设备和服务器连接起来的专用存储系统,未来的信息存储将以SAN存储方式为主。SAN在最基本的层次上定义为互连存储设备和服务器的专用光纤通道网络,它在这些设备之间提供端到端的通讯,并允许多台服务器独立地访问同一个存储设备。
1.2存储区域网(SAN)的优势
SAN的技术特点有先进、安全、高效和成熟。由于SAN采用光纤通道作为其物理基础,距离远且有很大的继续发展空间,这是SAN先进之处。由于SAN不但保留了传统射频技术、HA、CLUSTER等安全措施,而且目前提供双环冗余、远程备份等先进的安全手段,所以SAN非常安全可靠。
基于SAN的技术特点,SAN有以下巨大的优势:
(1)具有完善的存储网络管理机制,对诸如磁盘阵列、磁带库等存储设备能够进行灵活管理以及在线监测。
(2)基于千兆位的高效的存储宽带,所以更适合大量数据高速处理的需求。
(3)无限制的动态平滑扩容能力。
(4)兼容以前的SCSI存储设备,成本可低廉。
(5)将主机点对点与存储设备的简单附属关系上升为全局多主机动态共享模式。
(6)具有灵活的网络体系结构,包括FC-AL仲裁环、点对点、Fabric交换网等各种连接方式。
早期的SAN采用光纤通道技术,所以早期的SAN多指采用光纤通道的存储局域网(FC-SAN),直到iSCSI协议出现以后,为了区分,把SAN分为FC-SAN和IP-SAN。IP-SAN指采用iSCSI协议的存储局域网。
1.3存储区域网(SAN)的应用
鉴于SAN的巨大优势和广阔的前景,SAN的应用非常广泛。不仅包括医院、学校、企业等对信息要求比较高的机构,在容灾备份中也起到关键作用。
随着信息数据的高速增长,对于信息的采集、存储和管理的要求越来越高。因而,基于SAN存储结构的信息管理也应运而生。本文着重探讨基于SAN存储架构下的海量信息管理,以及构建思路和方法。
2. SAN与信息管理
2.1 信息管理现状
互联网革新了生活也革新了工作环境和方式,在新时代背景下,任何机构都必须实现信息化,那么数据存储是不可忽视的一个问题。
数据被采集然后存储然后形成企业、机构等管理决策的依据。随着信息化的发展,信息的需求越来越大,这也使得信息量的增长以超乎想象的速度增长,这无疑给海量信息管理增添了管理难度。
数据对各种机构的作用非常重要,数据能够记录各种工作事物的状况和现状,数据形成的信息能够帮助机构进行管理和决策,以协助机构更好的运作。
2.2海量信息背景下选择SAN存储架构的原因
DAS直接连接存储已经远远不能满足企业的需求。对于多个服务器或多台PC的环境,使用DAS方式设备的初始费用可能比较低,但是这种连接方式下,每台PC或服务器单独拥有自己的存储磁盘,要再分配容量就相当困难;对于整个环境下的存储系统管理,工作烦琐而重复,没有集中管理解决方案是不行的。由于单台计算机对数据远远不能满足企业对数据的要求,因此这种连接方式已经在企业的解决方案中甚少被采用了。[d1]不选择网络附属存储方式(NAS),而选择SAN存储架构是因为NAS是把存储设备直接放到已有的网络中,通过LAN实现数据的共享,性能受限于TCP/IP网络,会形成与业务系统对网络资源的争夺,此外连接距离有限,当网络中拥有多个NAS时,对它们的管理会变得日益复杂。
通过SAN存储架构能够降低海量信息管理的成本,而且管理维护相对也比较容易。IP-SAN可以直接利用已经存在的以太网线、交换机、网卡和路由器进行通讯,除了存储设备意外,一般情况下不用再购买其他额外的设备,可以节省成本。FC-SAN则新建一个光纤网,虽然成本较高,但是光纤速度快,传输距离更长。
2.3基于SAN存储架构的海量信息管理过程
基于SAN存储架构的海量信息管理,通常情况下要考虑三个关键过程因素。
(1)如何管理好SAN存储架构,从而使得SAN上的数据信息能够有效的运行。
(2)如何实现数据分级存储,保证最有效、最有用、访问量最大的信息数据能够存储在SAN中。
(3)如何实施信息生命周期管理,即对同一数据,在产生时间断不同的存储策略应该相应发生一系列变化。
这三个因素是基于SAN存储架构的海量信息管理中非常关键的三个过程,所以在各个环节都不能大意。
2.4SAN管理软件
对于基于SAN架构的信息管理,后期管理软件也非常重要,如果没有管理软件,主机就不能识别SAN存储架构,所以这就必须使用完整的软件来管理SAN架构下的信息管理工作,这一系列软件组合起来要能够实现管理SAN的磁盘阵列,支持其他端互通信息。所以后期的管理软件必须能够实现以下三个功能。
(1)这一系列软件要能管理和监控SAN中的磁盘的阵列,要以LUN为核心将多个LUN组织到各个应用服务器。如可以将所有与视频、影音数据相关的所有LUN组织成一个逻辑组,这样不用考虑服务器的位置。
(2)这一系列软件要能够与服务器的操作系统进行无缝连接,起到联系服务器
与光纤通道沟通的功能。
(3)SAN的自动路径选择软件能够在SAN和服务器的某条连接通道发生某些障碍的时候将原来的I/O访问转移到另外的可用通道上,这样在设计时的冗余通道,就可以实现SAN通信的高可靠性。
除了利用SAN进行数据存储外,数据的备份也十分重要。SAN技术不仅能在存储I/O一方实现专用备份功能,而且无需从数据网来回传输数据,这样可以提高效率。
3. 小结
海量信息提供给我们广阔的数据,这是方便我们更好的进行管理或者工作运作,但大量信息也包含冗余信息,做好信息存储十分重要。SAN存储架构便提供了一种十分好的存储方式,具有高效、安全等很多优势。
对SAN存储架构下的信息管理进行研究分析,尝试构架更好的SAN架构体系,对当下海量信息的管理具有十分重要的意义。所以要优化海量信息管理,进一步研究SAN存储架构具有非常重要的意义。
参考文献:
[1]陈广;郭延红. IP-SAN存储技术的特点及应用[J].计算机工程应用技术,2010,(5).
[2]张智勇. 基于SAN存储架构下的海量信息管理[J].电脑知识与技术,2010,(2).
[3]刘彬.JSP数据库高级教程[M].北京:清华大学出版社,2001.
[4]葛忠良. SAN在我院信息系统存储中的应用[A].郭亚军.2006年中国数字医学论坛论文集[C].江苏:江苏人民出版社,2006.
[5]汪宏伟. 基于SAN的高可靠性校园网络信息存储系统的设计[J].情报探索,2006,(2)
[d1]增加