2012年9月 情报探索 第9期(总179期) 云计算在数字图书馆信息资源整合中的应用 张姝 710064) (长安大学图书馆 陕西西安合的发展优势以及需解决的问题。 关键词:云计算 图书馆信息整合 摘 要:阐述了云计算的概念及特点,分析了目前我国数字图书馆信息资源整合的现状,提出了基于云计算的图书馆信息整 中图分类号:G250.7 文献标识码:A doi:10.3969 ̄.issn.1005—8095.2012.09.031 20世纪8O年代末,“电子图书馆…‘虚拟图书 馆”等概念引起发达国家的重视,相关工程和项目得 以实施。进人90年代,信息高速公路将图书馆、学校 乃至个人连接起来.提供存储信息的检索和查询,实 现了区域性乃至更大范围的资源共享,由此产生了 数字图书的雏形。然而.就在全球大力发展数字图书 馆的时候,图书馆却面临读者流失的危机。2005年 世界上最大的图书馆、书目数据库及信息中心—— 联机计算机图书馆中心(简称OCLC)做了一次大规 模调查,调查表明,84%的被调查者查询信息首先访 问搜索引擎.只有1%是从图书馆网站开始。信息的 质量和数量是查询满意度的主要指标.搜索引擎在 这方面显然已经超过图书馆牢牢抓住了读者.图书 馆已不再被人们看作是信息需求的起点,这种现象 的出现,令图书馆界人士唏嘘不已。 造成这种现象的原因是多方面的,但没有将各 个图书馆数字资源有效整合是一个重要因素。目前, 除了公共图书馆外.更多的为读者服务的是各个高 校图书馆的数字资源。但是各个高校图书馆的资源 没有有效整合,而且在资料存储方面,由于网络、设 备等的局限性,各个高校图书馆往往偏重于本校学 科的资料存储,其他方面资料贫乏,所以读者在查询 信息的时候,往往要查阅好几个图书馆网站也不一 定能查到自己满意的结果。仅这一项原因,就足以迫 使读者放弃图书馆转而使用搜索引擎。如何进行有 效存储,将各个图书馆的资源以最低成本联合起来, 互补有无,为读者提供高效、便捷的个性化服务,是 近年来图书馆界一直在探讨的话题。目前,随着计算 机网络的高速发展.云计算——一种新型的服务模 式被IT研究人员提出并得以发展,它的出现,为数 字图书馆信息整合服务的发展开辟了一条新路径, 拓展了数字图书馆的发展空间。 1云计算概述 什么是云计算?可以从狭义和广义两个方面理 解。狭义云计算是指IT基础设施的交付和使用模 收稿日期:2012—01-14 作者简介:张妹(1978一),女,本科,馆员,已发表论文9篇。 式,通过网络以按需、易扩展的方式获得所需的资源 (硬件、平台、软件)。提供资源的网络被称为“云”。广 义云计算是指服务的交付和使用模式.通过网络以 按需、易扩展的方式获得所需的服务。这种服务可以 是IT和软件、互联网相关的,也可以是任意其他的 服务_1]。云计算旨在通过网络把多个成本相对较低 的计算实体整合成一个具有强大计算能力的完美系 统,并借助SaaS、PaaS、IaaS等先进的商业模式把这 强大的计算能力分布到终端用户手中。云计算的一 个核心理念就是通过不断提高“云”的处理能力,进 而减少用户终端的处理负担.最终使用户终端简化 成一个单纯的输入输出设备.并能按需享受“云”的 强大计算处理能力。 云计算是IT服务提供方式的一种重要变迁和 思维模式的转变。它的发展动力是对数据中心日益 增长的需求.而这些数据中心则已接近其饱和容量 并受限于资源。到2015年,会有超过25亿的人通过 100多亿台设备访问互联网.是如今需求的两倍以 上。通过扩展传统的基础设施来应对这些挑战很快 就暴露了其本身的各种不灵活。为了满足这种增长 需求,只能采用更高效、更高性能、更灵活的云架构, 才能完成必要的数据中心扩建这种不寻常的需求。 相对于传统计算,云计算关键特性在于:①计算 和存储功能抽象化,并作为服务提供给用户;②在可 大规模扩展的基础设施上构建服务;③可方便地购 买服务并根据使用付费;④可通过任意一台设备在 互联网或内部网上访问服务从而实现若干用户之间 资源共享。然而,应当将云计算视为一个演变步骤而 并非数据中心虚拟化的一个步骤。首先,虚拟化技术 使数据中心可整合服务器基础设施,以节省成本;其 次.灵活的资源管理技术提高了动态分配数据中心 资源的能力。这就进一步降低了成本,还提高了数据 中心的灵活性和性能,从而开辟了技术开发和部署 的新时代。 2基于云计算的数字图书馆信息资源整合研究 张 姝:云计算在数字图书馆信息资源整合中的应用 第9期(总179期) 2.1 我国数字图书馆信息资源存储系统现状 数字图书馆是一个以存储系统为核心.配合业 务应用系统进行数据查询服务的大型数据库系统。 目前,存储系统主要有直接附加存储(DAS),网络附 加存储(NAS)和存储区域网络(SAN)3种模式。 DAS是指直接与主机系统连接的存储设备。主 机操作系统独占该存储设备的使用权限。DAS有安 装简便、技术标准统一、访问速度快和价格较低等优 点。但当服务器发生故障时,存储设备中的数据不能 被存取。此外,DAS可扩展性差,不能提供跨平台的 文件共享功能 ]。 NAS是一个存储单位,连接在网络上提供文件 访问服务 ]。它将分布、独立的数据整合为大型、集 中化管理的数据中心。以便于对不同主机和应用服 务器进行访问。NAS最大的缺点是不能支持存储设 备之间的直接备份,这样在处理数据传出、备份、恢 复业务时会造成网络带宽大量消耗,访问速度降低。 SAN是通过专用高速光纤通道将服务器和处于 另一个独立网络上互连的各种存储设备连接而形成 的交换或共享式的存储网络[41。SAN由存储设备和 系统部件构成网络,所有的通信都在一个与应用网 络隔离的单独的网络上完成,可以被用来集中和共享 存储资源。但SAN数据共享的颗粒度过大,难于直接 支持文件级的数据共享。同时,由于SAN的强大功 能,必然造成设备的高昂费用,而国内还没有一个统 一的标准,从而造成SAN品牌之间的兼容性差。 以上3种存储模式是信息技术的飞速发展和数 字图书馆建设快速推进的必然结果.他们的存在各 有利弊,但随着数字化资源和用户访问量徒增,数据 存储量越来越大,对数字图书馆的发展提出更高的 要求,此时的存储系统已成为整个网络环境的基础 架构。如何最大程度优化信息存储架构,使图书馆信 息资源更好地适应广大用户的需求;如何在现有的 技术水平条件下,利用较少的、合理性的投资解决图 书馆面临的安全性问题:如何建立一个具有高管理 性、可扩展性、兼容性良好以及先进性的存储系统。 是当今图书馆信息整合服务在数字化环境下所要解 决的重要难题。云计算的出现,无疑为上述问题的解 决提供了一种崭新的、较为理想的方法。它不但包括 DAS、NAS、SAN存储模式的基础设备,还包括多个 存储设备之间协同工作的存储设备管理系统,甚至 还包括应用服务系统APIs接口和存储服务功能 5_。 2.2 云计算在图书馆信息资源整合与服务中的应用 目前图书馆数字信息资源主要包括:馆藏数目 数据库、特色文献数据库、生产商开发的商用数据 库。在云计算模式下,所有这些数字资源皆表现为数 据,图书馆的服务则表现为对数据的操控。因此.图 书馆信息资源的建设将不再是占有资源,而是确保 实时动态的信息资源能及时快捷的被用户获取。云 计算下的图书馆由于技术和服务模式的进步.颠覆 了传统的文献信息传递的延时性以及存储的局限 性,使得图书馆本质服务又跃上一个新的起点。 2.2.1云计算服务模式 按照服务类型来分.云计算通过虚拟化向图书馆 提供以下3个层次的服务模式:SaaS、PaaS和IaaS。 (1)SaaS(Software—as—a—Service)——软件即服 务。SaaS是基于互联网提供软件服务的软件应用模 式。作为一种在21世纪开始兴起的创新的软件应用 模式,SaaS是软件科技发展的最新趋势。也是最成 熟,应用最广泛的一种云计算。SaaS不是云计算,云 计算也不等于SaaS。SaaS是云计算上的应用表现, 云计算是SaaS的后端基础服务保障。SaaS应用于图 书馆则表现为:提供商为图书馆信息资源建设搭建 所需要的所有网络基础设施及后台运作平台.同时 肩负起所有系统的部署、升级和维护。作为图书馆无 需购买软硬件、建设机房.只需根据实际需要订购相 应的软件应用服务即可通过互联网为读者提供服 务。目前,SaaS已成为云计算产业的一个重要力量。 只要SaaS的品质和可信度能继续得到证实,它的魅 力就不会消退 (2)PaaS(Platform—as—a—Service)——平台即服 务。它是把服务器平台作为一种服务提供的商业模 式。SaaS提供商提供的应用程序或服务通常使用标 准Web协议和数据格式,以提高其易用性并扩大其 潜在的使用范围.并且越来越倾向于使用HTI'P和 常用的Web数据格式。但是SaaS提供商并不满足 于此,他们一直在思考如何开拓新的技术,推进整个 SaaS时代的飞越,于是PaaS出现了。基于PaaS下的 图书馆信息建设可以通过PaaS进行定制化研发的 中间平台。不同的图书馆将本馆特有资源进行描述, 建立本馆资源索引库,进而结合云提供商提供的平 台快速开发自己所需的应用和产品,提高用户在 Web平台上利用的资源数量。还可以使用可视化的 API(Application Programming Interface.应用程序编 程接口),甚至像800APP的PaaS平台还允许图书 馆混合并匹配适合本馆应用的其他平台。 (3)Iaas(Infrastructure as a Service)——基础设 施即服务。消费者通过Internet可以从完善的计算机 基础设施获得服务,这类服务称为基础设施即服务。 提供给图书馆资源建设的服务是对所有设施的利 用,包括处理、存储、网络和其它基本的计算资源.同 时能够部署和运行任意软件,包括操作系统和应用 程序。图书馆不用管理或控制任何云计算基础设施. 但能控制操作系统的选择、储存空间、部署的应用. 也有可能获得有限制的网络组件(例如,防火墙、负 载均衡器等)的控制。 2012年9月 情报探索 第9期(总179期) 2.2.2云计算图书馆架构 云计算下的图书馆,能否为用户提供良好的信 息资源服务,取决于云计算环境建设的优劣。结合上 述3种云计算服务模式。基于云计算下的图书馆资 源整合体系架构可划分为以下几个部分:读者服务 层(SaaS),主要指用户登录使用界面;后台管理层 (PaaS),包括主服务控制机群、云监控模块;基础设 施层(IaaS).包括存储节点机群、应用节点机群、计 算节点机群、服务器等。如图1所示。 的统一管理和有效掌控.还保证了服务的快速交付 和资源通过自动化部署后的一致性和高效性,将信 息资源的利用效率达到最大化。 3 云计算应用于数字图书馆信息资源整合的优势 通过以上对云计算的特点和服务模式及架构体 系的分析,我们不难看出.如果将云计算应用于图书 馆,必然会为图书馆数字资源整合带来巨大优势。 3.1 使图书馆数字资源检索更加高效便捷 云计算为网络应用提供了超强的计算能力,通 过一定的协调调度.云 计算模式可以通过数万 乃至百万的普通计算机 之间的联合来提供超强 的、可以与超级计算机 相抗衡的计算能力.使 用户完成单台计算机根 本无法完成的任务。因 此.可以满足图书馆用 户开展大规模同时在线 图1 云计算图书馆架构 首先.新用户通过注册页面创建自己的个人账 号。注册完成后会返回登陆界面,经过用户名及密码 的审核.用户就进入到了云桌面_6]。在该结构中,用 户通过服务目录来查找和选择所需的服务,进行信 息资源的检索。 其次.在后台管理层中,云监控模块在服务执行 过程中.对资源和配置器进行实时监控,管理员可以 通过云监控模块对机群状况进行监控以及对服务器 进行管理操作。主服务控制机群相当于控制器的部 分,主要负责接收用户发送的应用请求。当服务请求 发送并对用户进行合法性验证后,主服务控制机群 根据应用请求类型进行应用分类,并通过存储节点 机群和应用节点机群找到合适的服务资源。 再次.是存储节点机群和应用节点机群。存储节 点机群是由庞大的磁盘阵列系统或多组拥有海量存 储能力的机群系统所组成的存储系统,处理数据资 源的存取工作:应用节点机群是由一组或多组拥有 不同业务处理逻辑的机群系统所组成的应用系统, 检索服务,其速度得到 了质的飞跃。同时,因为 在云计算模式中,人们 不是从自己的计算机 上.也不是从某个制定 的服务器上,而是从互联网上,通过各种设备如电 脑、手机等以有线或无线方式接入互联网,能在任何 地点根据自身需求获取信息。从而使图书馆信息服 务达到更高的水平。 3.2在更大程度上实现信息资源共享 通过云计算模式,相关的图书馆之间可以共同 构筑图书馆的信息共享空间.这样众多的图书馆就 可以分享由大量系统连接在一起而形成的基础设 施,而不必更新相关的硬件,用户甚至可以随时获取 其他图书馆的珍稀资料,极大地满足了用户的信息 需求。同时图书馆数据库经常修改添加,相互合作的 图书馆每天都有新的信息增加到数据库中,因此用 户从图书馆数据库能检索到最新的资料和信息。这 不仅仅提高了数字资源的利用率,而且从物理上降 低设备能耗,大大加快了实现绿色数据计算的步伐。 3.3降低了数据被破坏的可能性 负责存储应用程序和处理各种逻辑复杂的应用。 最后.计算节点机群提供类似运算器的功能。计 算节点机群由多组架构完善的云计算机群组成,其 主要工作是处理超大运算量要求的计算。 拥有标准的管理流程和先进的IT管理模式的 云计算平台,不仅能够帮助图书馆实现IT基础设施 传统的图书馆服务器经常面临着被黑客恶意攻 击的危险,数据容易被破坏。一旦服务器出现故障, 图书馆无法给用户提供正常的服务。而云计算的推 广,为图书馆提供了可靠、安全的数据存储。用户可 以把自己的数据放在“云”中由专业的云存储服务商 来提供安全保障。他们有先进的技术和专业团队,为 网络应用提供了几乎无限多的可能,为存储和管理 数据提供了几乎无限的空间,从而使图书馆真正实 2012年9月 张姝:云计算在数字图书馆信息整合中的应用 第9期(总179期) 现无间断的安全服务 3.4为图书馆提供了经济实惠的服务模式 云计算中,用户只需花少量的钱来租用相关的 云服务商所提供的相关服务即可。它极大地减少了 图书馆软硬件资源的管理和维护成本,节省了人力 物力。用户不必担心自己所购买的IT产品被淘汰, 只需利用很少的投资便获得较大的回报。以上种种 使图书馆可以有效地控制开支,将绝大部分精力和 资金用在其核心业务上。 4云计算在图书馆应用中需解决的问题 随着云计算技术进一步发展.以及云计算理念 被用户的广泛接受,云计算技术必将成为重要的基 础设施。作为图书馆工作人员应该从各个方面考虑 部署云计算解决方案时将会遇到的若干挑战,认真 追踪研究以下几个方面: 4.1 制定标准的云计算应用流程 (1)目前没有一个系统化的步骤指导图书馆该 如何从传统的信息建设架构向统一化的数据中心架 构过渡。而图书馆急需这种系统性的指导方案。使之 在迁移过程中风险最小化,并确保数据完整。因此只 有加强有效的领导力量和紧密的行业协作.才能为 解决图书馆资源整合提供经济高效的解决方案,否 则将演变成为部署和维护成本极高且流程极为复杂 的碎片化解决方案。 (2)网络带宽需求是一个不容忽视的重要问题。 要弄清楚图书馆需要在网络上传递的数据有多大规 模,以及对特定服务的网络响应要求。 (3)云服务供应商应仔细考察其组织情况和业 务稳定性。供应商提供持续的服务和技术支持的水 平如何,在满足客户的服务水平协议要求方面的水 平如何,是评估其是否能够为图书馆资源整合建设 提供支持的重要因素。同时,能提供大规模、扩展性 好、质量较好的网络的供应商能够比较容易的提供 更快更高质量的服务。 (4)需要确认云计算技术能够带动图书馆的发 展。无论使用什么设备或链接情况如何,都要确保基 于云计算技术的应用程序可提高用户的工作效率。 4.2实施标准化 尽管云计算一片火热,但国内云计算产业适用 于图书馆资源整合建设现在仍处于起步阶段,标准 的缺失和不统一已成为限制云图书馆发展的瓶颈 当前许多和云计算有关的术语、技术接口等仍是“各 说各的”,不同公司采用不同的技术方案.这必将导 致大量数据和服务无法在广大的用户群范围内转 移、共享,从而局限了云图书馆的服务范围 4.3 关注云计算应用程序的稳定性问题 从理论上说,利用云计算技术,用户只需要通过 本地终端就可以通过互联网使用图书馆的相关资 源。但在云部署过程中,控制与数据中心激增和扩展 相关的复杂性非常重要。通过改进自动化虚拟机迁 移、简化管理、实现统一的万兆以太网络,以及推动 存储与服务器的整合,可简化当前的基础设施。但是 在这一过渡磨合时期由于设备调试或者人为因素有 可能会出现“云”服务中断或失效。为了维持图书馆 正常的服务,图书馆必然要继续在本地保存一些常 规的重要数据以此来作为“云”数据的一个备份。因 此.云计算模式不会完全推翻图书馆现有的部署模 式,而是在保留原有模式的基础上,使现有的部署模 式与云计算模式进行融合。另外,云计算也存在安全 漏洞,服务商提供的是一个共享的基础设施,对于该 系统的使用者而言并不是完全隔离的.由此就会产 生一个后果.即当一个攻击者得逞时.全部服务器都 向攻击者敞开了大门。因此云计算供应商必须开发 一个强大的分区和防御策略,同时监控环境是否有 未经授权的修改和活动。 4.4重视保护信息资源版权问题 在云计算模式下,各个图书馆之间通过有关的 协议将已有的信息资源放置于网络上共同分享。由 于数据托管于云服务提供商的云存储平台上,如何 保护资源版权.防范服务商以各种名义将这些资源 私有化从而用于商业用途 ].是图书馆界人士应当 积极探讨的一个问题。对云计算服务提供商而言,安 全泄露绝对会严重影响到企业的声誉与发展前景, 还会影响到其众多客户公司的13常运作,造成一种 行业性的信任危机。因此云计算服务提供商对安全 等级的要求应当格外重视,赢得人们的信任是云计 算服务提供商们不得不面对的一项工作。由于云计 算服务提供商负责所有前期的实施、后期的维护等 一系列服务.因此图书馆作为云计算用户唯有信任 服务提供商,才能放心使用云计算产品。 参考文献 [I]什么叫云计算[EB/OL].[2010—11-03].http://zhi— dao.baidu.corn/question/103061882.html [2] 杜海宁.基于云计算的图书馆海量数据存储研究 [J].图书与情报,2010(3):99—101 [3] 黄志军.数字图书馆的存储系统建设[J].情报探 索,2007(11):46—48 [4] 杨彦荣.浅谈数字图书馆存储系统建设[J].图书与 档案,2009(5):355—356 [5] 毛海波.区域数字图书馆云存储服务模式探讨[J]. 现代情报,201 1(2):128—134 [6] Brown C E.The Essential Guide to Flex 2 with Act ionScript,3.0[M].北京:人民邮电出版社,2007 [7] 曹薇,张乃洲.基于云计算的图书馆IT应用探讨 [J].情报探索,2010(5)106—017 [8]利用数字资源欧盟计划推进数字化图书『EB/OL]. [2010—1 1-03].http:#www.enet.con.cn/article/2006/0303/ A20060303507748 shtml