进入21世纪后,国际出版业发展很快,文献资源的出版形式发生了很大变化,实体型文献数量减少网络信息资源日趋丰富,网络资源取代传统实体型文献的趋势不可阻挡。例如:联合国文件已启用数据库的形式提供服务,不再出版印刷型;而近年来兴起的开放存取运动,使得很多国际组织和外国政府的重要文献资源可以通过网络免费获取。面对如此丰富、低获取成本的信息资源,对资源的分布、来源、存在状况、内容、质量、稳定性等问题进行准确的评估,为公众及学界提供积极有效的信息资源导航,已成为十分迫切的课题。
国际组织与外国政府出版物网络资源整合服务平台[1]是对联合国等重要国际组织和外国政府实体与网络资源进行全面系统整合而构建的,是集资源导航与检索、用户交互于一体的网络服务平台。该平台旨在揭示重要国际组织与外国政府网络资源、建立特色资源导航、推广中国国家图书馆特色馆藏资源,充分实现文献的利用价值,适应现代信息技术发展,为读者提供一站式信息服务;而想要向读者提供一站式服务就涉及网络资源的本地化长期保存。
1.国际组织和外国政府出版物网络资源分析
国际组织和外国政府网站,不以盈利为目的,其网络资源具有内容丰富可靠、发布及时、文献组织有序、获取便捷、具有较强的参考价值等特点,各网站内容、形式不同。在众多的网络资源中大体可分为动态型网络资源和静态型网络资源两种[2]。
1.1 动态型网络资源
这类资源更新速度较快,又可分为描述型动态网络资源与数据库型动态网络资源两种。
其中第一种主要为一些机构及其出版物的概括性介绍、最新动态等,帮助读者对相关机构或出版物作基本了解,内容庞杂,但并不是所有信息都适合于图书馆用户使用。因此这部分内容适合由图书馆进行整合、分类、提炼并放在馆内国际组织与外国政府资源专题网页上,帮助读者了解这些机构是什么?有哪些可利用的资源?有哪些文献信息方面的新动态?这部分不是长期保存的重点。
第二种数据库型动态网络资源则非常专业、权威和重要。特别是其中一些统计性数据库,是目前读者信息需求的热点。由于数量庞大、涉及专题多、更新快,考虑到目前硬件及技术条件可能对其进行全部下载有难度,因此建议采用网页导航的方式,将其整合到图书馆国际组织与外国政府资源专题网页下统一发布,使读者对哪些资源属于自己所需要的一目了然。
1.2 静态型网络资源
联合国及其专门机构网站多数建有在线全文数据库、电子图书馆等专栏。内容包括年度报告 、统计年鉴、研究报告、工作文件等。这类文献往往具有很高的利用价值;而且多为pdf或word格式,可免费下载,若能充分利用就能更好地满足读者的需要。
这类网络资源可根据馆藏情况分为两类处理;其一,对那些馆内没有实体馆藏的网络资源,可以定期下载,编目并长期保存,以确保与实体馆藏的有效互补与融合。其二,对那些已有实体馆藏的网络版文献可在书目数据中添加856字段、电子资源定位与访问字段,引导读者对其网络版的便捷获取。国家图书馆在Aleph500系统第16版升级时,新增了“外部链接功能”即在简明书目格式显示,根据书目记录中856字段$u子字段、URL的内容就可以获得网络资源。但是,目前读者使用OPAC系统检索时,还不能使用此项功能,建议为读者增加“外部链接”功能。
内容整合是指不仅对政府信息的网址地址进行整合;而且对信息内容进行整合后存档到本地数据库中并提供一站式检索,它是一种比较安全的整合[2]。
澳大利亚保存和获取网络文献资源项目 Preserving and Accessing Networked Documentary Resources of Australia,简称 PANDORA,是1996年澳大利亚国家图书馆 National Library of Australia (简称NLA)牵头与9个图书馆和文化机构合作启动的项目。它以收集、保存与澳大利亚相关的网站和出版物为目标,旨在通过保存活动为未来的用户提供这些资源的存取与利用[2]。收集的相关网站主要包括非常有代表性的学术、商业、组织机构网站,也包括政府网站。NLA开展的工作主要有:对网上信息资源进行选择、获取、收集、抓取、管理、存档,使用网址收集和管理软件采集信息,建立PANDORA存档,PANDORA Archive 对政府信息资源整合,提供一站式检索并存储到本地数据库。PANDORA存档的不仅是政府信息的内容;而且也存档了政府信息网页的形式,是一种比较完全深入的内容整合。
2. 国际组织和外国政府出版物网络资源长期保存需要解决的问题
“数字时代”出版商实行的是授权制度。也就是说目前图书馆采购的很多外购资源库均未获得资源的所有权;而只是以获取“使用权”的方式购买和利用数字资源。因此,存在外购资源的可持续利用问题[3]。笔者认为,要解决网络资源的本地化保存,主要需要解决以下两方面的问题:
2.1 法律问题
在信息时代环境下,通过下载等途径获取网络资源以弥补馆藏文献的不足是图书馆文献资源建设的重要方式,但是版权等法律问题是图书馆进行获取前必须首先考量的因素,网络资源的采集和利用必须合法。
目前国际组织和外国政府出版物网络资源可分为免费使用、付费使用、授权使用等几种使用形式,对于免费使用的联合国网络资源,如:所有书目信息数据库均可免费使用,绝大部分《在线出版物》和部分专题数据库,可以免费查阅和下载;但不得散发、出售、汇编等。(见版权说明) 对于需要付费的网络资源,如:联合国在线统计月报、世界发展指标在线数据库、全球发展金融在线数据库等,查阅和下载受到限制。对于必须通过授权的方式才能使用的网络资源,如:联合国正式文件系统数据库、ODS Official Documents System、联合国条约数据库等,必须与版权方取得联系,使其授权使用和下载资源。
一般来说,图书馆属于以教育、学习和研究,为读者服务为目的的范畴,不属于营利机构,多数联合国机构愿意图书馆利用其网络文献。即使有版权限制的文献资料,只要事先得到有关机构或有关作者的许可和授权即可使用。但不允许大量复制、刻录、或翻译,很多国内图书馆由于长期忽略这部分文献资源的建设或害怕麻烦,懒于沟通,语言障碍等原因导致国内托存图书馆与这些国际组织沟通渠道不畅,谈判不够积极主动。目前对于国际组织和外国政府出版物网络资源的开发还多局限于网站导航;而未进入更深入的本地化长期保存及开发使用阶段。
2.2 数字资源的永久保存问题
网络资源具有不稳定性和易消失性,国际组织和外国政策出版物的网络资源具有普通网络资源共有的一些特征,如信息量庞大繁杂、生命周期短暂、更新快、不稳定性和易消失等。这些特点导致两个后果,其一是原有链接常常失效。如不及时更新维护,往往造成死链,无法获取相关信息;亦无法保证图书馆用户对这类资源的持续、有效访问。其二是重要数据的不可追溯,有些机构对于其陈旧、过期数据不再保留或不再公开提供,导致一些文献资源成为“昙花文献、蜉蝣文献”。如果图书馆没有对这类网络资源及时进行抓取和保存,很可能造成数据的永久消失。在工作中笔者也曾遇到有读者前来寻求帮助,寻找他在几个月前遇到过的网页及数据[4]。
随着各个机构对自身网络资源的重视,这类现象近年逐步减少。但对那些可能机构本身认为没有保存价值,但对图书馆及其用户来说具有保存价值的资源来说,这类资源的抓取和保存工作还是非常必要的。目前国内对这类资源的保存工作几乎没有开展,特藏专栏的建立不是一劳永逸的事情,需要对这些动态的资源保持长期的追踪监测,随时更新链接信息和专栏内容。惟如此才能保持其新鲜度和生命力,避免成为死链接。
3. 国际组织和外国政府网络资源长期保存的规划与对策
3.1 目前长期保存工作取得的成绩
目前,许多国际组织和政府网站都提供了一些相关的数据库,有些可以免费使用;同时,通过多方努力,中国国家图书馆已经获赠了部分数据库的使用权限。如通过托存图书馆协议于2009年9月获得了《 IMF在线图书馆资源》含《International Financial Statistics 》等四个统计数据库的使用权限。这些资源是科学研究中不可多得的宝贵财富,但由于发布位置不显著、不集中、缺少详细介绍等原因,导致读者对此知之甚少利用率极低。只有当读者来到阅览室时,通过馆员辅导才了解如何使用。这种状况是对资源的极大浪费也有违图书馆促进知识获取的价值准则。
3.2 镜像服务规划
以联合国条约集为例。目前联合国因为经费的压力,不再提供纸板的条约集;而条约集在国家图书馆的收藏是非常完整的,为了保证条约集的完整性,在2010年举行的中国《联合国托存图书馆馆员培训研讨会上》代表们建议联合国授权本地化下载,以保持条约集的完整性。而为了更好地实现资源共享,就需要将各种格式的文件,无论是PDF格式;还是Word格式等,保存在服务器上,更快捷的为读者提供镜像服务。即电子资源的长期保存问题,代表们建议在国家图书馆建立本地镜像服务器,联系联合国各机构确定下载的授权,最终享有永久保存的权利。对于全文文献、电子书等涉及知识产权性质的不同,鉴于联合国各机构情况不同,有条件的做本地镜像,这同样需要取得国际组织各机构的授权。
3.3 制定网络资源的长期保存政策、技术和标准准备相应硬件设施,将虚拟馆藏转化为实体馆藏
用资源导航、数字资源列表的形式引导读者使用开放获取资源固然是一种经济、实用又方便易行的方法,但其最大的不足在于无法与中国国家图书馆的实体型文献进行联合检索;即读者从OPAC中查不到这部分资源。在此情况下,这些资源往往被忽视,同时鉴于数字世界的庞大规模及其生命周期的短暂,图书馆必须在这个新的信息世界中扩大采访范围、制定网络资源采集标准 ,以便继续履行其永久保存重要知识信息的历史使命。因此,应逐步对这部分资源进行有计划有目的的抓取、收集与保存。将虚拟馆藏转化为实体馆藏,构建综合化、一体化馆藏。
可以根据不同网络资源的不同特征,在尊重版权的基础上建立相应的长期保存政策、技术和标准,可以借鉴WICP(Web Information Collection and Preserva-项目[5]。即网络信息资源的采集与保存试验项目,它是2003年初由中国国家图书馆启动的涉及网络信息资源保存问题的研究项目,该项目积极探索信息资源的采集与保存的相关法律、技术、标准等问题,在进行网络信息的采集和保存时,对静态网页(表层网页)和动态网页、深层网页,采取不同的策略,这也是国际组织与外国政府出版物网络资源应参考的标准。例如对部分已获得版权授权并具有长期保存价值的必要文件下载到本地服务器中重新归类、定期总结并进行编目;同时在Marc格式856字段中增加地址链接,以达到宣传和运用的目的。对于未获得授权的,如果读者确有需求,也可积极与相关机构进行协商,获取使用授权、或打印有限数量,装订成册,供读者出于科研目的在小范围内使用。
鉴于目标内容较为庞大,中国国家图书馆作为国内该领域的开拓者,技术经验尚不丰富。因此建议首先选取一部分资源进行实验,逐步拓展。目前部分资源的版权问题已经解决,下一步需要的是网络采集技术与硬件方面的支持,还有一部分版权问题需要以国家图书馆名义进行沟通、协商,需要馆方支持。
此外,数字资源一旦被获取或建立,图书馆就开始承担对其提供永久访问的任务。因此需要在实践中逐步总结网络资源的长期保存政策、技术和标准,使其符合主流技术标准和通用的计算机设备要求;并随数据存储技术的不断发展进行数据更新与维护。将这些资源进行长期保存,从而保证图书馆现有和将来的研究需求能够得到满足。
4. 结束语
国家图书馆是国家总书库,是国内文献的最终查询库,是外文文献的最大收藏地并代表国家执行相应对外文化协议,承担联合国及其相关机构等重要国际组织和部分外国政府出版物的托存图书馆职责。国际组织和外国政府出版物作为国家图书馆的特色馆藏资源之一,中国国家图书馆负责收藏、管理各种形式的国际组织和外国政府出版物,为国家政府部门、国家重点科研院所及广大公众提供信息服务。文献收藏量目前居国内之首。可以说,其文献信息资源建设和开发利用的程度,代表了国家级的水平。对于中国科技进步和经济、社会发展具有尤为重要的意义。针对实体型文献向网络出版的转化,需要与时俱进。将文献情报研究的对象范围不断拓展,结合业务实践制定新的馆藏建设策略、完善特色馆藏资源建设。努力保障用户对原生数字资源和网络资源的永久访问,充分为政府部门决策规划提供依据,增强决策的科学性和准确性,满足用户的文献服务需求,使国际政治经济、文化等各方面信息得到更广泛的传播和利用。进一步拓深服务内涵,提高知识服务能力和文献管理水平,更好地行使国家图书馆的专藏资源建设职责。原载《农业图书情报学刊》2014年第12期