一个预言,一个传统的纸本媒体行将消失的预言,正在欧洲上空回荡。2010年11月,法国互联网专家艾贝尔博安(Fabrice Eplboin)在接受法国《资本》杂志记者专访时预言,随着互联网在全世界的普及,传统的报刊杂志将会淡出市场;在未来十到十五年内,像报纸、周刊一类的传统媒体肯定会逐渐消失。[1]
一、互联网发展现状及资源情况
互联网自1995年投入商业性使用以来,其扩张速度令人瞠目。同时,伴随着信息与通讯技术的相互交融,互联网中资源的种类和数量也呈几何级速度快速增长。下文所述数据将有助于我们了解今天互联网的发展现状和资源规模。
(一)互联网信息规模
互联网到底有多大?这是一个很难确切回答的问题,因为人们尚未找到一个适宜的测量工具或者公认的标准对其加以准确计算。目前,IT业界和学术界通常是借用计算机信息容量单位TB(Terabyte)来估算互联网的规模。2003年,美国加州大学伯克利分校信息管理和系统学院曾就记录于各类载体上的信息量进行了测算并发表了研究报告。[2]该报告将互联网信息分为4大类:表层网页(surface web)、深层网页(deep web)、电子邮件和即时讯息(Instant messaging),其信息总量约为532897TB。至于互联网中网站的数量,据英国国际知名的互联网安全和数据研究分析机构Natcraft最新发布的2010年10月号统计报告,当月其监测到的全球网站共有232839963个;[3]而各类网站所含资源总量估计已超过5亿TB,分别储存于与互联网相连的大约7800万个服务器中。[4]伴随着互联网的迅速扩张,网络中的资源种类也日益丰富,按照是否属于正式出版物为标准,大致可将其分为:1.由电子图书、电子期刊、电子报纸、政府出版物等构成的电子出版物;2.由收录于各类型机构知识库并通过互联网传播的学位(术)论文、研究报告等学术性在线资料;3.由网民或者网站自创的网络博客、BBS等类资料构成的非出版在线资料。这几类在线资源的数量亦以惊人的速度快速增长。以我国为例,目前每年出版的电子图书达50万种以上;在全国现有的1937种报纸中单独出版的数字报纸已达700种;另外,电子期刊的数量近年来也呈快速上升趋势,目前,互联网中期刊站点有580多家,电子期刊总量已近万种。未来几年,中国数字出版用户每年将增长30%,收入每年将增长50%。[5]
(二)互联网用户规模
在互联网实现商业性运行之初的1995年,互联网的使用者只有1600万,仅占全球人口的0.4%;经过15年的快速发展,至2010年9月,其使用者已近20亿,约占全球总人口的29%。而作为全球互联网应用最为发达的欧洲,截至2010年6月,其互联网的人口普及率已达58.4%,用户数量也占到全球用户总量的24.2%。从表1和表2可以清楚地看出1995~2010年期间互联网的发展轨迹和全球普及率变化情况。
二、欧洲互联网资源采集及缴存立法情况
早在10多年前,互联网资源的采集和缴存问题就已经引起联合国教科文组织的注意,在其分别于1996年和2000年公布的《电子出版物法定缴存》[8]及《法定缴存立法指南·2000年修订版》[9]两个指导性文件中,均对在线出版物的缴存有所涉及。在全球互联网普及率最高的欧洲,在线资料的采集和保存也受到了欧盟委员会的关注。该委员会在2006年8月24日公布的《关于文化资产的数字化和在线获取及数字保存建议》[10]中即敦促成员国就保存网页内容进行立法,授权本国法定保存机构通过网页收割一类的技术措施采集和保存互联网资源。[11]为落实该建议,不少欧洲国家已经开始修改或者订立新法规范在线资料的采集和缴存。据大英图书馆于2010年8月公布的一项问卷调查报告,已有挪威(从2001年起)、爱尔兰(从2003年起)、丹麦(从2004年起)、爱沙尼亚、法国、德国、拉脱维亚、立陶宛、斯洛文尼亚(皆从2006年起)和芬兰(从2007年起)共10个欧洲国家通过了相关立法,授权本国的国家图书馆采集互联网资源。[12]本文下面将简要介绍一些欧洲国家有关在线资料采集和缴存的有代表性的立法例。
三、欧洲六国在线出版物采集和缴存立法举要
(一)丹麦
丹麦是欧洲互联网普及率最高的国家之一,截至2010年6月底,互联网用户数量已达本国人口的86.1%,仅次于爱尔兰(97.6%)、挪威(94.8%)和瑞典(92.5%)。[13]丹麦皇家图书馆(Royal Library)和国家与大学图书馆(State and University Library)从2005年起开始采集互联网资源,采取网址(URL)搜索获取互联网中与本国有关的丹麦文和英文资料。其资源采集策略主要有以下3种:1.批量收割(Bulk harvesting),以网页快照方式每年进行4次资源采集;2.选择性收割(Selective harvesting),挑选80~100个经常更新且对本国社会生活具有特殊意义的网站(如新闻网站等)实施经常性采集;3.按事件收割(Event harvesting),以重要事件(如国家和地方选举)为对象,采集与之相关的在线信息。据统计,到2010年8月31日,两个馆已采集了大约45亿个网络对象,收获数据量达155TB;这些数据被分别储存于皇家图书馆和国家与大学图书馆专设的服务器中。[14]
数年前,丹麦政府就已注意到在线资料的保存问题。2004年12月22日,丹麦议会通过了《出版资料法定缴存法》。[15]根据该法,自2005年7月1日起,各类在线资料将被纳入国家出版物法定缴存范围。该法第8~12条具体规定了在线资料缴存的两种方式:主动采集制和被动缴存制。前者是指由国家法定缴存机构(皇家图书馆、国家与大学图书馆)按照预先设定的采集范围,采用技术手段定期扫描和收割互联网中对公众开放获取的资料;而后者则是指对于在主动采集过程中遇见的设有控制读取措施且属于采集范围的在线资料,规定其所有人须根据法定缴存机构的书面通知进行缴存。
该法有关在线资料缴存的主要内容有:1.凡互联网中由注册为丹麦域名.dk网站刊载或者由其他域名网站刊载的主要面向丹麦公众的在线资料均属法定缴存范围;不对公众开放的内部网络(如局域网)中的资料除外;前述丹麦域名的注册人和主要面向丹麦公众的其他域名网站资料的刊载者为缴存义务人;2.缴存义务人应根据法定缴存机构的要求,告知其与读取、复制和提供公众获取缴存出版物所必须的信息;缴存义务人有权要求法定缴存机构不得将设有读取控制措施的信息泄露给未经授权的任何第三方;3.负责管理互联网中丹麦域名的机构应根据法定缴存机构的请求,向其提供域名名录的电子复本以及域名注册者的相关信息;4.前述涉及请求缴存及制作缴存资料复本的费用由法定缴存机构负担。
另根据该法总则规定,对合法缴存于其馆藏的在线资料,法定缴存机构可基于长期保存目的制作其复本并在符合版权法和保护私人信息法有关规定的前提下提供获取,但在实际操作中限制极为严格,目前仅可向基于学术研究和统计目的的研究人员提供读取且事先须获得丹麦资料保护局(Danish Data Protection Agency)的许可。[16]
(二)德国
德国互联网普及率为79.1%,处于欧洲较高水平。自2006年起,德国国家图书馆开始履行在线资料的采集、编目和保存法定职能。根据有关法规和该馆《文献采访指南》[17]的规定,在线资料采集的对象包括互联网中对公众开放的所有以文本和音像格式出现的作品,如电子出版物(期刊、图书、报纸、政府出版物)、学位论文、音乐作品及网站等。临时版本资料、纯软件或者应用工具、与公众利益无关的商业性和私人性资料以及无线电和电视节目不在采集和缴存之列。
现行有关在线资料采集和缴存的法律制度主要规定于《2006年德国国家图书馆法》[18]和于2008年10月17日颁布的《向德国国家图书馆缴存出版物条例》[19]两个法律文献中。《国家图书馆法》第14条(3)款和第16条分别规定,缴存人应自作品发行或者提供公众获取之日起一周内自费向国家图书馆免费缴存一个复本的完整和最佳状态的非实物形式(immaterial form)作品,该作品应无使用期限限制且适于图书馆长期保存。《缴存出版物条例》则进一步就在线出版物的性质和缴存范围做出具体规定:1.缴存义务人应将其在线出版物(online publications,又称无形媒体作品Intangible media works)向国家图书馆缴存其商业版本及可通过商业途径获得的读取工具;2.缴存对象包括在线出版物的所有组成部分、软件和各种以实物及电子形态存在的读取工具,而不论其是否属于法定缴存范围;特别是那些只有缴存人才拥有的用于开发和使用在线出版物的非市场可得的读取工具,应一并缴存;3.国家图书馆可拒绝某些种类的在线出版物的缴存:(1)同时或者随后以不同技术设计出现的在线出版物的个别期卷;(2)技术程序无法采集和存档或者采集和保存人工成本过高的在线出版物;(3)内容定期更新需频繁缴存的在线出版物由国家图书馆决定是否接受;4.无须缴存的在线出版物有:(1)纯系个人或者机构自行发布的在线出版物;(2)由地区、城市和自治社团自行出版的在线出版物;(3)仅用于商品交易或者内部使用目的的在线资料;或者其他用于交通管理、私人和家庭内部及社会生活目的的在线资料;(4)游戏程序;(5)仅用于私人目的的网站;(6)实体或者非实体作品的临时性或者示范性版本、初稿;(7)单独出版的操作系统、非实质性应用程序和用于互联网服务的某些应用工具;(8)尚未出版的货品目录;(9)非由第三方出版的根据电视和广播节目制作的在线出版物;(10)内容未作任何改变的已缴存原创作品的在线版;(11)无任何事实和人际关系内容的网络交流、讨论或者信息工具;(12)无网页存档的电子邮件简讯;(13)仅供私人用户群使用的在线资料。
(三)法国
法国的信息产业比较发达,互联网用户数量目前已占到全国人口的68.9%。从2002年起,法国国家图书馆开始试验性网页采集和保存工作,通过网页快照对选举类网站实施保存。2004年,该馆又与美国互联网档案馆(Internet Archive)一起开展了为期5年的合作计划,对注册为法国域名的网站内容实施采集和保存。2006年,该馆正式承担在线出版物缴存和其他在线资料采集的法定职责。目前该馆主要采取网址、关键词和全文检索以及主题采集(如网络日记、博客、文学网站、社会活动家网站)等方式收割在线资料。资源采集策略有:按国家域名、事件和主题采集以及批量收割和选择性收割等。到2010年,采集和保存的在线资料已达180TB(130亿个文件)。根据版权法等法律的规定,采集保存的在线资料仅在国家图书馆馆舍内向研究人员提供检索和浏览。
法国是世界上第一个建立出版物缴存法律制度的国家。[20]1992年,法国议会曾专门通过了《出版物缴存法》,[21]但未涉及在线资料的缴存问题。但至2006年,法国议会在其通过的《关于信息社会版权和相关权利的法律》[22]中明确规定将法定缴存制度扩展到互联网领域。该法第39条和41条分别规定:1.通过电子渠道(electronic channels)向公众传播的任何种类的在线资料皆应依法缴存。依据该条含义,各类由符号、信号、文字、图像、声音或者其集合者组成的在线出版物,只要是通过互联网向公众传播的即属缴存范围。此类出版物除网站外尚含网络中的时事通讯(newsletters)和其他流媒体(streaming media)资料;2.法国国家图书馆等法定缴存机构有权采集和保存任何对公众开放的在线资料,采集时应将有关程序通知缴存义务人;3.在线资料的采集可采取自动程序或者与缴存义务人协商确定的其他方式;凡对资料设置密码或者其他读取限制措施的缴存义务人不得阻止国家图书馆等法定缴存机构采集其在线资料;4.作者不得阻止国家图书馆等法定缴存机构将其采集保存的在线资料提供给可信赖的研究人员使用;亦不得阻止国家图书馆使用任何方法以任何介质复制其作品,只要该复制行为符合法律规定,属于采集、保存和查询时所必须。另根据《遗产保护法典》(code du patrimoine)L132-2条i款之规定,通过电子途径出版或者向公众传播的各类在线作品的所有人为缴存义务人,其负有法定义务向国家图书馆等法定缴存机构缴存作品。
(四)意大利
意大利议会于2004年4月15日通过了第106号法律--《关于缴存供公众利用具有文化意义文献的法律》。[23]该法明确规定:为保存意大利文化和社会生活的记忆,凡属部分或者全部在意大利境内出版和销售的供公众阅读、收听、观看的出版物,不论其制作的技术手段、载体或者传播方式(包括专供残障人士利用的出版物),其制作者、编辑者、印刷者、出版者皆须于出版物首次发行之日起60日内,向设于佛罗伦萨和罗马的国家中央图书馆缴存两件复本,否则将面临最高1,500欧元罚款的行政处罚。这些规定实际上已经将在线出版物纳入缴存范围。2006年8月18日,该法的实施条例--《缴存公共文化资料条例》[24]公布,其中就在线出版物的缴存作了专门规定(第7章)。根据该条例有关定义的解释,“公共利用”(public use)一词即包括通过计算机网络对公众传播作品的行为;而“文件”(documents)一词则是指供公众有偿或者无偿使用的各种模拟和数字介质出版物,其中包括通过移动或者固定网络传输的出版物。
与印刷版出版物缴存有所不同的是,条例就在线出版物的缴存规定了缴存义务人依法主动缴存和国家图书馆主动采集两种方式。前者依照《关于缴存供公众利用具有文化意义文献的法律》有关规定执行,如缴存义务人的范围、缴存期限及接收缴存品机构等;而后者则由该法实施条例具体规定。其内容主要有:1.文化遗产部部长经咨询技术革新部部长并与有关行业协会和法定缴存委员会、版权咨议委员会协商后,可就经计算机网络传播文件的自愿缴存提出一项试验计划;2.在咨询法定缴存委员会后,文化遗产部可与负责缴存在线文件的有关各方达成协议,依据国际最佳做法和共识,拟定缴存条款的技术细节,并尽可能采用自动方式采集;3.缴存协议应确保优先采集下列类型的在线文件:(1)已入藏的以传统技术和介质制作的藏品的在线续编版;(2)由大学、科研和文化机构出版发行的在线科学资料;(3)由政府当局制定并通过网络传播的官方文件;(4)更新频繁的网站文件或者内容常被其他网站引用的网站资料;4.缴存协议应确保缴存日期的准确性和所采集资料的真实性,提供确定的文件复制或者传播日期及其作者信息;5.在特定人群中传播和共享且其获取受到限制的在线文件(如局域网中的文件)免于缴存;文化遗产部可在试验结果的基础上部分或者全部免除缴存义务人缴存在线文件的义务。关于对缴存后在线文件的获取利用,条例规定,在尊重版权人版权和相关权利的情况下对采集时属于开放获取的文件可提供在线读取服务;但对那些采集时设有某些限制(如许可协议或者其他合同条款限制)的文件仅可向经注册的用户提供使用。
(五)奥地利
奥地利国家图书馆于2008年起开始采集和保存网络资源,目前主要采取网址搜索和主题检索两种方式采集在线资料。资源采集策略有:按国家域名(.at)、事件、主题、批量收割和选择性收割等。
奥地利有关出版物法定缴存制度规定于《出版法》(Mediengesetz)中。根据2009年2月该法的一项修正案,[25]在线出版物被纳入采集和缴存范围。该修正案共3条(43b,43c,43d),从采集、缴送和利用3个方面规定了在线资料的缴存制度。1.关于主动采集制。授权奥地利国家图书馆对互联网中对公众开放的注册为奥地利国家域名(.at)的网站或者自动链接有奥地利内容的在线资料每年实施4次综合性自动采集;国家图书馆在实施采集行为前应书面告知被采集资料的所有人;该馆还可采集国内其他图书馆、科研机构、大学的在线资料并根据它们的请求,向其提供保存的在线资料;2.关于缴送制。资料所有人应向国家图书馆缴存无技术保护措施的在线资料;对设有读取控制措施的在线资料或者虽未设有该类措施,但由于技术原因致使国家图书馆无法对其实施采集的,资料的所有人应根据国家图书馆的书面请求缴存该资料并同时提交移除技术保护措施的有关资料;但对下列类型的在线资料国家图书馆可暂缓要求缴送:(1)在现有技术条件下虽经合理努力仍不能满足缴存资料的存储和保护需要的;(2)在线资料的缴送、采集和保存成本过高,远远超出国家图书馆所能承受的范围;(3)与已经缴存的其他载体出版物在内容上一致或者大致一致的在线资料;(4)音像制品和广播节目;(5)与公共利益无关或者无保存价值的非科学、非文化类在线资料;经与国家图书馆协商同意,缴存人可以任何技术格式缴存资料,特别是那些以电子方式提交的在线资料。3.关于对采集和缴送的在线资料的利用。修正案规定:(1)对采集和缴送的在线资料,如其尚受版权或者其他权利保护者,国家图书馆可制作其一件复本用于服务;(2)对缴存于国家图书馆的设有技术保护措施的在线资料,其所有人有权对该资料设定为期一年的禁用期,自缴存之日起一年内,禁止图书馆用于对公众服务,该项禁用决定应书面通知国家图书馆;对于国家图书馆主动采集保存的在线资料,其所有人有权设定最长不超过一年的禁用期(自被采集之日起计算),禁止该馆用户对其利用;该项禁用决定亦应书面通知国家图书馆;其他图书馆拥有的从国家图书馆索取的在线资料在提供读者使用时适用前述禁用期规定;(3)读者对缴存和采集的在线资料的读取仅限图书馆馆舍内;其中属于设有技术保护措施的在线资料,在同一时间内仅可允许一名用户使用;图书馆可为用户提供在线资料的打印件或者一件电子复本。
此外,为确保缴存和采集的在线资料的安全,修正案还特别规定:奥地利国家图书馆和其他拥有缴存和采集的在线资料的图书馆应采取一切必要的技术和管理措施确保资料的安全和完整;资料的所有人如怀疑其资料可能存在被非法利用情形的,可对国家图书馆及其他相关图书馆的储存、交流和利用过程进行监督检查。
(六)英国
英国大英图书馆于2005年开始实施网页采集和存档,通过网址和全文搜索、按字顺和主题浏览和主题采集(Topical Collections)等方式摄取网络资源。资源采集策略主要有:选择性收割和按事件及主题采集等。目前,由大英图书馆与威尔士国家图书馆、联合信息系统委员会(Joint Information Systems Committee, JISC)、Wellcome图书馆、国家档案馆和苏格兰国家图书馆合作建立的“英国网页档案库”(UK Web Archive)已初具规模。该库内收有关英国历史、社会和文化方面的大约5,000个网站的资料并对公众免费开放。
英国最近一次有关出版物缴存的立法是2003年议会通过的《法定缴存图书馆法》。[26]该法虽未直接规定在线出版物的缴存,但授权文化、媒体和体育大臣制定规章,就在线出版物的界定及其缴存介质等内容具体予以规范。[27]2010年9月29日,根据“法定缴存顾问组”(The Legal Deposit Advisory Panel, LDAP)的建议,文化、媒体和体育部会同商业、创新与技能部联合公布了“非印刷版作品法定缴存征求意见稿”[28]和《2011年法定缴存图书馆(非印刷版出版物)条例》立法草案,[29]一并征求社会各界意见。
关于在线资料的采集和缴存,该条例草案规定:1.根据法定缴存图书馆的请求,凡属对公众免费和无障碍获取的在线资料必须在合理和切实可行的范围内尽快缴存;2.凡属收费或者限制公众读取的在线资料,其缴存义务人须在接到缴存图书馆缴存请求之日起3个月内缴存一件复本,除非该缴存请求对缴存期限另有要求;3.缴存图书馆须以书面形式提出缴存请求(无论是通过网页收割机器人收割时通知或者以其他方式提出),而缴存义务人仅须向首个提出缴存请求的图书馆履行义务;4.缴存的在线出版物复本须以出版商和缴存图书馆双方商定的最适宜保存目的的品质缴存,如双方无此约定,则以出版商选定的品质缴存。
相对于对公众免费开放的在线出版物,条例草案对那些收费或者设有读取限制的在线出版物规定了更严格的缴存义务:出版商在缴存此类出版物的同时,还须缴存所有与读取该出版物有关的计算机程序和其他读取工具及资料的复本。关于在线出版物的利用,草案规定,除适用本条例规定的一般性限制性条款外,应自该资料缴存至图书馆之日起7日后方可提供读者利用。
四、分析与思考
前述欧洲六国有关在线资料法定缴存的立法虽各有侧重,但因规范的对象皆为互联网资源,因而其立法内容有许多共同之处:1.关于采集和缴存的范围。六国立法皆规定凡属互联网中面向公众使用的资料皆为采集和缴存的对象;采集的范围多为注册为本国域名的网站和其他主要面向本国公众或者与本国社会经济文化生活密切相关的其他域名网站(含在国外注册的网站);2.关于采集和缴存的方式。根据在线资料的不同属性,按是否属于正式出版物为标准,六国立法多将其划分为两种资源采集方式--主动收割制和缴存制。对互联网中的正式出版物,如电子图书、电子期刊、电子报纸等,其出版者应主动缴存;而对其他在线资料则授权国家图书馆等国家法定缴存机构主动采集和保存;按资料是否设有控制读取措施,主动采集又可分为两类,一类是对公众无障碍开放获取的在线资料,国家图书馆可依其采集策略使用网络机器人实施采集;另一类是面向公众传播但设有读取控制措施(如密码等)的在线资料,其所有人应根据国家图书馆的书面通知缴存该资料及与解除控制读取措施有关的资料;该书面通知可由国家图书馆在采集过程中通过网络机器人送达。这说明,在线资料中除电子出版物外,其他资料的所有人通常不负主动缴存之义务,唯有在接获国家图书馆等法定缴存机构书面通知后方负缴存之责;3.关于采集策略。六国立法虽未直接加以规定,但为履行网络资源采集之法定职责,国家图书馆等机构在实际操作中多采取批量收割、选择性收割和按事件、主题、域名收割等方式;4.关于采集行为的实施主体。作为一种保存国家文化遗产的国家行为,六国立法无一例外地规定由国家图书馆代表国家履行网络资源的采集和保存职责,且亦有立法(如法国)明确规定,缴存义务人不得限制国家图书馆的采集行为。
通过以上对欧洲六国有关立法情况的介绍,可以清晰地看出立法保障在线资料采集行为的重要性和紧迫性。除其中一些带有共性的规定值得我国立法借鉴外,另有两个问题亦应当引起注意,一是关于立法模式。进入21世纪以来,随着数字出版的兴起和互联网信息的快速增长,出版物的类型和载体愈来愈丰富,传统的出版物法定缴存制度也正面临着诸多挑战,其立法模式正悄然发生变化。在英美法系国家,出于对出版商垄断权利的限制和对作者权利的保护,有关出版物法定缴存制度多规定于版权法中。但近年来,随着互联网的快速扩展,一些国家的立法者们开始意识到,缴存出版物已不再仅仅是版权领域的事,而事关国家文化遗产的保护和传承,事关国家经济和文化软实力和国际竞争力。因此,一些国家已开始考虑将出版物法定缴存制度从传统的版权法中独立出来,单独立法,如英国的《2003年法定缴存图书馆法》和其实施条例草案。二是对采集和缴存的在线资料的利用问题。从版权角度,在线资料大体可分为三大类:1.版权法不予保护的公共资源,如各类立法、司法和行政机关主办的政务类网站信息;2.开放资源,即版权人声明许可公众为个人学习和研究之目的而使用的各类在线资料;3.以公众为传播对象,但设置了某种控制读取措施的在线信息。另外,由于法律授权国家图书馆等法定机构可以不受限制地采集在线资源,故其采集的资料中有相当一部分包含私人或者机构的不宜公开或者有时间限制或者有条件获取的信息。由于被采集资料版权属性和内容的复杂性,因而前述国家的立法大都对采集保存后资料的利用设定了严格的条件,如利用主体仅限研究人员,利用目的须为研究或者统计目的,且在程序上属依申请行为,国家图书馆通常不得主动将其采集保存的在线资料用于公众服务。
我国是世界上互联网用户数量最多的国家,到2010年9月30日,我国网民数量已达4.39亿人,互联网普及率达32.9%;以.cn注册的网站达6百多万个。[30]互联网中大量涉及我国社会生活各领域的珍贵资源急需采集和保存。因此,国家应通过立法授权国家图书馆等负有保存国家文化遗产法定职责的机构采集和保存各类网络资源,以惠及当代、造福子孙。