|
当前位置:首页 > 法律信息研究 > 数字信息检索
|
|
数字信息检索 |
|
|
从引文分析看计算机对当代法律文献检索的影响 |
|
理查德•A•里特著 林咏华译 |
点击量:4448 |
林肯大学M•舒密特法律图书馆(美国) 中山大学法学院图书分馆 |
|
|
|
|
|
|
科技的奇迹令人眼花缭乱, 我们常常看不到其局限性, 急于给计算机检索工具赋予不应有的魅力, 这篇文章就证明了这一点。 (一)问题的提出: 这一研究始于我与一位同事的交谈, 他说几乎没必要在开架区保留1980 年之前的法律期刊, 因为这些资料的需求量很少。由于目前绝大多数电子法律期刊索引和法律评论全文数据库收录的都是1980 年以来的期刊, 我猜测过度依赖计算机检索工具, 正在使法律学者及学生错失大量有价值的信息。我决定就此进行调查, 以提醒图书馆员注意计算机的“破坏性”影响。我也希望能推动新方法的产生, 增加人们对法律评论资料的获取、利用。从这篇文章读者会发现: 1980 年之前的法律评论使用率低这一现象确定存在, 但是对于其发生的原因, 我的看法完全错了。 我所发现的法律评论引文模式, 表明最省事原则盛行于法学界[2 ] 。这种模式的存在也能使法律图书馆员警觉起来, 鼓励他们进行创造性的工作, 开发新的藏书管理方法和信息传递方法, 使文献检索者能更有效地获取更多的信息。我的研究证明计算机不是问题(如果它确实是一个问题的话) 的症结, 因此也不是问题的解决办法。同样, 使用了多年的印刷版索引不是“过去”问题的唯一原因, 或许也不是目前问题的答案。 (二)研究方法: 法律文献检索领域的计算机革命发生的时间稍早于1980 年,[3 ] 但当时还未涉及法律评论的检索。为检索法律评论论文而设计的计算机检索工具主要有《法律追踪》(LegalTrac) , H. W. 威尔逊公司的电子版《法律期刊索引》, 以及LEXIS 和WESTLAW 的法律期刊全文数据库, 收录的基本上都是1980 年以来的期刊。 测定当前人们对法律评论论文的“使用量”, 方法是取得写于1996 年的论文, 计算发表于1980年之前与之后的被引论文数量。诚然, 这个方法不能精确地测出法律评论论文的实际“阅览室使用量”, 因为引文并不一定能准确代表作者在图书馆内使用过的资料。尽管如此, 就这个研究来说, 它很有意义地反映出检索者对1980 年之前与之后出版的法律评论的使用水平。它也是唯一能客观地衡量实际使用量的方法。 就期刊的容量大小, 发刊数多少, 出版历史长短, 地区分布而论, 下面选出来的十五种期刊具有广泛的代表性。每一种期刊都是由常设的法学院出版的, 以保证各地作者都能毫不费力地进入一座具有海量馆藏的图书馆。[4 ] 这些期刊都具有常规的出版史, 不管哪一年所发表的文章数量都有代表性。选出来的期刊有: 加利福尼亚法律评论、康纳尔法律评论、哥伦比亚法律评论、戴维斯法律评论、艾默里法律评论、乔治亚法律期刊、乔治敦法律评论、哈佛法律期刊、内布拉斯加法律评论、诺特·当法律评论、俄勒冈法律评论、斯坦福法律评论、德克萨斯法律评论、华盛顿·李法律评论及耶鲁法律期刊。 我们查看上述每一种期刊的两册合订本, 一册是截止到1996 年11 月的最新合订本(有时, 是1994 - 1995 合订本, 但通常是1995 - 1996 合订本) 。另一册是1976 合订本, 或者1975 - 1976 合订本。这种做法很方便, 又能保持统计一致性。选1976 年的期刊有两个原因: (1) 1976 年距今正好20 年; (2) 能考察在没有计算机检索工具(在1980 年以后才普及应用) 的条件下法律期刊的利用情况。 为了解专业学者(大学教师) 和学生对法律期刊论文的利用有无差别, 统计数据根据论文作者的身份细分, 因此, 表中有“教师为主”或者“学生”两栏[5 ] 。法律期刊中的论文种类繁多, 为方便研究, 凡是没有脚注和序言的演讲稿, 一般都不作分析。 还有一些不能明确分类的论文, 就得决定是否和怎样把它们纳入统计表。有关实体法发展的年度综论文章凡是以短篇连续刊载的, 我们不统计, 除非它们有署名并加了脚注,属于这种情况的, 通常合并为一篇论文统计[6 ] 。另一种类型的法律评论论文, 如书评, 要作具体分析来取舍, 看它们是否包含实质性脚注, 是否教师所著。大体说来, 以这种方法排除的论文数量不多, 并且它们通常没有引证任何法律评论论文。 确定指导原则之后, 我设计了统计表发给志愿者, 由他们统计上述法律评论中的被引论文。我们只统计首次引文, 因此在一篇法律期刊论文中每一篇被引论文只计一次。此外, 被引论文如果没有编入《法律期刊索引》或《当代法律索引》, 引文不计算在内。由于引文数量以及志愿者人数很多, 不可能十全十美地执行那些“规则”, 在计算中必然会发生某些前后不一致的地方。但是, 这种可能性很小, 也许无关紧要。 (三)调查结果 表1 分析文章的总数 年份 教师为主 学生 合计 1976 (15 卷) 550 269 819 1996 (15 卷) 572 363 935 小计(30 卷) 1 , 122 632 1 ,754 我们查阅了935 篇1996 年发表的论文(见表1) , 引用法律评论论文5823 篇(次) 。分析表明, 被引论文只有27 %是1980 年以前发表的, 其余73 %是1980 - 1996 年发表的(见表2) 。如果说, 引文表明作者对被引论文的参考使用, 这无疑证实了以下看法: 目前, 人们很少使用1980年之前的法律评论---在每四篇被引用的论文中, 发表于1980年之前的只有一篇多一点。 表2 引文数量分析 1996 年论文 引文总数 1980 - 1996 年的引文 1980 年前的引文 教师为主 4 , 235 2 , 988 (70 %) 1 , 265 (30 %) 学生 1 , 588 1 , 256 (79 %) 322 (21 %) 合计 5 , 823 4 , 244 (73 %) 1 , 579 (27 %) 1976 年论文 引文总数 1960 - 1976 年的引文 1960 年前的引文 教师为主 2 , 161 1 , 460 (68 %) 701 (32 %) 学生 2 , 148 1 , 660 (77 %) 488 (23 %) 合计 4 , 309 3 , 120 (72 %) 1 , 189 (28 %) 为了查明这种较低的使用率是否与计算机检索工具的运用有关, 我们对上述期刊的1976 年合订本进行了类似的分析。原来我预料, 由于使用印刷版《法律期刊索引》(收录1908 年以来的期刊) 来查找相关论文, 1976 年论文的作者会更多地引用16 年(1960 -1976 年) 之前发表的论文, 然而, 分析结果与预料的情况相反: 这两个不同时期的论文对较旧(16年之前) 法律评论论文的引用情况几乎完全相同。我们查阅了819 篇1976 年的论文(见表1) , 其中引用法律评论论文4309 篇(次) 。分析表明, 这些被引论文只有28 %是1960 年以前发表的[7 ] , 其余72 %是1960 年以后发表的(见表2) 。这两组数据中,法律评论论文的引文模式极其相似, 只有一个百分点的差别。可见, 以计算机检索法律文献并不是现代作者较少使用1980 年以前的法律评论论文的原因。 我们还可以看出, 教师作者和学生作者的引文模式几乎完全相同(见表1 和表2) 。在我们查阅的1996 年论文中, 教师论文572 篇, 引用法律评论论文4235 篇(次) , 其中70 %是1980 - 1996 年发表的; 学生论文363 篇, 引用法律评论论文1588 篇(次) , 其中79 %是1980 - 1996 年发表的, 虽然上述百分比说明学生比教师更常用计算机检索工具,但这一差异所占比例很小, 可以忽略不计。 我们对1976 年论文的分析如下: 教师论文550 篇, 引用法律评论论文2161 篇(次) ;学生论文269 篇, 引用论文2161 篇(次) 。分析显示, 教师引用的论文68 %是1960 - 1976年发表的, 而在学生论文中这一比例为77 %。 综合1976 及1996 年的论文数据, 我们分析了1754 篇论文、10132 处引文。73 %的被引论文是16 年以内发表的。从中可看出: 在任何法律期刊论文中, 大约70 %的被引论文是来源文献发表前16 年内的论文。显然, 反过来也如此: 目前在学术界中, 作者引用的论文大约有30 %的是16 年以前发表的[8 ] 。 表3 合并的引文总数 1976年+ 1996年 1976年+1996年 “较新”的引文(a) “较旧”的引文(b) 论文总数 引文总数 1960年之后+1980年之后 1960年之前+1980年之前 1,754 10,132 7,364 (73%) 2,768 (27%) (a)这一数字是1976 年论文中1960 年之后发表的被引论文和1996 年论文中1980 年之后发表的被引论文之和。 (b)这一数字是1976 年论文中1960 年之前发表的被引论文和1996 年论文中1980 年之前发表的被引论文之和。 (四)讨论 对这种引文模式可作多种解释。可能因为作者所写的论文主要涉及当前热点问题, 或是涉及对新近学术研究成果的不同看法。在这两种情况下, 他们几乎不会用到15 或20 年以前的论文。这个研究揭示的引文模式无疑证实了这一看法。在上述情况下, 文献检索方式或者法律评论资料的获取方式与检索过程无关。当检索者渐次往前查阅较旧的资料, 他们似乎总会达到一定的界限, 即一种“论文关联界线”, 超出这一界线, 他们所能找到的与研究项目有关的资料会越来越少。这种理论认为, 人们很少用到1980 年之前的法律评论, 并不在于他们过度依赖计算机检索文献, 而是因为“谁也不再使用这些期刊”。既然早在普通运用计算机检索法律文献之前, 类似的引文模式就已经存在, 印刷版索引看来并不能使人们获取更多年代更久的资料。 对我们得到的数据也可作另一种解释: 连那些将会撰写与“旧”问题有关的论文的学者, 大概也选择引用较新的论文。这自然提出了首先促使我们研究的问题: 虽然我们的法律体系非常强调法律原则的历史发展, 但当代学者却更喜欢参考较新的论文, 原因何在?换一种说法: 他们频繁参考现代的资料而忽视重要的历史资料, 是否因为他们使用了只能查阅当前资料的检索工具? 这些统计数据同样可以用“最省事原则”来解释。根据这一原理, 检索者总是预先形成研究结论, 然后再查找相关资料加以论证, 当他们找到足以支持这一结论的资料就停止检索。研究还表明, 只要找到一点点相关的资料, 检索者就满足了, 即使他们知道还可以找到其他资料[9 ] 。就目前的研究而言, 我认为图书馆员应该着手解决那些影响文献检索效果、导致“最省事原则”检索现象发生的问题。具体说, 首先要使人们能通过索引方便地获取特定论文的信息, 其次要使人们能方便地获取这些论文资料。很明显, 图书馆所提供的获取馆藏文献的方式, 将会影响读者的检索效果。 这里提出了一些有趣的哲学问题。首先, 索者应该找到所有与研究项目有关的资料吗? 例如, 为了获取与研究相关的所有法律评论论文, 人们是否应该翻查每一本索引, 直到第一卷《法律期刊索引》(1908 出版) 及《琼斯·奇普曼索引》(收录1908 - 1937 年间的期刊) ?[10 ] 假使一位检索者, 从最近的索引开始查找法律评论论文, 查到1960 年索引就停止检索, 因为查看了1960 年的四卷《法律期刊索引》累积本后[11 ] , 他找不到任何相关的资料; 如果在下一卷更早的索引累积本中就有一篇相关论文, 那么检索者的判断有误吗? 一旦检索者达到“论文关联界线”, 几乎没有迹象表明能找到更多相关资料, 他就没有动力继续查找了。“论文关联界线”是一种随意的界线, 依据各人对思想体系的理解而设定。 其次, 什么才是完整有效的检索? 图书馆如何确保人们能使用馆内的便利设施来完成这样的检索(接下来的问题是, 图书馆对在馆内进行的文献检索应尽什么责任) ? 假设研究揭示法律评论论文的作者偏爱参考最近16 年内的资料, 图书馆怎样才能增加较旧资料的使用量呢? 只保留最近三年的索引, 必定不利于进行细致完整的检索。电子法律评论索引受限于其收录范围, 至多只能检索1980 年以来的资料。如果使读者不费力地使用所有相关的资料对图书馆来说是最基本的目标, 那么就检索法律评论而言, 实现这个目标会有许多障碍。图书馆如何才能提高这些资料的使用率呢? 也许只能鼓励出版社和书商研制更有效的检索工具,[12 ]或者是向读者传授更有用、更可靠的检索技巧[13 ]。 还有一个引起兴趣的问题要提出来。这项研究与保留过去的印刷版法律有什么关联呢? 有人主张或者闭架保存1980 年以前的法律评论, 或者完全淘汰这些资料。然而, 这种观点是基于这样的假设: 即由于法律专业师生非常依赖电子资源, 印刷版资料已经变得无关紧要。乍看之下, 我们的研究似乎证明了这种看法, 但实际上正相反。现今作者引用的法律评论论文差不多有30 %是1980 年以前发表的。如果不再保留这些印刷版资料, 那么大部分研究者只能使用缩微版资料或者通过馆际互借获取这些资料, 这样会使法律学者整整30 %使用期刊资料的机会受到影响。 如果法律图书馆完全淘汰印刷版法律评论, 这将意味着检索者只能利用现成的一小部分法律评论资料, 并不是各种法律期刊都被收录于全文数据库, 而且被收录期刊论文是经过选择的, 收录范围也不规范(从1980 年开始到现在每一年都有收录) 。特别是考虑到联机全文检索的效率很低, 我认为仅仅依靠联机数据库来获取法律评论资料是不适当且缺乏远见的。 总之, 较旧期刊资料的使用水平下降与上述因素有关(论文关联界线, 索引的问题,获取资料的方式) , 不能仅仅归因于计算机检索的影响。要是出版社或者书商研制出更全面的法律期刊索引, 较旧资料的使用量会提高吗? 目前还难以推测这对文献检索有什么影响, 如果说论文关联界线与“最省事原则”是限制因素, 那么这种更全面的索引对前者影响不大, 对后者影响显著。 法律图书馆员还应关注使用率为30 %的较旧期刊资料, 同时扪心自问: “作为藏书管理者, 我们如何确保读者能毫无困难地获取这部分资料?”我们何时应该确定资料的使用率太低要代之以另一种版式的资料? 如果图书馆将淘汰某一年(例如, 1970 年) 以前的所有法律评论, 只依靠缩微胶片或者联机服务来获取这些资料, 这对资料的利用会有什么影响呢? 就个人而言, 我所遇到的读者当中, 在得知他们正在寻找的资料以缩微胶片或某种计算机格式保存时, 乐于接受的实在不多。及时以用户喜欢的版式提供他们所需的资料, 这一点非常重要; 否则我们这些图书馆员就没有尽到责任。有一种危险的做法: 以使用率低为由, 认为某些资料不重要并将之淘汰。这完全是错误的。资料变旧时, 总体使用率会下降, 但是在读者需要用到其中某一部分的时候, 这些资料对他来说仍然有较高的价值。这就提出了一个问题---我们根据什么标准来决定何时淘汰较旧的法律评论资料。也许有人会主张, 只要研究所需, 所有的资料都同等重要, 应当不惜代价保存所有原版资料, 以维持馆藏的完整性。尽管我们可以为用户提供其他形式的文献资料, 例如缩微胶片或者光盘, 但这些版本的资料也许不如法律评论这种含有大量正文的资料有用[14 ] 。 (五)结论 这项研究意义深远。我们或许可以观察到人们对司法判例汇编(law reporters) 和各种早期法律书籍的类似使用模式。例如, 许多图书馆即使只有一份地区法院最早判例汇编的复本, 也能继续运行, 这并不是计算机技术革命的成果, 而是因为这些较旧的资料用得不多。在淘汰这些资料的时候, 我们也许不应该把它看作是对技术“高压”的屈服, 而应当看作是为更有用、更新的资料腾出空间。我们并不是在吐故, 而是在纳新。这些资料的使用率较低, 不是因为它们没有通过计算机编入索引, 纯粹是因为它们太旧了。 就此看来, 我们不应匆忙为计算机检索方法赋予其所不具有的影响力。考虑到当前人们对那些席卷我们图书馆的技术手段过分迷恋, 尤其应当如此。近来, 在面对法律图书馆管理上的问题时, 我们总是满足于推诿责任、摇头叹气, 把苦难归因于计算机。这真是无稽之谈。 无论如何解释这种引人注意的法律评论使用模式, 都改变不了一个事实: 这种模式不是新近才出现的。不能把它单独归因于所谓“计算机革命”的出现。即使计算机与现代(即1996年的作者)的引文模式有关, 早期作者(即1976年的作者)很少使用以前的法律评论论文无疑是另有原因的,例如“最省事原则”。这种使用模式早已存在的事实,或许会使解释其起因的过程变复杂,但它确实使我们得出无可争议的结论---较旧的法律评论论文使用率不高,这本身并不证明计算机在当代检索方法中具有魅力和影响力。本文可用哲人的一句话作结,“事物千变万化, 但万变不离其宗。”
|
【注释】
[1 ]学术性法律评论(law review) , 由美国各大学法学院出版的, 是美国最主要和著名的法学期刊。法律评论实际上是由所有有声誉的法学院作为培训优秀学生的基地而出版的, 由这些学生担任编辑。法律评论刊登著名学者的文章和学生写的评述以及判例注释, 反映法律方面的变化和改革, 描述历史的发展。指导性的文章和评述均以有大量脚注为其特色, 因此这些都是很有用的检索工具。除一般法律评论外, 每年都有大量专业性的学术刊物, 集中注意从生态学到工业关系方面的主题。有些专门学术期刊如《美国法制史杂志》和《税法评论》, 都是以法学院作为基地, 但不是由学生编辑的。参见[美] 科恩著、夏登峻译: 美国法律文献检索, 北京, 商务印书馆1994 年版, 译者注。 [2 ]要详细了解“最省事原则”, 参见Thomas Mann , LIBRARY RESEARCH MODELS 91 (1993) . [3 ]主要参阅William G. Harrington , A Brief History of Computer - Assisted Legal Research , 77 L. LIBR. J . 543(1984 - 85) . [4 ]美国律师协会对法学院的成立有审查和批准的程序, 即ABA“法学院认可标准和解释” (Standard for Approval of Law School and Interpretations) 。具体包括设施条件, 教师与学生的比例, 法律图书馆的藏书, 课程设置要求等等。根据这一规定, 法律图书馆是法学院成立的必备条件。参见于丽英: 法律__图书馆在法学教育中的作用---中美法律图书馆比较研究, 法学评论2003 年第1 期。译者注。 [5 ]使用“教师为主”这个词, 是因为有时法律评论中最重要的论文是由执业律师或政府官员撰写的,或者是与学生或研究生合著的。 [6 ]这个研究分析到的年度综论文章种类很多。某些期刊专门刊载特定主题的年度综论文章(例如, 反托拉斯法) , 而其他期刊刊载的年度综论文章没有限定主题(也就是, 涵盖从刑事法到宪法的所有部门法) 。 [7 ]由于1980 年距今(做这个研究的时间) 十六年, 而比较类似的时间间隔很有用, 因此在这个研究中对比的两个时间间隔为1980 - 1996 年, 1960 - 1976 年。 [8 ]与那些对此感到新奇的人一样, 我想知道如果计算的时间间隔提高到20 年, 这些数据会有什么不同。结果并不令人意外, 百分率只提高到大约80 %。 [9 ]关于这个问题的所有主要研究项目, 参见MANN , 前注(2) , ch. 8. [10 ]当然, 这个问题很复杂, 难以在本文中加以描述。有三种重叠的法律期刊索引收录了1980 年以前的期刊。要详细了解法律期刊的收录范围及历史发展, 参见Richard A. Leiter , History of Legal Periodical Indexing , LEGAL REFERENCE SERVICES Q. , Spring 1987 , at 35 , 或者任何关于法律文献学的权威参考书。 [11 ]《法律期刊索引》( Index to Legal Periodicals ) 已改名为《法律期刊与图书文献索引》( Index to Legal Periodicals &Books ) 每年12 期, 9 月无刊, 2 , 5 , 8 , 11 月出季度累积本, 8 月增出年度累积本。译者注。 [12 ]作者正试图说服H. W. 威尔逊公司出版回溯性的法律期刊索引数据库。但目前为止, 人们只是对这些意见感到惊讶, 这样的产品还无法开发出来。 [13 ]这也首先要解决什么是有效检索、以及作为图书馆员, 我们应如何教会读者进行有效检索的问题。说明各种法律文献检索工具的局限性, 可以鼓励读者进行更深入的检索。然而, 更负责的方法是让他们了解各种检索工具的收录范围及相对有效性(有人会认为上述两种方法是一样的) 。 [14 ]根据我的经验, 如果告诉读者他们正在查找的一篇论文只有缩微本, 他们通常会认为这篇论文“不那么重要”(虽然我们提供免费的放大打印) 。这并不是要批评缩微本不能作为正规的数据记录媒体。我个人是这种版本资料的爱好者。在我看来, 这种缩微胶片对于查索收藏量很大的“简短”文献, 例如国会的资料, 法规, 等等, 或者大量极珍贵而很少使用的资料更为方便。
特别备注:原文发表于美国《法律图书馆期刊》1998年第90卷。中译文载于《中山大学学报论丛》2005年第25卷第2期。为加强业内交流转于此,特示鸣谢。
|
|
|
|
|
|