大数据环境下法学研究方法面临“变”与“不变”,法学研究者在明确“变”与“不变”的基础上应主动求变,掌握法律信息检索的通用方法。
一、大数据环境下法学研究的“变”与“不变”
(一)大数据环境下法学研究的“变”
大数据环境下法学研究的“变”指法学研究外在环境的变化,如信息生产方式、信息载体的变化,以及由此带来的法学研究者信息需求和信息利用方式的变化。
大数据是当下时髦的一个用词,但大数据之大却是常人难以想象的。“一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多,相当于美国两年的纸质信件数量;发出的社区帖子达200万个,相当于《时代》杂志770年的文字量。”[1]大数据环境下信息生产量的变化如此巨大,与此同时,传统印刷型纸质文献信息已不再是信息载体的唯一形式,机读型、视听型、多媒体等新型文献信息载体大量出现,电子化或数字型信息越来越成为信息载体的主流。数字出版、数字图书馆、数字阅读等也得到越来越多的人关注和接受。
与传统印刷型纸质文献信息相比,数字型信息之所以成为主流是由其特点决定的:第一、容易获取,它在网络所及的任何时间、任何地点都可以浏览、下载和利用;第二,更新速度快,数据出版大大缩短了文献信息发表和更新的时间;第三、数据便携性,移动硬盘、U盘等信息存储器的“身材”日益变小、“容量”日益变大;第四、低成本,信息获取者可以更加快速或免费的获取;第五、分享便利,社会网站的出现使得信息分享变得轻而易举。[2]
信息载体由纸本到数字,信息需求和利用由一元到多元的根本性转变已成为未来发展趋势。从普通大众到某一学科的学习或研究群体的信息需求和利用方式都发生了质的变化。
联合国国际电信联盟(ITU)表示,2014年全球上网人数已超过30亿人,相当于世界人口的39%,同时,根据报告中公布的最新数据显示,全球互联网使用率仍继续稳步增长。[3]进入新世纪,中国在短短的几年内超过了美国,成为了全球网民数量最多的国家。截至2014年12月,我国网民规模达6.49亿,其中搜索引擎网民规模为5.22亿,使用率为80.5%,比2013年增长6.7%。搜索引擎是网民除即时通信外使用率最高的互联网应用。搜索引擎作为互联网的基础应用,随着网民规模的扩大而持续增加。[4]
进一步研究发现,伴随着计算机、互联网等新技术成长起来的信息用户被称为Google一代、网络族、数字部落、数字移民[5]、Y一代[6],他们对电脑、手机、网络的依赖就像一日三餐一样。他们习惯于用键盘打字而不用纸笔写字,通过手机等移动终端阅读而不到图书馆读纸本书,……[7]传统上作为图书收藏中心的图书馆,数字资源也正成为主要方面,[8]对数字资源的利用也是全球法学研究者获取学术信息的主要方式。
美国教育部教育统计国家中心每两年对全美学术性图书馆的调查显示,在美国学术性图书馆信息资源经费总投入中,电子资源达到了73.8%,相应的信息服务八成以上是围绕电子资源开展的,如虚拟参考咨询、文献传递(通过网络传递电子资源)等。[9]而专业图书馆则更强调学科电子资源的导航、数据库利用培训以及信息检索课等信息服务形式。如2013年伦敦大学David Gee教授对全球124个法律图书馆的调查显示,87%的法律图书馆针对电子资源提供法律信息检索培训。[10]
印度德里法律大学副馆长Priya Rai对印度德里地区的法律研究者,包括法律大学、大学法学院、法学研究中心、法学研究所等机构的本科生、研究生、教师和研究人员在内的528人,作了一个关于法学研究者获取信息行为的调查,调查发现,96.6%的法学研究者使用电子资源,仅3.4%的人使用纸质资源来完成学习和研究。[11]
本人在2013年秋季通过对中国人民大学法律硕士二年级模拟法庭班的54名学生(来自法学各个研究方向)的问卷调查显示,他们在查找资料时95%的人首先会选择电子资源,仅5%的人首先选择纸本资料。
(二)大数据环境下法学研究的“不变”
法学研究的“不变”首先是法学研究方法本身,也就是法律思维或法律分析方法未变,其次是作为法学研究对象的法律信息的类型未变。
法学研究方法,或法律思维是指导法学研究领域的一套模式,是“找出问题、寻找规则、分析和应用、得出结论”的过程,包括法律问题是什么,对此问题适用的规则是什么,规则适用的情况有哪些,以及能得出什么样的结论。
进入21世纪,新兴学科在法学领域的渗透逐渐加深,法学研究者除了需要学习和关注传统与法律领域密切相关的学科知识外,还需要了解与法学交叉学科的发展,需要用一种更加广阔的视野来学习和借鉴其有益于法学领域发展的多样的方法。但是法学研究方法或法律思维是由法律学科特点决定的,法律学科特点未变,法学研究方法或法律思维也未变。
除此之外,法律信息的类型也没有变化。关于法律信息或法律文献的类型,国内外从不同角度都有论述,但是一般认为涉及以下三种:一是原始(一次)法律资源,指有法律约束力的资源,如法律法规(法条、成文法),判例法国家还应该包括判例;二是二次法律资源,指不具有法律约束力但和法律问题相关的法律评论文章、专著、法律词典、法律百科全书等;三是用来帮助解决特定法律问题所需要的非法律信息。
本人既不是图书馆专家,也不是法律专家,关于法律文献的类型不敢妄加断言,只是有感于在法律图书馆工作并结合给法学院学生作检索培训和上法律文献检索课的一些体会,将法学研究者最常用的文献列举如下:立法文件、司法文件、学者著述,以及新闻报道、统计数据、年鉴、词典工具书等。以上这些类型的信息,过去和未来都是法学研究必不可少的。
二、大数据环境下法学研究者应主动应变
大数据环境对法学研究的影响是深远的,它能为法学研究者提供符合其研究习惯的法律信息。但由于法律信息涉及古今中外与法律学科相关的所有知识,卷帙浩繁、错综复杂,今天的法学研究者并不一定清楚什么时候以及怎样使用纸本资源和电子资源。找到对解决法律问题真正有帮助的文献,研究者可能做出高质量的研究成果,而找不到则研究工作无从开始。从某种程度上来说,法律信息的检索决定着法学研究的成败。
比起纸本时代,今天找到一个法律问题的答案确实比以前容易多了,但是要找到一个恰当的、全面的答案的确需要一定的检索技能。[12]掌握法律信息检索技能,意味着研究者在遇到法律问题时能够快速判断、敏锐锁定信息源,并能够熟练地获取、科学的评价、合理的运用这一信息,因此可以大大节省研究者的时间。有研究表明研究者花在查找资料上的时间占了其总投入研究时间的1/3-1/2。试想,如果我们把节省的时间集中用到知识的创新上,无疑将推动整个法律科学的发展。
对法律从业者来说,掌握法律文检索技能也意义重大。“在民主社会,法律信息对于有效的司法是至关重要的。”[13]法官的判案过程实际上就是一个寻找法律信息的过程,尤其是法官在遇到比较复杂的案子时,更需要具备找到合适法律信息的技巧。法官找法的技巧实际上在一定程度上影响着司法的公正。对于律师来说,法律文献检索技能决定了他为当事人辩护的成败。一个律师为某一案件事实不恰当的援引法律不仅浪费当事人的时间和金钱,还有可能被当事人诉至法庭,名利俱损。[14]
三、大数据环境下法律信息检索通用方法(一般检索步骤)
大数据开启了一个新的世界,需要法学研究者主动求变,认识到法律信息检索的重要性,掌握这一技能的要领,从而轻松开创有效的研究工作。
法律信息检索是一项技能,需要不断练习,形成一种习惯。它的基本检索步骤或方法包括:分析课题、选取关键词、选择数据库、选择字段(检索范围)以及检索结果评价。
(一)分析课题
在开始检索法律文献之前,首先需要对课题做认真详细的考察分析,明确检索的目标和要求,有的放矢是成功的开始。分析课题需要考虑以下几个方面:
根据课题目的为求新、求全、还是求准,确定需要检索的具体内容。比如求新,检索用来规范某种行为如公司注册、食品安全在某国现行有效的法律条文以及判例法国家有法律约束力最新判例;检索对某个新问题的权威评论文章。求全,检索关于某个法律问题研究的整个发展脉络的文献,如检索各国文化立法研究、中国历代审判制度研究的相关文献。求准,如检索某部法律、某个司法案例或判例、某篇文章、某一组或某项数据等等。
根据以上信息进一步确定需要检索的文献的类型,如法律法规或成文法、司法案例、判例、专著、评论文章、新闻报道、统计数据等等;文献涉及的国别,如欧盟法律文件、美国法律信息(联邦/州)、其他国家法律信息等等;文献涉及的语种,如查找印度矿产资源立法的中文译本、中国关于知识产权立法的英文译本等。
一个成功的检索,通常需要检索者掌握一定课题相关的背景知识。如果事先我们没有相关背景知识的积累也不要紧,一些小的检索工具可以帮上大忙。它们可以提供课题相关的介绍性或背景知识,帮我们甄别检索文献的“新、全、准”。
如法律百科全书、维基百科、综述性论文、或者有条件的直接向课题相关的专家咨询。
这些背景知识往往可以给我们提供检索点。检索点是检索的开始,许多法律文献检索项目最难的是找到第一个相关文献。这第一个文献信息会带给你很多相关的文献。如一个判例通常会援引更早的相关判例作为法律依据,一部立法会指向有关的法律决定、立法史文件、以及其他专著、学说、年鉴、百科全书等二次文献,一篇法律评论文章会参考很多相关文献。[15]
(二)选取关键词
选用能够涵盖课题主要主题概念的词,或者能够表达课题中心意思的词,选用意义明确的词。专有名词要用引号引起来,如查找雾霾的相关法律规制、精神病患者作证等相关文献,“雾霾”一定不能分成“雾”和“霾”,“精神病患者”一定不能分开“精神病”和“患者”。选用有实质意义的概念词,不要使用过长词组和短语,必要时可拆分成几个关键词,如我国农民养老保险的新规定,可以拆分成“农民”、“养老保险”和“法律”三个关键词。
很多时候,同一个意思可以用不同的词来表达,因此关键词的同义词或近义词的运用也可以扩展检索范围,如查找电子地图的知识产权问题查不到理想结果的时候,可以换成网络地图知识产权或者虚拟地图知识产权来重新检索。
或者通过一个词的上位概念和下位概念来扩大和缩小检索范围,在确定关键词时不妨运用头脑风暴法来想一下和主题相关的所有的词,以最先想到的恰当的关键词为中心向更深更广的角度扩展。如查找快餐中鸡肉的食品安全法律问题,由鸡肉想到禽类再到动物,可以扩大查找范围;反之由动物到禽类再到鸡肉则可以缩小检索范围。
通常在选取关键词时最容易犯的错误是,理所当然的认为所选的关键词是相关法域最标准的表述,实际上不然,所以常常检索不到想要的结果。最常见的是查找台湾地区的法律信息,如查找有关知识产权的相关法律规定,选取“知识产权”作为关键词,在台湾的法律专业数据库中无论如何也找不到,因为相应的关键词表述为“智慧财产权”。还有查找国外有关优质(战略)矿产资源的立法,如果将“优质和战略”直译成“good and strategic”,肯定找不到结果。[16]这需要借助权威法律词典,如在线元照英美法词典、Westlaw的Black's\Thesaurus、Google和维基百科等查阅已有文献的表述,或者浏览Westlaw和Lexis的自然语言检索结果搜寻关键词的标准表述。
同时,如果关键词不止一个,检索时需要注意二者之间的逻辑关系,一般数据库默认为同时出现在文档选定的位置,如两个关键词同时出现在文章的标题部分。具体介绍详见本书技能训练篇。
(三)选择数据库
法学研究者在着手检索时常常会发现不知道到哪儿去找相关信息,他们希望法律数据库能超越Google和百度,在一个检索框中输入关键词,就可以将所有信息一网打尽。数据库开发商们也绞尽脑汁想把法律数据库整合在一个平台上,如国内外的很多发现系统正尝试着做到这一点。从目前的研究进展来看,发现系统对电子书和论文检索还不错,但还未能将法律法规(成文法、法条)、司法案例、判例等有效地发现出来,因此还非常有必要对法学专业数据库有一个大致了解。
国内外法律专业数据库收录的内容各有特色,有的又互相交叉,明确数据库的大致收录情况,就可以结合课题的目的和要求确定必查或重点查找的数据库。根据法律文献的特点和法学研究者的研究习惯,将首选的数据库归纳如下:表中未注明的为数据更新到当前的全文数据库,表中涉及的数据库基本为法律商业数据库,免费法律资源文后会有详细介绍。
(四)选择字段(检索范围)
字段在数据库中对应的英文表述有“field”或“segment”,可以理解为“检索范围”把,即将一篇文档分成若干部分,如标题、摘要、作者信息、全文等,选择字段实际上就是选择课题关键词在整个文档中出现的位置,如希望课题关键词在一篇论文的标题部分出现,就要选择相应的字段,如下图所示。
字段也可以理解为在数据库中检索的限制条件,字段选择的不同,可以扩大或者缩小检索范围。最常用的检索字段有标题、作者(著者)、摘要、主题(包括篇名、关键词、摘要,课题关键词在一篇文档的这三个部分的任一部分出现都可以检索出来),常用字段大多数情况下能够帮助找到和课题相关的材料。有时用课题关键词在常用字段里检索都没找到合适结果,还会用到全文检索,全文检索需要观察该数据库是否同时提供了限制“词频”的功能,避免产生很多不相关的检索结果。如知网、Heinonline和Westlaw都提供了全文检索加“词频”的功能。
中文法律信息的检索字段比较容易选择,外文数据库字段对应的中文意思归纳为下表[17]。
(五)检索结果评价
在完成了上述分析课题、选取关键词、选择数据库和字段几个步骤后,进入查看检索结果阶段,检索结果有多有少、甚至为零。这时通过如下几个方面来评价检索结果。
首先,通过一些小工具判断相关的检索结果是不是最新的,如中文法律法规可以通过北大法宝查看该法是否现行有效,中文司法案例可以结合北大法宝和“慧科搜索数据库”浏览案例的进展,外文法律法规和判例可以通过Westlaw的Keycite功能、Lexis的Shapedize功能来判断法律法规和判例的效力问题。此外,还可以利用一些网站的推送功能,Westlaw和Lexis的alert功能对特定法律主题进行定制,这样系统就可以定期将该主题的最新进展信息发送到指定邮箱。
其次,关注课题相关法律信息的来源,转载的信息一定要找到原始出处,有多个来源的注意选择其中比较权威的,如某学者的参会论文同时在法学专业数据库电子期刊上刊登、会议组织网站和个人博客上发表,要优先选择数据库电子刊刊登的版本,因为这些付费的商业数据库信息大多都经过严格的审查程序才会收录某文献。如果都是免费网络资源,则要看清楚这些网站地址的后缀,优先选择以gov结尾的政府网站,其次是以org结尾的学术组织,知名学者的个人博客中的信息也可以参考。
再次,对于检索非常具体的一个问题中的有关方面、一个或一组数据,为了保证准确,除了上述几点要考虑,还要将检索到的信息放到特定的语境中对比观察,运用常识判断是否准确。如检索到2013年全国有关部门的信访总量数据,和已知的前几年数据相比有了明显的下降(前几年信访总量稳定上升),这就需要对检索到的2013年的数据持怀疑态度。后进一步对信访检索发现,2013年5月我国政法委信访改革指出涉法涉诉信访将一律改由政法机关处理[18],打消了疑虑,可以放心的用2013年的数据了。
最后,检索了很多文献,该如何判断是不是查全了,什么时候结束这项工作?如果在筛选检索结果时不断看到案例或判例引用同样的法律法规(判例法国家可能是有约束力的判例),或绞尽脑汁穷尽了课题的关键词及其同义词(近义词),检索到的相关文献总是重复出现,令人振奋的是可以停止检索了。反之,如果查询结果出入很大,则需要审视前述几个环节,分析原因,进一步查找。对于检索不到任何结果的,则需要变换检索关键词和修正检索方式,从头再来。法律文献检索是一项反反复复的过程,无怪乎国外称其为“Legal Research”,真的是“re-search”的过程,需要耐心和技巧。(本文选自《推开法律信息检索之门》一书内容)
新书推介:
《推开法律信息检索之门》
作者: 刘明 人民大学法学院图书馆
中国政法大学出版社
出版时间:2015.4
16开,259页
定价:39元
《推开法律信息检索之门》特色评论
本书根据法学研究者的信息需求和研究习惯,结合作者日常解答咨询、培训和授课的体会编写而成。全书共分为四篇,包括理论方法篇、技能训练篇、应用篇和附录。首先是介绍法律信息检索的通用方法或步骤;其次是按照法学研究常用的文献类型分类演示具体检索方法;再次是法律信息检索在法学研究中的具体应用;后附上法学研究常用数据库的使用指南。该书特点是将复杂的检索方法分解成几个步骤,并用图示或图解的方法展示,使用者可一目了然地了解检索技巧。
《推开法律信息检索之门》目录
前言
第一章法律信息检索理论方法
第一节大数据环境下法学研究的“变”与“不变”
第二节大数据环境下法学研究者应主动应变
第三节大数据环境下法律信息检索通用方法
第二章一次法律资源检索技能
第一节 中外法律法规(成文法)检索
第二节 中外案例(判例)检索
第三章二次法律资源检索技能
第一节 中外期刊论文检索
第二节 中外博硕士学位论文检索
第三节 中外电子图书检索
第四章其他信息资源检索技能
第一节政府信息检索
第二节免费网络法律资源检索
第三节 我国台湾地区“法律”信息检索
第四节美国法律资源检索
第五章法律信息检索综合应用
第一节如何利用信息检索撰写法学文献综述
第二节 如何利用电子资源跟踪法学学科前沿
第三节如何利用电子资源检索课题相关文献
第四节如何利用信息检索完成案例分析