本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 法律信息资源
法律信息资源
暂无下载资料

 从法律信息资源在网络中的分布结构看法律学科数据库的建设
            唐乐其 点击量:8363
中山大学法学院图书馆
【摘要】
社会的发展,法学研究的深入和法学新兴学科的出现,网络信息资源的局限性已难以满足用户的需求。而要真正满足法学研究的需要,法律学科信息库应建设成以学科为中心,主题和子题内容纵横交错、结构严谨、逻辑性强的法律学科信息库。
    
  信息学家施拉姆教授认为:“信息在社会控制和社会变迁上所起的作用,或许比军队和原子弹更大些”。1的确在电子信息技术高度发达的今天,网络信息技术和资源成为一个发达国家的重要战略资源,网络法律信息资源的开发与利用是关系到一个国家的社会、法制、经济等方面的重要因素之一。法律信息是人们进行一切学科研究之源泉。没有丰富的法律信息的分析整合,法学研究也会成为无源之水。八十年代,我国把加强国民经济信息化进程作为实现四化的重要目标。二十年来,网络信息技术的发展与取得一定成绩的法律信息系统研究的发展,对促进法学各领域理论研究的不断深入起到了非常重要的作用。目前,法律信息已成为庞大的网络信息中的重要组成部分。也正因为信息的庞大、网络信息结构的多样性和复杂性,使用户或是在相关网站中的法律一级、二级分类目录中,或是通过智能的搜索引擎仍是难以获得所需的法律学科信息资源。其主要原因是一方面很多综合网站中一级分类栏目法学类目下的法律各学科子目录信息不够齐全、信息分类不够规范和严谨、更新不够及时,而另一方面智能的搜索引擎,虽能搜索到很多信息,但信息杂乱无章,即使用户按照指令限定关键词搜索所需信息,也会因无限膨胀的庞大信息超越了关键词的真正内涵而陷入鱼龙混杂的信息海洋之中。为改变这样的状况,国内外很多的综合法律网站、专业法律网站、法律数据库应运而生。与其它综合网站相比较,这些网站是用户查询所需法律信息好去处。但从法律各学科领域的各种信息而言,信息量仍是不够全面,更新不够及时,用户常因查找路径烦琐或IP地址和密码限制等因素陷入尴尬境地。因此,建设一个能让用户快而易地获取其研究领域的信息资源,掌握研究领域发展动态的体系规范、科学和内容丰富的法律学科信息库是新世纪信息技术的又一挑战。
 
  1. 法律学科信息库建设的框架
 
  清代学者王鸣盛认为:“凡读书,最切要者目录之学。目录明,方可读书;不明,终是乱读。”“目录之学,学中第一紧要事,必须从此问途,方能及其门而入。”2一门学科的框架犹如这门学科之脉搏经络。一方面,它反映该学科从总论到具体内容理论的结构,让用户了解这门学科的面貌、学术上的渊源流变,揭示该门学科理论与研究发展状况。另一方面,它是读者查询学科理论研究成果之向导。就像一本书的每一个章可被认为是一个主题,每一个节可被认为是一个子题,主题与子题目录应是互相关联的树状结构,用户通过主题目录和各子题次目录层层遍历可了解该法律学科的体系,直接搜索所需的定题信息。我国第一部较完备的法制古籍目录学著作《中国法制古籍目录学》3是目前国内尚不多见的法制古籍分类编目、提要的目录学著作。该著作按照历史的沿革将历代法制古籍书目分为八部分,各部分书目按其内容性质大致分为综合、法制思想、典章制度、法规律令、狱政、案例等门类,必要时又在各门下再分目。且每一书目几乎具有符合现时编制图书元数据要求的各内容,评价了从商周到清末有关法制的书籍1500多种图书,为法制史的学习和研究提供了入门途径。网络法律学科信息库中法律学科的分类也应有“离其疏远,合其近密”4的效果。其分类法应以法律学科体系作为信息资源库构建的框架结构,即以法律学科为中心,各主题类目与子题类目有序地立类和分类,结构清晰、层次简明、逻辑性强,信息数据能涵盖所建法律学科应包括的知识领域,能及时反映所建学科的发展和与其它相关学科领域和与社会发展的状况,并能追踪、归纳、分析法律学科的发展状况、揭示法律学科的发展趋势成为法律学科信息库的最大特点。如婚姻家庭法的分类体系可设为:
 
  D913.9/D923.9  婚姻家庭法
 
  9.1 婚姻家庭法理论
 
  概论、性质、功能、原则。。。。。。
 
  9.2亲戚
 
  亲戚分类、亲系和亲等、亲戚关系的终止。。。。。。
 
  9.3婚姻关系法
 
  结婚法、离婚法。。。。。。
 
  9.4家庭关系法
 
  夫妻关系、非婚同居关系、亲子法、收养法、家庭关系中的法律援助和法律责任。。。。。。
 
  9.5继承法
 
  财产继承、法定继承、遗嘱继承与遗赠、遗产的处理。。。。。。
 
  9.6涉外婚姻家庭、继承的法律适用
 
  涉外婚姻、家庭的法律适用、涉外继承的法律适用、区际婚姻家庭关系的法律适用。。。。。。
 
  同时分类语言以字母和数字相结合的基本字符。只分主题类目的标记,不设子题类目的标记,以免法律学科体系的不断发展,各类目标记的修改和更新造成各类目分类标记的不一致和相冲突。这样,法律学科信息库的分类体系不仅能反映传统法律学科领域的划分方法,而且也能随法律学科体系的不断发展,法律理论的更新而不断修改、补充法律学科信息的类目、调整分类体系,使法律学科信息分类体系既能反映适时的法律学科体系,又具有一定的灵活和拓展性,为法律学科理论与实践的发展留有可分类目的余地。另一方面,法律学科信息库设立Web搜索引擎。用户通过关键词执行搜索时,搜索引擎能自动遍历确立目标搜索信息库中各类型数据中所有信息,并自动列出与搜索有紧密关联的信息资源的索引。用户还可以采取确定主题词搜索的范围、锁定信息源出处的方式检索。检索的途径可采用:1.文献题名,如期刊、书名、硕博论文、会议名……;2.责任者,如作者、编者、译者、机关团体…;3.号码,如国际标准书号ISBN、国际标准刊号ISSN、中国刊号CN、中国书号、专利号…;4.出版社、语种、国家…。用户通过选择性地使用搜索引擎可达到“点石成金”的感觉。目前网络数据库类型很多,有的是以期刊文献为数据库主要资源,有的是以新闻快递为特色,也有是综合数字图书馆专以图书文献为特色。而笔者认为,能真正满足法学研究需求的法律学科信息库应是按照学科的分类体系,集法学著作、法律期刊、法律新闻、法律论坛…多种语言为一体的多类型的法律学科信息库。
 
  法律学科信息库的采取分布式集成,集不同信息资源载体形式(如经数字化了的书、刊、图像、缩微制品…)来源和语言的大型、复杂的数字图书馆。“需求决定服务,服务决定资源”成为建馆的宗旨。因此,法律学科信息库是一个开放式的硬件和软件集成的平台。通过群体智慧、技术和产品的集成,把大量的法律学科信息资源进行数字化处理,并采取有序化的逻辑结构组织起来。法律学科信息库页面可设三个层面:第一层面为法律信息综合服务,设法律学科的一级类目分类(用户从该类目中点击进入各学科的二级类目)、各类型最新信息、法律工具书、相关机构链接(法院、司法机关、行政机关、公证机关、律所    …)、信息服务窗口(向用户提供专题化推送或定题信息服务6)、搜索引擎。第二层为法律学科二级信息,用户可从二级类目主题下再选择多个子题目录,以婚姻家庭法为例,亲戚下级目录可设亲戚分类、亲系和亲等、亲戚关系的终止…。同时还设立该学科国内外的经典案例及案例评析、有关法律法规、政策、国际条约、国际公约和国际惯例、学术论坛。用户可在该论坛中发表、探讨相关问题的看法和见解。二级类目与下设的多个子题目录也都是以树状分布式呈现。
 
  总之,法律学科信息库的建设应注意法律学科体系框架下数据建设的:(1)集成性。实现法律学科各类目信息与相关边缘交叉学科信息数据的集成,形成各学科研究的互动; (2)体系性与拓展性。为促进法律学科理论研究与时俱进和适应学科研究的发展需要。以法律各学科为中心的主题树,主题与子主题、新生子题和交叉学科之间;子题与新生子题、交叉学科之间都留有可延伸拓展的空间和连接的切入口。主题与子题可上下纵横连接,子题与子题可纵横交错连接,形成纵横交错,脉络相通的法律学科的信息网络线性分布式框架体系;(3)积累性。社会的发展,知识的层出不穷,要求法律各学科信息累积的持续、完备、系统地建设;(4)标准性。学科信息建设的软件设计,单元数据的分类、标引都要按照国际或国家行业标准进行数字化建设,以确保数据资源的转换和共享。
 
  2、法律学科信息库建设
 
  法律学科信息库是将收藏、服务、人和计算机集在一个多维环境中,法律学科情报人员按法律学科采用对显性化网络的或非网络的法律学科信息进行开发、识别、检索、分析、提取、归纳、加工、规划、控制、集成、存储等方式展开的信息建设的系统组织管理工程,将高性能的、有序化的、丰富齐全的信息库资源系统地提供和传播给用户查询使用,并通过对信息资源系统的、有效的管理实现信息资源的共享、创新和增值。使用户最便于直接使用的电子文本(目前多采用国(MPEG)为信息资源的主要处理对象,按照学科信息的主题树与子题和与其他交叉学科相关内容之间的,子题与子题和其他交叉学科之间的逻辑关联,以树状和线性并进的方式,将信息文本存储在无数节点上,灵活多维地使用文本格式和链接技术组织信息,处理各种类型的网络的和非网络的法律学科信息和其他学科中相关的信息资源,并进行信息的深层次加工与管理,形成知识的编码化与用户交流使用的互动格局,真正实现法律数字图书馆法律信息资源的知识管理。
 
  2.1 法律学科信息资源的挖掘与整合
 
  正因为法律学科信息库应涵盖法律学科各方面知识,因而它的各类型、多语言信息的挖掘和整合是一项极其复杂的系统工程。信息资源主要来源于网络法律信息资源和非网络法律信息资源。信息挖掘是信息资源来源最主要的途径。网络法律信息挖掘就是数据挖掘,是从大量的、模糊的、杂乱无章的、噪声的、随机的关系数据中,发现、提取、分析、加工法律学科的有关信息,揭示隐藏在随机应用数据中与法律学科信息资源建设相关的显形和隐形的信息资源的过程。整个过程要求情报人员不仅具有所设法律学科丰富的理论知识,还应具有情报信息学科的理论知识,能熟练掌握网络数据库信息分布的结构和计算机技能,通过人机结合能从网络中分析挖掘潜在的相关信息,并能将分布于不同系统和不同地区的所有相关信息按照学科理论体系、信息建设系统和用户需求有效地进行整合。
数据挖掘有数据的抽取、数据的分类发现、数据聚类和数据关联四个主要方法:⑴数据的抽取,是情报人员从无限庞杂的信息源中以多维的数据分析方法抽取与法律学科有关的信息数据。而多维的数据分析法是从多重角度分析处理挖掘出数据的真实内容,从而确定数据内容与法律学科各类目的逻辑关联性,决定数据的采集与否;⑵ 数据分类,是情报人员对网络中发现的相关数据进行分析、比较、识别、分类、整理、取舍,从大量的信息中剥离出与主题或子题类目有密切关联的数据;⑶数据聚类,是将属于主题和子题类目的各种数据,或近似各类目的数据进行分析比较聚类。情报人员对所搜索到的信息数据进行比较分析,有时还需要阅读信息文献内容,在得到正确的评判后才能聚类。往往一个相似数据的条目内容实际上反映的是不同属性的数据。因此,数据聚类也是防止数据混杂,违反学科信息的逻辑结构和体系规则的有效途径;⑷数据关联,是指情报人员不仅将搜索到的有关法律学科各目录的数据分类取舍、归聚于相应的类目中,还要将有关联的其他学科的数据归聚于其相应的类目之下,揭示边缘交叉学科的一些理论与法律学科理论的关联性,引导用户把学科理论的研究推向深度和广度。数据挖掘中数据分析和归类是最为重要的步骤。
 
  从网络信息内容挖掘或是按学科各主题和子题目录为挖掘目标是法律学科信息挖掘有效的途径。网络信息资源种类繁多,既有收费的,也有免费的,不同分类体系具有不拘一格的信息结构模式。如:网络数据、网络资源指南、智能搜索引擎、图书馆网上公开目录查询、最新期刊目录、快速参考工具资料、电子期刊、电子论坛、政府信息、数字图书馆等等。其中网络数据为重要网络学术信息源。网络学术信息源又可分为三种:(1)正式出版物。它包括各种数据库、联机期刊、电子出版物、报纸等;(2)半正式出版物。它包括从机关、团体、部门等网页或各种发布信息基本单位的主页上可查询到的正式出版系统中无法查询到的“灰色信息”;(3)非正式出版物。如:论坛、新闻组或讨论组的电子公告板新闻、电子会议、BBS、电子邮件等等。情报人员一方面可以通过一般综合网站中的法律一级类目、综合法律数据库网站的分类目录、以及法律专业信息网站中直接挖掘所设法律学科的信息。另一方面还要善于使用挖掘信息的搜索引擎工具。情报人员在挖掘结果标引限定网络数据时,除了注意网络数据资源不同的结构模式,还应注意网络法律期刊文献的不同划分。按普通法系国家的法律资源来看,一次文献是指由国家强制执行并被记载下来的有关人们行为规范的规则,主要指法律、法规,包括司法决定、成文法、案例、行政性法律或法规和政府部门的决定。而大陆法系则有些不同,主要是以制定法或成文法为法律主体,案例不是法律依据。按照《中华人民共和国立法法》的规定,原始文献应包括宪法、法律、行政法规、地方性法规、民族自治条例、单行条例、部门规章和地方政府规章,案例不作为法律依据。二次文献是指对法律原则的讨论和分析,是解释性和分析性的法律文献,主要包括法律专著、法律期刊论文、法律百科全书、法律工具书、法律报告和法律新闻等。不同法系的国家对法律文献有不同的划分法。从国内图书情报学的角度而言,法律信息资源的分类法与普通法系对法律信息资源的分类法则就有些不同。1993年《图书馆学百科全书》设立的一次文献、二次文献和三次文献的条目规定:一次文献是指“人们对已创造的知识进行第一次加工(固化)而成为的文字记载”。7 据此,一次法律信息文献不仅包括法律、法规、法律著作、期刊论文、法律百科全书、法律工具书,还应包括法律手稿、法庭记录、法律报告、法律学术会议论文等原始文献。因为“判断某一文献是否为第一次文献是根据信息的内容是否为第一手资料,具有相当高的信息新颖度,而不是论其载体与记录形态如何” 。8二次文献是指“对一次文献进行加工整理后的产物”9 如案例汇编、法律书目、索引、文献题录等。二次文献是由一次文献派生而来,从相对无序的文献到相对有序的动态过程。三次文献是指“按给定的课题,利用二次文献选择一次文献加以分析、综合而编写出来的专题报告或专著,如综述报告、述评报告、技术预测数据手册、一次文献书目的书目、二次文献的书目和索引等等。”10 据此,三次法律文献还可包括法律情报工作者对一次文献所作的专题评述、跟踪研究报告、案例分析、以及法律时事新闻的评析等。三次文献具有比较、判断、推理某法学领域研究动态的作用,为法律信息使用者提供向导和促进某法学领域研究深化,使一次文献和二次文献成为优化信息的作用。因此,挖掘数据之前要分清各种不同网站中对法律学科信息文献的一级与二级目录的不同划分法。
 
  2.2 法律学科信息的组织与管理
 
  数据的挖掘仅是对网络中不同节点包含的法律学科信息的各种数据群中的单元数进行有目的的采集。根据我国学者对数据库的定义, 数据库是根据一定目的要求,按照一定方式经过一定筛选,进行系统编排而形成的某个领域信息的有机统一体。法律学科信息的组织,则是将通过各种渠道和方法采集的所设法律学科的信息进行开发、精选、加工、整理、规划、控制、集成、传递和利用等方式实现法律学科信息组建的目标和发展要求。其中主题树分布方式为比较科学的信息组织方式。主题树方式是将搜索到信息资源按照主题与子题目录分门别类加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需信息资源。各类目中有经科学分类、规范化处理后,以固定格式存储于计算机中的大量法律各学科信息数据库。各类目信息可按照2003年5月旧金山的looksmart公司开发的信息整合分布式技术进行多层次的科学方式和固定的记录格式存储,并利用超文本与多媒体技术相结合的方式来组织利用网络信息资源,将文字、图表、声音、图像、视频等多媒体信息以超文本方式组起来,使人们可通过高度链接的网络在各种信息库中遨游。其步骤可归结为:第一,以科学性和实用性相结合的原则,按照所设法律学科领域知识体系的主题和子题目录的逻辑关联进行有序化的归类、排序、存储。第二,对显性的法律学科信息进行了组织管理之后,展开对隐性知识的开发与利用。情报人员发挥其具备的法律学科的理论知识和情报信息处理的能力,在对一次文献、二次文献进行管理整合的基础上做出法律学科研究发展的综述、报告和评论等。也就是依靠人的知识和智能把不同信息中的隐性知识转变为可以借鉴利用的显性知识,并对这些知识进行管理和再利用,把法律数字图书馆成为具有更富特色和个性化的服务机制。
 
  2.3 法律数字图书馆不同语言信息的并存
 
  目前国内建设的各类型数据库都是以中文为唯一语言的数据库。因而很难转变数据库中文信息缺乏、实现“知识涌现”的效应,而顺应时代发展需要的法律数字图书馆应该是具有多种语言信息资源的图书馆。但是,同一个法律数字图书馆如何能建设成为既有中文语种的信息资源,又有英语或多种语言信息资源兼容并存实是非常复杂的技术和工程。目前图书分类系统采用得较多的美国国会图书馆分类系统(LLC)11已成为美国、加拿大、澳大利亚等多国使用的 “一国际通用的” 世界上分类类目最多的一部图书分类法。美国国会图书馆设计了USMARC支持LCC、DDC(杜威十进制)、UDC( 国际十进制法)和MARC机读目录数据库的图书、期刊分类系统。而我国有90%左右的图书馆使用《中国图书资料分类法》(CCL)。该图书分类系统和LCC图书分类系统采用的同是字母和数字混合制的分类标记为信息资源的分类语言。我国深圳图书馆研制的图书管理系统则是采用ChineseMARC和USMARC格式来分别编制中、西文书刊的元数据库的,与LCC图书管理系统采用的MARC(Machine readable catalog 机读目录)格式是相兼容的。这样在法律学科信息库中实现Web中英信息元数据的分类和执行搜索的框架完全统一结构化是可以实现的。但是,另一方面仅仅是元数据的检索结果是不能真正满足用户需求的,因为一条信息的元数据和摘要只能让用户了解信息的大致内容,但具体内容和作者的观点还蕴藏在信息的全部内容之中。这样就要求法律学科信息库既能让用户搜索信息的中英文的元数据,也能让用户搜索到信息的中英文全部内容。因此法律学科信息库应设立web多语言信息资源的链接点,在技术允许的条件下解决Web多语言统一协调、兼容的问题,多语言浏览器问题和机器翻译等问题。而这问题在“863”计划中就成为支持研究的项目,同时,采用PDF格式显示中、英语全文信息资源也是有效的途径。
 
        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268
加入收藏 | 本站首页 | 联系我们
go