本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 法律信息资源
法律信息资源
暂无下载资料

 法律大数据要注重质与量的提升
            王竹 点击量:54
四川大学法学院法律大数据实验室
    

  当前法律大数据分析的研究和实践正面临历史性机遇和现实性挑战,应该抓住机遇,迎接挑战,并期待数据来源在质和量上获得提升。

  法律大数据分析的历史性机遇主要是指近年来司法数据的公开,这是我国法治化进程的重要体现。第一,裁判文书数据的公开。最高人民法院于2014年初设立“中国裁判文书网”,截止到2016年5月15日,已经公布了约1739万篇裁判文书。根据四川大学法学院“法律大数据实验室”与“法合实验室”联合发布的《法律大数据双年报(2014-2015)》数据估算,2016年裁判文书公布总量预计将超过1500万篇;到“中国裁判文书网”建立5周年之际,即2019年年底,裁判文书公布总量将超过1亿篇。第二,案件审判流程和案件执行数据的公开。最高人民法院设立了“中国审判流程信息公开网”和“中国执行信息公开网”,全程公开案件审判流程数据和案件执行数据,现阶段可以进行部分数据的查询,相关司法数据总量将数倍于裁判文书数据。第三,全国和地方法律法规文件数据的公开。我国现行有效的全国法律规范性文件总量为20余万部,地方法律规范性文件总量为100余万部。2015年修改后的《立法法》授予了设区的市的人民代表大会及其常务委员会地方性法规立法权,可以预见,未来我国地方性法规以及相关地方政府规章的数量还将大幅增长。

  法律大数据分析的现实性挑战主要是数据分布和数据质量的挑战,尤其是数据质量对数据清洗和数据挖掘提出了较高要求:第一,裁判文书分布的不均匀性。在844个民事案由、469个刑事罪名和918个行政案由中,前十大案由或者罪名的案件占比约为三分之二。从笔者的研究经验来看,判决书数量超过200篇才能进行一定的统计分析,满足这一需求的民事案由不足300个,刑事罪名不足150个,行政案由不足100个;判决书数量超过1000篇才能进行较为深入的数据挖掘,满足这一需求的民事案由不足200个,刑事罪名不足100个,行政案由不足50个。第二,裁判文书质量参差不齐。对法律大数据分析影响最大的是裁判依据的错误引用。例如《民法通则》总计156个条文,但有的法院竟然引用了第1108条。此外,有的法条不但从未被正确引用过,而且同一法院多份判决书还“以讹传讹”,有的条文被错误引用的次数居然超过了被正确引用的次数,有的还出现了数字颠倒。第三,主要裁判依据范围的不确定性。法律、行政法规和司法解释是判决书的主要裁判依据。根据笔者长期跟踪研究,我国现行有效法律为249部,行政法规为555部,司法解释为1251部,但仍然缺乏官方权威认定。地方规范性文件更是数量庞杂,部分存在范围不明和效力存疑问题。

  法律大数据分析的开展主观上要加强数据挖掘方法的研究,客观上则期待数据来源在质和量上的提升。第一,裁判文书数据的全面公开。“中国裁判文书网”2015年公布裁判文书713万篇,同期审结、执结案件1673万件,同比公开率约为43%.未来裁判文书的公开比例应该逐步提高,最终实现全面公开。第二,裁判文书数据质量的稳步提高。首先是案由信息的标准化,部分裁判文书未准确包含民事案由或刑事罪名信息,行政案由则亟待规范。其次是案号信息的统一化,判决书案号缺乏全国统一规划,容易造成“同案号不同案”的情况。最后是裁判依据的准确性。第三,法律法规文件数据的权威回溯性发布。全国人大法工委应该建立法律、法律解释、地方性法规、司法解释和其他规范性文件的权威发布平台,国务院法制办应该建立完整的行政法规、部门规章、地方政府规章和其他规范性文件的权威发布平台,并实现全面的回溯性范围和效力认定。

        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268 京公网安备 11010802020444号
加入收藏 | 本站首页 | 联系我们
go