本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 法律信息资源
法律信息资源
暂无下载资料

 大数据背景下的司法统计分析探索
            易员 点击量:3355
威海中级法院
【摘要】
多年来,人民法院信息化建设和司法统计自身发展取得显著成就,现代信息技术的发展使电子报表、数据收集成为可能,基层法院司法统计工作对数据的传输、收集、储存都跟上了步伐,但是大数据的重点不是简单的收集数据,而是重在对数据的分析挖掘,并由此获得凭直觉难以发现的有用信息。
【关键字】
司法统计;大数据;信息化
    

  2011年,麦肯锡全球研究院发布了题为《大数据:下一个创新、竞争和生产力的前沿》的研究报告,首次提出了“大数据时代已经到来”。司法统计是指对法院的各项工作,主要是法院的审判活动所产生和形成的各种数据,以及与之相联系的其它社会现象的数量方面,进行记录、搜集、整理、分析、提取、保存等活动过程。它是人民法院掌握审判工作情况、评估审判运行态势、总结审判工作经验的重要依据,是人民法院实现科学决策、科学管理的重要手段。大数据和司法统计分析的结合,无疑对法院的司法统计工作提出了机遇和挑战。如何利用信息技术快速提取信息,如何从大数据平台中分离出隐含的、潜在的、有用的、能够反映出司法活动特点和审判规律的信息,成为司法统计分析工作的重要任务。

  2015年,罗振宇宣讲:“只要拥有交易大数据和处理数据的能力,就能够成为金融帝国,成为更高维度的银行。未来只会有一种银行,那就是数据银行。”阿里巴巴是什么?表面上是这样的:一方面造路,一方面造车。所谓“路”,就是要成为中国的商业基础设施。如果将来你想做一家公司,你所需要的一切都可以在阿里巴巴的商业生态系统中找到,它会向你提供所有的服务。所谓“车”,就是要制造未来在这个基础设施上卖得最好、挣钱最多的商品。阿里巴巴本质上是一家扩大数据价值的公司。大数据和云计算将成为未来最重要的基础设施。回顾阿里巴巴过去两年的扩张路线图,我们会发现,阿里巴巴的所有收购行为都可以被视为在补全阿里巴巴持有数据的行为。“司法所提供的是公共服务,这辆车即大数据统计分析。法院是司法信息的垄断持有者,学会如何把各方面工作嫁接到大数据上,或补全法院持有数据的行为,能及时抓住经济乃至社会形势的脉搏,为社会提供服务。

  一、大数据背景下司法统计工作在基层法院的定位

  在大数据时代的背景下,最高人民法院院长周强在全国法院第四次司法统计工作会议提出了”大数据、大格局、大服务“的司法统计理念。依托大数据的平台发展,基层法院的司法统计分析工作为各项政策的制定和实施、审判活动的规律探索提供参考。特别是对眼前的司法改革,”大数据“的提供、汇总、分析、使用,为其科学研判提供根据,设置机构、调整编制、确定员额、调配人力、评价业绩,都必须依托全面、精细的司法统计数据(1)。

  (一)司法统计分析的特点

  一是数据性。司法统计分析要从收集数据入手,用数据反映情况和问题,运用数字语言描述审判现象、原因、规律,提出对策建议。二是时效性。由于司法统计的分析对象大多是一定时期的案件数据或指标,这些信息反映的问题通常具有很强的时效性,如果不及时转化,它的实践价值将随着时间的推移而降低。比如,对民间借贷纠纷案件的标的额统计分析,统计汇总的数据只是针对一个时段内标的的变化规律,只能适用于特定时段。

  大数据的特点决定了司法统计数据独特的应用方式:追求全部、整体数据,探讨的是数据的相关关系,注重数据的联动、无穷组合和创新以及数据生产者与数据应用者的互动。顺应大数据的时代潮流,司法统计分析应当以大量而全面的可量化分析的数据为对象,以依托信息化技术的多样化的数据分析方法为工具,通过对数据的整理、分析和提炼,达到从看似无关的海量数据中寻找有价值的信息的目的(2)。

  (二)司法统计分析与大数据结合的重要意义

  司法统计分析的特点决定了它对基层法院审判工作总结、规律探索的决定性意义。司法统计分析是庞大的数据库,通过信息技术手段,在案件从立案到审判、再到执行中的各环节设定节点,将节点信息收集,通过一定的统计规则将信息量化并以数据的形式呈现,形成具有海量数据的司法活动数据库,使全国法院案件信息互联互通,资源共享,让案件信息成为法官办案的参谋助手。

  司法统计分析是司法决策的参谋,运用司法统计数据进行对比分析,从海量数据中掌握审判执行的工作情况,挖掘审判运行态势信息,有利于转变人民法院司法决策、审判管理思维模式,从以经验性、模糊化管理转变为数字化、精密化、科学化、智能化管理,例如,美国把20多年的犯罪数据和交通事故数据映射到同一张分析图上后发现,无论是交通事故和犯罪活动的高发地带,还是频发时段都有高度的重合性,这引发了美国公路安全部门与司法部门的联合行动,通过共同治理数据”黑点“,实现交通事故率和犯罪率双双下降。

  司法统计分析是调研的信息渠道,以案件信息为要素的司法统计数据为审判理论研究提供了客观的基础素材,使调研工作有理有据,运用数据查摆存在的问题、探究形成原因并采取相应措施,使调研不空洞、不单调。

  司法统计也是监督媒介,对内来看,通过统计数据对审判执行部门和办案人员的办案质量、效率、效果情况进行监督,对外实行司法统计数据公开制,现阶段基层法院主要是强调司法裁判文书的公开,以加强公众对司法工作的了解和认同,有利于司法转型,使司法从被动型、神秘型向公开、民主、透明转变,以数据公开、信息公开促进司法公开,以司法公开促司法公信。

  二、司法统计工作的现状及问题

  司法统计通过独特的信息收集和处理手段,对众多个案信息的提取,能够形成具有统计学意义的案件信息量。全国法院已经告别手工报表的繁琐时代,依托信息技术,都在着手建立法院审判执行案件数据信息中心。以威海两级法院为例,司法统计工作全部实现数字化、电子化,案件立案、审判、执行及案卷归档、移送等工作流程环节全部纳入统一的管理系统,各个办案节点的相关数据得以实时录入,实现了对各案审判执行情况动态实时监控,实现每月上报给上级法院的统计报表数据均从数据中心自动采集。虽然司法统计已经和大数据紧密联系在一起,但是司法统计工作仍然存在很多问题。

  一是对司法统计重视程度不够,统计范围较窄,导致基础数据薄弱。受益于大数据时代的信息技术,司法统计人员完全可以通过法院内部审判管理系统进行统计更新数据,而不需要逐庭核实数据进行填写,这极大便利了司法统计工作。但司法统计需要各业务庭室及时上传各类案件信息,实时更新。在实践中,部分人员”重审执,轻事务“,认为统计报表只是个简单的数字报备,数字多一个少一个无关紧要,致使很多审判执行的信息数据不完整录入。多数人员仅仅停留在自觉录入审判信息系统的节点信息,能熟练应用数据平台的不多,利用审判执行分析系统实现对审执数据的综合提取并用于司法统计分析的更是凤毛麟角。司法统计分析的源泉在于数据的收集,尤其是各类审判执行信息的录入和提取。虽然威海两级法院从技术层面完善数据录入方式,使用审判管理系统更加直观、简便获得司法信息,但是数据的准确性和及时性还难以尽如人意,有些重要司法信息未被采集、部分司法信息采集较为笼统,统计调查范围相对较窄,统计指标相对较少,多注重于案件数量信息采集,而不是人民法院全部的司法活动信息,更谈不上对案件相关的经济社会信息的统计,造成司法统计分析基础不牢。

  二是数据出现隔离现象。信息化工作有较好的基础,法院积累了不少的数据,但是,这些数据是条块分割的。流程数据在审管办,执行数据在执行局,裁判文书在信息中心,案件数据在研究室,人事数据在政治处,大家都把数据囤着,没有分享。数据不能分享,就是一个个点,难以成面,更谈不上数据整合后提供决策价值引导。

  三是重视信息的录入,忽视整合、深度挖掘并应用信息资料。目前的司法统计分析大都还停留在数量统计和描述性分析上,司法统计工作只是满足于报表和质效考核的需要,利用司法统计分析审判执行工作也只停留在数据高低、大小对比这样的描述性分析的层次上,运用数据深挖信息、寻找规律及发展趋势的能力欠缺,以致于司法统计工作服务于审判执行工作、决策管理的作用未充分发挥出来。大数据时代最重要的就是整合数据,从数据信息中提炼有价值的单纯一案无法看出来的信息。因为每一个案件都有当事人、年龄、职业、住址、适用法律、裁判结果等信息,这个信息量汇总起来,是一个庞大的数据平台。人民法院处理大量的审判执行案件数字信息外,还产生大量的司法政务数字信息、队伍建设数字信息和司法保障数字信息等。这些信息往往深埋于法院的档案室里,缺乏有力整合、挖掘和利用,而与”大数据“相差甚远。司法统计分析的实质在于解读司法统计数据,探究审判活动的真相及其原因。从认识对象本身的客观逻辑来看,对象越离散、越多样化、越表现出显著的异质性,就越需要发达的统计手段才有可能把握其中的规律,法律世界的共性也需要科学的量化分析手段才能准确把握。司法统计数据信息缺乏整合,没有实现信息共享,信息资源浪费严重,司法统计信息服务审判、服务管理、服务决策的巨大潜力尚未开发,司法统计工作与审判运行态势分析脱节。

  四是司法统计队伍缺少专项人才。司法统计人员要求具有法律专业知识、统计学知识、分析写作能力,并能熟练操作计算机,但目前的司法统计人员很难全面地具备这些能力。大数据时代,信息技术日新月异,需要统计人员及时完善信息录入模块建设,适应大数据的运用。由于司法统计工作较枯燥、琐碎,愿意从事这项工作且肯钻研的人廖廖无几,导致司法统计队伍极不稳定,流动性很大,多数人员是兼职从事这项工作,不能全身心投入其中,加之法院对司法统计工作并不上心,无法真正发挥统计分析的价值。

  五是分析能力不强,统计的口径不统一,也没有标志性的评价依据。目前各基层法院司法统计分析的撰写以单兵作战的居多,组成课题组的较少。由于司法统计数据的采集、整理、分析均由一人完成,不仅工作量大,还容易产生分析角度单一的问题,不能全方位分析提炼统计数据,出现专题分析少、创新分析少等多种问题。而且统计口径来自于不同部门,例如跨行政区划的界定,不同的部门就有不同的标准,每个人对标准理解也不一样,淘宝纠纷案件当事人绝大多数都不在一个省内,案子有必要都由跨行政区划来审吗?现在对一些业务工作的统计分析只局限于对数字的罗列和与去年同期的比较,没有一个标志性的参照数字,在做分析时,难以更深入地评估工作的进展程度。

  三、 大数据和司法统计工作结合的创新思路

  数据不是简单的数字,而是有根据的数字。大数据时代的4V特点决定了司法统计工作的发展趋势。 ”Volume(数据量大)“,即必须要拥有大量的审判信息数据,司法统计工作要不断充实审判信息数据库。Velocity(处理速度快,时效性高)”,即信息输入必须实时高效,司法统计工作因此将要加快统计的步伐,做到及时更新、时时上传。“Variety(数据类型繁多)”,即司法统计工作要全方面搜集案件信息,做好多门路的信息数据搜集。“Value(价值密度低)”,即必须从所采集的海量数据信息中“提纯”有价值的信息,加强对数据的加工、分析和应用,更好地服务于人民法院的科学决策和管理(3)。

  (一)高度重视信息化建设,建立完整的司法活动数据库

  在“大数据”战略的要求下,全国法院所有的案件信息和裁判文书必须进行数据集中,以便采取数据仓库、数据挖掘等技术,否则“大数据”应用将成为“空谈”。各地法院都在不断改革完善司法审判执行管理系统,以信息技术为基础性手段,通过审判管理信息系统和裁判文书管理系统,及时、全面、准确地采集反映案件及其审理过程情况的各类信息,实现便捷、高效、智能地提取生成司法统计数据,进一步强化审判大数据的增量效应,依托信息化全面实现网上同步办案,确保司法统计数据的全面性、真实性。

  以笔者所在法院为例,法院不断研发智能化的案件信息管理系统,除法律规定不能公开的案件外,所有案卷材料均随办案进程同步录入办案系统,实现案件网上流转、网上审查、网上办理。网上办案系统对所有操作实时记录存储,生成动态、全面的审判信息,形成了司法统计的海量数据基础。同时,推进司法统计软件和网上办案系统的有效对接,实现司法统计数据从网上办案系统的智能提取,确保数据真实完整。值得一提的是,这样的司法统计模式是在全面统计、全程统计、全员统计的情况下运行起来的,将打破过去司法统计工作只是由司法统计人员、内勤将收结案件情况统计上报的思维方式,每一个部门、每一名工作人员都将参与到司法统计工作之中。

  但同时应看到统计数据局限在一个法院内部,各个法院的数据间没有互相联系、互相分享,每月仍然需要向上级法院报送数据,没有形成“数据互联网”。在这种情况下,应改革现行司法统计案件应用软件,由最高人民法院顶层设计与个别对接相结合,制定信息化建设规划,构建标准统一、动态更新、开放共享的覆盖全国四级法院专网加快推进统一开发案件信息管理系统,带动人民法院信息化建设实现跨越发展,避免信息“孤岛”,实现业务流、信息流、管理流有机结合,减少重复建设,让司法统计不需要人为向上级报送数据,统计信息自动生成4)。

  (二)重视培养复合型人才,建立稳定的司法统计信息管理小组

  推动人民法院的“大数据”战略,加快信息化建设,不仅需要信息技术而且需要懂技术、懂统计、懂法律的复合型人才。鉴于当前基层法院缺少稳定的统计队伍,应当将培养法律信息技术人才纳入人才培养计划,根据知识结构的现状进行针对性的能力提升。而且可以考虑建立司法统计信息管理小组,很多其他国家和地区的司法统计形式是值得借鉴的。我国台湾地区“司法院”统计处有24人,具有统计调查、信息管理等综合职能。美国司法部司法统计局有70多人,分为四个行政办公处和五个统计业务处,是美国司法案件统计、司法信息标准制定、管理、发布乃至调查研究等方面的唯一机构,是真正的司法信息中心。从这些来看,结合我国基层法院的真实情况,我们可尝试建立司法统计分析联络员组成课题小组的制度,这相当于人民法院的综合性司法信息管理中心,针对统计人员掌握大量案件数据和统计方法的特点,大力强化统计人员的司法统计分析能力,整合各个部门的司法活动信息,有效避免数据隔离的现象,发挥司法统计的职能,有效增强司法决策的科学性和实效性。

  (三)重点整合、深度挖掘、广泛应用统计信息

  大数据时代,最讲究的就是对信息资源的整合应用,信息集而不用,就是浪费资源。深化对司法统计数据的应用,围绕审判工作反映的新问题、新情况、新动向选题,运用数据所反映出来的信息了解审判情势的状况,查找存在的问题,分析产生原因,认真核对、审查、评估基础统计资料,可应用分类比较法等方法准确透彻地研究、归纳、汇总、加工数据,寻找解决途径,提出具体、合理、切实可行的对策建议,形成完整的、反映全局的、具有较强综合性的司法统计分析,以此来顺应新形势下审判工作不断出现的新情况。充分利用已有的司法资源库,建立案件审理实证分析模型,探寻审判执行工作的特点和规律,为法官办案提供参考比对信息,促进法律适用的统一。借助审判执行分析系统,通过构建系统化的“探索→描述→解释”的司法统计分析基本模型,可以实现科学地运用“数”挖掘其中的“理”。比如,民间借贷纠纷和刑事诈骗类两个独立体系的案件之间可能联系性不大,但是可以通过建立数学统计模型,深层次挖掘两类案件的数据仓库,得出各个视角、各个层次的统计分析结果,从这个分析上就可以看出,很多涉及民间借贷民事类纠纷的被告,也是诈骗类犯罪的嫌疑人。通过不同的角度强化预测分析,对司法统计信息数据及时总结研判,向社会公众发布防控高发犯罪、防范常见纠纷的预警和提示。更要结合审判执行特点和规律,挖掘分析司法统计数据背后的社会治理、经济发展等方面的苗头性、倾向性问题,通过司法建议等方式及时就有关问题向有关单位提供决策建议,充分发挥司法统计服务决策的职能作用。

  要积极拓宽司法统计分析成果转化渠道,不能将司法统计工作的职能只局限于法院的工作,还应扩展到服务社会发展的范围,促成司法统计分析成果转化。及时关注涉及经济社会发展的审判数据,加强分析,让数据“开口说话”,积极为有关部门提供决策信息和建议。比如,青岛中院采集近五年银行及企业借贷纠纷的金额、对象、还款情况等指标,分析这些指标与全市涉金融类案件的相关性,将经济案件中所反映出来的经济运行中存在的问题和审理案件中隐含的潜在的社会不稳定因素排查出来,提出金融部门及有关企业如何更好发挥引导投资职能、减少民间投资风险的司法建议,得到政府及民众的批示肯定;威海中院挖掘分析犯罪案件数据,预测犯罪活动趋势并提出治安防控建议,相关部门积极回应;威海市环翠区人民法院针对贷款案件激增的情况,向金融机构提出司法建议,提醒金融机构做好积极防范,尽量避免自身的风险,为金融机构的资金回转提供了有力的司法保障。

  (四)“大数据”公开以得公信力

  健全司法统计信息公开制度,改革司法统计涉密与非涉密捆绑式管理模式,以公开为原则,不公开为例外,以公开促公正树公信。现阶段的司法公开,主要是在裁判文书上网方面,司法统计获得的“大数据”,只要不侵犯当事人隐私,不违反国家保密要求,法院的数据接口完全可以面向社会打开,让更多的研究者参与到司法“大数据”的开放和利用中来,不断促进技术的发展,使数据成果服务于各行各业。

  结语

  在大数据的时代背景下,人民法院更要倚重信息化技术,充分开发、深度挖掘司法信息资源,以大量而全面的可量化分析的数据为对象,以依托信息化技术的多样化的数据分析方法为工具,通过对数据的整理、分析和提炼,形成有理有据的司法统计分析,充分释放司法信息蕴含的社情民意信息、社会治安信息、经济发展信息,为科学决策和管理提供可选择的咨询建议和对策方案。特别是在司法改革方面,如何合理配置法院的各类人员等问题,都应该结合司法统计大数据,做到用数据说话,用数据管理,用数据决策,用数据创新。

        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268 京公网安备 11010802020444号
加入收藏 | 本站首页 | 联系我们
go