我们在律所的基础上,组建了一个叫做“无讼”的团队,做一些“互联网+法律”方面的尝试,目前已经有几十位伙伴了。这两年,我经常和数据工程师、程序员们工作在一起。那么,我今天就从法律与技术跨界的角度,结合律师行业在法律大数据方面的探索,从纯技术角度,谈谈我对于司法改革的一些思考吧。
去年9月,国务院发布了《促进大数据发展行动纲要》,已经将大数据应用上升到了国家战略的层面。说起大数据,可能很多人会首先想到商品零售、金融等领域的应用场景。在我们法律领域,大数据其实也有很多可挖掘、可利用、可产生价值的地方。
总的说来,我觉得法律大数据可能在以下三个方面对司法改革产生积极的作用。
首先,法律大数据可以为司改决策提供数据支持。
举个简单的例子,四中全会提出要设跨行政区划的法院,希望破除地方保护,解决当事人跨行政区划诉讼难的问题。但问题在于,跨行政区划的案件,就一定会受到地方干预吗?我们有过数据支持吗?
其实,我们团队对目前已经公开的1800多万篇裁判文书进行了大数据分析。在提取出跨区域案件数量,跨行政区划打官司的一方是否败诉,败诉率是否高于同一区域同类型案件的当事人等数据之后,我们就可以建立模型,分析跨行政区划的案件是否有地方保护的情况存在。
据我们了解,目前最高法院的司改部门实际上已经在开始尝试这样的一些方法。未来,只要把每年千万级的案件数据放入数据模型中进行计算,就可以实时监控跨行政区划案件是否有地方保护的情况存在。
再比如,最高法院的巡回法庭,到底应该设在深圳,设在沈阳,还是设在成都?一个非常简单的办法就是,我们来看同一区域内,若干省份的当事人地址距离哪个点最近。通过现在的LBS技术,这样的计算其实很容易实现,也就能达到便民的目的。
其次,法律大数据可以帮助解决司改进程中遇到的一些问题。
比如说老生常谈的“案多人少”问题。有人甚至担心,因为实行“员额制”以后,这个问题可能会更加突出。
实际上,不依靠技术手段,这个问题根本无法解决。原因在于,在经济“新常态”下,诉讼案件数量一定会爆发性增长,但法官人数不可能一直增加,“案多人少”问题永远解决不了。通过技术手段帮助法官提高工作效率似乎是最好的办法之一。
“无讼”团队的程序员们正在研发相关产品,通过对裁判文书中的“大数据”进行提炼、分析,可以智能、精准地为法官主动推送与在办案件密切相关的法律法规、相似案件的裁判文书等信息,在线自动生成文书模板,最大限度减少法官的工作量,从而帮助解决“案多人少”的问题。
再比如说“同案同判”或者“类案同判”的问题。因为每一个法官可能了解的案件数量是有限的,再加上机构、地域等方面的客观因素制约,在全国范围内做到“同案同判”十分困难。
但是,通过对海量裁判文书进行分析,找出“相同”案件的裁量尺度,测算出个案的偏离度,对偏离者做出裁判预警,就能促进“同案同判”的实现。
再次,法律大数据可以帮助民众更好地理解司法改革。
一个个数据本身艰深、枯燥,但是利用数据可视化技术,普通民众也能轻松读懂。最高法院发布的《司法公开白皮书》之所以在去年两会上得到代表委员们的高度认可,其中一个重要的原因就是里面搭配了大量直观易懂的图表。
设想一下,如果通过数据可视化技术勾画出中国法治地图,那么整个中国的法治现状就可以一目了然地展现给社会公众。在这样的思路下,我们已经尝试做了中国裁判文书公开的地图,实时展现全国各地的裁判文书公开情况。
但是,我们也看到,要形成这样的法律大数据,还面临着一些困难。
第一,数据采集方式有待提高。
传统的数据采集以统计为导向,多靠人工录入。这样的方式既增加了法官、检察官的工作量,也因为主观因素强而存在数据不够客观,甚至数据“失真”的问题。同时,由于司法统计的项目往往是滞后的,很难及时收集、分析和利用。因此,我建议彻
底改革司法统计方式,建立一套基于大数据的司法统计方法。
第二,数据的完整程度不够高。
一方面,目前数据公开的还不够全面。虽然这两年法院依托信息化和司法公开,向社会公开了裁判文书,但在审判过程数据等方面的开放程度还不够,法律大数据无法形成闭环。
另一方面,现有法律大数据中的数据类别还不完整。相比法院,检察院、公安、司法行政机关的数据公开还有很大的发展空间,律师行业的信息化程度也远落后于法院。这种状态长期存在,十分不利于法律大数据的形成。
第三,数据不开放、不贯通。
目前已经形成的数据多被保留在公检法司各部门内部,而并没有开放,社会也就很难利用。横向来看,公检法司各部门间的数据也尚未贯通,还停留在一个个“数据孤岛”的状态,严重制约了法律大数据的发展。
而为了促进法律大数据的形成,推动司法改革进程,我想提出以下三个建议:
第一,充分利用信息化手段采集数据。
法律大数据其实产生于法律人的日常工作之中,法官、检察官每触动一下鼠标、敲击一次键盘,都是在生产司法数据。这样的数据,完全可以通过信息化的手段进行采集。
事实上,由于法官、检察官、律师等法律工作者的工作成果大多以文书为载体,法律领域的数据也是最有利于信息化采集的。
此外,希望国家有关部门能考虑加大律师行业信息化的投入。一直以来,律师行业的信息化程度远远低于法院,这当然有客观因素,比如说缺乏财政支持、组织体系相对松散等等。但如果加大投入力度,就可以更好地提供采集数据的基础。
我们现有的技术水平,可以将一篇裁判文书拆解为若干数据段,从中提取有价值的数据。我想,这种技术也可以挖掘律师代理词、辩护词等文书中蕴含的大量数据。未来随着自然语言分析技术的发展,甚至随着人工智能技术在法律领域的广泛应用,数据采集、挖掘的能力还会得到进一步增强。
第二,实现司法数据的全面开放,打破数据壁垒。
国务院发布的《促进大数据发展行动纲要》将数据视为“国家基础性战略资”,号召政府部门对数据的开发共享。而在法律领域,司法系统内部各部门、各条线间的数据也应该全部贯通,形成完整的法律大数据资源。
因此,司法机关也应当按照国家的战略部署,把整个司法过程中形成的各种文书全部公开。这样,就可以通过技术手段从中采集到海量的司法数据,将这些数据资源融会贯通,从而更高效地利用。
第三,鼓励、引导社会充分利用法律大数据。
法律大数据是全社会的共同财富,民间的创新力量也可以在它的利用上发挥重要作用。比如说,最近中国裁判文书网的改版受到了法律界的交口称赞,这实际上是在民间先行探索的基础上,采各家之长的成果。
再比如,由司法行政机关主导的“律师分级制度”争议极大,但其实,只要司法行政机关开放所有的律师行业信息,这件事情完全可以依靠民间力量和市场调节机制更好地完成。
三个月前,我们的“无讼”团队尝试用大数据的方法为律师提供在互联网上的虚拟身份,生成“律师名片”,为更客观的律师评价提供基础。我们设想,如果未来的法律大数据更加全面完整,不仅“律师名片”可以更详实、客观,“法官名片”、“检察官名片”也可以应运而生。
我前不久在西部一个省高院参加信息化建设专家论证会,让我欣喜的是,当地法院对数据开放的认知程度非常高,对推动建设“法官名片”极有兴趣。因为,“法官名片”与“律师名片”可以建立互动互评机制,而在那时,这些互动互评内容本身也会成为法律大数据的重要组成部分。
孟书记及各位领导,我们期待,未来法律大数据的采集、挖掘、分析等相关技术运用到司法实践中来,可以更好地帮助发现司法工作中的关键问题,找出有效对策,从而更有效地提升司法公信力,构建一个法官、检察官与律师之间相互支持、彼此信任的法律生态圈。
谢谢大家!
信息来源:天同诉讼圈