一、法律大数据产业的界定及其基本特征
由于网络和信息技术的迅猛发展,生产力和生产关系都在发生重大变革,所有传统商业模式和政府行政运作流程都在被解构和重构。 目前,大数据已经逐渐成为国家及其各个管理部门和各类经济主体用来预测和决策的重要工具之一,通过大数据助力国家治理体系和治理能力的现代化过程已经是国家治国理政战略的一个重要部分,利用交易过程中所沉淀下来的数据开展的对商业行为的分析和预测也愈发精准和有效。因为不同领域产生的信息和数据本质上是有很大差异的,且对大数据的利用已经开始行业内的分工与整合,大数据产业已经开始进入产业领域、产业链细分的阶段。 法律大数据产业因尚处于发展初期,对其并无明确界定,但获得较多认同的、较具开放性的界定是《环球法律评论》专栏作家维克托对法律大数据的理解:“以一种前所未有的方式,通过对海量法律数据进行分析,对法律问题进行预判,获得巨大价值的产品和服务,或得出新的认识、深刻的观点和主张。”[1] 法律大数据的范畴应该有广义和狭义之分。 广义的法律大数据既包括因法律行为和法律关系产生的信息和数据,也包括其他与法律有关的所有信息和数据。而狭义的法律大数据仅包含因法律行为和法律关系产生的信息和数据。
法律大数据主要有以下四个特征:第一,法律大数据原始信息存在的形式大多是文本信息,在没有对文本信息进行结构化分割之前,对于信息和数据的大数据利用难度是比较大的。 第二,法律大数据可利用的基础信息的数量十分庞大,除了司法机关公布的各类法律文书之外,还包含互联网上存贮的以及以纸质形式存在的各类信息和数据。 第三,法律大数据所利用的基础信息是以司法机关公布的各类法律文书为核心的。 相较于其他法律信息,这些信息的可信度高,其中讹误的信息较少,格式较为规范。第四,法律大数据的复杂性较高,其数据展现的相关性,既有法律的专业逻辑,也有一般社会活动所遵循的规律和准则。
当下我国法律大数据产业发展状态主要呈现出以下四个特点:第一,法律大数据产业发展尚处于初创阶段,产品和服务的研发大多已达到可被学术研究和市场利用的要求。 第二,法律大数据产业的基本产品形式或服务模式尚未真正成型,法律大数据的经营或研究机构,对于法律大数据的产品或服务均处于探索阶段。 第三,法律大数据行业混杂了一批挂“大数据”之名卖“律师”或“律师事务所”的机构,这些冒名之辈对于法律大数据产业的发展是十分不利的。 第四,无论是政府相关法律部门,还是法律实务界的法官、检察官、律师,均对法律大数据产业寄予厚望。
二、法律大数据产业的产业功能与产业意义
看待一个产业存在的功能与意义必须与相关的国家战略与远期规划联系起来,而看待法律大数据产业的视角中必不可少的则是依法治国方略的全面实施这一宏观背景。
(一)法律大数据分析与预测成为国家治理的重要手段
我们必须承认的是国家治理所要面对的这个社会越来越复杂,而且“现代社会关系的复杂性同时也增加了社会对司法功能的复杂需求” [2] 。包括司法在内的国家法律行为的产生必须依赖更加科学的决策模式,目前流行的指标式法治评估模式必须加快转型和改革。 中国裁判文书网、中国审判流程信息公开网、中国执行信息公开网、全国企业破产重整案件信息网、人民检察院案件信息公开网等官方信息平台收集和开放的文书和数据具有规模大、持续更新、真实性高的特点。 包括中国裁判文书网等平台公布的信息和数据在历史上第一次毫无偏见和歧视地记录了案件信息,而不是只记录重点、疑难、焦点案件,这就为形成真正科学的决策奠定了必要的信息基础。
法律大数据正逐步成为国家治理战略的一部分,法律大数据的本质特征之一就是利用集体智慧来分析和决策,理想的数据分析应该可以被运用到对所有个体或群体不断重复的行为或活动的分析之中。对规模足够大的数据的统计能够揭示原本隐藏在各类要素之间的关联性,数据分析能够更加深刻地体现依靠经验无法解释的相关性。“大数据中相关性分析之所以能够为法律因果关系认定和法律类推提供启示,在于其建立在海量数据之上的基础优势,以及数据挖掘、数据关联性分析科学方法所带来的对于事实与操作标准的有效解释和处理。”[3] “大数据分析不是一群迂腐的学究们在偏执地制造煽动性的期刊论文,它是由决策者执行并为自己决策服务的,目的是寻找更好的方法。”[4] 法律大数据分析通过回归方程的统计预测和公共政策随机试验的开展必将对部分传统法学经验研究产生较大的冲击。法律大数据可以扩宽传统决策咨询的视域,但它又不同于目前某些社会分析和政策研究中存在的过分强调其他学科方法而导致的舍本逐末的情况,法律大数据提供数据和相关性,而不做任何倾向性的筛选和解读,这就科学地、合理地为治国理政建言献策提供了信息基础。
(二)法律大数据有利于全社会法治共识的形成
法律大数据增强了立法、执法、司法等国家法律活动的透明性,进一步提升了法治建设过程的公共性。实际上,一般公众对于中国裁判文书网、中国审判流程信息公开网、中国执行信息公开网上所公布的信息的利用率是非常低的。这些基础信息即使已经被按照简明的逻辑和标准进行了归类,但对于一般公众而言,这些信息依然是庞大和复杂的。 更何况法律信息公开平台上公布的信息和数据也存在重复上传、命名标准不统一、涉密信息处理不当等问题,增大了公众利用这些信息和数据的难度。法律大数据分析可以部分地改变这种窘境,因为法律大数据的分析结果可较为客观地告诉公众海量法律数据中所蕴含的规律和逻辑,对于将立法公开、司法公开、执法公开真正地落到实处有举足轻重的作用。 在政府相关机构信息公开的过程中,一定要避免程式化的为公开而公开,必须注意的是法律信息公开的最终目的是让社会公众了解我国立法、司法、执法的真实状况,对于我国的法治建设和法律实施情况形成基本的共识。 此外,法律大数据分析还有助于法律职业共同体中的公开意识和数据共享机制的形成,十分有利于法律职业共同体内部的交流与合作。
(三)法律大数据产业的经济价值和社会效应
法律大数据的收集、分类、利用将会产生巨大的经济价值,并形成较为强烈的正面社会效应。 法律大数据产业的经济价值主要表现在以下三个方面:第一,作为新兴产业会增加就业岗位,促进经济发展。第二,法律大数据产业是低耗能低污染的领域,对资源的需求较低,投入产出比较高。 第三,法律大数据的产品形式和服务模式存在较大的发展空间,是一个颇具经济前景的产业。 法律大数据产业的社会效应则主要表现为两个方面:一方面是法律大数据产业会为国家法治的建设和发展提供技术支撑;另一方面,法律大数据产业为传统的法律行业和信息技术行业的交流和发展提供了机遇和平台。
(四)法律大数据对于法律服务行业的意义
法律大数据的运用可以在弄清法律市场基本分布情况的基础上,优化法律服务市场的基本结构,帮助律师事务所等法律服务提供者理顺法律服务的基本流程,提升法律服务的基本质量,评估法律服务的效果等。对于其他法律服务提供者(如律师事务所、公证处等)进行的大数据分析可以被运用在如何改善与维护客户关系上。法律大数据的分析结果可以用客观、真实的数据阐释和说明法律产品或服务的优势所在,对于律师事务所等法律服务提供者的营销模式、运营模式等都会有十分深远的影响。
三、法律大数据开放框架的基本路径
(一)通过建立统一数据平台实现数据开放
我国目前的法律信息和数据开放的基本框架主要是由相关国家机关确立的。法律信息和数据的开放框架应该符合国家和政府数据开放的基本原则和思路。 在国家宏观层面的大数据战略中,对于规模足够庞大、具有长足运用前景和可能产生足够经济机会的数据或信息, 国家视其数据的所有权归属、 数据属性等决定是否建立国家统一的数据平台,而法律大数据符合国家建立统一数据开放平台的基本特征。国家通过建立统一的数据开放平台实现原始信息和数据向公众的免费开放,一方面通过信息开放实现开放、透明政府的建设,另一方面则通过数据开放满足社会公众和各类法律服务市场主体共享数据的需求。对于目前基于自建数据库进行法律大数据服务或产品研发的模式,其既可能产生原始信息和数据所有权的争议,也可能因基础数据信息无法实时更新而影响服务或产品的时效性。
法律信息和数据开放的基本框架应确立公共数据集中开放模式,即基本信息和数据一站式供给模式,同时要着力避免因集中供给而形成的信息和数据的垄断,避免部分主体因为经济弱势地位导致无法获取足够信息造成针对部分公众或研究者的数据壁垒,确保基础信息和数据的准确性,防止因信息源的混乱造成数据混乱和数据造假等。数据开放的统一平台也应建立信息反馈、互动机制,利用信息和数据使用者进行人工的数据识别和错误数据的校正。
(二)开放法律数据应明晰且易得易用
法律信息和数据开放的基本框架要确保开放的法律数据具备清晰明了、易得易用的特点,开放的法律信息和数据应该能够高效地被获取和利用,并能够推动相应法律服务行业的发展和创新。 法律数据的开放不仅仅增强了国家法律行为的公开性和透明度,“更重要的是数据中所包含的潜在效益将被开发和再利用,创造更多的经济价值,提高社会运行的效率,为消费者提供更加优质的产品和服务”[5]。法律数据的开放改变了以往法律服务领域信息不对称、专业能力和水平无法客观评价等问题,消费者可以通过数据进行充分地比较,甚至获得对于任何一个法律服务提供者全景式的描述和评价。
(三)以全面的法律数据开放促进充分的法律数据利用
法律大数据开放的目的是能够对数据和信息进行充分的利用。与商业活动中销售、物流等数据信息的大数据分析和利用活动不同,对于法律大数据的收集和利用是有很强的技术和知识壁垒存在的,这就导致了法律大数据开放程度高、利用程度低的现状的形成,且导致法律大数据的流动是单向度的,国家相关机关公开的信息量非常大,但得到的反馈和生产出的产业利用成果却比较少。因此,法律大数据的基础数据和信息不仅应开放, 还应该通过多种手段促进其流动,并在流动中实现交互使用模式的真正形成。法律大数据产业中的服务和产品创新都要依托国家统一数据开放平台公开的基础数据信息来完成,其基本操作大致分为三个阶段:第一个阶段是依服务或产品需求提取基础信息数据;第二阶段是按照服务或产品的内在逻辑进行基础数据信息的聚合;第三个阶段是对服务或产品利用,并不断重复前两个阶段,以实现数据更新。全面的数据开放对于以上三个阶段都有极为重要的意义:一方面可以为数据的流动和利用提供更多的素材,另一方面也通过提升基础数据信息的量级来增强大数据分析结果的科学性和准确性。
四、法律大数据产业的基本结构和布局
(一)法律大数据产业宏观布局的两个主要方向
法律大数据产业发展有两个主要的方向。一个是公共化。一方面即前文所述的将法律大数据运用在国家治理当中,让法律大数据为国家法治建设、社会治理、法律服务行业结构的调整与优化服务;另一方面则是希望通过法律大数据的系统应用助力公民对政治活动的多元参与、维护公共利益。 另一个方向则是商业化。商业化主要体现在将法律大数据运用到法律服务之中,例如通过法律大数据为委托人预测判决的结果、通过法律大数据为律师受委托进行辩护的效果进行评估等。法律大数据产业的这两个发展方向之间是不冲突的,法律大数据产业的公共化符合我国法治建设的基本思路和逻辑,法律大数据产业的商业化则顺应了法律服务市场变革和调整的需求,二者可以和谐共存并围绕社会公共福利保障和实现来完成良性的互动。
(二)法律大数据产业参与者的类型化
法律大数据市场中的主体,按照在纵向产业链上的作用不同分为以下类型:信息提供者、数据提供者、数据开发者、数据使用者、数据交易中介平台、行业监管者。 当下的法律大数据产业中,各类主体的界分并不明晰,行业也尚无明确的知识产权界定方式和行业监管者,这些都必须在法律大数据产业结构的进一步完善中逐步明确,并通过行业各类主体的明确与完善实现法律大数据整个产业链的建设。
法律大数据产业的参与者按照其所拥有和处置的数据的规模和范围,大致可以分为三类:第一类是大型基础数据库平台,如中国裁判文书网等,此类数据库的建设应该被国家规划和限制,避免重复建设或违法建立国家法律信息公开平台的镜像。 第二类是小型商业数据库和数据分析商,提供某一类或某一部分法律信息和数据的查询和分析或归类服务,传统的法律数据库大多要向此类模式转型。第三类是专项数据分析和整理服务提供商。主要针对客户所积累和沉淀的大量信息,进行数据整理和大数据分析。
(三)法律大数据产业主要产品的类型化
目前,法律大数据产业中的主要产品可以分为三大类: 第一类是法律大数据分析和预测类产品。通过对既有信息的大数据处理,可以对特定行为基本模式、趋势、结果进行分析与预测。此类产品的主要形式有:对法律逻辑和裁判规则进行提炼;对某种犯罪行为的定罪、量刑结果进行预测;特定群体与法律相关特征的描述和分析;对特定领域或行业法律问题的总结等。 第二类是法律实务辅助工具,如法官、律师的办案辅助工具,案件流程管理工具、文档整理工具等,这类应用的输出方式主要是电脑或手机软件。 第三类是交互式的人工智能产品,可以实现部分标准化、重复性高的咨询、辅导等服务,通过将接收到的外部输入信息进行格式化的分解,并进入大数据平台进行比对和分析后,输出解决方案或意见,常见的运用方式如人身损害赔偿计算、针对性的律师推荐等。
五、法律大数据产业发展中可能出现的偏差及其预防
(一)法律数据使用中存在的侵权和资源浪费
法律数据信息尤其是判决书等法律文书是国家作为国家资产或公共资源的一部分在使用和管理的。目前众多法律大数据企业通过建立中国裁判文书网等国家数据开放平台的镜像来建立数据库。这种做法不仅可能存在知识产权上的争议,更是一种重复建设和资源浪费行为。政府相关机构建立的法律数据库从所有权上看是一种国家成果或公共科研成果,在法律大数据产业发展中要注意处理好公共科研成果与私人学术转化或商业转化之间的关系,要注意和预防法律大数据领域的侵权。要极力避免产业发展到一定阶段后,大企业对信息和数据的垄断。 信息和数据垄断造成的数据壁垒会阻碍和损害相关领域的创新和发展,但同时也不能过于放松对行业监管而导致无效率的竞争和资源的浪费。
(二)法律大数据运用过程中忽视个体或个案
大数据的“大”体现在数据的量上,法律大数据也不例外。利用法律大数据开展理论研究和具体运用的基础是必须有一个体量足够大的数据库,来保证大数据分析所依靠的信息“要全数据不要抽样”[6]。目前,法律大数据的应用的主要方向是利用海量数据分析事物或行为的规律、趋势。这种运用思路和方法注重的是趋势,但可能因此而忽视作为大数据分析对象的原始信息中的差异性,尤其在法律大数据技术运用的初期,这种忽视或忽略是很常见的,并可能直接导致对于个体或个案本身特性的忽视、甚至歧视。 法律大数据技术可能助推这种歧视或错误的延续或扩张,因为大数据在分析和总结过往某种行为规律的同时,也可能是在总结和分析某种错误的或不合时宜的规律。 在此种情况下,更应该注意法律大数据所反映的是阶段时间内的客观事实,但这种事实的是非曲直则还需要进一步探讨或验证。
(三)法律大数据利用过程中不当的信息公开
如同历史上所有伟大的技术变革一样,大数据技术同样是一把双刃剑,在大数据时代,“现在我们的一举一动都能在某个数据库中找到线索”[7]。要注意数据公开、数据获取、数据分析与个人隐私保护之间的关系。法律大数据绝不是简单的数据集合,立法、司法、执法等信息集合成为法律大数据后,将产生新的社会效益或经济效益。 相应地,如果对于法律大数据使用或保管不当,对于法律大数据所涉个人或组织造成的损害也是远大于对一般信息的不当运用所造成的损失的。 因此,必须注意对法律大数据的保存并建立相应监管机制。这方面的研究较多,本文主要侧重于法律大数据产业的发展,对此问题不须赘述。
六、加快法律大数据产业发展的建议
(一)政府应突出加强对开源法律数据的管理,做好基础数据库建设工作
法律大数据中的原始数据信息大多产生于政府的立法、司法、执法行为和过程之中,作为原始数据产生源头的政府机构应做好对于法律大数据产业发展的引导和规范工作。 具体来说,主要有以下四方面。
1. 原始法律数据的筛选、整理和公开工作。 在法律大数据产业发展中最重要的产业基础就是政府公开的立法、司法、执法行为和过程中产生的信息和数据。国家相关机构一方面应严格遵守立法公开、司法公开、执法公开的相关原则和限度,做好信息公开工作;另一方面政府相关信息管理和监管机构应系统规范国家各个机关信息和数据公开的标准与模式,为数据的统一筛选、整理和进入数据库做好准备工作。
2. 法律数据的横向整合工作。 目前,国家各个法律部门公开的信息和数据很多还处于割裂的状态。 以刑事案件为例,法院公开的裁判文书与检察机关公开的立案、侦查、起诉信息无法实现有效、准确的对接,各个法律部门的数据库建立标准不统一,无法实现数据之间的匹配和对接。 政府相关部门应统一标准、协调工作机制,实现各机关之间关联信息或数据之间的对接和匹配,这对于做好后期的数据识别和整理工作有非常重要的意义。
3. 原始信息和数据中涉密信息的处理工作。 各信息公开机关要依照相关法律标准做好原始数据或信息中涉及国家机密、商业秘密和个人隐私部分的处理工作,法律大数据公开平台应该设置二次审查机制,防止以上信息的泄露,做好法律大数据产业中的保密工作和个人隐私保护工作。
4. 规范、高效、易用的法律基础数据库的建设和管理工作。法律大数据产业中最重要的产业基础设施就是全面、系统、科学的基础数据库。 在产业的基础设施建设方面,政府相关监管机关应严格限制基础数据的重复建设。考虑到国家机关是法律大数据重要的基础信息和数据来源,或可选择国家建设统一的法律数据公开平台的方式,并设定个人免费使用,商业利用则需向国家支付相应费用的方式实现法律数据库的共享。
需特别强调的是,与在其他产业发展中扮演的监管者角色不同,在法律大数据产业中,政府首先要做好产业的重要参与者的角色,在这个新兴的产业中既要保证原始数据和信息的供给稳定和质量,又要做好或设计好基础设施的建设规划。
(二)政府在做好产业监管者的基础上应充分鼓励市场的发展与创新
在法律大数据产业中,政府除了要做好基础数据开放的工作之外,还是市场的主要监管主体。 在监督、规范与促进法律大数据产业发展方面,政府作为产业的监督者和管理者则应从以下四个方面努力:
1. 优化产业结构,防止因垄断的产生而阻碍产业的良性发展。监督者和管理者应该保证市场处于一种稳定的秩序当中,并且是具有较高效率的。 一方面,使产业中各类主体保持一个适当的比例,这其中既有对不同规模竞争者所占市场份额的控制,防止产业寡头或垄断者的出现,也包括应使产业链中不同性质市场主体保持适当的比例;另一方面,监管者应着力防止因行政权力、市场势力产生垄断导致市场的低效率和发展的停滞。
2. 在保证数据安全和充分开放的基础上,充分鼓励法律大数据产业的发展与创新。市场具有不可估量的创新能力,并能够形成一套自有的秩序。 在市场中没有出现损害产业中各类经济主体和消费者权益的情况下,监管者可保持适当的隐形,以便给予市场主体较大的发挥空间。
3. 做好法律大数据信息或成果所有权的确权工作。在当今这个数据已经成为一种重要经济资产的时代,只有在明确界分产权的基础上,才能够对产权进行有效保护,并藉此鼓励基于自身努力的可以使得法律大数据技术和分析结果增值的行为。
4. 通过立法和政策等多种手段鼓励法律大数据产业向纵深发展。信息技术行业的特征之一就在于不必短时间内过分追求产业的规模,因为只要在产业技术或产品相对成熟后,市场规模的扩大是可以以极快速度完成的。 因此,监管者应通过多种手段鼓励法律大数据产业向专业化、精细化的方向发展,通过各类产业政策的制定鼓励法律大数据分析工具和相关服务和产品的研发,实现法律大数据技术成果的产业转化。
此外,“产业竞争有一个隐含的时间维度” [8] ,监管者一定要注意法律大数据产业发展的阶段性特征。 目前我国法律大数据产业尚处于初创阶段,各国也并无成熟的监管经验可供借鉴。 因此,在产业中各类经济主体不破坏社会稳定与秩序、不损害个体权利的前提下,在短时间内可既不对各类主体施加过多的限制,也暂不给予过多的政策性扶植,为市场主体的自主性探索和发展留出充分空间,同时也较好地控制了国家的规制和监管成本。
(三)扩宽法律大数据领域内政企合作的渠道和路径
在法律大数据产业的发展中,政府相关机构除了通过立法规范和引导包含法律大数据在内的国家和政府数据的开发和利用之外,政府还是法律大数据产业重要的参与者。数据和信息作为现代社会中三大资源(另外两类资源为物质和能量)之一,正在推动国家产业规划和战略的转型。 “政府应该与产业界、学术界以及非营利性组织一起,共同充分利用大数据所创造的机会。” [9] 在国家大数据战略的引领下,在法律大数据领域展开广泛的政企合作,具体路径主要有以下四个方面:
1. 建立产业发展促进基金,作为天使投资人投资有潜力的法律大数据科技研发的个人或组织,孵化一批有代表性的具有领先技术的提供法律大数据相关服务或产品的公司,以资本介入的市场化方式参与到产业的形成过程之中,通过适度参与市场行为深度挖掘法律大数据中蕴含的巨大经济价值和社会效益。
2. 积极推广法律大数据的运用,将法律大数据广泛运用于国家网络安全、社会治理、经济管理等方面,通过法律大数据的运用实现司法为民、行政便民等基本政策,并通过法律大数据公开和解释立法、司法、行政等信息,一方面使得社会管理者和被管理者之间的关系更加和谐和融洽, 形成良好、顺畅的沟通渠道;另一方面可以极大程度上强化和巩固我国信息和数据产业方面的综合实力。
3. 对政府所需法律服务进行分类,将其分为政府系统内提供的法律大数据服务与从外部获取的法律大数据服务。 一般来说,原始信息的存储、涉密信息的处理等属于政府系统内提供的法律大数据服务,而对原始信息的整理、分析属于可以从外部获取的法律大数据服务。在对政府所需法律大数据服务进行识别和分类的基础上,实现政府部分法律服务的市场采购,这样一方面降低了政府在信息化建设方面的成本投入,另一方面也将激发法律大数据产业的市场活力。法律大数据运用对于优化法治资源配置有着重要的意义,尤其对于重新配置司法系统内资源、行政系统内资源是有着十分积极的作用的,政府可以通过购买市场法律大数据分析服务的方式来改进法治资源分配的模式和方法。
4. 政府应通过多种方式鼓励和促进法律大数据人才的培养和成长。尤其是要重点培养一批既具备一定法律知识,又拥有数据处理和分析技能的交叉学科背景的理论研究和实践应用人才,以设立科研项目、批准建设相应专业、建设产业园区等方式实现对于法律大数据人才的帮扶和培养。
(四)以长远、开放的眼光看待法律大数据产业的边界及预期规模
目前法学界和法律实务界对于法律大数据的关注多集中于司法裁判文书和司法统计方面,并认为“法律大数据分析的历史性机遇主要是指近年来司法数据的公开”[10]。这一方面是因为司法信息和数据的公开确实在政府信息公开中是走在前列的,另一方面司法和案例的研究确实在法学界占有十分重要的地位。但客观地说,这种情况实际上限制了法律大数据产业发展的可能性和预期的规模。因为法律实务中还会产生大量的关于立法和行政执法的信息和数据,这些数据对于评估立法、执法效果,甚至是评估我国的法治建设效果都有着十分重要的作用。 另外,这些法律信息和数据也会对于扩大法律服务市场的规模和疆域起到积极的作用。因此,我们需要用更加宏观和开放的视角界定和分析中国的法律大数据产业。所谓宏观的视角指的是应该站在更高位置看待中国的法律大数据产业,不要把法律大数据简单地限制在立法条文和司法案例信息和数据中,应该注意到法律大数据领域还应该包含执法、公证、法学教育、法律服务市场等重要领域中的信息和数据。而所谓开放的视角则指的是中国的法律大数据产业关注和利用的不应该仅仅是官方开放的信息和数据,还应该包含互联网等媒介上发布的信息和数据,例如可通过对于自媒体上公众对于法律信息和法律事件的评论信息和数据展开舆情分析。
七、结语:法学理论界应客观、冷静地看待法律大数据产业
(一)法律大数据分析对既有法学研究方法的影响
大数据研究中很多例子证明:只有信息样本足够多、数据量足够大的时候,才能发现事物存在和运行的规律。这就导致大数据的生产和大数据的研究方法和视角会对许多社会科学研究带来转型的机遇。 法律大数据同样为法学(法律)研究带来了巨大的冲击,无论是立法、执法、司法行为,还是受法律调整的社会关系和行为,都受限于社会发展基本规律和法治的基本精神,法律大数据会展现出这些关系和行为的规律性和可预测性。这使得法学研究可采用的研究方法和得出的研究结果更加科学和有说服力,理论研究者和法律实践者不必再纠结于理论研究成果的实践基础和实践意义,也不必再纠结于所谓的教义法学和社科法学孰是孰非。因为法律大数据将重构法学研究的基础,规范适用情况将可统计、规范适用结果将可预测,而社科法学所提炼的典型案例或虚构案例将失去主要意义,因为法律大数据可以帮助我们找到法治实践中什么是真正值得关注的内容。 对于立法、执法和司法的评估不再单向度地依靠问卷等信息获取方式, 而是更多地通过公共政策随机试验完成,获取的数据更加真实和完整。
法律大数据收集与分析方面的创新和革命是通过信息和数据开展科学决策的基础。法律大数据分析通过回归分析、随机验证、交叉比对等方法对决策行为进行事前引导和事后评价。法律大数据分析技术的创新不仅仅会对国家治理方式带来革新,还会一定程度上冲击传统法学研究方法。无论是传统的法学规范研究方法或教义法学研究方法,还是晚近兴起的法经济学、法社会学、法政治学等利用多种学科方法和工具展开的法学研究,因为以上两类研究方法开展研究的基础中的法律文本和对法律的经验性评价都无法实现全面的量化统计和分析,尤其是在占法学研究主流的教义法学研究中,关注的主要是法律体系内的逻辑性和自洽性,对于法律的具体实施情况并未形成充分关照。最近兴起的社科法学研究方法,在一定程度上突破了部门法的藩篱,使得某些涉及多个部门法的疑难问题被关注并为其积极寻找应对方案。虽然社科法学仍然未能进入法学研究的主流范畴,但确实已经形成对于教义法学研究方法的有效补充。但即便在教义法学和社科法学共同构建的法学研究方法体系中,对于法律制度的预设功能与实际效果的比对与验证都缺乏有效的、科学的工具,而法律大数据分析方法的优势正在于此。可见,在法学理论研究中,法律大数据研究方法必将占据更大的空间和更高的地位。事实上,法律大数据分析方法、法学的规范和社会科学研究方法都是可以共谋发展的。法律大数据分析方法并不会也不能完全替代既有法学研究方法,却可以对既有法学研究方法形成有效的补充。 有了法律大数据分析方法和分析结果的帮助,法学研究工作可以探索这样一条新的研究基本路径和思路:提出假设-数据验证-理论分析。 依此路径对于法学理论研究中的理论问题进行研究检验具有极高的可行性和执行效率。
具体而言,法律大数据分析方法和分析结果对于法学理论界和法律实务界可以提供以下三方面的帮助:第一,在立法方面,法律大数据的分析结果有助于更加科学、高效、全面地评估立法效果。例如,通过对司法文书、执法文件中引用法律条文的分析,可以得知法律条文的适用情况并进而找出规范中的僵尸条款和不合理之处,对于法律的修改和完善有十分重要的积极作用。第二,在司法、执法、普法等法律实践方面,法律大数据的分析结果有助于提炼裁判规则和执法行为的规律,并有助于对司法、执法的过程和结果形成一套科学的量化标准。例如,对于法官、检察官、律师等法律专业人士的工作可以形成更加有效的评价,对于普法的效果可以进行全面测评,对于法律实施的过程也可以形成更加全面、系统的检测,对于预防冤假错案、过度执法等有重要意义。 第三,在现实法律疑难问题和突发事件的应对方面,法律大数据能够协助司法、执法或其他社会治理机关得到更加全面的事件基本情况、公众舆论的反应、过往案例的处置方案和处置效果、相关法律依据等信息,对其合理处理疑难、突发社会问题,及时回应社会公众的治理需求有极大的帮助。有了法律大数据的帮助,法律专家能够为实践中的难题给出更为准确和有针对性的对策和建议。 有了法律大数据提供的支撑,理论研究的成果必将更加言之有物。
(二)法学理论界对待法律大数据的应有态度
客观地说,法律大数据对于法学理论界来说,是挑战与机遇并存。法学理论工作者只需要应时代发展之势,平静地看待法律大数据产业的发展即可,不必危言耸听地提出法律大数据将颠覆传统法学研究方法,也不必对法律大数据分析不屑一顾。在面对法律大数据的时候,建议法学理论工作者应秉持三种工作态度:第一种是对法律大数据要客观、理性地接受。 法学理论工作者应正视法律大数据等新的研究方法和研究资源的出现,要客观地看待法律大数据产业的功能和作用,并理性地分析法律大数据应用的利弊得失。 第二种是要合理、适度地运用法律大数据。在科学分析法律大数据运用的成本与收益的基础上,在恰当的时机、合适的场域中运用法律大数据,协助研究者总结事务规律或探求解决问题的系统性方案。第三种是要与从事法律大数据收集和分析工作的个人、机构进行友善、积极的沟通。法律大数据的开放程度决定了法律大数据研究的壁垒不在于数据信息本身的获取,而在于提取和分析法律大数据的方法和思路。这既是一个信息技术问题,又是一个法律问题,并无法单方面找出最佳方案。 因此,需要法学理论工作者与从事法律大数据收集和整理工作的个人和机构保持良好的沟通,通过阐释法律体系内部的特征和法律实践的基本规律为法律大数据的收集、整理、分析工作提供参考,并进而形成二者的良性互动。