一、引发思维与社会变革的“大数据”
近年来,“大数据”越来越广为人知,并被认为是信息时代的新“石油”,这主要基于两点共识。首先,在过去20年间,数据产生速度越来越快。据国际数据公司IDC报道,[1]2011年产生和复制的数据量超过1.8泽[2]字节,是过去5年数据增长的9倍,并将以每两年翻倍的速度增长。其次,大数据中隐藏着巨大的机会和价值,将为许多领域带来变革性发展。因此,大数据研究领域吸引了产业界、政府和学术界的广泛关注。例如,美国知名的公共媒体等机构长期持续报道大数据相关信息,《自然》[3]和《科学》[4]杂志也分别开放了特殊专栏,来讨论大数据带来的挑战和重要性,各国政府机构最近纷纷宣布了多项加快大数据进程的重大计划,[5]各行各业也都在积极讨论大数据的吸引力。
大数据技术不仅意味着处理大量的数据。它与传统的数据处理技术相比,除了数据容量更大的表象特点之外,还体现了一些其它特点。随着大数据的流行,其定义呈现多样化的趋势。许多文献对大数据进行了定义。研究大数据的先驱——国际数据中心IDC——在2011年的报告中给出了如下的属性定义:[6] “大数据技术描述了一个技术和体系的新时代,被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。这个定义刻画了大数据的4项显著特征,即数据体量大(volume)、数据类型多样(variety)、数据处理速度快(velocity)和数据价值密度低(value)。这一“4V”定义的使用较为广泛,类似的定义也出现在诸多相关文献中。
自开始有符号记录以来,人类一直在产生数据。然而越向早追溯,记录的成本越高、数量越少,“上古人类结绳记事,或许只记攸关生命的大事”;[7]且在历史中,大部分数据都随风而逝。存留下来的数据量尽管相对非常有限,但对于人类而言处理已经非常费时和困难。当今时代,人类在历史上第一次有技术能力来经济有效地捕获、存储和处理伴随人类活动而产生的各种数据。大数据应用是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。大数据分析是一个交叉学科研究领域,需要来自不同专业领域的专家协作挖掘数据中隐藏的价值。目前,大数据应用已经在结构化数据分析、文本分析、网站分析、多媒体分析、网络分析和移动分析等多个分析领域取得了广泛的深入研究,在社会管理、商业营销、政府决策、情报分析、法律实施等诸多领域得到应用。
大数据的处理方式是相对传统的计算处理和分析机制的一次根本的转变。2007年1月,数据库软件的先驱吉姆·格雷(Jim Gray)将这种转变称为继“实验验证”、“理论推理”和“计算”之后人类认知世界的“第四范式”。[8]在大数据时代,海量数据、大数据的处理方式以及对大数据的认知理念都将对我们的思考方式产生深远的影响。它不仅对经济市场和社会发展呈现出不同程度的冲击与影响,而且也在潜移默化地影响着法学研究及司法实践。大数据的发展带来了很多亟待解决的法律问题,但我们更应着眼于它提供的广阔机会。大数据给法学研究和司法实践工作者们提出了新的研究问题和新的研究方法,更带来了新的认知方式。我们必须了解大数据,思辨地看待大数据技术的处理方式和思维模式,才能在科技与法学交汇中更好地把握时代的脉搏,更好地推进法学研究和司法实践改革。
二、大数据时代中国司法面临的主要挑战
在大数据时代,司法领域迎来了新的问题。在法律制度仍不完善的现状下,“大数据时代要求司法者倡导能动主义”,在特定时期内,以积极参与的方式推动社会的发展进步。[9]当前,司法人员在司法业务中面临着与大数据时代相关的诸多挑战,其中最典型的问题包括如下两个方面。
(一)数据权利及个人信息保护有待司法实践探索
法律的设立总是落后于社会发展。面对飞速发展的互联网和大数据技术所带来的诸多新型社会问题,立法在个人信息保护、数据的产权及归属等问题上显得尤为滞后。
我国政府已经建立起了多家大数据交易所并已开始进行数据交易。[10]然而,贵阳大数据交易所执行总裁王叁寿先生曾在众多场合提及大数据交易面临的尴尬。国家发改委的一份关于推动大数据交易发展的报告显示,大数据产业发展目前面临四个难题:1.数据权利类型没有明确;2.数据权利主体存在争议;3.数据的控制和使用权利界限不明,如何分离尚不明晰;4.数据通过互联网非常容易被复制,权属保护很困难。[11]当前,关于数据的法律属性及定位仍存在较大争议。《中华人民共和国民法总则(草案)》第108条中将“数据信息”规定为知识产权客体的一种。[12]有学者对此持彻底反对意见,认为数据不能成为知识产权的客体。[13]有学者提出,应将“衍生数据”作为知识产权客体的一种。[14]亦有学者提出,基于数据没有特定性、独立性,亦无独立经济价值等原因,不宜将其独立视作财产。[15]
与促进数据产生和流通的法律保障体系模糊相对的另一个问题,是面对大数据时代对包含个人信息的数据的大量的、普遍的采集、存储、处理和流转,我国对个人信息的保护仍缺少系统的立法回应。我国的《个人信息保护法》仍在酝酿之中,距离2003年国务院委托中国社会科学院专家草拟专家建议稿已有10余年。[16]我国学者发出呼声:“个人数据保护,正是为人类进入信息社会所做的制度准备中最重要的一环,是信息社会的必要法制基础之一,是信息社会的文明基石,构建人权的新起点。”[17]
立法的确是困难的。个人信息保护中蕴含的人格利益与信息自由流通和应用中蕴含的巨大经济利益、公共安全和公共健康等公共利益之间形成了巨大的张力。这种矛盾和利益冲突在大数据时代将被进一步激化。大数据产生的利益应该如何分配?大数据带来的个人信息被滥用的隐患应该如何规制和防控?面对利益冲突应该如何设置利益平衡点?面对这些新问题,我国和发达国家都暂时没有找到令人满意的答案。以往,面对随着科技发展带来的新型社会问题,我们常在借鉴域外比较成熟的法律制度的基础上进行立法工作,少走了很多弯路,也较少进行大量全社会范围内的讨论,但弊端在于,我们跳过了真正意义上的从无到有的过程,缺少了相应经验的积累。所以在与发达国家同时面对新问题的时候,特别是在涉及到新的技术带来的利益应该如何分配等方面,我们的立法宜充分调动各方主体的关心和参与,考虑市场失灵的情况,观察中国市场自我调节的情况,了解司法实践中总结的经验智慧,跟进数据技术革命,并致力于为之提供良好的制度支撑。
然而,面对新的社会问题,立法或许可以稍作等待,司法却无从回避,并且司法实践中对相应矛盾纠纷的分析梳理、司法智慧的运用和司法经验的总结积累,是立法工作的宝贵资源。在现行法律体系下,我国司法机关进行了积极探索,已经运用著作权法及反不正当竞争法解决了许多数据保护相关纠纷。例如,早在1996年北京阳光数据公司与上海霸才数据信息有限公司技术合同纠纷案[18]中,判决就写道“信息已成为现代化社会的重要资源之一,其价值已为社会所公认,开发和利用信息资源,生产高质量的信息产品,向社会提供服务,是市场经济发展的需要……信息开发者和服务者的权利义务,已得到社会的普遍重视。目前,我国信息产品和信息服务业尚处在初级发展阶段,社会信息化的程度还不高,对符合法定构成要件的信息产品和信息服务予以法律保护,有利于鼓励和促进开发者开发、生产高质量的信息产品和提供高质量的信息服务”,并论证了阳光数据公司的相应数据具备商业秘密的构成要件,应受《反不正当竞争法》保护。在个人信息保护方面,我国也有法官提出,当前可以我国《宪法》中关于公民人格尊严不受侵犯的规定作为保护公民个人信息的基础,以《民法通则》中有关公民人格尊严受法律保护的规定为该部门法保护个人信息的基础。[19]在个案裁判中,司法人员不宜机械地适用文义解释,而应把握法律规范体系中蕴含的价值判断,深入分析个案中的利益关系,在新的时代背景下对法律规范做出符合立法目的之解释。
(二)大数据时代证据规则体系有待完善和发展
事实判断是司法审判中至为关键的环节之一。司法实践中最终认定的“事实”,实际上是由证据碎片拼接组合所呈现的。证据对于司法实践无疑具有重大影响。在信息社会中,特别是大数据的价值被社会认识并重视之后,我们的生活被日益丰富多维地记录在信息系统之中。数据作为人类社会的忠实记录,成为了等待人们去寻找证据以“还原”事实的宝库;大数据技术及思维范式也可能对案件相关证据的收集方法、范围乃至采信规则产生影响。具体而言,大数据带来的证据规则方面的挑战主要包括如下两个方面:
1.电子数据证据使用规范需跟随大数据技术的发展不断细化完善
目前,我国电子证据规则仍有待发展完善,司法工作人员对于电子证据本身的可采性标准及效力认定等问题仍然存在疑问,这是对司法实践中运用电子数据证据的重要挑战。尽管我国2012年修改的《刑事诉讼法》、《民事诉讼法》及2014年修改的《行政诉讼法》均将电子数据规定为证据类型之一,2015年开始施行的《最高人民法院关于适用〈中华人民共和国民事诉讼法〉的解释》中也对电子数据进行了进一步界定,但由于电子数据容易被伪造和删改等因素,加上我国法律相关实践经验的不足,在司法实践中如何审查和认定电子证据的真实性仍然是一个难题。“人们惯常审视电子证据的思维模式是寻求一种能够脱离开电子数据的虚拟世界而在现实生活中存在替代物。这种思维的基础是不相信在网络中流动的数字化信息的真实性。”[20] 2016年9月,最高人民法院、最高人民检察院和公安部联合发布了《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称《电子数据规定》),对于刑事诉讼中电子数据的定义及其收集、提取、移送、展示、审查、判断等方面进行了规范。[21]其中许多条款的设置都旨在保障电子数据的真实性识别。[22]其中对于电子数据应着重审查其是否具有数字签名、数字证书等特殊标识,审查其收集方法是否符合相关技术标准等规定,均对法院审查和判断电子数据提出了挑战。
在大数据时代,更需要发展和细化电子数据证据的保全、取证和真实性判断等方面的规范。对大数据技术的深入理解和技术跟踪,对电子证据真实性实质审查中的电子证据司法鉴定和证据印证这两类方法均有积极意义。[23]正如我国学者所述,“电子证据同时具有脆弱性和稳定性这一对相互矛盾的特性”。脆弱性包括两个主要方面:(1)电子数据易于被篡改和伪造,或因系统故障等非人为因素而发生异变;(2)电子证据本身个性化特征较弱,例如网站难以通过注册信息来确认注册者的真实身份。稳定性则表现在:(1)易于存储和复制,不易彻底销毁;(2)篡改、伪造的痕迹难以完全消除。[24]在大数据技术下,许多电子证据的上述脆弱性将得到一定程度的减弱,而稳定性特点将可能进一步增强。一方面,在大数据时代,数据成为一种重要的资源和财富,许多大数据拥有方均会采用更为先进的存储技术或采用稳定成熟的云服务平台,在这种情况下,数据因系统故障等非人为因素而发生异变的可能性微乎其微,篡改数据的痕迹也更难于完全消除,为电子司法鉴定提供了更为有利的环境。另一方面,大数据时代,一个主体的众多信息都可能被记录在许多具有独立来源的信息系统中,使得电子数据证据往往可以与其它电子数据相互印证,使原本易于篡改且难于证明与特定主体相对应的电子数据可以得到补强。
在大数据时代,几乎无处不在的电子数据成为了记录事实的重要载体。大数据技术所带来的潜在的电子证据脆弱性减弱和稳定性增强,需要相应的规范来予以充分利用,进而指导司法实践。司法领域可在取证、保存、出示、审查及认定方面都进一步发展电子数据证据使用规范细则,服务大数据时代的诉讼,“在充分认识到电子证据重要性的基础上,进行制度的改变,法律的完善,构建科学的电子证据规则体系,使得电子证据合法、合理、充分地被运用,实现电子证据应有的功能和作用。”[25]
2.大数据分析结论能否作为司法证据使用仍需论证和予以明确
大数据分析技术可能为证据的收集提供新的思路和方法。大数据技术通过对海量数据的自动分析,从海量的琐碎数据中挖掘出有价值的信息,从而为人们在相应领域的活动提供依据和启示。大数据分析能够依托海量数据,挖掘出事物间的关联关系。在司法领域的证据收集过程中,根据具体情况,可以依托大数据分析直接搜索出相关数据,也可以基于对以往大数据的分析挖掘出事物间的关联关系,再据此进行进一步的证据调查和采集。
面对这样的想法,一些学者开始探讨大数据分析结论是否能够作为司法证据使用,以及大数据在事实认定中的作用机制。基于目前大数据分析是一种以分析关联关系为主的、对精确要求较低的定量分析等理由,我国学者多数认为目前不宜将大数据直接作为一种证据使用。[26]也有学者提出,大数据分析虽然或许不能直接体现在证据的推论结构中,但可以进入证据分析领域,提供“数据经验”,可以为事实认定者提供事实认定的语境和背景知识,填补人类对海量碎片信息认知能力的不足。[27]本文认为目前至少在民事诉讼中,大数据分析结果并非不可作为证据使用。在大数据时代之前,传统调查统计的方法已经开始应用于民事诉讼领域。例如,在知识产权民事诉讼领域,美国法院已开始用专家调查证据支持可能出现商标混淆的主张。[28]我国一些学者提议关注和借鉴美国的司法实践,将消费者调查统计结果作为证据,承认其具有可采性,将之引入我国司法实践,并指出在商标法领域,针对混淆可能性、第二含义的产生、商标的通用名称化、商标的淡化、虚假广告等问题,都可能涉及调查统计方法的应用。[29]我国目前司法实践中也有当事人将市场调查报告作为证据,有些也得到了法院的采信。[30]在华为诉IDC必要专利许可费率纠纷案[31]中,一、二审法院在进行标准必要专利许可费裁定时,均参考了STRATEGY ANALYTICS研究机构对全球手机市场中苹果、三星等公司销售额的统计分析和预测。“问卷调查证据和其他认定因素一样……使得法官更好地将抽象的法律和具体的事实焊接在一起,得出尽可能公正和准确的裁决。”[32]在这些已经使用调查统计报告作为证据的问题上,理论上也可能运用大数据分析结论作为证据,只是正如统计调查证据需要披露相关细节并符合规范一样,大数据分析结论作为证据使用也必然需要说明数据来源及分析方法,并逐渐发展和确立证据审查规范。司法实践需要正确理解数据科学的性质和作用,对采用大数据分析结论作为证据保持审慎但开放的态度,并在此过程中起到科学引导作用。此外,大数据时代“证据偏在”的问题将更加凸显,需要借助证据制度加以克服。[33]
三、大数据技术为中国司法带来新的发展机遇
大数据分析作为一种新型的研究范式和决策辅助方法,正无孔不入地渗透到社会生活的方方面面,为人类活动提供信息参考。司法领域也自不例外。除案件相关领域的数据外,司法活动本身也在源源不断地产生案件判决、庭审笔录等各类业务数据。此外,社会各界对于司法活动有着密切的关注,各大门户网站、社交媒体上均存在大量对司法事件、司法单位、司法人员的报道和评论。对海量异构的案件相关的领域数据、司法业务数据及互联网数据的分析,可能为司法能力现代化、司法公正的促进、司法资源的优化配置、司法机关与社会公众的良性互动等方面都提供有益的辅助支持。我国司法系统也非常重视科技力量的运用。最高人民法院提出要“建设立足于时代发展前沿的‘智慧法院’”。[34]最高人民检察院发布了《“十二五”科技强检规划纲要》。[35]大数据技术是其中的重要技术之一。中央政法委书记孟建柱重点说明“大数据表示的是过去,但表达的是未来,其意义就在于,通过对海量数据的整合、挖掘,揭示传统技术方式难以展现的关联关系,让人们更清楚地理解事物本质、把握未来取向,从而发现新规律、提升新能力”,[36]并反复强调“要着力提升科技信息化应用能力,善于运用大数据,提高维护稳定工作现代化水平。”[37]
总体而言,大数据技术主要可在如下几个方面发挥重要辅助作用,为中国司法的进一步发展带来新的机遇:
(一)辅助提升司法能力、促进司法公正
大数据技术可以在众多司法过程中提供关联关系挖掘和决策辅助,[38]辅助提升司法能力,并促进司法公正。
在职务犯罪风险评估、预测、预防以及犯罪侦查等司法活动中,尽管现阶段大数据分析的实际运用尚为数不多,但学术界及实务界都正在积极展开探索和讨论。我国有学者提出,如果缺乏来自刑事司法体系内的大数据支撑,大数据分析目前似乎无法探究刑事司法与犯罪的核心问题。[39]我国也有学者提出,当代职务犯罪线索更加隐蔽,可以针对组织内部和社会动态两大类别的数据,建立大数据相关模式分析,“对不同数据源的数据进行比对、关联、分析和预测,对国家公职人员履行职务期间碎片化电子数据全体样本进行相关性分析”,发现线索,进行预警,辅助决策。[40]为使大数据分析更好地发挥作用,宜在合法范围内尽可能建立司法内部数据及政府机构内部数据的实施收集及适当的共享机制。目前,我国在司法裁判文书的公开和分析方面已经取得了一定进展,并正在进一步推进。中国裁判文书网收集并公开的裁判文书已超过2000万篇。[41]我国司法系统及企业界均已经开展了一些相关工作。例如,安徽高院的“类案指引项目”建立了裁判文书大数据挖掘和分析系统,拟在传统法学理论和实践判例的基础上,以类案同判为目标,对海量裁判文书进行量化分析。该系统已在2016年5月在安徽部分法院投入试用。[42]在企业界,北大法宝、知产宝的“索骥”产品等也都基于海量判决文书提供了不同层次的数据分析服务。
针对司法案件的大数据分析一方面将极大地便利司法人员从在先案件信息中了解先例情况,学习经验,辅助构建审判和量刑决策模型,提升司法能力,律师对司法大数据的积极运用也将为案件的审理提供有益信息;另一方面,司法大数据将有力地促进司法公正。公正司法不仅需要法官的道德良知,也需要外在的约束和推动。[43]
首先,针对司法案件的大数据分析可以有效辅助“同案同判”目标的推进。同案同判是司法公正的一项基本要求,是自然正义在司法领域最具体的体现,蕴含着法律面前人人平等的朴素正义。司法大数据分析可以减少由于时间和空间上的距离造成的信息沟壑。同一类案件处理中可能涉及很多不同的因素,司法大数据分析将在全国司法裁判文书中进行分析,辅助揭示各类因素在不同案件中所起到的作用,使法官适用法律时更能保证与全国同类案件进行类似处理,从而保证裁判的统一性。其次,司法大数据分析的推进将提高司法的公开性,使司法处于阳光之下,以公开来促进公正。司法信息公开和大数据分析将在很大程度上解决司法机关与当事人和社会民众之间的信息不对称问题。这使司法人员在处理案件时会考虑到社会监督,从而促使司法人员提高案件处理质量,特别是提高司法公正。最后,司法大数据分析将促进裁判文书质量的提高。大数据时代,裁判文书公布后,数据分析可以对裁判文书的质量进行评价,这将促进法官认真地制作裁判文书,充分地说理,呈现高质量的文字水平,提高案件裁判的质量,并对后来类似案件的审理提供有价值的参考。
“司法公开是一种自信,一种力量,是树立和提升司法公信的重要途径。通过司法公开可以全面保障人民群众的知情权、参与权、表达权和监督权,使司法权在阳光下运行、在规范和监督下运行、在公众信任的氛围中运行。”[44]在大数据时代,司法公开既是技术和社会发展所致的必然趋势和要求,又将通过大数据技术辅助提升司法能力、促进司法公正,使司法系统拥有和展现基于司法能力和司法公正的自信和力量。
(二)辅助配置司法资源
大数据技术可以辅助进行司法资源的优化配置。例如,可以应用大数据技术对案件繁简分流及合并拆分审理等过程中的规律进行分析,辅助进行案件繁简分流及合并、拆分审理的决策建议,建立司法资源节约机制;可以应用大数据技术测算不同区域不同业务的司法业务量,辅助评估每个司法人员的办案质量、效果及专长,并进行司法人员的优化配置。特别在当前的司法改革工作中,有人士提出,“应以大数据为依据,科学进行调查研究,科学测定法官、司法辅助人员的工作量,科学推动审判权监督管理方式改革,科学推动审判辅助及案件执行事务改革,确保法院司法改革取得应有的实效。”[45]
(三)辅助促进司法机关与社会公众的良性互动
近些年来,比较重要或热点的司法事件经常会在社会上引起广泛关注。“在当今网络信息时代,公众对司法信息需求量越来越大,对司法公开的信息及时性要求越来越高,司法领域的热点多、触点多、燃点低……不仅要通过审判活动实现司法公正,而且要以人们看得见的方式实现司法公正,让裁判或认定的过程变成当事人感受民主、客观、公正的过程。”[46]公众在互联网上的舆论可能包含改进司法工作的有益建议,也可能是基于信息不对称或错误信息而产生的不符合实际情况的认识,后者常常给相关司法人员带来压力,有时甚至有可能不当影响了司法独立。在坚持审判独立原则的前提下,可以应用大数据技术,发现公众心理和舆论传播的特点,进行舆论风险预警和适当的、及时的信息发布,从而构建司法机关与社会公众的良性互动关系,也有助于缓解舆论对于司法人员的压力,辅助审判独立的实现。同时,大数据技术可以帮助司法机关从众多司法业务数据和互联网信息中挖掘司法为民目标的实现和提升路径,进而辅助提高社会公众对司法工作的满意度。
综上所述,大数据技术可对司法的多方面提供支撑。对数据进行分析挖掘,“可以发现隐藏在大量细节背后的规律。依据规律,可预测未来。收集分析海量的各种类型的数据,并快速获取影响未来的信息能力,就是大数据技术的魅力。”[47]但在运用大数据技术进行辅助决策时,有一些事项值得注意。1.在使用包含个人信息的数据时要注意合理使用的范围,不能侵犯他人的人格权利。2.不同来源的不同类型数据,在可靠性等方面可能存在较大差异。例如,相对于互联网数据而言,司法业务数据通常更为准确和真实。在数据分析设计时应对此有所注意。3.应对大数据分析得出关联关系和进行预测的原理有清醒认识,了解到数据分析有其固有的局限性,对数据分析进行恰当合理的利用。
四、大数据时代司法对法学研究及人才培养的需求
大数据时代,积极应对中国司法面临的挑战与把握发展机遇的核心均在于人。大数据在司法中的充分应用不是简单的法律与技术的堆积,而是需要法律界人士体会和实践其中思维方式和研究方法的变革,开展交叉学科研究和应用,并从实践中设计和发展相应的教育体系,培养能够更好地回应时代需求的人才。
(一)大数据带来思维方式和研究方法的变革
在过去的几千年中,实验验证、理论推导和科学计算是人类探索自然、研究社会的三种基本认知范式。在大数据条件下,以计算为中心的理念逐渐转变到以数据为中心,形成数据思维方式——大数据时代的新型研究范式即“第四范式”。科学家们认为,未来科学的发展趋势是,随着数据量的高速增长,计算机将不仅仅能做计算模拟仿真,还能分析总结并得到理论。这意味着一些过去由科学家和专业学者所从事的工作,在未来可以由计算机来进行并可能做得更好。在《大数据时代》[48]一书中,舍恩伯格等对大数据引发的思维变革进行了如下总结:1.分析数据时,要尽可能地利用所有数据,而不只是分析少量的样本数据。2.相比于精确的数据,更乐于接受纷繁复杂的数据。3.应更为关注事物之间的相关关系,而不是探索因果关系。4.大数据的简单算法比小数据的复杂算法更为有效。5.大数据的分析结果将减少决策中的草率和主观因素,数据科学家将取代“专家”。
该总结中的第4条主要与数据分析的计算机算法相关,而其它几条则直接涉及到思维方式的转变,同时也可能带来一定的冲突。第1个转变意味着研究工作将不再依赖于小规模的数据采样,而是转而分析大规模的、真实的甚至实时的复杂数据全集。使用数据全集能够带来更完整而全面的认识,从而可能发现采样方法所难以揭示的细节。信息技术的发展使人们可以借助大数据分析技术,在法学研究和司法实践工作中可能实现定量化指导,甚至使之成为一门科学。第2个转变是个体数据相关的精确度不再重要,因为当拥有海量的即时数据时,适当忽略微观层面上的精确度,可能在宏观层面拥有更好的洞察力。这对于公共事务管理、宏观调控等实践将具有重要意义;但另一方面,这也可能导致对个体情况的漠视,造成司法实践中的盲点。第3个转变极其重要。在大数据时代的研究方法下,人们可能不再关注于事物间的因果关系,而关注其相互之间的相关关系。值得肯定的是,相关关系也许并不能准确地说明某个社会现象发生的原因,但它会揭示其发展过程。这一点以及舍恩伯格等所宣称的第5点改变,对于习惯讲究严密逻辑和因果关系的研究工作者们可能难以接受,会认为当前大数据的概念空洞而粗糙,就数据论数据,忽视人性和理论指导,从而难以取得突破性进展,甚至可能带来灾难。由此看来,如何运用法学和社会科学相关理论来指导司法实践领域的大数据分析,这可能是学术研究和实践探索中都需要认真思考并亟待突破的问题。[49]
尽管自然科学与社会科学的发展总是相互关联,大数据技术在法学研究及司法领域的应用仍将带来社会科学和自然科学之间的一次碰撞和深度交汇。“社会科学与自然科学的区别之一在于思维方式的不同,社会科学是总体逻辑思维,自然科学是类型逻辑思维。”前者关注独立各异个案的整体分布;后者则关注典型现象并挖掘其中的规律,进而将规律推广适用于具体问题。而大数据技术的这种量化分析特点决定了它无法挖掘出普适规律来描述和解释所有个体行为。[50]另一方面,作为社会现象的一部分,法律现象与自然现象之间有着显著区别,它有着太多的异质性和不确定性。[51]这使得我们在使用大数据来研究法律现象的时候,不一定能够像研究自然科学问题那样直接和有效。这些都有可能成为大数据技术在法学研究和司法实践中应用所需要解决的问题。在面对大数据的冲击时,是坚守自身特有的话语模式,还是迎接这一技术所带来的深刻影响,也许是大数据时代下的法学研究和司法变革所需要做出的必然选择。
(二)交叉学科研究和人才培养势在必行
大数据时代已经到来,我们必须对此有所准备和应对,将法学理论与科学计算理论相结合,打破学科划分带来的思想羁绊,了解相关交叉学科的思维方式,或者以交叉合作的方式展开研究和实践工作。传统的法学研究工作较普遍地表现为单独个体的活动,而大数据时代的海量数据常常无法由单个个体完成收集、整理和分析。目前,许多应用大数据的研究都采用了较大规模的分工协作方式。[52]在结合大数据技术进行法学研究和司法实践的过程中,倚靠个体或者单一部门来开展工作,在一些问题上难以取得突破,必须加强跨学科和跨部门的协作。
在人才培养方面,传统的法学院课程设计一般以单一的法学课程为主,这样的设置使得大多数从法学院毕业的科研工作人员往往仅基于传统意义上的法学视角、法学理论来研究和解决法律问题,缺乏多样性。非法学专业的法律硕士虽然为法律职业共同体引入了多学科背景的人才,但在各个教育阶段仍然以单一学科为主。单一学科课程的叠加只是权宜之计,并非我们希望的最佳课程设置模式。单一学科的知识相对容易获得,难以轻易掌握的是利用大数据技术在司法领域分析问题、解决问题的思维和方法。这需要发展出一批具有应用大数据技术去解决司法问题的经验丰富的研究者或实务工作先锋来参与系统的人才培养计划的设计,并进行思维方式和研究方法的传授。
五、结语
我们仍处在大数据时代薄雾弥漫的清晨。尽管还不能看到那一时代的清晰轮廓,但我们能够预见人类研究范式和社会运行方式都将迎来巨大变革。社会变革时期成文法往往格外显得滞后,此时司法系统的能动性尤为重要,对维护社会公平正义、促进新的法律秩序形成起着重要作用。司法系统作为法治社会的重要支柱,应积极面对大数据技术正在引发的这场变革,拓宽视野,奠定基础,积累经验,培育人才,为信息时代的社会法律制度贡献司法智慧和司法经验,为更加公正、高效、科学、公信的司法实践积蓄现代化的大数据技术和思维范式支撑。