本站首页 关于我们 法律图书馆与法律信息研究会 法律信息研究 中外法律图书馆 法学文献与检索 政府信息公开 法律图书馆导航 法律法学网导航
法律信息资源
法律信息服务
数字信息检索
数字技术发展
专业网站建设
澳门法律信息
  当前位置:首页 > 法律信息研究 > 法律信息资源
法律信息资源
暂无下载资料

 人工智能与司法的裁判及解释
            李 飞 点击量:8938
华中科技大学法学院
【摘要】
基于大数据的人工智能(AI)正加速应用于司法裁判之中。智能司法的背后是从文字向代码的司法逻辑转向,不仅催生了人工智能法学,更重塑了同案同判的公正理念。但 AI 司法的复杂性与隐秘性共存,并威胁自身的合法性和优越性。除了 AI 司法过程的不可还原性导致的黑箱效应,数据与算法作为 AI 司法生态的重大环节也并非无懈可击。法官的解释任务因此出现了新的内容:需要对 AI 司法的基础条件进行验证与整合。为了使 AI 的技术理性与同案同判的目的理性契合,法官应当基于人机协同而关注四个诠释节点:(1)案例数据是否充足? (2)裁判结果是否合理? (3)因果关系是否相当? (4)正反计算是否对称?
【关键字】
大数据;人工智能;同案同判;法律解释;诠释节点
    

  一、引论:问题的提出

  历经萌芽酝酿和长期积累之后,“特别是在移动互联网、大数据、超级计算、传感网、脑科学等新理论新技术以及经济社会发展强烈需求的共同驱动下,人工智能加速发展”,〔1〕正将人类推向智能社会。

  “就法律而言,人工智能已经被广泛地用在法律制度的各个层面。”〔2〕 这种应用不仅助推法哲学的本体论思考,而且直接塑造了智能化的司法裁判,人工智能即(AI)司法。不管是识别提取法律事实和情节,还是自动推送关联法条和类案,无论是推荐量刑和生成法律文书,还是通过深度学习不断提高前述司法活动的准确性,AI 司法都表现出超越人类司法的计算分析能力。〔3〕除此之外,AI 基于特定机器学习模型,还可以对法院判决和法官行为进行高度准确性预判,〔4〕把握司法审判的一般规律,保障公民对裁判结果的预测可能性。毋庸讳言,人类司法向数字司法的转换,为解决因公民不断增长的司法服务、公正诉求与司法资源紧张以及诉讼爆炸之间的矛盾提供了武器。

  尽管计算机代码可以比人类更有效地进行法律规则整合和运算,从而提高司法裁判的质效,但它也潜藏着一系列局限和问题。因为人工智能与法律机制的结合,是法律逻辑从文字符号向数字代码的转换。这意味着司法裁判的核心特点必然表现为:依赖于机器代码来定义和计算人们需要遵守的规则和违反规则的结果。虽然 AI 司法所得的裁判结果是清晰可见的,但司法裁判过程已经包含了不同于自然语言的机器语言层次,因此,法律解释必须对计算机语言和基于运算的新文本做出回应与统合。借用伽达默尔的话来说:我们需要将凝固在非语言符号中的科学陈述,与既不是任意的也不由我们操纵的、而仅仅要求我们尊重的我们存在的基本秩序重新连接起来。〔5〕同时,“法律生命不在于逻辑,而在于经验。”法律公正的实现不仅仅在于结果和逻辑推断,它还必须以符合生活世界的方式进行论证和展示,以换取公众的服从和信仰。因此,对 AI 司法结果的接受进行妥当的法律解释,使 AI 计算过程和法律论证有机结合,是亟待研究的 问题。在主体自为的意义上,对 AI 司法的解释思考也是对法律科学人本主义的重新阐释,以及对人类理性和 AI 理性关系的探讨。

  以下,笔者首先阐述 AI 司法的数据前提和历史逻辑,及其对司法公正理念的影响,然后论述 AI 司法的公正形态对司法解释带来的挑战,最后结合 AI 司法特征,尝试提出与智慧司法相协同的裁判解释操作方案。另外需要指出的是,从法律规范的类型化和人工智能司法的实践出发,因为罪刑法定是刑事司法的铁则,因此,刑事司法判例因其严格的法定性似乎更适宜作为人工智能的大数据基础。换言之,海量刑事判例所提供的行为类型更具有明确性和合法性,因而,本文探讨以刑事司法逻辑为原型。

  二、司法公正的重塑:司法数据与人工智能

  人工智能是一种教导机器如何做一个最初由人类来完成任务的技术。但从人工智能旨在建立人工认知系统和解释人类自然认知系统的目的出发,人工智能既是一项试图理解人类认知的科学,也是一门试图构建具有类似人类能力机器的工程学科。〔6〕69 通过机器学习、视觉识别、语音识别和自然语言处理等技术,人工智能增强并外化了人类智慧,正如同非智能机械当初延伸和提升人类体力一样。在此过程中,社会组织和行为互动的智能化并不是唯一要义,更根本的是由智能互动和意义空间变动带来的价值嬗变和理性震荡。作为公共部门,司法实践的环境、程式和理性也借由人工智能而快速演进,在引发司法理念深刻变革的同时,也要求再次反思和优化司法理性范畴,客观全面的审视技术理性的红利和挑战,尤其是司法理性与数据和算法的关系。

  自民主法治社会以降,法律平等原则基础上的同案同判已成为公正理念的必要组成部分。同案同判即遵循先例,符合一般理性认知和朴素法律情感,因而能使当事人和社会公众对裁判结果心悦诚服。同案同判在判例法国家具有不言而喻的自明性,即便在制定法国家也日益成为司法的有机部分。但其面临的一个重大障碍是,如何识别何谓相同案例和不同案例,从而准确适用于待决案件。对此难题,人工智能提供了超越以往的高效解答和技术支持。从案例就是数据的角度来说,前述问题可分为两个方面:数据收集的困难和数据处理的困难。这两个问题随着信息技术的进步,尤其是人工智能的出现而消解。同案同判的司法公正由此得以重塑。不过,在人工智能强化司法正义,以及巩固司法合法性的同时,也应该注意到自身隐藏的内在矛盾,亦即稍后详述的智能司法的复杂性和隐秘性。

  (一) 从司法小数据到司法大数据

  回望法律信息发展史不难发现,司法审判实际上是科技进步推动司法大数据颠覆司法小数据,或者说,从小数据司法向大数据司法的演进,并带动司法理念变革的过程。

  通常认为,所谓大数据是指四 V 特征的数据集,即大规模(Volume)、多样态(Variety)、快流变(Veloc-ity)、高价值(Value)。〔7〕大数据并不是新鲜事物,因为近几十年来,各种机构和团体已经收集了大量的数据,并通过研究现象、人类和事件之间的相互关联、早期征兆和因果联系,从而作出决定。〔8〕换言之,与前信息社会中分散、琐碎、有限的数据状况相比,大数据的产生直接表征着信息和知识在社会结构和行为决策中取得了决定性价值和中心地位。因为就信息数据而言,非民主政治自不待言,即便是民主法治背景下,公众倘若无法得到充分有效的信息和知识,不仅理智、审慎和负责的选民无法建构,民主程序也必然是扭曲的。〔9〕 相应的,司法裁判和公正理念也无法摆脱信息机制的挤压。由此可见,信息资源是任何民主社会的重要组成部分,是司法公正的先决条件。换言之,司法信息和司法价值存在交互作用。因此,从小数据到大数据的司法裁判演变,必然导致司法公正理念进化。

  其一,小数据背景下,司法公正的理念长期处于蒙昧、分散和对立状态。由于科技媒介相当落后,法律数据、司法信息和法律理性不仅传播缓慢,而且分布失衡残破,滋生暗数据。司法者不仅可以秘密司法,即便在国家公布法律之后,也可以公然伪造裁判文书出入人罪。即使是公正的司法裁判,不管是裁判者还是诉讼人,依然会受制于司法数据本身的流通、信息提取和识别障碍。达维曾经通过法律比较后指出,在近代法典化之前,无论分裂的欧洲大陆还是统一的英吉利都一样,法院一直在法律的发展中发挥主要作用,以自己的方式对法律进行解释,这是无可争辩的事实。〔10〕 在中国传统社会中,司法的重要功能是维护等级性的家族伦理,受地方士绅权力约束。因而近代以前的中外司法实际上都使司法公正处于分散化和分裂状态之中。总之,司法结构的散乱与司法公正的缺失互为因果,司法的权威主义和家长主义盛行。究其原因,科技不仅决定着社会关系和政治形态,更直接影响着法律传播和数据状况,并最终决定司法运行状态。

  其二,伴随科技进步,司法大数据推动着公共结构的变动,以及公正理念的重塑。因为当公民取得信息权之后,法律和裁判在内的司法数据也就获得了更大的公共属性,知识本身转化为一种公共事务。〔11〕一方面,公民和社会借此获得了更多的知情权、话语权和参与权,案件变得透明和可比较。基于此,倘若认为一切公民的权利增长源于社会结构变迁,那么从司法正当性上来说,司法权力就必须以满足社会结构变动基础上的公正诉求为己任,以便重新获得和确证自身合法性。另一方面,信息革命对社会组织形式的最大影响表现为“去中心化”。基于工业社会的科层制国家机关,逐步向扁平化、开放化、流动化以及数字化过渡。从政治学角度来说,这是个人在获得信息权之后,市民社会的参与式民主对代议制民主范式的补充和矫正。司法裁判在信息趋向均衡的过程中,扩充并容纳了更多民主参与能力。简言之,公众不仅要求更民主理性的立法正义,同时必然要求获得更多司法正义。司法审判在大数据语境下意味着公民之间,国家权力和市民社会之间的法律信息差距的缩减,案件变得众所周知,问责变得及时透明,多元主体参与讨论变得增多。总之,司法大数据表征着司法信息的生产、流通和分配方式的革命,其结果必然导致以法律平等和同案同判诉求的司法理念革新。

  不过,司法数据革命也包含着悖论。因为数据呈指数增长的同时,蕴藏着海量数据湮没认知和有效司法信息获取的对立。因为群体对共享信息的关注随着群体规模扩大而增加,但是拥有独特知识的局外人和非共享信息可能被无情轻视、忽视和抵制,因而群体可能犯下弥天大错。〔12〕在信息社会和大数据背景下,倘若同类司法案件无法有效提取和对比,那么人为司法裁判失误不仅更容易放大,也更容易与公众司法期望发生冲突和断裂。道德审判和舆论旋涡必然触发司法公信危机,这是司法裁判在大数据背景下面对的陷阱。

  (二)从法官司法到 AI 司法

  司法大数据引发的公正问题,实际上源于人类智能及其计算工具的有限性所致。对此,人工智能作为计算机科学的重大突破,可以有效处理庞大司法数据,从而应对海量司法数据对司法公正形成的桎梏。

  人工智能是指能够像人类一样具备感知、推理、判断、学习、交流和决策等行为的人造机器智能。〔13〕如果以人类智能为标准,人工智能可以细分为专属于特定领域的“弱 AI”、具有通用功能的“强 AI”,以及超越人类的“超 AI”。目前而言,虽然“图灵测试”作为是人工智能的测试标准存在“行为主义”的缺陷,但根据该可操作性的标准可知,包括法律领域在内的人工智能都处于弱 AI 阶段,距离通用 AI 还有很长的距离要走。

  在技术目标上说,AI 是对复杂信息处理问题的研究。〔14〕而且正如开篇所述,随着硬件和软件的不断更新,特别是复杂算法基础上深度学习的应用,AI已经能够处理复杂法律数据,并具备不断自主优化的能力。人工智能之所以具备解决司法大数据悖论的能力,并在法律框架内对特定案件做出法律裁判,就在于 AI 技术可以通过深度学习对大规模的先例判决进行分类、聚类、分析和关联,形成行为比对模型,从而对待决案件做出判断。与人类的经验认知和非智能化的计算机数据处理相比,AI 能够对大数据中隐含的,以前未知的、潜在有用的信息进行提取。进而,可以找到大数据的逻辑或数学描述,最终表现为一组数据的复杂性质,模式和规律。〔15〕从司法决策者角度而言,无论是工程师,还是司法官员,AI 司法判断都是一个根据司法数据来编写算法和建立模型,进而对预处理案件进行深度处理,在先前裁判结果的谱系之间寻求妥当、一致结果的过程。鉴于此,调适算法和深度学习也是一个不断试错的过程,AI 司法遵循着归纳逻辑前进。至于 AI 能否发展成基于法律规则学习和案件事实直接对接的司法裁判系统,从康德对人类理性是先天综合判断的假说出发,这似乎存在很大疑问。不过,就当前 AI 司法技术所得到的裁判结果而言,其无疑具有以下几个特征。

  其一,合法性。AI 司法建立在庞大的司法数据之上,基本可以为绝大多数案件提供判断的先例、标准和刻度。只要承认特定社会生活的历史连续性和生产性,而不过分强调社会进化的突变性,AI 司法就符合社会演进和法律信念。说到底,AI 司法是对市民社会之上的大量、合法、生效案件逻辑的整合、延续和遵从。如果说小数据背景下的同案同判主要是基于局部信息的识别和遵循,那么基于大数据的人工智能司法更多体现了诉讼对抗中民主沟通和实践理性。由此,AI 司法使用的法律知识,源于生活世界的实践理性对法律规则的理论理性的统合与建构,由此形成法律知识的混合体系。相较于司法三段论,这种司法范式无疑更贴近社会公众的法律经验和公正理念。所以,不管从新自然法学的动态正义角度,还是从现实主义法学的裁判法律说,抑或从法社会学之活法视角观察,它无疑都具有合法性。另外,AI 司法是人类司法借助计算机科学的代码计算所实现的司法形态,是对人类经验式司法的补充和理性思维的强化,这并没有取代人类的司法主体地位。不过,法官司法主体的强化还需要人机信任与协同,人机交互学习的深入。

  其二,逻辑性。AI 是对人脑机能进行逆向工程的建构,从而实现模拟人类思维的产物。AI 以人工神经网络来模拟大脑皮质,通过电子以及光子对数据代码的运算来模拟人类大脑神经对脑电波的回路反应和信息处理。因此,AI 司法与人类司法具有高度共性和等效结构,并具有打破人类法律数据处理局限,超越人类以自然语言来识别整合法律信息和知识的功能。这也是 AI 能够将法律事实的输入和裁判结果输出连接起来的逻辑。当然,这种逻辑分为两部分,一是由人类智能支配的自然语言之上的案件事实输入与裁判结果认定,二是人工智能通过机器语言和数字代码对司法数据的挖掘、规整和判断。虽然这两部分都是数据法学和整体司法的组成部分,但这种更内在的语言联结与整合,并非不言自明。

  其三,精确性。根据韦伯的见解,法的理性化和体系化,一般意味着审判机能的计算可能性的扩大。〔16〕因此,技术的精确化是现代法的重要特征之一。不言而喻,在选择性注意机制和有限理性约束下,人类对经验事实的感知和数据信息判断是粗疏的。与之相反,AI 作为计算机科学的前沿,具有强大的数据存储、清洗和挖掘能力,并且不被外界情感和舆论干扰。AI 司法的该优势,表现为识别提取隐藏法律知识,进行多元分析和渐进决策,并在不断建构和优化决策模型基础上,建构行为类型和法律后果的精准联系。对于奉行罪刑法定原则的刑事司法来说,AI 具备对行为和刑罚进行几何解析和归结的功能,可以为贝卡利亚所期许的“精确的、普遍的犯罪与刑罚的阶梯”提供可能。〔17〕

  其四,复杂性。对于司法过程的公开性和可见性要求而言,如果说以上特征是 AI 对人类司法运算优点的扩展和强化,那么 AI 司法的复杂性无疑构成了自身的局限性和问题点,并对自身优势和司法公正产生扰动。AI 司法以大数据和人工智能的融合为前提,不仅存在司法数据的复杂结构和案例数据增长,深度学习更导致了由代码运算产生的高纬法律知识。技术综合和机制迭代使得人工智能更像是一门无法洞悉和还原深层机制的炼金术。可是,权力和规范是通过互动过程社会性地建构起来的,而不是预先假定供用户采用或需要时使用的。〔18〕科学为我们许诺的是真理,但至少应是我们的智力能够把握的一些有关各种关系的知识,否则相当于没有许诺和平和幸福。〔19〕 因此,复杂性不仅直接构成公众理解 AI 司法过程的障碍,更威胁着 AI 司法的合法性和服从性。此外,数据、算法和硬件实际上形成正反馈关系,因而AI 司法的复杂性趋于增长。对此,如何把握 AI 司法过程的正当性和合理性,或者说,如何确证并展示机器的深度学习掌握了人类期望的司法逻辑,是一个紧迫的问题。

  诚然,最大限度地获取公共法律信息才能促进司法和法治。〔20〕在大数据背景下,司法数据的智能化处理必然导致社会司法公正理念的革新,以及对公正概念的期望重构。就具体的公正取向而言,人工智能法学的产生必然将同案同判的司法形态与唯理主义的规范适用处于同等地位,而且前者甚至会超越和摄动后者。不过问题在于,数字驱动导致了数据加工和信息处理的复杂化,AI 司法无法像人一样运用自然语言,并对输入与输出之间的法律计算进行细致论证与展示。正因如此,智能司法的逻辑判断存在隐秘化,或黑箱化,并可能妨害新型的司法理念扩散,无法彻底取信于民。对此,AI 作为人类司法的组成部分仍需遵循一项法律定律:法律的应用以解释为前提,法律的解释服务于法律的应用。〔21〕 因此,在既定法律解释原则内,法官的司法裁判必须与 AI 运算过程协同起来,在探查司法解释任务变动基础上,对此加以阐明。

  三、法律解释的挑战:代码运算和法律论证

  在分析大数据所带来的公正理念变革,以及阐明AI 司法的隐秘化问题之后,就需要深度剖析司法智能化与人类法律论证之间冲突的深层机制,寻找双方功能耦合的途径。具体而言,从 AI 司法和人类司法各自的逻辑上说,能否认为 AI 司法在技术上和理论上可以实现并替代法官的法律论证,从而贯穿和整合司法逻辑呢? 在本文看来,即便 AI 司法发展到超人工智能阶段,法官的裁判解释依然具有不可取代的地位和价值。

  (一) AI 司法运算的不可还原性

  首先,AI 之所以需要建立在大数据之上,并出现AI 与大数据的融合,以及两者界限的模糊,原因在于人类基于小数据的独特创造性思维是 AI 目前无法模仿的。自从康德在哲学上发动了认知革命,以先天综合判断将唯理论和经验结合起来之后,我们通常认为,人类的认知既包括人脑的先天综合形式,也包括对感官经验质料的加工。不过,运用理性对少量信息和规则进行推理和演绎,似乎是人类独有的能力。这也是基于规则演绎的司法专家系统没有兴盛起来的原因。

  从上述结论出发对人工智能技术进行哲学反思,AI 存在两个学派:一个表现为理性主义、逻辑主义,以操作思维符号为特征的还原论;另一个是把计算机看作模拟大脑,借助人工神经和统计学,通过学习实现智能的神经科学。〔14〕 当前人工智能选择了第二种路径进行建构。深度学习实际上就是将传统的人工神经元网络的内置层的层级予以规模放大的产物,并不是对传统人工神经元计算模型的原则性突破。〔22〕 因为,一方面,机器智能不具有人类的感觉、知觉和情感,也无法通过探索自然,经验社会和建立家庭来完成个性的历史塑造,它必须通过大数据来学习完成。通过这种学习,AI 一定程度上可以克服思维模式困境,尤其是弥补 AI 与特定社会文化常识之间的差距。对于司法判断而言,AI 无法仅仅根据法律规范和原则就对特定案件出裁判,而需要通过大量司法案例作为训练数据来学习和建模。另一方面,我们很难将法律规则的模糊性和灵活性,转换成可以被机器理解的形式化语言。〔23〕 即便是对于比较精确的刑法规范,规范要素、违法性判断、责任阻却事由,由于其中包含微妙的价值权衡,同样很难通过代码加以计算。因此,AI 需要通过大数据和深度学习,尽可能多的掌握相关法律知识及其关联。

  其次,基于上述知识背景和技术逻辑,AI 计算的复杂化与智慧性呈正相关关系,我们只能把握输入和输出的确定性,无法还原黑箱的计算过程。概言之,深度学习的本质,是以不断递归和卷积的深度神经网络为前提,通过非线性系统建模来提供更高层次的抽象能力。这是其优于人类线性思维能力的根本原因。这种结构可以弥补算法的不足,自动取得对司法数据规律的深刻把握,最终增强对司法裁判结果的正确性与可接受性。这意味着,即便司法算法比较简单,但随着模型的复杂性增大,正反交叉运算过程必然导致司法运算变得难以还原。“即使当用户坐下来研究数据挖掘操作时,他们可能也无法理解导致结果的推理。特定的技术是很难理解的,即使是那些设计和编程它们的人也是如此。”〔24〕 这是 AI 司法运算的不可还原的根据。

  辩证的审视这一缺陷,AI 司法借此可以更好地维护司法的客观性,同时祛除人为干扰。不过,AI 的复杂性也威胁着司法透明,进而危及合法性与合理性。对于推崇说理的司法参与者来说,没有判决理由或理由软弱,就无法保证判决不具有任意性或不公平性。〔25〕 对此,问题的解决必须遵循黑箱原理,通过司法输入和司法输出之间的相互反馈加以解决,并以此为作为法官裁判解释的操作原理。换句话说,人类始终是司法裁断的主体,司法者必须以自身理性对AI 的技术理性在社会合意性和有效性上进行整合和解释。这也是克服 AI 司法过程中的二元逻辑断裂,支持整体司法理性的担保。

  (二) 法律解释任务的变动

  第一,数据偏差需要法官的法律解释进行矫正。人类司法对 AI 技术的运用,必然以数据信任为前提。但在大数据时代,我们需要重塑这种认知和信任。概言之,“我们必须确定何时和如何信任数据科学的发现,以及在何处或在何种程度上不信任它们。我们信任推断知识的这种重建,需要实证检验和基本的分析竞争性。”〔23〕

  以既定生效判决为 AI 分析对象的大数据,即便个案存在问题甚至错误,其整体的合法性依然能够提供可信赖性。不过,从特定案例的存量和增量上看,司法大数据可以进一步细化和量化。数据必然存在不同规模的先例集成。小数据背景下,我们更多的凭借自身理性去弥补并接受较少抽样下的误差,但大数据背景下,较多的或更多的样本群误差则必须警惕。随机、偶然、涨落和混沌在 AI 系统中扮演着重要角色。人工智能的深度神经网络和机器学习高度依赖的裁判文书是不是充分的大数据,这是必须考虑的大问题。“在这样的情况之下,司法领域应用 AI 构建出来的具体裁判模型,很有可能与实际裁判形成偏差,如果充分信赖有偏差的模型,那就会存在严重的问题。”〔26〕 法官的法律解释作为司法的逻辑论证,需要承担数据的确证的监护功能。

  第二,案例数据参照需要法官通过解释技术加以权衡。如上所述,司法大数据其实存在不同规模的案例数据集,包含着多元行为类型、法律后果以及要素间的关联。质言之,遵循的“先例”其实可以分为三种类型:大数据先例、中数据先例和小数据先例。这三种数据理论上分别代表了一般的公共司法理念、协商后的司法理念和待继续协商的司法理念。从维护法律秩序的稳定性和保障公民的期待可能性出发,不管是相同或差异行为模式,越是大规模的数据集,越需要法官遵从;而越小的数据集,法官遵从的可能性和必要性就会缩减。这同样基于平等原则,以及法律心理认知的连续性和一致性。

  可是,倘若从该司法逻辑出发,恐怕同时潜藏两种司法风险,即,AI 司法在大数据先例中侵夺了法官裁判的司法创造性,在小数据先例中架空了案例指导的事实价值。当然,情况也可能完全相反。因为即使是小数据先例,“如果要想让诉讼人确信法院司法活动是公平的,那么坚持先例必须是一个规则而不是一个例外。”〔27〕 于是,发掘和引入数据之外的新案例的正当理由,也就是法官通过法律解释和论证对数据参照进行遴选,从而权衡维持法律逻辑的一致性和变革性的过程。

  第三,代码运算需要法官解释嵌入公共理性。即便数据和算法完全正确,即便人工智能通过网络空间学习可以获得特定社会常识和文化知识,但是社会发展和公共政策是同时变动的。法律政策既然是公共政策组成部分,自然需要将公共政策作为 AI 司法过程的变动参数,与诉讼人的具体处境结合起来。无论是政策变动,还是政策考量和执行,都是司法数据和AI 的环境要素。如后所述,程序员对法律的算法编程与法官对法律的理解无法置换。因此,司法者必须通过法律解释来体现和贯彻公共政策,以防范和矫正AI 司法过程可能潜藏的不良价值取向、道德倾向和伦理风险。公共政策在 AI 司法中的贯彻和执行,就需要法官深刻把握不同要素权重,尤其是规范要素含义和裁判结果变化之间的关系,并以文字语言向诉讼人进行阐述和论证。

  第四,算法检验与具体裁判解释相关联。在人工智能生态中,算法处于更加基础性地位。从预防 AI法律风险的角度而言,理想的司法算法创意和优化要求司法者和工程师角色统一起来。不过,从社会职业分工趋势来说,这两种角色只会协同互动,不会合二为一。验证司法算法的正确性、合理性,仅仅诉诸编程者的自我确证显然是行不通的。不难断定,这只能通过法官在具体司法过程中的解释论证来检视和验证,以便确定算法有无漏洞和暗门,并推动算法与法律逻辑的不断接近。在此基础上,法官的裁判解释是良性原始数据和文本的生产过程,也构成优化 AI 司法参数,甚至创造新算法的条件。尽管能否基于“硅基伦理”从而在法律上将人工智能作为人来对待,并使其承担主体责任还很难预测。〔28〕 但就现实而言,算法验证还与 AI 司法中的风险预防、责任分配,乃至技术理性的批判和进化割舍不断。

  综上可知,司法大数据处理的智能化,实际上是机器语言突破和扬弃人工语言的模糊性,在既定先例数据集之上对待决案件的识别、归类和匹配,从而解决人类司法不确定性。在这个意义上,这是法律科学借助人工智能采取的实证化表现,但这并未否定司法裁判和法学隶属于规范世界的本质。相反,正如考夫曼所言,没有分析学的法律诠释可能是盲目的,同时没有诠释学的分析学可能是空洞的。〔29〕然而,AI 司法虽具备分析优势,但机器语言在法教义学中的出现却是法律解释必须面对的新课题。

  四、司法理性的调适:人机协同与诠释节点

  我国正在法律实践领域探索大数据的司法应用,推进“智慧法院”建设。〔30〕 但在具体的司法裁判中,如何通过具体的法律解释有效整合人工智能对于司法理性的冲击,使得裁判结果符合社会公正期待,是法理学和部门法学亟待研究的人机协同问题。一定意义上,AI 就是人类的司法工具,同时也是法官的司法环境。这不仅关系司法权力和理性的自我确证,而且关系人类智能和机器智能的本体论和价值论。然而,司法决策是一个令人生畏的复杂领域,除了需要考察分析大量事实、规则、先例或者它们的组合,以便形成合法的解决方案,更重要的是,个别案件可能涉及重要的利益和深刻的感情,他们的解决办法影响到所有法律行为者的期望,并影响他们对法律制度的理解。〔31〕因为一切国家行动,即使就其细节来说是特殊的,但就其意蕴和道理则是普遍的,无不取决于与公共利益的关系。〔32〕因此,从方法论和认识论上而言,人机协同要求法院的裁判解释,要根据 AI 司法的特征,对整体司法的过程和结果进行调控,使 AI 司法和人类司法取长补短。

  可以肯定的是,AI 司法所引起的裁判解释问题,并非是能够单纯通过算法将社会道德、公共情感和法律公正嵌入代码可以解决的。AI 是人脑智能的延伸和补充,AI 司法则是人类司法的强化和优化,前者无法取代后者。法律解释作为法律理性的体现和司法应用的保障,即便是人工智能发展到超人工智能的地步,从主体论的角度来说,司法者都必须支配整体法律解释过程,防止过度依赖 AI 导致的司法异化。虽然有论者指出,人工智能系统被设计成使得它们的输入多样性,差异化,并通过以重复、稳定的方式实现许多类型的计算过程,因而解释系统就可以用原始的输入集合来考察 AI,并且通过逆向的原始输入替换来考察不同要素的权重。〔33〕不过该论者也承认,将 AI系统中的输入和中间过程映射到人类可解释的概念上将会遇到挑战,而如果相关因素不能预先确定,挑战就会加剧。本文也认为,通过技术手段能够不断改善 AI 司法过程的透明化,但从整体司法逻辑来看,法院裁判的法律解释应当根据 AI 司法的优势与不足加以补充和调适。

  如前所述,AI 司法能够充分挖掘司法大数据中的隐秘知识、深层规律和行为结果模型,并且这些都属于不断迭代学习形成高维知识,难以降维还原为人类理解的知识。在黑箱原理之下,法官的法律解释需要通过增减和替换不同法律参数来检验行为集合及其子集与法律后果之间的对应谱系和边际效果。在此意义上,人类的法律语言相对于 AI 的机器语言就获得了元语言的价值。法律解释事实上是元语言的自然语言对机器语言的诠释过程,是生活世界对技术理性的对接和吸纳,以防止技术理性以极端的方式超出和颠覆市民社会的司法受众的生活常识和想象。换言之,人工智能司法不但重塑司法公正理念和丰富司法公正形态,也必然导致传统法律解释范式的变迁。本文认为,审慎和准确地调适 AI 司法中具体案件的解释,至少应当注意以下方面:

  第一、案例数据是否充足? 如前所述,当前人工智能的主流模式建筑在深度神经网络模型之上,通过对相关信息和知识进行识别和提取来完成机器学习,因此大数据是 AI 训练的基础。虽然我们将人工智能定位为“智能助手”,人类才是最终的司法决策者。但从人工智能的司法逻辑本质上是“遵循先例”来看,真正基于大数据的裁判结果固然具有信赖性,可是数据相对有限和不足时,恐怕更需要发挥人类司法决策的主体性和能动性。概言之,在人工智能司法背景下,数据规模是决定法院的裁判解释是应当遵循程式化解释路径,还是更多的考虑非程式化解释方法,继而安排法律解释方式和技术的基石。具体而言,对数据规模与法律解释的关联应当注意以下三点:

  (1)当数据足够庞大时,意味着 AI 司法裁判原型是一个高纬、复杂、开放的连续图式。这意味着人工智能司法的裁判能够完成待决案件与案例模型的数据拟合,裁判结果更具有社会历史的连续性和确定性。(2)与前者相反,当数据有限甚至不足时,AI 司法裁判原型更类似于界限清晰、封闭、非连续的二元阶梯。然而由于统计归纳的缺陷,“如果司法决策者只能进行二元选择时,那么与存在一系列选择的情况相比,他们更有可能犯下重大错误”。〔34〕 这种错误不仅人类司法无法避免,人工智能司法可能更加无法避免。因为人工智能的司法裁判奉行的是形式逻辑计算,而不是辩证否定性推理。(3)从前述逻辑出发不难发现,司法数据规模的大和小是相对而言的,并且相互之间并不存在明晰界限。大数据判例包括了各种细微差别的中数据和较大差异的小数据。碎片化的小数据和相对连续的中数据随着裁判案件的增多,可能会发展成规模庞大、连续性的大数据。换言之,尽管大数据是人工智能司法的核心技术之一,但应当辩证发展地看待大数据的发生与塑造,因而也应当辩证地配置相应的机器信任和人类智能。

  笔者认为,人工智能司法采取何种数据参照和解释路径,需要权衡待决案件的共性和个性进行具体判断。准确地说,对于人工智能司法而言,司法权力应当对基于大数据的裁判给予充分信任,对基于中数据的裁判应当仔细甄别和遴选行为类型,对于小数据的裁判恐怕更需要法官智慧进行主导,并促进司法中数据和大数据的生产。总之,人工智能司法应当考虑数据规模,并根据具体情况采取不同的解释技术,妥当采用文理解释、目的解释、社会解释和体系解释方法。

  第二、裁判结果是否合理? 裁判结果合理与否及其合理的程度,取决于能否以及在多大程度上实现法律规范目的。这种目的虽然由立法机关所赋予,但是法律规范目的的理解需要在尊重形式合法性的前提下,把握客观实质合理性。因此,即便是 AI 在大数据基础上取得裁判结果,即便这种结果十分精细、确定和可靠,也有必要加以规范审视。质言之,法官作为人工智能司法的裁判主体,既应当注意到司法数据的客观性和事实性,从而促进司法结果在一般公正意义上的连续性和普适性,也需要法官结合立法的规范目的和法律政策对个案结果加以反思和检视。美国大法官布雷耶曾经指出,历史教训表明,当最高法院的判决不被主流民意接受,甚至遭遇总统、国会的抵制时,司法机关保障人权、节制公权的作用将彻底失灵。〔35〕 该结论虽然针对人类司法而言,但同样适用于人工智能司法的裁判结果。

  不言而喻,与人类司法相比,AI 司法长于对判例大数据的客观把握和总体整合,精于高纬抽象和关联计算,但是任何司法案例都嵌套于过往历史的文化积淀和民族传统之中,是过往历史文化的延续。这种历史文化逻辑也是司法的人类基因,奠定了司法裁判获得生活世界接受和市民社会服从的前提。在社会发展日新月异的今天,特别是人工智能司法的诞生和应用,注重司法结果的稳定性、延续性和可接受性,对生活世界的市民主体而言当然更具有特别意义。因此,对于人工智能司法的裁判结果,既要给予充分信任,又应当通过法律解释注意结果的合理性和妥当性,尤其是不能因人工智能司法的优势而忽视公共政策和社会情事的变迁。司法审判既然是公共服务的关键部分,那么 AI 司法也就无法获得免检资格。显然,这只能通过法官坚持从法律条文的规范目的出发,联系刑事政策与公共政策的社会取向和价值判断,采取或积极或消极的解释态度,对裁判结果进行权衡、确认和调适。总之,对裁判结果合理性的审查和调适,是人工智能裁判在市民社会取得合法性的途径。

  第三、因果关系是否相当? 众所周知,相关关系是大数据分析的重要特征,而因果关系无论采取何种学说,都因高度规范性而不同于前者。详言之,司法大数据的智能化能够在多元法律知识要素之间建立复杂高纬联系,以便 AI 对输入的司法数据进行考察、提取和匹配。“通过合理时间内大数据的处理和交互,大数据分析可以促进以前的隐藏洞见的出现,揭示未知趋势和演化模式,从而支持有效预测,去除抽样和民意调查,促进新的更具调查性和确定性的数据分析方法,达至更可靠和更精确的结果。”〔36〕大数据分析通过抓取多元数据集之间的关联,是高级分析的必要条件,尽管具有随机性,却具有可预测性。〔37〕尽管相关关系可以改进认知偏差,导向因果关系,甚至生成具有法律意义的统计性因果关系,但是法学在不违背科学规律基础上,必须按照自身目标来认定因果关系。从这一结论出发,司法者应当结合时代科学知识和一般社会通识,对 AI 司法裁判过程中的法律要素进行规范性把握。因此,不应当将事实知识和规范知识相混淆,从而将相关关系误认为因果关系,也不应当忽视人工智能通过数据挖掘和机器学习所得到的隐性知识和不确定知识,因为后者在法律规范目的下可能是建构新的因果关系的源泉。

  第四、正反计算是否对称? AI 司法过程仍然是庭审中诉讼双方博弈的延续。既然如此,AI 司法必然要将有利和不利、加重或减轻责任的事实转化为可替换、梯度性处理数据的计算参数,进而辩证地对 AI计算过程进行交叉检验,作出更审慎公正的解释和裁判。这种正反计算过程不仅是司法规律要求使然,其实也是防止数据计算偏差,尤其是防范和检验人工司法的算法歧视和偏颇的司法举措。如前所述,算法在人工智能生态中处于基础性地位,而验证司法算法的正确性、合理性,仅仅诉诸编程者的自我确证显然是行不通的。因此,对于人工智能司法中防止算法帝国的擅断形成,就需要更加稳健精细的司法步骤进行正反计算,从而形成对算法技术的分权制衡。可以说,人工智能司法基于算法的底层建构,既带来了司法公正观念和司法权力的重构,也必然要求司法程序采取辩证的反思性计算。对公正的司法而言,法官的司法决策和论证,都需要对一个事件为真的证据或者可能性的程度进行评价,考虑把有罪误判为无罪、无罪误判为有罪的影响。〔38〕这样做的好处在于,一方面,可以参考以往同类案件大数据决策的一般模式,促进司法统一和公共预测可能性;另一方面,这种正方两方面的数据替换和结果预测,也可以有效回应诉讼双方的关切焦点,做出符合法律共同体思维的回答。

  不仅如此,正反计算还是数据质量和深度学习进化的前提和保障。美国政府于 2001 通过的《数据质量法案》规定,联邦机构应当将其决定建立在高质量数据上,并允许公众质疑和纠正不准确的数据。〔39〕可是,与小数据的容易监控和纠正不同,大数据处于高速增长过程中,这就增加了数据纠错的难度,尤其是对于一般社会公众而言,该规定或许更多的是一种政府形象管理。与一般公众相比,对于数据风险和机器学习偏差,法官不仅无法置身事外,而且必须通过法律解释积极参与其中。这是其作为裁判主体的地位要求,也是控制人工智能司法风险的必然要求。反过来说,司法判例作为机器学习的训练数据和裁判参照标准,法官倘若无法通过适当的手段和逻辑矫正数据偏差,由此导致的司法惯性不仅直接影响司法公正,更可能导致司法过程中人类主体地位的堕落。鉴于此,与人工智能对司法过程的简化相比,通过正反计算以及梯度审查就是必要的再复杂化和精细化。这符合司法的内在构造与逻辑。换言之,司法作为诉讼双方的对抗过程,其对抗性自然应当延伸和适用于司法数据,从而保证司法质量。AI 司法既是运用以往数据的过程,同时也是生产和加工新数据的过程。因此,遵循司法审判的基本规律,就有必要将法律解释过程和数据监测、控制、纠正、改进统一起来。显然,通过正反对称性计算,法官不仅可以实现顺应司法的诉讼结构和公正权衡,还可以保障数据质量,促进机器学习,防控 AI 司法危险。

  五、结语

  人工智能司法的产生,不仅解决了从司法小数据到司法大数据转向过程中法律知识提取的难题,而且重塑了同案同判的公正理念。但从人工智能技术的内在局限和复杂性出发,法官也必须调整法律解释的方向和策略,以适应人工智能司法进程。从立法论角度来看,人工智能的发展必然导致智能技术规范转变为法律行为规范,以防控技术异化。相应的,人工智能的司法逻辑也需要法律解释技术吸收和融合技术操作规范,对技术理性进行审视与整合,对自身进行优化和扬弃。这是法官作为司法裁判的主体以及面对技术阶层的权力虹吸,司法机制需要采取的能动策略。

  随着“以信息技术与制造技术深度融合为主线,以新一代人工智能技术的产业化和集成应用为重点,推进人工智能和制造业深度融合,加快制造强国和网络强国建设”〔40〕 的政策展开,中国的智能社会日渐临近。从智能社会是信息社会的发达阶段上来说,工业主义基础上的传统司法的宏大叙事势必将彻底不复存在,但后结构主义法学的解释延异和去中心化逻辑尽管促进了司法民主和话语平等,但国家权力作为必要的权威中心并不因此而被否定,甚至有必要加以适当强化和维护。将这一结论适用于人工智能的司法场域,不难断言,在 AI 司法是人类司法强化的结论下,人类司法对 AI 司法同时需要互信协同和反思存疑。机器学习已从不同层次对规范与事实进行了复杂关联,并表达为全新的认知结果,但其优势与弊端交织。无论如何,在人工智能和司法逻辑之间,司法权作为一种裁判权,需要以法律解释来担当人机协同的接口,以自然语言连接和融通机器语言,以法律解释调适来推动智能司法变革。

  对此,法官需要将人工智能司法过程中法律符号系统的关键节点:案例数据的充足性,裁判结果的合理性,因果关系的相当性,以及正反计算的对称性等作为诠释节点,以完成 AI 司法裁判的证成。这不仅涉及司法数据的良性循环,道德、伦理、政策与 AI 司法运算的融合,而且也根植于算法学习、高纬抽象和数据分析不能取代并需要重建以价值规范为基础的生活世界和社会交往。当然,从数据增长和 AI 进化上看,建构并提升司法公正框架下的人机信任、人机协同和人机学习,还需要将特定技术规范规定为新的解释规范,内化为人工智能司法的信条,并最终推进诠释节点的精准化、结构化和法治化。原载《法律科学》 (西北政法大学学报) 2018 年第 5 期

        
        
      首都法学网       北京市高级人民法院       中美法律信息与图书馆论坛(CAFLL)
      国家图书馆       美国法律图书馆学会(AALL)       国家检察官学院
      中国社科院法学所图书馆       国际法律图书馆协会(IALL)       最高人民法院图书馆

主管单位:中国法学会  主办单位:中国法学法律网合作机制 技术支持:北大英华科技有限公司(北大法宝)
电话:010-82668266-152 传真:010-82668268
加入收藏 | 本站首页 | 联系我们
go