2016年初,国家发改委印发了《关于组织实施促进大数据发展重大工程的通知》,重点支持大数据共享开放,提出建立完善公共数据开放制度和建立统一的公共数据共享开放平台体系的要求,为公共数据的开放与共享打响了前哨。作为社会公共数据重要组成部分的司法数据,是司法机关司法活动信息的客观记录,除了如实反映司法工作情况之外,也是研究法律实施情况、社会综治情况、经济社会发展情况的重要参照。[1]在数据快速流转的大数据时代,只有共享的数据资源才能释放出数据的价值。[2]司法大数据的开放与共享,不仅顺应了大数据发展潮流,也是司法机关积极回应时代司法需求,实现司法工作现代化的必由之路。
一、司法数据的权属问题
目前学界对于司法大数据的研究主要集中于数据应用方面,如有学者提出构建统一的刑事司法数据库,[3]有学者提出应将大数据应用于司法改革的各项改革工作中,[4]还有学者将司法大数据与审判管理和监督联系起来进行研究。[5]对于司法数据的基础问题、司法数据权属的问题则鲜有专门研究。明晰产权是建立数据流通规则和秩序的前提条件,[6]数据权属问题是大数据时代各行各业数据开发与利用的核心。为此,司法大数据的研究也必须回归到司法数据的权属研究上来,解决司法数据应用的法律障碍。
从宏观上而言,作为公共数据的司法数据,其内容关涉了诸如犯罪与刑罚等影响经济和社会运行的基础材料。对公民权利保障和企业经营决策具有重要影响,其采集过程依靠国家强制力和国家财政予以支持,数据的开放与利用也同样依靠国家财政支持,从此意义上来说,司法数据从权属上来说应属于国家所有。但数据权属问题如此界定,未免太过笼统和欠缺周全考虑,对此,我们可以回归到数据开放与共享本身,从其利用开放过程中分析其间数据的权利归属以及变化。数据的利用是一个连续的过程,其内含了采集、存储、分析、交易与应用等诸多环节,数据的采集是一切数据利用活动的开端,也是数据权属认定的起点。数据的价值首先在于其记录的内容,所以数据的权属应先归属于被记录方。其次,在大数据时代的数据利用过程里,未经加工的原始数据价值微乎其微,数据的“二次开发”才是数据利用的关键和价值的飞跃,故而,加工者也有对数据加工的内容要求权属认定的权利。
具体到司法数据的采集与应用过程中,承担数据采集和记录任务的即为国家各级司法机关,但司法数据并非当然地属于司法机关所有,而首先应当归属于被记录人,如人民法院采集的当事人信息在未经整理和加工原始状态下,应由被采集的当事人个人所有。但数据的采集只是整个数据利用过程的起点,司法机关在后续的数据整理、存储和利用中,将对数据进行二次加工和开发,经此过程之后的数据与原始数据发生了本质性的改变,附着在原始数据之上的被记录人的人身属性自然应被剥离。故此,司法机关应对其加工后的数据信息享有所有权。但应特别注意的是,司法机关所享有的司法数据的所有权是附条件的,除了在数据收集时应获得被记录人同意之外,司法机关还应遵循基本的信息使用伦理,即不能侵犯个人隐私、商业秘密和国家机密。
二、司法大数据开放与共享的必要性
(一)提高司法质效,维护司法公正
作为检验司法工作的一面“镜子”,司法数据可以使全社会方便了解各项制度的运行情况、各级司法机关的工作情况,客观的司法数据也将提高司法管理和司法监督的科学性,改变以前靠走访调研、领导视察、听取汇报等传统管理方式获取数据不够全面客观的问题。司法数据的全面开放,不仅在司法机关内部对司法人员和司法活动起到了切实的监督作用,同时也会因为司法工作情况“曝光”在社会公众面前,形成更多的社会监督压力,督促司法机关规范司法行为,防止和遏制司法腐败,从而起到提高司法质效、维护司法公正的作用。
(二)辅助司法决策,深化司法改革
现代社会需要现代化的治理思维和治理方式,仅凭经验进行决策的传统治理方式已经不适应当下改革实践的要求。大数据技术为社会提供了利用海量数据资源的可能,改变了以往只能通过抽样调查对现状进行估计的工作方式,由此可以大大提高改革与决策的科学性。以本次司法改革为例,司法改革作为系统的司法体制和机制的改革,需要对目前司法运行的基本情况进行全面的统计和评估,提供翔实的数据材料以保证改革方案的科学合理。作为本次司法改革的重心所在,员额制改革、司法责任制改革、司法权力运行机制改革以及执行制度改革,跨行政区域的司法组织建设等内容,需要根据各地经济社会发展情况、各级司法机关的建设情况、科学核算人案数量、案件权重、人均结案率、办案效率等基础数据,通过充分的司法数据来辅助改革方案的制定和落实。上海作为全国司法改革的探路者,在法官、司法辅助人员、司法行政人员三类人员比例设计中,通过大数据的数据采集方式,以2013年12月底为基准时间点,先测算出上海法院系统法官的办案工作量,再推算出上海法院系统审判工作需要的法官数量总额,综合考虑各个法院的实际情况后,依据案件权重以及今后案件的发展趋势等数据,科学测算出33%的法官员额比例,[7]远低于中央规定的法官员额比例上限,为各地的司法改革提供了良好的借鉴和经验。
(三)促进法律实施,推进依法治国
经过三十余年密集的立法实践,中国特色社会主义法律体系已经基本形成,由此我国法治建设的重点就从法律制定转移到了法律的实施和完善上来,通过对法律实施效果的评估,解决法律适用中出现的问题,以推动法制的健全和完善。司法作为法律实施的重要领域,司法数据中蕴含了大量的法律适用信息,是检验立法实施效果、推动立法完善的重要手段。司法通过对宪法和法律的适用,成为沟通立法与社会的纽带,发挥着重要的枢纽作用。同时,宪法和法律的实施正是当代法治建设的基本内涵,也是全面推进依法治国的时代要求。[8]借由司法数据的开放与共享,在明确法律适用现状与问题的基础上,通过法律的实施与完善,实现了依法治国的推进和深入。
(四)参与社会治理,服务社会发展
司法作为社会治理和纠纷解决的重要方式,大量反映社会矛盾和社会发展状况的信息都被储存在司法数据之中,通过对司法数据的整理和深入分析,即可以从中解码出经济社会发展的基本情况,如,“通过刑事犯罪的分布情况可以得出社会治安维护的重点区域,通过商事案件立案信息分析经济领域的最新动向”等,可以说司法统计的案件信息就是经济社会发展状况的“晴雨表”。[9]关涉社会生活方方面面的司法数据的开放与共享,将极大地降低相关主体数据收集成本,为企业经济决策和社会治理提供数据支持,为我国产业转型升级、经济社会的良性发展注入充沛动力。
三、司法大数据开放与共享的现状与障碍
随着本轮司法改革的深入,顺应大数据的时代发展潮流,我国司法机关以司法公开和司法信息化建设为抓手,积极推动司法数据的开放与共享,目前已经在裁判文书公开、执行信息公开和司法工作流程公开等方面取得了丰硕的成果,为司法大数据的进一步发展奠定了坚实的基础,但目前司法大数据开放与共享的实现还须解决一系列体制与机制障碍。
(一)局部性的开放与共享,缺乏顶层设计和规划
随着“大数据、互联网+、云计算”等互联网技术发展的最新成果进入社会,司法机关积极配合中央大数据的发展战略,顺应时代潮流对司法工作提出的全新要求,提出了全面推进司法公开和司法信息化的要求,最高人民法院在此方面成果显著。从2014年开始已经逐步实现了生效裁判文书全部上网工作,在裁判文书公开平台之外还建立了执行信息公开平台和审判流程公开平台;但就目前已经公开的司法数据来看:数据的整理、分类与应用程度还远远不够,以中国裁判文书网为例,目前网站所收录的文书总量已经达到2030万篇,并且以每日新增2万篇以上的速度规模不断扩大,但其分类检索功能建设还处于初级阶段,检索项设置还比较简单,关键词检索还不够智能;而且文书下载还不太便利。这些问题都极大地影响了数据库的使用,需要不断完善。
同时,在缺乏顶层设计和规划的情况下,目前司法机关所开放和共享的数据呈现出强烈的局部性和碎片化的特征。在裁判文书和执行信息领域的数据开放虽然卓有成效,但如火如荼的热闹依然掩盖不了数据开放系统性的缺失,诸如司法数据应包含哪些内容,可以公开哪些内容等基础性和根本性问题被选择性回避和忽视。目前司法数据的开放与共享工作依然遵循的是“摸着石头过河”式的增量改革进路,选择阻碍最小的数据内容进行开放,至于其他内容的开放是否能够及时跟进,则陷入了不可预知和不可估计的政策等待之中。司法数据的开放与共享工作,在司法改革视野内作为改革的一部分,一定程度上也出现了广受学者诟病的系统性和导向性不足的问题。[10]司法大数据建设的最终目标和实现路径尚未明晰,司法数据开放与共享的清单尚未建立,司法数据的开放缺乏有效的规划和目标指引。
(二)司法数据开放与共享的相关立法滞后
对于司法数据的统计、储存、利用、开放与共享等内容,国内还没有专门的法律法规予以规范。目前司法数据的开放只能依靠司法机关法律解释或内部文件进行规范,但这些规定只是针对部分司法数据的开放工作,并不能对司法大数据的建设和发展提供立法支持。作为借鉴,国内政务数据的公开工作则相对成熟和规范,2008年国务院就颁布了《政府信息公开条例》对政府信息公开的范围和程序等进行了系统的规定,但遗憾的是该条例的使用对象只包括行政机关,司法机关的数据开放与共享工作无法被纳入其中在司法数据的管理和开放工作方面。目前可以参照的法律只有《保密法》及各地实施细则中的相关规定,而《保密法》对保密事项的模糊规定,事实上使大量的司法数据被划入保密信息管理,[11](P6)更是增加了司法数据开放与共享的难度。而除此之外,随着裁判文书等数据的先行开放,可以预见关于数据的知识产权保护、个人隐私保护、商业秘密保护、国家信息安全保障等问题将逐渐受到社会关注,对此,我们理应未雨绸缪,由相关部门以专门立法的形式进行规定。
(三)部门之间存在数据堡垒,信息孤岛现象严重
司法数据作为司法机关进行司法活动的记录,绝大部分的司法数据是由司法机关所拥有,这里的司法机关包括审判机关、检察机关和司法行政管理机关。司法数据的开放与共享首先应实现司法数据的有效整合,包括部门间的横向数据整合以及上下级间的纵向数据整合。我国司法机关的管理一定程度上受到了行政管理模式的影响,部门之间条块分割严重,同时受到权限问题、保密问题甚至是部门利益问题的影响,司法机关之间缺乏基本的协调与共享机制,在“各自为政”的思维之下,不同机关产生的司法数据都被其当作了部门所有的私产,不愿意与其他司法机关共享。此外,司法机关内部上下级之间也存在着数据堡垒,长期以来司法统计工作采取的都是逐级上报的方式,下级司法机关无法接触到上级司法机关的信息,单向度的数据传输造成了司法数据在内部都无法正常流转和共享的局面。
除了部门间存在数据堡垒之外,司法数据还出现了信息孤岛现象,所描述的其他方面的问题,如数据的利用率低、交互性低等问题。具体而言,目前各类司法数据的切分过于粗放,信息杂乱孤立,[12](P574)数据开放与共享的平台尚未建立,这就导致了司法数据无法被成批量地进行应用,数据利用的智能化程度还很低,如系统不能直接生成动态的司法运行状况,也不能实现根据用户需求进行个人定制的数据服务。大数据时代的数据开放与共享,并非是简单的数据的公开,而应是建立在数据“乘法融合”[13]下与社会发展的协同和共享。
(四)司法数据开放与共享的人财物保障不足
司法数据开放与共享的前提是司法统计工作的良好开展,司法统计虽然是司法机关基础性的调研活动,[14](P3)但是出于种种客观条件的限制,该工作并未得到充分的物质保障和人力资源保障。司法信息建设需要长期投入大量的人力、物力、财力,[15](P347)目前我国司法经费、人员供养主要依靠地方财政进行支持,虽然有省级和中央专项财政补助,但各地经济社会发展状况的差异还是直接影响到了各地司法统计和司法信息化工作的发展程度。在本次司法改革之后,省以下司法机关人财物都将进行统一管理,这一举措在理论上解决各地司法机关信息化建设上保障不足和差异较大的问题,但是就目前来看,省级统管的改革还处于试点阶段,各项具体的工作制度尚未完善,在过渡期间司法机关的经济物质保障依然要受到地方财政的制约。
由于受到各地经济发展状况的制约,各地司法机关在司法数据收集和统计方面所具备的硬件设施、软件条件以及人才储备情况有巨大差异。在全国信息化建设不断完善的情况下,不少中西部地区的司法机关还需要依靠人工手填司法报表的方式进行数据的收集与上报;而在司法数据的软件应用上的问题则更为突出,主要体现为各省司法机关之间案件管理系统和数据收集系统的不兼容,甚至是司法统计的指标设置都不完全匹配,这无疑给地区之间司法数据的融合造成了困难。人员保障不足的问题主要体现为司法机关内部拥有统计学或信息管理学知识的工作人员很少,在实践中进行司法统计工作的基本为刚入职的年轻书记员或者各科室内勤人员,在缺乏基本的统计知识的情况下,司法统计员流动性大的实际情况影响了工作连续稳定的开展,直接对司法数据的质量保障造成了冲击。
四、司法大数据开放与共享的实施路径
(一)重视司法大数据的开放与共享工作
司法大数据的建设并非只是司法工作的辅助,而是推动司法工作信息化和现代化转型的重要方式。大数据技术和思维在司法领域的应用,将改变目前司法统计中陈旧的工作方式,实现数据的高效收集和处理,并及时将司法数据向社会开放,从而与社会进行良好的数据交流和互动在进行数据传播之外,司法大数据工程还将提高司法机关的服务意识,促进司法机关的转型步伐,实现司法决策与管理的科学性。目前各级司法机关对于数据开放与共享的重要性还认识不清,不少人将其视为“装点门面的样子工程”,其主动开放的司法数据也多为法检年度工作报告的摘录,系统性的数据开放工作尚未展开。事实上,司法数据的开放不仅是司法活动的辅助,更是司法工作的题中之意和自然延伸,扩大司法数据的开放与共享,就是在不断改进和完善司法工作。各级各地司法机关应站在司法工作现代转型的高度上重视司法大数据的开放与共享,从法律法规、机构设置、财政支持、人员配备和技术服务等方面支持司法大数据建设的深入。
(二)通过专门立法建立数据开放与共享的规范
司法数据开放与共享的前提条件是,司法机关与当事人、企业、社会组织以及国家之间权利与义务关系的明晰。目前我国相关领域的立法上还有大片空白,对司法数据收集、应用与开放行为应采取何种规制模式还尚无定论。有观点认为可以遵循通行的信息安全规范进行保护,也有观点认为鉴于司法数据作为社会公共数据的特殊性,应采取特别的规制模式从政务数据的公开来看,我国《政府信息公开条例》采取的是正面规定和反面列举的方式,但政府信息公开与司法数据还存在本质上的不同,司法数据中既有司法机关理应主动向社会公开的自身工作信息,也有由于案件审理所获取的当事人信息。对于当事人信息就不宜简单地直接进行公开,而应借鉴欧美“通知+同意”的方式,在收集、处理数据时须事先告知用户,并得到用户的明示或者默示的许可。司法数据在收集过程中就应以一定方式告知当事人其信息将会被收集和使用,同时还应告诉当事人数据收集的范围和用途,以满足社会隐私保护的基本需求。同时,该专门立法作为司法数据管理工作的总纲领,应对司法数据管理工作的原则性内容,数据管理和开放的主体、对象、程序、实施等重要事项进行规定。
(三)从打破内部壁垒开始,逐步实现开放与共享
多数时候事物的发展与完善可以遵循由易到难的方式,社会领域的制度建设也大都采取了先进行增量改革,再集中力量最后攻坚破难的路径进行。但信息领域的技术应用有其自身的特点,数据开放与共享的前提是良好的数据整理和融合,在司法数据推向社会之前,其理应在内部先进行合适的处理、加工、勘误和融合,之后即以数据集群的方式共同出现。数据的价值发挥要依靠海量数据的协同,司法大数据的核心不是数据的开放,而是在开放的要求下实现数据的深度融合,这样的开放与共享才能发挥出应有作用。为此,司法数据的开放与共享应摒弃先易后难的传统路径,首先解决影响数据建设的核心难题:司法机关内部的信息堡垒,否则释放再多的信息都起不到促进大数据建设的目的,况且几乎所有的司法数据都掌握在司法机关内部,不解决司法机关不愿共享数据的心态,司法大数据建设就成了“隔靴搔痒”式的花样作秀。
目前包括审判机关、检察机关、司法行政机关在内,都已经建立自己的工作系统和数据库,但现在这些数据还只是在部门内部流通,甚至很多地方司法机关都不能接触到系统内部的信息,故而现在要打破部门之间的数据堡垒,既要实现部门之间横向的数据开放与交流,又要促成部门内部上、下级之间数据的对流和交换。由于各部门都面临着行政化的司法政绩考评,人民法院的结案率和上诉率、检察机关的起诉率、公安机关的破案率等考评指标的存在,使各部门在开放本部门的数据时忧心忡忡,在缺乏相关法律法规的直接规定之下,几个机关之间不约而同地选择了对数据进行封闭。[16](P14~16)要打通司法机关的内部壁垒,就必须明文规定其相互之间信息共享的义务,并建立统一的协调和指挥机构,以此推动数据共享机制的建立。
(四)统一司法统计的元数据标准
目前我国司法统计元数据标准尚未统一,导致各部门司法数据的类型和内容无法对接,在技术上为司法数据的深度融合和协同开放造成了阻碍。从案件信息的统计来看,人民法院和人民检察院在信息采集的内容上有较大差异,数据分类也不尽相同,甚至每月报表数据采集的起止时间也不相同统一的元数据标准是在技术层面实现各部门之间信息共享的基本要求,司法大数据的元数据建设应包括题名、单一标识、类别、描述、数据预览、修订历史、许可项、标签、API授权项、附属项等内容。[17]对此,可以通过制定统一的技术手册的方式,对司法数据采集的种类、内容、起止时间、存储、信息交换与利用等环节的技术操作进行详细规范,并以此为标准对从事司法统计和数据维护的工作人员进行培训。
(五)完善司法数据开放与共享工作的程序
司法数据的开放与共享涉及了多部门的协同工作,数据采集的对象范围较广,社会影响较大,完善的工作程序可以减少工作疏漏,提高工作效率,在促进司法大数据建设的同时,切实保护当事人隐私和国家机密。按照所处阶段来分类,司法数据开放与共享工作包括如下程序:
一是数据开放的前期程序,在案件审理或者司法活动中,司法机关应及时履行对当事人的告知义务,明确数据收集的范围和用途,取得当事人同意,随后在数据的分类和储存过程中应对数据是否涉国家秘密、是否涉及商业机密等区别后进行区分使用。
二是数据开放的核心程序,主要包括司法数据的开放方式、开放次序和开放程序。数据在经过内部纵向的整理和分类之后,应进行部门之间横向的信息的交换和再次整理,这一过程由统一的司法数据管理部门在专门的数据库中予以实现。经过深度融合后的司法数据应制成公开目录向社会开放所有应开放的数据。
三是数据开放的后续程序,主要包括涉密数据、争议数据和失效数据的撤回、修改、删除程序,受理数据公开争议的权利保障程序以及数据开放工作的监督程序等。
结语
随着互联网技术和信息技术的不断发展,“大数据”技术也从未来学中的概念逐步走入了现实中的社会生活。技术进步的意义从来不局限在科技领域,技术与制度、技术与社会的深度融合,使得技术的发展往往会成为社会变革的催化剂。大数据技术的成熟在为司法数据公开提供技术支持的同时,也成了倒逼司法数据公开的重要力量,技术的成熟可以促使和逼迫人们思维的转换和管理方式的更新。司法数据的开放与共享,从理论上讲是司法公开的一部分,将直接促进司法工作透明度的提高,从而有利于司法公正的实现;从实践上看也是进行司法决策、推动司法改革、完善司法管理工作的重要前提。司法数据开放与共享最为深远的意义是,借此推动我国司法管理模式和理念的现代化,实现国家司法体制运行的现代化,科技的发展既促进了制度的变革,又实现了与社会发展的深度统一。本文原载《学术探索》2017(2)