当前位置:中国法学创新网 >> 最新文选 >> 大数据时代中国司法面临的主要挑战与机遇

大数据时代中国司法面临的主要挑战与机遇

来源:《法制与社会发展》2016年第6期 作者:张吉豫 日期:2017-01-09 10:49:34 浏览:2719

——兼论大数据时代司法对法学研究及人才培养的需求


 

  要:大数据技术中蕴藏着巨大价值,将引起思维范式和产业运作方式等多方面变革。大数据技术的发展和广泛应用为司法领域带来了新的挑战和机遇。一方面,大数据时代的数据保护及证据规则仍有待司法实践的探索,以在法律制度和规则尚不明晰和系统的变革时期,积极发挥司法能动性,为促进社会公平正义和新的秩序的建立贡献司法智慧和司法经验。另一方面,大数据技术在提升司法能力、提高司法公正、优化配置司法资源、促进司法机关与社会公众良性互动等方面可对司法起到辅助支撑作用。面对大数据时代的挑战与机遇,司法对法学教育提出了进行交叉学科人才培养的需求。

关键词:大数据;司法;个人信息权;数据产权;法学教育

中图分类号:DF0 文献标识码:A 文章编号:1006-6128201606-0052-10

 

一、引发思维与社会变革的“大数据”

近年来,“大数据”越来越广为人知,并被认为是信息时代的新“石油”,这主要基于两点共识。首先,在过去20年间,数据产生速度越来越快。据国际数据公司IDC报道,[1]2011年产生和复制的数据量超过1.8[2]字节,是过去5年数据增长的9倍,并将以每两年翻倍的速度增长。其次,大数据中隐藏着巨大的机会和价值,将为许多领域带来变革性发展。因此,大数据研究领域吸引了产业界、政府和学术界的广泛关注。例如,美国知名的公共媒体等机构长期持续报道大数据相关信息,《自然》[3]和《科学》[4]杂志也分别开放了特殊专栏,来讨论大数据带来的挑战和重要性,各国政府机构最近纷纷宣布了多项加快大数据进程的重大计划,[5]各行各业也都在积极讨论大数据的吸引力。

大数据技术不仅意味着处理大量的数据。它与传统的数据处理技术相比,除了数据容量更大的表象特点之外,还体现了一些其它特点。随着大数据的流行,其定义呈现多样化的趋势。许多文献对大数据进行了定义。研究大数据的先驱——国际数据中心IDC——在2011年的报告中给出了如下的属性定义:[6] “大数据技术描述了一个技术和体系的新时代,被设计于从大规模多样化的数据中通过高速捕获、发现和分析技术提取数据的价值”。这个定义刻画了大数据的4项显著特征,即数据体量大(volume)、数据类型多样 (variety)、数据处理速度快(velocity)和数据价值密度低(value)。这一“4V”定义的使用较为广泛,类似的定义也出现在诸多相关文献中。

自开始有符号记录以来,人类一直在产生数据。然而越向早追溯,记录的成本越高、数量越少,“上古人类结绳记事,或许只记攸关生命的大事”;[7]且在历史中,大部分数据都随风而逝。存留下来的数据量尽管相对非常有限,但对于人类而言处理已经非常费时和困难。当今时代,人类在历史上第一次有技术能力来经济有效地捕获、存储和处理伴随人类活动而产生的各种数据。大数据应用是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。大数据分析是一个交叉学科研究领域,需要来自不同专业领域的专家协作挖掘数据中隐藏的价值。目前,大数据应用已经在结构化数据分析、文本分析、网站分析、多媒体分析、网络分析和移动分析等多个分析领域取得了广泛的深入研究,在社会管理、商业营销、政府决策、情报分析、法律实施等诸多领域得到应用。

大数据的处理方式是相对传统的计算处理和分析机制的一次根本的转变。20071月,数据库软件的先驱吉姆·格雷(Jim Gray)将这种转变称为继“实验验证”、“理论推理”和“计算”之后人类认知世界的“第四范式”。[8]在大数据时代,海量数据、大数据的处理方式以及对大数据的认知理念都将对我们的思考方式产生深远的影响。它不仅对经济市场和社会发展呈现出不同程度的冲击与影响,而且也在潜移默化地影响着法学研究及司法实践。大数据的发展带来了很多亟待解决的法律问题,但我们更应着眼于它提供的广阔机会。大数据给法学研究和司法实践工作者们提出了新的研究问题和新的研究方法,更带来了新的认知方式。我们必须了解大数据,思辨地看待大数据技术的处理方式和思维模式,才能在科技与法学交汇中更好地把握时代的脉搏,更好地推进法学研究和司法实践改革。

二、大数据时代中国司法面临的主要挑战

在大数据时代,司法领域迎来了新的问题。在法律制度仍不完善的现状下, “大数据时代要求司法者倡导能动主义”,在特定时期内,以积极参与的方式推动社会的发展进步。[9]当前,司法人员在司法业务中面临着与大数据时代相关的诸多挑战,其中最典型的问题包括如下两个方面。

(一)数据权利及个人信息保护有待司法实践探索

法律的设立总是落后于社会发展。面对飞速发展的互联网和大数据技术所带来的诸多新型社会问题,立法在个人信息保护、数据的产权及归属等问题上显得尤为滞后。

我国政府已经建立起了多家大数据交易所并已开始进行数据交易。[10]然而,贵阳大数据交易所执行总裁王叁寿先生曾在众多场合提及大数据交易面临的尴尬。国家发改委的一份关于推动大数据交易发展的报告显示,大数据产业发展目前面临四个难题:1.数据权利类型没有明确;2.数据权利主体存在争议;3.数据的控制和使用权利界限不明,如何分离尚不明晰;4.数据通过互联网非常容易被复制,权属保护很困难。[11]当前,关于数据的法律属性及定位仍存在较大争议。《中华人民共和国民法总则(草案)》第108条中将“数据信息”规定为知识产权客体的一种。[12]有学者对此持彻底反对意见,认为数据不能成为知识产权的客体。[13]有学者提出,应将“衍生数据”作为知识产权客体的一种。[14]亦有学者提出,基于数据没有特定性、独立性,亦无独立经济价值等原因,不宜将其独立视作财产。[15]

与促进数据产生和流通的法律保障体系模糊相对的另一个问题,是面对大数据时代对包含个人信息的数据的大量的、普遍的采集、存储、处理和流转,我国对个人信息的保护仍缺少系统的立法回应。我国的《个人信息保护法》仍在酝酿之中,距离2003年国务院委托中国社会科学院专家草拟专家建议稿已有10余年。[16]我国学者发出呼声:“个人数据保护,正是为人类进入信息社会所做的制度准备中最重要的一环,是信息社会的必要法制基础之一,是信息社会的文明基石,构建人权的新起点。” [17]

立法的确是困难的。个人信息保护中蕴含的人格利益与信息自由流通和应用中蕴含的巨大经济利益、公共安全和公共健康等公共利益之间形成了巨大的张力。这种矛盾和利益冲突在大数据时代将被进一步激化。大数据产生的利益应该如何分配?大数据带来的个人信息被滥用的隐患应该如何规制和防控?面对利益冲突应该如何设置利益平衡点?面对这些新问题,我国和发达国家都暂时没有找到令人满意的答案。以往,面对随着科技发展带来的新型社会问题,我们常在借鉴域外比较成熟的法律制度的基础上进行立法工作,少走了很多弯路,也较少进行大量全社会范围内的讨论,但弊端在于,我们跳过了真正意义上的从无到有的过程,缺少了相应经验的积累。所以在与发达国家同时面对新问题的时候,特别是在涉及到新的技术带来的利益应该如何分配等方面,我们的立法宜充分调动各方主体的关心和参与,考虑市场失灵的情况,观察中国市场自我调节的情况,了解司法实践中总结的经验智慧,跟进数据技术革命,并致力于为之提供良好的制度支撑。

然而,面对新的社会问题,立法或许可以稍作等待,司法却无从回避,并且司法实践中对相应矛盾纠纷的分析梳理、司法智慧的运用和司法经验的总结积累,是立法工作的宝贵资源。在现行法律体系下,我国司法机关进行了积极探索,已经运用著作权法及反不正当竞争法解决了许多数据保护相关纠纷。例如,早在1996年北京阳光数据公司与上海霸才数据信息有限公司技术合同纠纷案[18]中,判决就写道“信息已成为现代化社会的重要资源之一,其价值已为社会所公认,开发和利用信息资源,生产高质量的信息产品,向社会提供服务,是市场经济发展的需要……信息开发者和服务者的权利义务,已得到社会的普遍重视。目前,我国信息产品和信息服务业尚处在初级发展阶段,社会信息化的程度还不高,对符合法定构成要件的信息产品和信息服务予以法律保护,有利于鼓励和促进开发者开发、生产高质量的信息产品和提供高质量的信息服务”,并论证了阳光数据公司的相应数据具备商业秘密的构成要件,应受《反不正当竞争法》保护。在个人信息保护方面,我国也有法官提出,当前可以我国《宪法》中关于公民人格尊严不受侵犯的规定作为保护公民个人信息的基础,以《民法通则》中有关公民人格尊严受法律保护的规定为该部门法保护个人信息的基础。[19]在个案裁判中,司法人员不宜机械地适用文义解释,而应把握法律规范体系中蕴含的价值判断,深入分析个案中的利益关系,在新的时代背景下对法律规范做出符合立法目的之解释。

(二)大数据时代证据规则体系有待完善和发展

事实判断是司法审判中至为关键的环节之一。司法实践中最终认定的“事实”,实际上是由证据碎片拼接组合所呈现的。证据对于司法实践无疑具有重大影响。在信息社会中,特别是大数据的价值被社会认识并重视之后,我们的生活被日益丰富多维地记录在信息系统之中。数据作为人类社会的忠实记录,成为了等待人们去寻找证据以“还原”事实的宝库;大数据技术及思维范式也可能对案件相关证据的收集方法、范围乃至采信规则产生影响。具体而言,大数据带来的证据规则方面的挑战主要包括如下两个方面:

1.电子数据证据使用规范需跟随大数据技术的发展不断细化完善

目前,我国电子证据规则仍有待发展完善,司法工作人员对于电子证据本身的可采性标准及效力认定等问题仍然存在疑问,这是对司法实践中运用电子数据证据的重要挑战。尽管我国2012年修改的《刑事诉讼法》、《民事诉讼法》及2014年修改的《行政诉讼法》均将电子数据规定为证据类型之一,2015年开始施行的《最高人民法院关于适用〈中华人民共和国民事诉讼法〉的解释》中也对电子数据进行了进一步界定,但由于电子数据容易被伪造和删改等因素,加上我国法律相关实践经验的不足,在司法实践中如何审查和认定电子证据的真实性仍然是一个难题。“人们惯常审视电子证据的思维模式是寻求一种能够脱离开电子数据的虚拟世界而在现实生活中存在替代物。这种思维的基础是不相信在网络中流动的数字化信息的真实性。” [20]20169月,最高人民法院、最高人民检察院和公安部联合发布了《关于办理刑事案件收集提取和审查判断电子数据若干问题的规定》(以下简称《电子数据规定》), 对于刑事诉讼中电子数据的定义及其收集、提取、移送、展示、审查、判断等方面进行了规范。[21]其中许多条款的设置都旨在保障电子数据的真实性识别。[22]其中对于电子数据应着重审查其是否具有数字签名、数字证书等特殊标识,审查其收集方法是否符合相关技术标准等规定,均对法院审查和判断电子数据提出了挑战。

在大数据时代,更需要发展和细化电子数据证据的保全、取证和真实性判断等方面的规范。对大数据技术的深入理解和技术跟踪,对电子证据真实性实质审查中的电子证据司法鉴定和证据印证这两类方法均有积极意义。[23]正如我国学者所述,“电子证据同时具有脆弱性和稳定性这一对相互矛盾的特性”。脆弱性包括两个主要方面:(1)电子数据易于被篡改和伪造,或因系统故障等非人为因素而发生异变;(2)电子证据本身个性化特征较弱,例如网站难以通过注册信息来确认注册者的真实身份。稳定性则表现在:(1)易于存储和复制,不易彻底销毁;(2)篡改、伪造的痕迹难以完全消除。[24]在大数据技术下,许多电子证据的上述脆弱性将得到一定程度的减弱,而稳定性特点将可能进一步增强。一方面,在大数据时代,数据成为一种重要的资源和财富,许多大数据拥有方均会采用更为先进的存储技术或采用稳定成熟的云服务平台,在这种情况下,数据因系统故障等非人为因素而发生异变的可能性微乎其微,篡改数据的痕迹也更难于完全消除,为电子司法鉴定提供了更为有利的环境。另一方面,大数据时代,一个主体的众多信息都可能被记录在许多具有独立来源的信息系统中,使得电子数据证据往往可以与其它电子数据相互印证,使原本易于篡改且难于证明与特定主体相对应的电子数据可以得到补强。

在大数据时代,几乎无处不在的电子数据成为了记录事实的重要载体。大数据技术所带来的潜在的电子证据脆弱性减弱和稳定性增强,需要相应的规范来予以充分利用,进而指导司法实践。司法领域可在取证、保存、出示、审查及认定方面都进一步发展电子数据证据使用规范细则,服务大数据时代的诉讼,“在充分认识到电子证据重要性的基础上,进行制度的改变,法律的完善,构建科学的电子证据规则体系,使得电子证据合法、合理、充分地被运用,实现电子证据应有的功能和作用。” [25]

2.大数据分析结论能否作为司法证据使用仍需论证和予以明确

大数据分析技术可能为证据的收集提供新的思路和方法。大数据技术通过对海量数据的自动分析,从海量的琐碎数据中挖掘出有价值的信息,从而为人们在相应领域的活动提供依据和启示。大数据分析能够依托海量数据,挖掘出事物间的关联关系。在司法领域的证据收集过程中,根据具体情况,可以依托大数据分析直接搜索出相关数据,也可以基于对以往大数据的分析挖掘出事物间的关联关系,再据此进行进一步的证据调查和采集。

面对这样的想法,一些学者开始探讨大数据分析结论是否能够作为司法证据使用,以及大数据在事实认定中的作用机制。基于目前大数据分析是一种以分析关联关系为主的、对精确要求较低的定量分析等理由,我国学者多数认为目前不宜将大数据直接作为一种证据使用。[26]也有学者提出,大数据分析虽然或许不能直接体现在证据的推论结构中,但可以进入证据分析领域,提供“数据经验”,可以为事实认定者提供事实认定的语境和背景知识,填补人类对海量碎片信息认知能力的不足。[27]本文认为目前至少在民事诉讼中,大数据分析结果并非不可作为证据使用。在大数据时代之前,传统调查统计的方法已经开始应用于民事诉讼领域。例如,在知识产权民事诉讼领域,美国法院已开始用专家调查证据支持可能出现商标混淆的主张。[28]我国一些学者提议关注和借鉴美国的司法实践,将消费者调查统计结果作为证据,承认其具有可采性,将之引入我国司法实践,并指出在商标法领域,针对混淆可能性、第二含义的产生、商标的通用名称化、商标的淡化、虚假广告等问题,都可能涉及调查统计方法的应用。[29]我国目前司法实践中也有当事人将市场调查报告作为证据,有些也得到了法院的采信。[30]在华为诉IDC必要专利许可费率纠纷案[31]中,一、二审法院在进行标准必要专利许可费裁定时,均参考了STRATEGY ANALYTICS研究机构对全球手机市场中苹果、三星等公司销售额的统计分析和预测。“问卷调查证据和其他认定因素一样……使得法官更好地将抽象的法律和具体的事实焊接在一起,得出尽可能公正和准确的裁决。”[32]在这些已经使用调查统计报告作为证据的问题上,理论上也可能运用大数据分析结论作为证据,只是正如统计调查证据需要披露相关细节并符合规范一样,大数据分析结论作为证据使用也必然需要说明数据来源及分析方法,并逐渐发展和确立证据审查规范。司法实践需要正确理解数据科学的性质和作用,对采用大数据分析结论作为证据保持审慎但开放的态度,并在此过程中起到科学引导作用。此外,大数据时代“证据偏在”的问题将更加凸显,需要借助证据制度加以克服。[33]

三、大数据技术为中国司法带来新的发展机遇

大数据分析作为一种新型的研究范式和决策辅助方法,正无孔不入地渗透到社会生活的方方面面,为人类活动提供信息参考。司法领域也自不例外。除案件相关领域的数据外,司法活动本身也在源源不断地产生案件判决、庭审笔录等各类业务数据。此外,社会各界对于司法活动有着密切的关注,各大门户网站、社交媒体上均存在大量对司法事件、司法单位、司法人员的报道和评论。对海量异构的案件相关的领域数据、司法业务数据及互联网数据的分析,可能为司法能力现代化、司法公正的促进、司法资源的优化配置、司法机关与社会公众的良性互动等方面都提供有益的辅助支持。我国司法系统也非常重视科技力量的运用。最高人民法院提出要“建设立足于时代发展前沿的‘智慧法院’”。[34]最高人民检察院发布了《“十二五”科技强检规划纲要》。[35]大数据技术是其中的重要技术之一。中央政法委书记孟建柱重点说明“大数据表示的是过去,但表达的是未来,其意义就在于,通过对海量数据的整合、挖掘,揭示传统技术方式难以展现的关联关系,让人们更清楚地理解事物本质、把握未来取向,从而发现新规律、提升新能力”,[36]并反复强调“要着力提升科技信息化应用能力,善于运用大数据,提高维护稳定工作现代化水平。”[37]

总体而言,大数据技术主要可在如下几个方面发挥重要辅助作用,为中国司法的进一步发展带来新的机遇:

(一)辅助提升司法能力、促进司法公正

大数据技术可以在众多司法过程中提供关联关系挖掘和决策辅助,[38]辅助提升司法能力,并促进司法公正。

在职务犯罪风险评估、预测、预防以及犯罪侦查等司法活动中,尽管现阶段大数据分析的实际运用尚为数不多,但学术界及实务界都正在积极展开探索和讨论。我国有学者提出,如果缺乏来自刑事司法体系内的大数据支撑,大数据分析目前似乎无法探究刑事司法与犯罪的核心问题。[39]我国也有学者提出,当代职务犯罪线索更加隐蔽,可以针对组织内部和社会动态两大类别的数据,建立大数据相关模式分析,“对不同数据源的数据进行比对、关联、分析和预测,对国家公职人员履行职务期间碎片化电子数据全体样本进行相关性分析”,发现线索,进行预警,辅助决策。[40]为使大数据分析更好地发挥作用,宜在合法范围内尽可能建立司法内部数据及政府机构内部数据的实施收集及适当的共享机制。目前,我国在司法裁判文书的公开和分析方面已经取得了一定进展,并正在进一步推进。中国裁判文书网收集并公开的裁判文书已超过2000万篇。[41]我国司法系统及企业界均已经开展了一些相关工作。例如,安徽高院的“类案指引项目”建立了裁判文书大数据挖掘和分析系统,拟在传统法学理论和实践判例的基础上,以类案同判为目标,对海量裁判文书进行量化分析。该系统已在20165月在安徽部分法院投入试用。[42]在企业界,北大法宝、知产宝的“索骥”产品等也都基于海量判决文书提供了不同层次的数据分析服务。

针对司法案件的大数据分析一方面将极大地便利司法人员从在先案件信息中了解先例情况,学习经验,辅助构建审判和量刑决策模型,提升司法能力,律师对司法大数据的积极运用也将为案件的审理提供有益信息;另一方面,司法大数据将有力地促进司法公正。公正司法不仅需要法官的道德良知,也需要外在的约束和推动。[43]

首先,针对司法案件的大数据分析可以有效辅助“同案同判”目标的推进。同案同判是司法公正的一项基本要求,是自然正义在司法领域最具体的体现,蕴含着法律面前人人平等的朴素正义。司法大数据分析可以减少由于时间和空间上的距离造成的信息沟壑。同一类案件处理中可能涉及很多不同的因素,司法大数据分析将在全国司法裁判文书中进行分析,辅助揭示各类因素在不同案件中所起到的作用,使法官适用法律时更能保证与全国同类案件进行类似处理,从而保证裁判的统一性。其次,司法大数据分析的推进将提高司法的公开性,使司法处于阳光之下,以公开来促进公正。司法信息公开和大数据分析将在很大程度上解决司法机关与当事人和社会民众之间的信息不对称问题。这使司法人员在处理案件时会考虑到社会监督,从而促使司法人员提高案件处理质量,特别是提高司法公正。最后,司法大数据分析将促进裁判文书质量的提高。大数据时代,裁判文书公布后,数据分析可以对裁判文书的质量进行评价,这将促进法官认真地制作裁判文书,充分地说理,呈现高质量的文字水平,提高案件裁判的质量,并对后来类似案件的审理提供有价值的参考。

“司法公开是一种自信,一种力量,是树立和提升司法公信的重要途径。通过司法公开可以全面保障人民群众的知情权、参与权、表达权和监督权,使司法权在阳光下运行、在规范和监督下运行、在公众信任的氛围中运行。”[44]在大数据时代,司法公开既是技术和社会发展所致的必然趋势和要求,又将通过大数据技术辅助提升司法能力、促进司法公正,使司法系统拥有和展现基于司法能力和司法公正的自信和力量。

(二)辅助配置司法资源

大数据技术可以辅助进行司法资源的优化配置。例如,可以应用大数据技术对案件繁简分流及合并拆分审理等过程中的规律进行分析,辅助进行案件繁简分流及合并、拆分审理的决策建议,建立司法资源节约机制;可以应用大数据技术测算不同区域不同业务的司法业务量,辅助评估每个司法人员的办案质量、效果及专长,并进行司法人员的优化配置。特别在当前的司法改革工作中,有人士提出,“应以大数据为依据,科学进行调查研究,科学测定法官、司法辅助人员的工作量,科学推动审判权监督管理方式改革,科学推动审判辅助及案件执行事务改革,确保法院司法改革取得应有的实效。” [45]

(三)辅助促进司法机关与社会公众的良性互动

近些年来,比较重要或热点的司法事件经常会在社会上引起广泛关注。“在当今网络信息时代,公众对司法信息需求量越来越大,对司法公开的信息及时性要求越来越高,司法领域的热点多、触点多、燃点低……不仅要通过审判活动实现司法公正,而且要以人们看得见的方式实现司法公正,让裁判或认定的过程变成当事人感受民主、客观、公正的过程。”[46]公众在互联网上的舆论可能包含改进司法工作的有益建议,也可能是基于信息不对称或错误信息而产生的不符合实际情况的认识,后者常常给相关司法人员带来压力,有时甚至有可能不当影响了司法独立。在坚持审判独立原则的前提下,可以应用大数据技术,发现公众心理和舆论传播的特点,进行舆论风险预警和适当的、及时的信息发布,从而构建司法机关与社会公众的良性互动关系,也有助于缓解舆论对于司法人员的压力,辅助审判独立的实现。同时,大数据技术可以帮助司法机关从众多司法业务数据和互联网信息中挖掘司法为民目标的实现和提升路径,进而辅助提高社会公众对司法工作的满意度。

综上所述,大数据技术可对司法的多方面提供支撑。对数据进行分析挖掘,“可以发现隐藏在大量细节背后的规律。依据规律,可预测未来。收集分析海量的各种类型的数据,并快速获取影响未来的信息能力,就是大数据技术的魅力。”[47]但在运用大数据技术进行辅助决策时,有一些事项值得注意。1.在使用包含个人信息的数据时要注意合理使用的范围,不能侵犯他人的人格权利。2.不同来源的不同类型数据,在可靠性等方面可能存在较大差异。例如,相对于互联网数据而言,司法业务数据通常更为准确和真实。在数据分析设计时应对此有所注意。3.应对大数据分析得出关联关系和进行预测的原理有清醒认识,了解到数据分析有其固有的局限性,对数据分析进行恰当合理的利用。

四、大数据时代司法对法学研究及人才培养的需求

大数据时代,积极应对中国司法面临的挑战与把握发展机遇的核心均在于人。大数据在司法中的充分应用不是简单的法律与技术的堆积,而是需要法律界人士体会和实践其中思维方式和研究方法的变革,开展交叉学科研究和应用,并从实践中设计和发展相应的教育体系,培养能够更好地回应时代需求的人才。

(一)大数据带来思维方式和研究方法的变革

在过去的几千年中,实验验证、理论推导和科学计算是人类探索自然、研究社会的三种基本认知范式。在大数据条件下,以计算为中心的理念逐渐转变到以数据为中心,形成数据思维方式——大数据时代的新型研究范式即“第四范式”。科学家们认为,未来科学的发展趋势是,随着数据量的高速增长,计算机将不仅仅能做计算模拟仿真,还能分析总结并得到理论。这意味着一些过去由科学家和专业学者所从事的工作,在未来可以由计算机来进行并可能做得更好。在《大数据时代》[48]一书中,舍恩伯格等对大数据引发的思维变革进行了如下总结:1.分析数据时,要尽可能地利用所有数据,而不只是分析少量的样本数据。2.相比于精确的数据,更乐于接受纷繁复杂的数据。3.应更为关注事物之间的相关关系,而不是探索因果关系。4.大数据的简单算法比小数据的复杂算法更为有效。5.大数据的分析结果将减少决策中的草率和主观因素,数据科学家将取代“专家”。

该总结中的第4条主要与数据分析的计算机算法相关,而其它几条则直接涉及到思维方式的转变,同时也可能带来一定的冲突。第1个转变意味着研究工作将不再依赖于小规模的数据采样,而是转而分析大规模的、真实的甚至实时的复杂数据全集。使用数据全集能够带来更完整而全面的认识,从而可能发现采样方法所难以揭示的细节。信息技术的发展使人们可以借助大数据分析技术,在法学研究和司法实践工作中可能实现定量化指导,甚至使之成为一门科学。第2个转变是个体数据相关的精确度不再重要,因为当拥有海量的即时数据时,适当忽略微观层面上的精确度,可能在宏观层面拥有更好的洞察力。这对于公共事务管理、宏观调控等实践将具有重要意义;但另一方面,这也可能导致对个体情况的漠视,造成司法实践中的盲点。第3个转变极其重要。在大数据时代的研究方法下,人们可能不再关注于事物间的因果关系,而关注其相互之间的相关关系。值得肯定的是,相关关系也许并不能准确地说明某个社会现象发生的原因,但它会揭示其发展过程。这一点以及舍恩伯格等所宣称的第5点改变,对于习惯讲究严密逻辑和因果关系的研究工作者们可能难以接受,会认为当前大数据的概念空洞而粗糙,就数据论数据,忽视人性和理论指导,从而难以取得突破性进展,甚至可能带来灾难。由此看来,如何运用法学和社会科学相关理论来指导司法实践领域的大数据分析,这可能是学术研究和实践探索中都需要认真思考并亟待突破的问题。[49]

尽管自然科学与社会科学的发展总是相互关联,大数据技术在法学研究及司法领域的应用仍将带来社会科学和自然科学之间的一次碰撞和深度交汇。“社会科学与自然科学的区别之一在于思维方式的不同,社会科学是总体逻辑思维,自然科学是类型逻辑思维。”前者关注独立各异个案的整体分布;后者则关注典型现象并挖掘其中的规律,进而将规律推广适用于具体问题。而大数据技术的这种量化分析特点决定了它无法挖掘出普适规律来描述和解释所有个体行为。[50]另一方面,作为社会现象的一部分,法律现象与自然现象之间有着显著区别,它有着太多的异质性和不确定性。[51]这使得我们在使用大数据来研究法律现象的时候,不一定能够像研究自然科学问题那样直接和有效。这些都有可能成为大数据技术在法学研究和司法实践中应用所需要解决的问题。在面对大数据的冲击时,是坚守自身特有的话语模式,还是迎接这一技术所带来的深刻影响,也许是大数据时代下的法学研究和司法变革所需要做出的必然选择。

(二)交叉学科研究和人才培养势在必行

大数据时代已经到来,我们必须对此有所准备和应对,将法学理论与科学计算理论相结合,打破学科划分带来的思想羁绊,了解相关交叉学科的思维方式,或者以交叉合作的方式展开研究和实践工作。传统的法学研究工作较普遍地表现为单独个体的活动,而大数据时代的海量数据常常无法由单个个体完成收集、整理和分析。目前,许多应用大数据的研究都采用了较大规模的分工协作方式。[52]在结合大数据技术进行法学研究和司法实践的过程中,倚靠个体或者单一部门来开展工作,在一些问题上难以取得突破,必须加强跨学科和跨部门的协作。

在人才培养方面,传统的法学院课程设计一般以单一的法学课程为主,这样的设置使得大多数从法学院毕业的科研工作人员往往仅基于传统意义上的法学视角、法学理论来研究和解决法律问题,缺乏多样性。非法学专业的法律硕士虽然为法律职业共同体引入了多学科背景的人才,但在各个教育阶段仍然以单一学科为主。单一学科课程的叠加只是权宜之计,并非我们希望的最佳课程设置模式。单一学科的知识相对容易获得,难以轻易掌握的是利用大数据技术在司法领域分析问题、解决问题的思维和方法。这需要发展出一批具有应用大数据技术去解决司法问题的经验丰富的研究者或实务工作先锋来参与系统的人才培养计划的设计,并进行思维方式和研究方法的传授。

五、结语

我们仍处在大数据时代薄雾弥漫的清晨。尽管还不能看到那一时代的清晰轮廓,但我们能够预见人类研究范式和社会运行方式都将迎来巨大变革。社会变革时期成文法往往格外显得滞后,此时司法系统的能动性尤为重要,对维护社会公平正义、促进新的法律秩序形成起着重要作用。司法系统作为法治社会的重要支柱,应积极面对大数据技术正在引发的这场变革,拓宽视野,奠定基础,积累经验,培育人才,为信息时代的社会法律制度贡献司法智慧和司法经验,为更加公正、高效、科学、公信的司法实践积蓄现代化的大数据技术和思维范式支撑。

 




收稿日期:2016-09-10

基金项目: 国家社会科学基金青年项目“标准必要专利的FRAND许可规则研究”(15CFX045)

作者简介:张吉豫(1982-),女,河南南阳人,中国人民大学法学院讲师。感谢审稿专家对本文提出的修改建议。

[1] See John Gantz and David Reinsel, Extracting Value from Chaos, IDC iView, (Jun., 2011), pp.1-12.

[2] Zeta,计算机储存容量计算单位,指270次方。

[3] Big Data.2008. http://www.nature.com/news/specials/bigdata/index.html, 2016725日访问。

[4] Special Online Collection: Dealing with Big Data.2011. http://www.sciencemag.org/site/special/data/, 2016725日访问。

[5] See White House, Fact Sheet: Big Data across the Federal Government, Office of Science and Technology Policy, 2012相关计划主要包括:2012322日,奥巴马宣布美国政府投资2亿美元启动“大数据研究和发展计划”;20136月,西方八国集团(G8)签订了《开放数据宪章》,联合推动大数据发展;20159 月,国务院公布了《促进大数据发展行动纲要》;201510月,中共十八届五中全会指出“实施国家大数据战略,推进数据资源开放共享”,等。

[6]同注1

[7]蒋勋:《汉字书法之美》,广西师范学院出版社2009年版,第19页。

[8] Kristin M.Tolle, D.Stewart W Tansley, Anthony J.G.Hey, The fourth Paradigm: Data-Intensive Scientific Discovery, Proceedings of the IEEE, Vol.99, No.8 (2011), pp.1334-1337.

[9]参见孙光宁:《大数据时代对司法审判的冲击及其应对——从指导性案例29号切入》,《湖北社会科学》2016年第5期,第153页。

[10]  2015415日,全国首家大数据交易所——贵阳大数据交易所正式运营并完成了首批大数据交易。参见齐爱民:《对大数据立法管理是时代之需》,《广西日报》201675日,第11版。文中指出:“我国政府在全球率先开创了大数据交易的先河,继贵阳大数据交易所之后,国内其他省市的大数据交易所和大数据交易中心雨后春笋般成长起来。大数据交易在我国越来越普遍,交易数额越来越大。而数据是什么?急需立法予以明确以确定数据权属和规范交易秩序。”

[11]参见王林、陈晶:《万亿元大数据产业有望驶入快车道》, http://article.cyol.com/chuangye/content/2016-07/05/content_13011896.htm2016720日访问。

[12]参见http://www.npc.gov.cn/npc/flcazqyj/2016-07/05/content_1993342htm2016720日访问。

[13]例如齐爱民:《〈民法总则(草案)〉将“数据信息”归为知识产权的客体是一个必须更正的错误》,http://www.aiweibang.com/yuedu/129062176.html2016720日访问。

[14]参见杨立新、陈小江:《衍生数据是数据专有权的客体》,《中国社会科学报》2016713日,第1006期。http://sscp.cssn.cn/xkpd/zxtj/201607/t20160713_3119407.html2016720日访问。

[15]参见梅夏英:《数据的法律属性及其民法定位》,《中国社会科学》2016年第9期。文章提出,“数据没有特定性、独立性,亦不属于无形物,不能归入表彰民事权利的客体;数据无独立经济价值,其交易性受制于信息的内容,且其价值实现依赖于数据安全和自我控制保护,因此也不宜将其独立视作财产。基于数据的非客体性,大数据交易的合同性质宜界定为数据服务合同;基于主体不确定、外部性问题和垄断性的缺乏,数据权利化也难以实现。”

[16]我国0506年相继出版了两部个人信息保护法的建议稿,包括:齐爱民:《中华人民共和国个人信息保护法示范法草案学者建议稿》,《河北法学》2005年第6期,第2-5页;周汉华主编:《个人信息保护法(专家建议稿)及立法研究报告》,法律出版社2006年版。

[17]郭瑜:《个人数据保护法研究》,北京大学出版社2012年版,第83页。

[18]  (1996)一中知初字第54号。

[19]参见张超:《浅析个人信息的法律保护》,http://www.chinacourt.org/article/detail/2013/05/id/959019.shtml2016725日访问。

[20]高波:《从制度到思维:大数据对电子证据收集的影响与应对》,《大连理工大学学报(社会科学版)》2014年第2期,第90页。

[21]参见http://www.spp.gov.cn/xwfbh/wsfbt/201609/t20160920_167380_1.shtml2016930日访问。

[22]参见谢登科:《电子数据证据使用的五大法律问题——〈电子数据规定〉分析探讨》,http://mp.weixin.qq.com/s?__biz=MjM5NjMyNDM5Nw==&mid=2653159654&idx=1&sn=24148cb02287ae6e076dc9e5e038ebb0 & chksm=bd3a55a48a4ddcb2af 9757864a2e0130142e06da51eb77d4e86d7bf37a00164e635931a23c34#wechat_redirect2016930日访问。

[23]参见龙卫球、裴炜:《电子证据概念与审查认定规则的构建研究》,《北京航空航天大学学报( 社会科学版)2016年第2期,第44-46页。该文指出:法院对电子证据进行实质审查时主要关注三个事项:电子司法鉴定就证据真实性所提出的意见,该电子证据是否有其他证据予以补强以及证据完整性。

[24]参见注23

[25]樊崇义、李思远:《论电子证据时代的到来》,《苏州大学学报(哲学社会科学版)》2016年第2期,第106页。

[26]我国多位学者在论著中论述或表达了这一观点。例如,付艳茹、马强:《大数据背景下职务犯罪预防途径和方法》,《中国人民公安大学学报(社会科学版)2015年第6期,第9-16页。再如,周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第64-82页。

[27]参见周蔚:《大数据在事实认定中作用机制分析》,《中国政法大学学报》2015年第6期,第64-82页。

[28]参见[]汉斯·采泽尔、戴维·凯:《用数字证明:法律和诉讼中的实证方法》,黄向阳译,中国人民大学出版社2008年版,第202页。

[29]参见金海军:《商标与通用名称问题的消费者调查方法——实证与比较》,《暨南学报(哲学社会科学版)》2013年第10期,第25-35页。参见杜颖:《商标纠纷中的消费者问卷调查证据》,《环球法律评论》2008年第1期,第71-80页。

[30]例如:张小泉刀剪商标侵权及不正当竞争纠纷案,(2004)沪高民三(知)终字第27号;蒙牛乳业诉蒙牛酒业侵犯商标权及不正当竞争纠纷案,(2006)一中民初字第1896号等。参见张爱国:《商标消费者调查的正当性研究: 49 份商标侵权纠纷民事判决书谈起》,《知识产权》2011 年第2 期,第63-64页。该文中指出,截至2010 1 月,在4237份侵犯商标权的裁判文书中,有49 份有效判决涉及问卷调查证据。

[31] 2013)粤高法民三终字第305号。

[32]谢晓尧、陈贤凯:《商标混淆的科学测度——调查实验方法在司法中的运用》,《中山大学学报(社会科学版)》2013年第5期,第171页。

[33]参见高波:《大数据:电子数据证据的挑战与机遇》,《重庆大学学报(社会科学版)》2014年第3期,第112-113页。

[34]周斌:《周强在最高法信息化建设工作领导小组2016年第一次全体会议上强调:推信息化建设转型升级建“智慧法院”》, http://www.legaldaily.com.cn/Court/content/2016-02/01/content_6471053.htm?node=539492016725日访问。

[35]参见侯建刚:《高检院印发〈“十二五”科技强检规划纲要〉》,《检察日报》20111010日,第1版。

[36]孟建柱:《深入推进社会治理创新 切实提高维护公共安全能力水平——学习贯彻习近平总书记关于公共安全工作重要批示》,《求是》2015年第21期,第9页。

[37]曹建明:《做好互联网时代的检察工作“+”法》,《检察日报》2015818日,第4版。

[38]参见肖鑫、周浩漓:《大数据技术下的司法统计现状及其应用创新建设研究》,《南方论坛》2015年第8期,第65-71页。

[39]参见何挺:《刑事司法实证研究:以数据及其运用为中心的探讨》,《中国法学》2016年第4期,第216页。该文章主旨虽为探讨刑事司法实证研究,但本文认为其中这方面相关论述也适用于利用大数据分析来辅助犯罪预测等司法活动本身。

[40]参见付艳茹、马强:《大数据背景下职务犯罪预防途径和方法》,《中国人民公安大学学报(社会科学版)2015年第6期,第9-16页。

[41]截止至2016925日,中国裁判文书网公布的裁判文书有21177820篇。见http://wenshu.court.gov.cn/;我国企业界相关司法案例平台同样收集和整理了大量裁判文书,例如北大法宝所收集的裁判文书也超过了2000万件,见http://www.pkulaw.cn/Case/

[42]参见李忠好、姜浩:《安徽高院类案指引项目研究开发投入使用》, http://finance.sina.com.cn/sf/news/2016-06-21/105534160.html 2016630日访问。

[43]参见杨凯:《审判管理理论体系的法理构架与体制机制创新》,《中国法学》2014年第3期,第225页。

[44]张文显:《关于司法公信建设的若干问题》,载张文显:《司法的实践理性》,法律出版社2016年版,第103页。

[45]高岚:《大数据思维下司法改革之钥》,《人民法院报》2016517日,第2版。

[46]同注44

[47]赵国栋、易欢欢、糜万军等:《大数据时代的历史机遇:产业变革与数据科学》,清华大学出版社2013年版,第21页。

[48]  []维克托·迈尔-舍恩伯格、肯尼思·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,浙江人民出版社2012年版。

[49]参见注48

[50]参见孟小峰、李勇、祝建华:《社会计算:大数据时代的机遇与挑战》,《计算机研究与发展》2013年第12,2488-2489页。

[51]20127月,欧洲核子研究中心(CERN)宣布发现希格斯玻色子。这是一个典型的基于大数据的科学实验,至少要在1万亿个数据实例中才可能找出1个希格斯粒子。见白建军:《大数据对法学研究的些许影响》,《中外法学》2015年第1,34页。

[52]


微博
分享到
发表评论

登录注册还可以输入10000

  • 2017-01-10 20:32

    这篇文章写得很好!作者理工科背景,逻辑思路清晰!

    1 3 回复 0