Judicial Application and Theoretical Review of Big Data Proof
-
摘要: 在刑事司法活动中,业已出现了有异于传统证明的大数据证明方式。通过对我国当下司法实践中适用案件的观察性分析,可归纳出大数据在刑事司法领域中的证明作用主要表现为:证明涉案主体的同一性、信息载体的关联性、海量信息的涉案数额、犯罪行为、犯罪构成中的特征信息五个方面。与传统司法证明相比,大数据证明最鲜明的特点体现为智能化、模型化及特殊相关性,要认识其内在原理与运行机制,可采取一种“海量信息+数据处理+结论”的要素思维。文章基于司法适用和内在机理对大数据证明进行理论上的检视,认为首先应当确立能够作为定案依据的大数据证明结论证据本位的法律属性规范,其次厘清其作为机器意见的事实认定原理,最后尝试以算法应用场景的稳定性为标准建立类案通用型和个案专门型二元分化的审查进路范式。Abstract: In criminal justice activities, big data has emerged as a way of proof that is different from the traditional proof. Through the observational analysis of the applicable cases in China's current judicial practice, it can be summarized that the proof role of big data in the field of criminal justice is mainly manifested in five aspects: proving the identity of the subject involved in the case, the relevance of the information carrier, the amount of the massive information involved in the case, the criminal behavior, and the characteristic information in the criminal composition. Compared with traditional judicial proof, the most distinctive features of big data proof are intelligence, modeling and special relevance. To understand its inner principle and operation mechanism, we can adopt a kind of elemental thinking of “massive information + data processing + conclusion”. Based on the judicial application and the inner mechanism of the theoretical review of big data proof, we should firstly establish the legal attribute specification of the evidence-based conclusion of big data proof that can be used as the basis of the case, secondly clarify its factual determination principle as the opinion of the machine, and finally try to establish the paradigm of the binary differentiation of the general and case-specific review process based on the stability of the algorithm application scenarios.
-
Key words:
- big data proof /
- judicial application /
- fact finding /
- judicial review.
-
一. 问题的提出
当人类社会进入21世纪以后,科学与技术发展迅猛,从第一次工业革命开始,世界的发展速率跨过了前所未有的拐点。人类的科学研究已经经历了3个阶段,从最早的实验归纳到理论推理,再到仿真模拟,现在正在迈入第4个阶段,即数据密集型科学发现,这一阶段的科技创新的启发基础即海量数据和超级算力[1]10-11。与社会与科技的发展同频,大数据和人工智能技术的产生和快速发展映射在刑事司法领域,也推动其产生着深刻的变化。这其中既有刑事司法机关主动的技术革新以提升犯罪控制的效率和准确性的因素,也归因于日益更新和复杂的犯罪手段的被动冲击。由司法大数据专题报告显示,我国涉信息网络犯罪案件呈逐年上升趋势[2],其中涉信息网络犯罪中的诈骗罪、帮助信息网络犯罪活动罪等近年来更是居于最高发罪名的前十位[3]。不仅是涉及这类罪名的事实认定,在其他大量的传统型犯罪的司法证明实践中,也已出现了一些对案件事实或定罪量刑具有证明作用的海量数据信息及大数据分析技术等证明手段、技术方法。这在学界及司法实践中一般将其概括称为大数据证明,并将与大数据技术相关呈现出的以大数据分析报告为代表的在刑事诉讼中发挥证明作用的新兴证据形式,统称大数据证据。总体来说,尽管随着大数据、人工智能等现代科技手段的不断兴起,大量的新型证明手段和证据材料进入法庭,但我国的诉讼程序和证明机制迄今仍然没有改变其传统的司法认知模式。并且由于相关涉专门性知识证据的程序性机制的限制性,庭审事实认定仍然惯于使用以事实认定者思维认知型的经验法则和证据推论的基础方式。有鉴于此,本文认为,应当在深入探究大数据证明的内在机理及运行机制之后,考察其是否能够与刑事诉讼中现有的某些证据理论范式相契合。如需要建立与现有范式不同的审查与采信机制,仍应当从基础司法证明原理,以及司法审查程序中抽象并概括出具有相同特性的新型证据和证据方法的审查和采信的进路、原则及规则。以及更重要的或许是建立一种框架性的证据分析方法,以解析和解决科技加速度发展背景下不断衍生和发明的涉及专门知识的新型证据的举证、质证和采证的司法证明问题。
以目前现有的理论成果来看,大部分都是以“大数据证据”作为研究的对象,包括对于大数据证据的证据种类、价值方法、质证规则等展开的一系列的理论探索。然而,当下有关大数据证据及相关证据类型的讨论并非是在同一概念语境及范畴下。换言之,由于司法实务中相关证据运用存在困境导致案例样本量不够丰富,以及信息技术的持续衍进及发展,当前学界有关大数据证据的主题研究呈现出不同的场景和适用理解,以及或许脱离了司法实践中存在的具体证据形式而在一种抽象概念之上展开阐述的混杂格局。再者,现有的理论研究提出有关提交法庭的相关大数据证据材料的审查,侧重偏向于一种技术主义的研究进路,而忽视与刑事诉讼中的诉讼参与主体与证据使用的机制结合。以上问题的产生,一定程度上是源于真正呈现于庭审活动的大数据证据应用有限,多数运用了大数据技术和方法的证据材料在庭前都已经转化为传统的证据形式来作为最终定罪量刑的依据。另外就是目前对于“大数据证明”的研究较少
1 ,关于证据材料背后的大数据证明的证明方法和内在机理仍然不甚明晰,有待厘清。这也使得“大数据证据”主题下的研究尤其是有关审查规则、质证规则等领域内容的兴起也引发了部分学者对这类研究价值和意义的质疑和困惑,甚至将其引为“伪学”的诟病。事实上,以目前的科技发展水平和司法现实样态来看,大数据证明的司法价值不仅仅在于提供直接作为定罪量刑依据的证据材料,更在于挖掘事实信息之间的客观联系与数据信息结构化处理后形成的证据推论。因此,本文将不拘泥于“大数据证据”的特性、证据形式等静态的证据类型分析,而是从实证的角度出发,以我国司法判例中大数据证明的实务运用为基础,重点关注和阐明大数据证明方法和手段在我国当下刑事司法证明活动中的作用和内在机理,再以理论检视回归证据法和诉讼制度的规则完善,以期为今后的大数据证明和证据体系的构建提供一些学理上的基础和参照。二. 大数据证明的司法适用
大数据证明通过使用大数据技术对海量数据进行收集、分析、碰撞、提取后发现对案件事实或要件事实具有证明作用的信息与线索,并可以通过经专门设计过的算法模型,提出传统经验式证明极难或无法发现的信息或事实。既然大数据证明是一种基于现代信息技术的发展而创造了新的应用价值的司法证明手段、方法,那么对大数据证明的认识和界定,应当从回应司法实践的适用需求的角度而非语义学出发,即采取一种应用导向的方法论进路。
侦查机关在诉讼活动中具有强势的犯罪控制的职能取向,往往积极通过寻求技术手段的创新和应用以不断提高犯罪侦查乃至犯罪预防的效率及准确性。近年来我国各地公安机关都探索建立了诸如吉林省“云眼车辆大数据应用系统”、山东省“大数据警务云实战平台”、云南省“公安大数据综合应用服务平台”等日渐智能和完善的大数据侦查系统。从应用的主要技术方法来看,大数据技术在刑事侦查活动中主要有两类侦查方法。一类是数据搜索和统计,即通过对存储了海量数据的公权力机关内部或社会及企业数据库进行涉案人员、关系、行为等线索、信息的查询、收集、提取等。最典型的即通过公安机关身份信息查询系统、国家反诈大数据平台等进行涉案信息数据的搜索或统计。另一类是数据挖掘和分析,主要是指通过设计建模的算法模型从海量信息中发现、挖掘其中隐含的具有潜在价值信息的技术决策过程[4]123,司法实践中常见的如行为人活动轨迹分析、犯罪组织架构、涉案资金流向分析等主要应用场景。尽管大数据已经在司法证明领域发挥了重要作用,但由于大数据侦查运用的隐蔽性,以及当前大数据证明处于相关法定证据种类形式要件缺位的规范适用困境之下[5]
2 ,因此大数据证明的运用往往杂糅于传统证明的认定路径之下,可公开获取参考的相关案例较少。一 大数据证明在刑事司法证明中的多维运用
以“大数据”为全文关键词搜索中国裁判文书网上公开的相关刑事裁判文书,从一些典型的个案应用,以及其显现出的共性的价值和问题,得以窥见大数据证明司法适用的实践雏形。通过对审判实践中应用情况的实证考察,可以总结出当下大数据在我国刑事司法证明场域中的证明作用表现在以下几个方面:
1 证明涉案主体的同一性
由司法适用的案例总体来看,大数据在当下的刑事司法证明活动中最主要或是说最易于被裁判者采信的应用形式就是对于涉案主体的同一性的认定。主要是借由大数据技术进行人身同一性认定方式,诸如人像对比等生物特征识别技术
3 ,DNA检测对比、指纹对比等生物痕迹检验比对4 等获得的分析认定结论。由案件裁判文书中对这类证据进行审查判断的采信理由来看,这些基于相对成熟和应用普遍的算法模型的大数据比对技术获得的对于涉案主体的人身同一性证明,已经得到法官可以直接采信的司法承认。并且,随着生物特征识别技术的不断迭新及精密发展,将会进一步扩展人身同一性认定的证明方式和范围。2 证明信息载体的关联性
电子证据的本质特征在于虚拟空间性抑或数字性,这决定了在案件事实中发挥证明作用时要考察其证据的特殊关联性,即电子证据具有的不同于传统物理空间证据的双向关联性[6]35,包括内容上的关联性及信息载体的关联性两个层面。信息载体的关联性能够确定涉案主体与数据信息是否相关,法庭只有确认了信息载体与行为人具有身份关联性,或是处于行为人控制之下即行为和时空的关联性,才能从虚拟空间延伸至现实物理空间,将电子证据的证明内容与特定人关联起来。这在涉信息网络犯罪中,向来属于证明的难点和质证的争点,通过利用大数据对犯罪嫌疑人的行为轨迹、行为习惯、特征信息等进行综合评判
5 ,可以认定犯罪嫌疑人和信息载体具有关联性,从而完成虚拟空间犯罪行为归责于被告人的证明推论。这类证明材料在司法实践中也已经获得法官的采信认可。3 证明海量信息的涉案数额
在我国犯罪构成要件的证明结构中,罪量要素决定了罪与非罪或是否从重或加重处罚的裁判结果。在当下大量涉网络犯罪尤其是大数据的时代背景下,由司法解释的细化规定,关于相关犯罪的罪量要求也表现为“公民个人信息条数”“会员账号数”“音视频文件个数”“图片数量”等海量数据标准[7]。此类罪量要素的证明的认定,要以网络和数据库作为信息载体的海量数据信息为依据,由于涉及的数据信息高达数几十万甚至千万、亿级以上的数量级,一般都是借由大数据算法模型自动统计和认定。例如以网络云计算平台的海量镜像文件、数据库备份文件作为原始数据信息
6 ,以认定相关涉及资金总量、人员数量等。这类大数据证明材料在法庭中多以司法鉴定或委托、聘请专家出具专门报告的形式出具。由司法判例来看,作为重要犯罪构成要件的海量信息数据,法官一般在考量辩方提出的明确反证以去除掉真伪不明的数额之后,予以认定。4 证明犯罪行为
在现代信息社会中,尤其是伴随着各行业产业数字化转型,人类的各项社会行为都极易被记录、存储、采集、关联。而大数据的应用基础即是通过海量数据的大体量汇聚,将原本平行碎片化采集、存储的小数据,通过多样性的数据处理和挖掘技术,以形成归纳性推理的价值转化。得益于我国公安及社会监控系统的普及,征信信息等系统的互联,以及数据权属的公权力规制,使得侦查机关可以打破数据壁垒,多维度立体式侦查犯罪嫌疑人的犯罪行为、行为动向、行程轨迹等。在一般的刑事案件中,也都可以基于身份信息查询、车辆记录系统、视频监控记录、住宿登记记录、交通出行购票记录、出入境记录、通话记录等综合研判犯罪行为人的涉案行为经过、行为特点、行程轨迹,以助于从客观时空和行为的层面掌握犯罪经过等重要的证明事实
7 ,与其他的在案证据相互印证,以构建完整的案件事实。5 证明犯罪构成中的特征信息
大数据技术应用中的核心技术原理,即是以某一或不同数据库中的海量数据信息为基础,通过统计或行为建模,设计专门的算法模型[8],以作出有效的数据分析结论。在刑事犯罪治理中,尤其是网络犯罪案件、涉众型犯罪案件、金融犯罪案件中,通过对罪名构成要件中的行为或组织特征研发和设计专门的算法证明模型,在个案中利用大数据挖掘和分析技术,直接输入或通过软件程序抓取获得原始的涉案全量数据,经智能化程序作出分析结论,并作为相关罪名核心要件的证明支撑。例如在互联网金融犯罪中,依据提炼和总结的不同类案的普遍规律和特性建立特征算法模型,调取个案中国家反诈大数据平台资金流水、银行卡交易明细、个人钱包明细等涉案数据信息进行综合研判分析,作出相关性网络刻画,用以查明和判断犯罪成员层级架构、资金流向、组织属性、人员关系和发挥的作用等等关键信息。还比如,海量淫秽色情视频的算法认定、洗钱犯罪中在海量数据中挖掘、采集被删除的资金交易数据等等应用场景。这类大数据证明方式在司法适用中一般被称之为大数据分析报告,随着大数据技术在犯罪侦查中运用形态的不断升级和算法模型的日益成熟,经反复验证和深度学习,可以预见在未来这将会是极具潜力的大数据证明应用场景。但基于数据分析算法乃至人工智能技术形成的可用于证明案件事实的机器意见,其内在机理是不同于作为人的专家作出的鉴定意见和专家意见的机器逻辑,因此有不少学者呼吁基于这类证明材料作为机器意见的特殊性应当确立独立且创新的证据种类,以充分利用和发掘其在刑事证明中的价值和作用。在当前的司法实践中,大数据分析报告证据往往转化为书证、鉴定意见甚至电子证据予以举证,在庭审活动中最终一般都会被法官采纳,并作为最终的定案依据。
二 大数据证明在刑事司法证明中的前瞻性应用与研究
除了从现实案例中总结概括得出的大数据证明的司法适用样态,一些有关大数据分析在刑事司法证明中的应用研究也提出了一系列并非直接用于案件事实要件的证明但颇具现实性及前瞻性的应用前景。例如:1.以既有的数据经验作为法官心证参考。大数据在在案证据之外的事实认定环节中的作用机制。简单来说,是在法官缺乏背景经验或判断的依据时,以既有的历史性行业领域或司法裁判的全量数据做出的统计信息作为客观的概率经验,来取代人类经验简单的主观认知[9]。但由于这类证明方法的本质是数理关系而非客观事实,因此在司法活动中的适用必须设定合理的限度,强调其概率性和参照性。2.人身危险性、再犯可能性评估,以作为司法机关裁判或减刑、假释的考量依据。大数据技术最具开发和应用的价值是预测功能。近一百年来,全世界都在探索通过风险评估工具进行犯罪预测,“据统计,当前世界范围内有超过200种风险评估工具被用于刑事司法和司法精神病领域”[10]。美国的司法机关已经普遍采用大数据风险评估系统来对犯罪嫌疑人的社会危险性、人身危险性进行评估,并将其作为逮捕、量刑和假释的依据。我国在北京、上海一些地区也以近年的案例数据库为支撑在设计和建立相关的量化评估系统上做出了探索性的尝试[11],大数据证明在这一领域还会有更长远的发展。
从大数据证明的应用样态及典型案例的实证分析中可以发现看出,总体来说,大数据证明在我国当前的刑事司法实践中多表现为初级的运用形态,这源于理论上的分歧和缺漏及实践中的桎梏和质疑两个层面的困境。在网络信息时代背景下,大数据技术将成为今后支撑组织架构及社会治理的底层技术和高效手段,在迎合需求和反向规制的双重驱动下,未来应当形成一系列体系性、标准化的大数据证据及证明机制。在这一远景目标下,在对大数据证明的司法适用进行考察过后,还应当深入其本质的内在原理与运行机制,以理论检视从而回归证据法和诉讼制度的规范完善。
三. 大数据证明的内在原理与运行机制
大数据证明作为一种新型的证明方法,在证明机理上与传统司法证明相比最重要的差异即是利用智能化算法,从而在一些涉及海量证明对象或主观推理困境的案件中,利用数学模型和超强算力超越了基于人类经验认知的经验式证明方法的能力和边界[12]。由司法适用的现实样态来看,大数据已经成为现实的证明手段,并且提供了一些新的证明方式和证据内容。有学者论之大数据分析“最显著的特征是全样本、混杂性、相关性”[9],也有学者认为大数据证明“具有衍生性、电子性、科技性和间接性等特点”[13];但本文认为,与传统司法证明相比,大数据证明最鲜明的特点在于智能化、模型化及特殊相关性。智能化指的是机器决策过程,即自主的智能化过程。模型化指大数据证明对于不同的证明对象要使用专门的算法模型,亦即利用类型化的数据挖掘和分析技术对海量数据进行筛选、过滤和分析。特殊相关性是指大数据的相关性是一种超越人类经验判断的以数理统计的“数据经验”为基础的相关关系,大数据证明的关联性规则需“由机器识别的关联性意见转化为人类接受和认同的因果关系认识”[5]。从大数据证明的特性出发,要认识大数据证明的内在原理与运行机制,可以采取一种要素思维,其本质包含“海量信息+数据处理+结论”三点要素,同时这也是对大数据证明可靠性审查的三重核心环节。
一 基础性要素:分布式的海量数据信息
海量数据作为大数据证明的首要要素,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的统称。海量数据信息是数据化的个人和社会运作方式的信息记载,具言之,由于人类社会行为和组织关系经由电子化设备和技术必然会在虚拟空间或者数字空间留存数据痕迹,与之相关的还有数据信息伴生的附属信息和关联痕迹[6]16些可存储、记载、体现、分析的行为和关系信息量远远超于在借助现代信息技术手段之前仅凭人类经验记忆、推断和计算、发现的传统认知能力和水平。但在本质上,其仍然是人类行为本身产生的数据痕迹,是数字化的人类行为和社会关系等信息的客观记载。大体量的数据是大数据技术系统的输入端基础,具有多样化的种类和来源,包括来自不同的云系统、数据库的结构化、半结构化和非结构化数据等。在大数据侦查活动中,对于涉案大数据的数据收集体现为三点基本要求:一是数据的集合性,即数据收集过程中应当结合行为人、犯罪嫌疑人案件发生前后的密集化行为、行为表现特征、综合联络信息、活动轨迹等进行采集存储和分析研判,而非仅仅单一要素的数据信息采集。二是数据的本体性,如上文所述,数据信息是将人类行为及社会信息等一切经计算机、网络等现代信息技术手段、设备、载体存储、留存的过程性与综合性数字化记录的集合。数据信息产生于人与人、人与信息载体终端的数据信息交换和交流,因此人的行为是一切数据产生的本体源头。三是数据的全面性,在大数据侦查中应当避免抽样采集,但值得注意的是,在运用大数据证明中,理论上应当是相关的全量数据,但客观现实中只是基于特定案件中客观能够获得的分散式存储数据仓库。并且由于大数据涉及信息数据量巨大,并且格式和种类不尽相同,原始数据的选取、收集方式、数据收集标准以及信息源的处理方式,都会影响大数据证明的结果和准确性[14]151-153。
证据的真实性审查是证据相关性和实质性的核心,对大数据证明结果真实性审查的重点是原始数据的真实性,亦即数据的鉴真,包括原始的数据收集和数据清洗过程中保持数据的原始性、客观性和完整性。具体来说,在数据收集程序,应当考察数据质量、数据重复、数据缺失、采集手段规范性、采集范围偏差等。数据清洗程序中,审查是否存在数据混同、丢失、污染的风险。在数据保全环节,涉案数据可能存储于云平台上,分散在不同的物理服务器上,如何对大量的数据进行保全是亟需解决的问题。
二 技术性要素:数据处理
在海量数据基础之上的数据处理,主要指的是通过算法和软件进行数据处理、数据挖掘等大数据技术方法的过程。具体来说,在现有的大数据技术背景下,大数据侦查方法主要包括数据搜索、数据碰撞等通过大数据技术直接获取目标数据,以及数据挖掘、数据画像、犯罪网络分析等以海量数据作为原材料进行挖掘二次分析后获得数据分析报告材料两大类别。大数据证明的核心过程即在于使用的智能化算法,算法代表着用系统的方法解决某一问题的计算过程,“算法将问题情境转换为限制条件,将问题要点抽象为计算变量,将整个问题切换为数学模型,通过公式化运算求解答案”[15]。在专业技术领域,目前的研究关注重点都集中于算法的“黑箱效应”“算法偏见”问题,其症结在于大数据技术是建立在相关关系分析的基础之上,我们只能看到输入的原始数据和程序输出后得到的分析结果,但无法知晓其中运算和分析的过程,机器也无法自行解释,当机器逻辑与人脑逻辑产生矛盾,并难以验证时,由此引发人类对于大数据分析结论正确性的质疑和反对。所以在数据鉴真之外,算法与程序的可靠性也是大数据证明可靠性的核心要素。在算法维度大数据证明存在的可靠性风险,主要取决于算法源代码的本身是否可行可靠,以及运行程序的稳定性和司法场景的客观性。但从司法适用的现实情况来看,我国在刑事侦查程序中沿用的大数据相关技术系统,在算法和程序上都是相对成熟和普适的,有时也会存在具体案件中就个案情形搭建算法模型、设计程序的需求和情形,因此可以针对不同场景下的算法和程序采取分流式的审查进路。
三 结果性要素:分析结论
分析结论是大数据证明方法直接呈现在法庭中的存在样态。大数据的核心技术特征即从海量非结构化的低密度价值数据信息中“挖掘”和整合出结构化的信息相关关系及规律价值,海量信息只是进行数据处理的原料和基础,大数据不在于“大”,而在于数据挖掘和分析的价值。大数据分析作出的结论同诉讼活动中的专家证据一样,具有专门知识性和意见证据属性,但区别在于大数据分析结果是由程序设计语言作出的机器意见,其本质上输出的是一种机器逻辑,在一定程度上可能会引发人类的理解困境和质疑。因此大数据证明结论的可靠性系于大数据分析结论的可解释性,即分析和预测过程可以转化成具备逻辑关系的规则。当依据数理统计和运算模型作出的分析结论并不符合甚至悖反了人脑的决策认知时,将会令人对于计算模型产生不信任感,有损司法裁判的说理性和可接受性。在刑事司法领域的大数据分析模型选择,不能仅考虑数据处理有效性的单一指标,而应当兼顾考虑模型的准确度和可解释性,实现大数据分析结论的安全、公正和透明。
四. 大数据证明的理论检视
作为一种基于海量数字信息,并依托算法和计算机程序技术获得对事实认定有证明价值的信息材料,大数据已然进入了司法证明领域,引发了司法证明方式的革新。以大数据证明在司法适用中的现实样态为研究方向的锚点,可以避免学术研究纸上谈兵,脱离司法实际,在对大数据证明的内在原理与运行机制进行考察,探究其相应的审查分析方法之后,最后还是应当进行理论层面的检视,以完善大数据证明相关规则制度的构建。
一 证明本位:证据法律属性
1 法律属性缺位
尽管大数据技术在刑事侦查活动中作为收集、分析案件线索及证据材料的科技手段由来已久,尤其是相关通讯监控、轨迹定位等此类信息技术在成熟普及之前就已经长期作为技术侦查措施;但根据相关研究,即便是在大量裁判文书中明确显示使用过大数据技术侦查手段,而由大数据技术所获取的材料信息最终均未作为诉讼证据[16]。这反映出我国在智慧司法变革之下对于大数据等现代信息技术的介入在静态证据制度和司法证明场域的审慎态度及滞后性。但大数据分析获得的相关结论作为证明待证事实可能存在的客观依据,不仅具备证据属性的内核要件,并且有助于缩短推论的证明过程,甚至拓展了先前传统司法证明的空白领域,在司法证明领域具有独特且潜力巨大的证据价值。
要将利用大数据技术形成的证明材料运用于事实认定,首先要解决的即是其证据资格问题。从司法证明对于证据的实质要件来看,一切能够证明案件事实的材料都可以作为证据。而作为时代发展衍生的科技产物,大数据证明结果进入诉讼程序的障碍在于其无法准确锚定于刑事诉讼法中规定的八类证据种类,因而也就不具备了作为证据的法定形式要件。法定证据形式审查是证据材料在经关联性审查后的必经环节,是证据材料进入法庭调查程序前确认其是否具有准入资格的程序要求。尽管我国列举式的法定证据类型体系早已饱受诟病,一直以来也有一些学者疾呼摒弃这一封闭式的证据种类规定转而建立开放式的证据形式立法体例;但在现行规范下司法实践想要采纳、采信诉讼一方提出的某项被作为对案件事实有证明作用的大数据证据材料,只好进行证据的形式转化,将其“挂靠”在一些在表现形式上有某些共性但内涵并不严谨的证据类型下,如物证、书证、电子数据、鉴定意见等[17]。公诉方和法官都试图从立法规范和司法运行中找到一条可融贯、可兼顾互通之权衡进路,既避免排除对案件事实有证明作用的证据材料,又借以发挥这类证据方法的客观证明作用。尽管将大数据证据转化后能够纳入到现行法定的证据制度框架下,但证据转化的适用方式对司法的公正性贻害无穷。从证据法治基本原理的角度来看,这样的做法背离了证据裁判原则,违反最佳证据原则,诉讼各方无法对大数据证据进行有效质证,使得辩护方的辩护权利虚置,甚至会助益于掩盖规避非法取证行为[18]。由审判案例中还可以看到,在公诉方提出指控的证据体系中出现了一些大数据分析报告的证据材料,并被法庭予以采纳作为定罪量刑的依据。这反映了在大数据时代背景下,大数据证明进入司法适用已经显现出价值鲜明且不可替代的趋势,并且在当下的司法实践中,证据种类转化的方法也没有办法解决所有的大数据证据在刑事诉讼中的使用问题。为破除这一系列由大数据证明方法的法律属性缺位导致的司法适用困境,亟需赋予那些通过大数据技术收集和作出的证据材料作为证据本位的法律地位。从长远的证据制度化建设来说,更重要的是应当确立一种更具包容性和开放格局的科技证据体系模式,同时探索建立起一套框架性的证据分析方法,以解析和解决科技加速度发展背景下不断衍生和发明的涉及专门知识的新型证据的举证、质证和采证的司法证明问题。
2 证明本位探究
首先应当明确,学界重点讨论的大数据证据并不是某一表现形式的证据种类,而是一类理论概括的证据种类,类似于技术侦查证据、科学证据等证据法概念,其与八种刑事诉讼法定的证据类型不是同一位阶的法律概念[19]。大数据证据意指在诉讼活动中为查明相关犯罪事实和信息,运用大数据技术收集和作出的能够证明案件事实的大数据分析结论,在这一问题中,容易陷入的误区是要注意区分大数据证明与利用大数据技术获得的证据。由上文第一部分关于大数据证明在司法适用现实样态的考察,可以总结出目前通过大数据证明方法主要体现出来的两类证据内容。
一是大数据分析结果。现在司法适用中一般称之为大数据分析报告,其“报告”之称谓在证据法体系中其实反映出一种作为定罪量刑参考的法律属性意味,但如上文所述,在当前的司法实践中,法官对于控方提出的大数据分析报告基本上都是予以采纳而不是排除,这样的司法采信惯例会促进大数据分析结果在刑事诉讼活动中的使用和发挥司法证明作用。以证明对象不同,可以将大数据分析结果分为三种类型,一是客观事实性,即指能够证明客观案件事实的大数据分析结果;二是相关关系型,即用以发现和确认间接事实之间、时空行为之间、“人—物—案”等的关联性;三是特征要件型,主要是指通过算法模型进行数据挖掘、数据刻画和犯罪网络分析等方法作出大数据分析结论,证明罪名构成要件中的行为或组织特征。具体分类内容及适用,详见表1。
表 1 大数据分析结果的类型划分证明对象 类型特征 具体证明作用 举例 客观事实型 通过数据搜索、数据碰撞、数据挖掘等大数据技术发现和证明客观待证事实。 证明涉案主体的同一性;
证明海量信息的涉案数额;
证明犯罪行为如互联网金融犯罪中,分析涉案公司及其关联公司股权结构和资金流向,发现集资诈骗犯罪事实;再如在洗钱犯罪中,通过互联网数据挖掘发现被删除的资金流转信息。 相关关系型 通过对不同云平台和数据网中的数据进行综合集成和分析研判,发现和确认时空的关联性和主体的同一性。 证明“人—物—案”的
关联性;证明犯罪行为如大数据查询通话记录证明、行程监控、交通信息、
住宿信息等确认信息终端及信息终端的使用人特征要件型 通过基础数据筛选并借助数据库和大数据分析技术,作出犯罪构成要件涉及的
行为或组织特征。证明犯罪构成中的特征信息 如毒品犯罪、恐怖活动犯罪等有组织的犯罪罪名,用以发现和分析犯罪组织内的人员关系、组织架构、分赃分工等特征信息。 二是海量数据集合。这其实是一项颇有争议的问题,即海量数据本身是否属于大数据证据的范畴?其实这一问题的核心关怀在于海量的数据集合是否有其特殊性,并适用特别证据规则的需要?海量的数据集合一般是通过运用大数据搜索、数据碰撞的方法获得的全量涉案大数据副本,许多学者都基于海量数据信息本身具有电子数据外部性的特征,认为直接归属适用电子数据使用和审查的证据规则[20]。本文认为,案件中收集和统计的海量数据依然要区别于现行规定中的电子数据,这两类证据形式有共性,但无法完全等同,具体来说:一是从核心的证明内容上来看,电子数据重点是直接证明案件事实,一般是形成于案件发生过程中;但大数据是通过整合数据资源以发掘事物背后隐藏的关系,需要特别关注数据的全面性、完整性、数据的计量分析、涉及数据统计、数据清洗、数据碰撞,甚至涉及诸多与案件无直接相关的分布式存储载体。二是从审查方式上来看,大数据会应用抽样、概率、算法统计等特殊的审查手段,现行的电子证据司法鉴定无法切中其关键要点。因此,在证据调查活动中获得的海量数据应当适于大数据证明特殊的审查判断方式,而非简单沿用电子数据的审查判断方式。
二 机器意见:事实认定原理
1 审查的理论范式
在我国的司法活动中,相对比国际上尤以美国、英国为典型的经济发达国家的司法运行,长期存在着科技化程度不高的问题。在一些西方国家借由相对完备和开放的专家证人制度,促就了发达且覆盖领域广泛的法庭鉴识科学。但我国迄今仍以相对僵化和封闭的司法鉴定的规范化管理为体制。当出现新的科学技术及手段,转化适用于刑事司法领域的存在更明显的滞后性,往往也需要再来建立一套新的证据使用和审查判断的规则和机制,新型技术及证据类型用于有效指控和证明犯罪和事实的周期也会更长。毋庸置疑,随着社会生活网络化、信息化程度越来越高,尤其是针对用户特征的个性化推荐算法的的应运而生[21],使得社会数据资源越来越丰富和全面,大数据技术应用尤其是在刑事侦查领域会越来越普遍和高效。从价值论的角度,大数据证明不仅利用高效算力大大提升司法效率,弥补传统经验式司法证明的认知短板,还能够为事实认定提供先前未知的证据材料,拓宽人类证明活动的认知边界,将来越来越多的犯罪“情节”和“后果”都要借助大数据证明才能实现[22],在未来更有着人身危险性评估、犯罪风险预测、发现未遂犯罪等广阔的预测性应用前景[12]。“在为法院判决提供事实认定结论方面,常识和传统的证明方法就遭遇了科学数据的竞争。这些数据往往概念复杂,数量非常丰富,而且有时甚至是违反直觉的。进而法院频频遭遇复杂的科学技术证据,只有那些拥有高度专业化知识或杰出技艺的人才能毫无困难地领会。”[23]201与归类于何种证据类型出示于庭审相比,大数据证明内在的证明机理及如何对案件事实发挥实质的证明作用才是司法证明活动中更为实际的问题。因为依据外部性特征作出的证据种类定位仅有举证归类的规范作用及审查方法的参照作用,而这也使得在庭审中对于大数据证据的调查活动主要体现为对取证规范要求的对照判断,从而流于外部性的形式审查。基于大数据获得的证据材料,有时甚至是在全量数据的基础上进行数据分析和处理,从理性和认知的角度来说,是超越人类理性能力范围之外的客观或经验事实。对大数据证据的审查范式本质上是对诉讼中涉及的专门性问题进行有效审查的专家证据路径,需要经由专业人员辅助证据调查,在我国现有的证据审查和事实认定的司法实践样态下,可以参考域外科学证据法官具有的“守门人”职责,重申和强调法官的专门审查义务,同时充分发挥有专门知识的人就案件的专门性问题进行审查和解释说明的作用,以强化证据调查活动的实质性。
2 逻辑和推论方式
事实认定是在收集和采信的证据基础上形成证据性事实碎片到推断性事实再到要件性事实的证据推论过程。证据裁判本质上是一种理念化的事实认定方式,作为现代司法证明的基石性原则,其内核是事实认定的理性化。而大数据证据的理性化体现,不同于以往的事实认定基于经验的论证判断过程,而往往是通过非结构性的数据化信息建立了一种可关联和概率性的事实呈现。这也是传统事实认定过程中事实认定者主要基于多重信息印证、因果关系、显性相关关系等证据信息整合及证据推论的证明方式所不可能做到的。大数据分析只关心相关关系,而不考虑先验推理性的因果逻辑,即机器的逻辑只反映是什么,而不问为什么。与之相比,原有的事实认定活动偏重因果关系推断,是一种显性的相关性;一些大数据模型的分析结论是通过大数据挖掘基于机器逻辑的相关关系,反映了一种隐性的相关性。因此这将需要我们探索建立超越人类经验认知的新的大数据证据关联性规则[5]。
我国一直以来的传统诉讼认识论以唯物辩证观为指导,强调证据印证规则,认为只有从证据之间的相互印证关系才能认定证据是否确实、充分,由此也确立了“孤证不能定案”原则。由此推之,大数据证据不论作为直接证据还是间接证据,都不能单独地发挥证明作用。认定案件事实,要结合其他证据和大数据证据的其他附属信息共同以证据体系的方式来证明案件事实。有一些学者提出,大数据证据的兴起和运用将改变法院审判的传统事实认定机制,由因果关系分析发展为关联关系分析[24],但事实上,这一论断值得商榷。在我国的司法实践中,司法证明逻辑是直接涵摄于实体法规范中的罪名要件,只能说大数据证据本身的审查运用和证据论证是一种异于其他传统证据形式的证据分析方法。但说到底,不论是大数据作为证据本身,还是基于大数据作出的分析报告及结论,都只是作为指控证据体系中的一项,而非一套完整的指控证据链条。其具有的科技性、数字化、大体量的特征决定了其与传统证据材料的收集和审查方式的不同,但在司法证明的证据结构中,依然是作为间接证据需要与其他证据结合组合审查,以认定案件事实。
三 二元分化:司法审查进路
算法模型是大数据证明的核心独特性所在,相当于其机器意见生成的“大脑机制”。由上文对现有的司法案例的考察以及结合算法模型的设计和应用方式的讨论为基础,可以针对大数据证明涉及的算法模型建立一种二元分野的司法审查进路。具体来说,通过行为和特征建模形成算法模型对要件事实进行证明的大数据证明方法,以应用场景的稳定性为标准,通常可分化为类案通用型和个案专门型两类司法适用的类型。
类案通用型一般是指将类案中普遍的犯罪特征和证明规律形成相对稳定和普遍适用的算法模型。比如互联网金融犯罪中,已经研发出多种资金流向分析模型,来区分和认定具备不同要件特征的集资诈骗犯罪、非吸犯罪、组织领导传销活动犯罪等类案罪名。再比如在洗钱犯罪中,通过反洗钱类罪分析研判平台、借助大数据挖掘对于可疑的资金交易进行洗钱模式识别和计算可疑度[25]。这类算法模型及运行程序一般经反复验证,机器学习数据充分且全面,信息系统开放程度较高。
而个案专门型是根据个案中出现的具体犯罪行为特征及行为和数据之间的因果关系所设计的专门性的算法模型,是一种针对个案的行为建模,以统计或挖掘本案中的犯罪要件特征和信息,完成具体案件中的关键事实的认定。例如在最高检发布的典型案例“常某职务侵占案”中,为证明被告人支付宝、微信的收付款记录与案件的关联性,“检察机关联合被害企业风控和技术部搭建北京市涉案门店经营收入高低峰的大数据模型,实现企业、侦查机关、检察机关、犯罪嫌疑人四方数据共享。利用客观数据模型与主观供述证言相结合,制定四方均认可的数据分层化处理标准”[26]。以应用场景的稳定性为标准,是由于应用场景的稳定性是审查算法模型及计算结论可靠性的重要标准,能反映其技术成熟程度,准确度高低,从而用以评估经这一算法模型获得的大数据分析报告的证明力大小。除应用场景的稳定性之外,还有算法模型的复杂性、开放程度、可解释性等等审查维度,但由具体的司法效用及实操性上来看,应用相对成熟及普遍的类案通用型大数据分析模型无需在诉讼活动中临时进行算法设计,一般可以认定程序应用的稳定性较强,因此对这类大数据分析报告的调查重点偏重于原始数据的可靠性和相关性审查和质证。而个案专门型的大数据分析报告,在必要时仍然应当重点关切算法模型的科学性和运行原理,必要时应聘请具有专门知识的人出具专业的审查意见。
最后,由分化标准的确立可以构建具有针对性的证据调查规则:类案通用型可以设置依申请和依职权的审查程序规则,当诉讼主体一方对大数据证明所依据的算法和程序提出异议,应当进行算法的可靠性审查;而个案专门型应当让法官承担必需的审查义务,以规避算法证据应用的权力异化风险,保障司法公正。
1)1 以“大数据证明”为标题关键词在中国知网进行文献检索,能够发现主要有两篇比较有代表性的以“大数据证明”为主题的期刊论文,分别为谢君泽的《论大数据证明》(载《中国刑事法杂志》2020年第2期)和王燃的《大数据证明的机理及可靠性探究》(载《法学家》2022年第3期)。2)2 大数据证据的法律属性问题是当前大数据证明研究中的首要课题。在我国法定的证据形式作为证据前置性证据资格要件的立法体例之下,证据种类成为限制大数据证明在司法适用中的第一道难以逾越的门槛。关于这一制度上的困境,学界也已经进行了充分且观点各异的理论见解。相关观点和讨论可参见刘品新的《论大数据证据》,载《环球法律评论》2019年第1期。3)3 例如“大数据分析比对,发现其疑似伪造身份信息为刘洋。经人像平台比对发现与河南籍李某某相似度达100%”。参见“陈钢故意伤害案”,新疆维吾尔自治区乌鲁木齐市中级人民法院(2020)新01刑初45号一审刑事判决书。4)4 例如“通过提取现场斑迹进行大数据比对后锁定行为人系被告人王雷”。参见“王雷盗窃案”,浙江省台州市椒江区人民法院(2021)浙1002刑初533号一审刑事判决书。5)5 例如“公安机关根据其上线使用的微信信息,经技术侦查,锁定登陆该微信手机,经大数据情报研判,确定手机的使用人为郑昌龙。”参见“郑昌龙、张进走私、贩卖、运输、制造毒品、骗取贷款、票据承兑、金融票证案”,黑龙江省哈尔滨市中级人民法院(2017)黑01刑初108号一审刑事判决书。6)6 例如“司法会计鉴定意见所依检材主要有被告单位在阿里云存储平台保存的充值及提现数据、相关第三方支付公司提供的与金某2公司和英途财富公司的交易资料、e租宝平台和芝麻金融平台上线债权项目调查材料、钰诚融资租赁公司控制使用的公司及个人银行账户清单、银行交易流水、刘静静记载的支付项目中介费明细表等”,参见“刘曼曼等非法吸收公众存款案”(“e租宝案”)北京市第一中级人民法院(2016)京01刑初140号一审刑事判决书。7)7 例如“11.轨迹信息情况,根据云南公安大数据综合应用服务平台证实,2018年4月16日2:03分李永进入住云县和云居403房间,20:43分通过云县公安检查站,退房时间为2018年4月17日11:54分。”。参见“李军、李卫民走私、贩卖、运输、制造毒品案”,云南省高级人民法院(2019)云刑终673号二审刑事裁定书。 -
表 1 大数据分析结果的类型划分
证明对象 类型特征 具体证明作用 举例 客观事实型 通过数据搜索、数据碰撞、数据挖掘等大数据技术发现和证明客观待证事实。 证明涉案主体的同一性;
证明海量信息的涉案数额;
证明犯罪行为如互联网金融犯罪中,分析涉案公司及其关联公司股权结构和资金流向,发现集资诈骗犯罪事实;再如在洗钱犯罪中,通过互联网数据挖掘发现被删除的资金流转信息。 相关关系型 通过对不同云平台和数据网中的数据进行综合集成和分析研判,发现和确认时空的关联性和主体的同一性。 证明“人—物—案”的
关联性;证明犯罪行为如大数据查询通话记录证明、行程监控、交通信息、
住宿信息等确认信息终端及信息终端的使用人特征要件型 通过基础数据筛选并借助数据库和大数据分析技术,作出犯罪构成要件涉及的
行为或组织特征。证明犯罪构成中的特征信息 如毒品犯罪、恐怖活动犯罪等有组织的犯罪罪名,用以发现和分析犯罪组织内的人员关系、组织架构、分赃分工等特征信息。 -
[1] TONY H,STEWART T & KRISTIN T. 第四范式:数据密集型科学发现[M]. 潘教峰,张晓林,译. 北京:科学出版社,2012. [2] 中国司法大数据研究院. 涉信息网络犯罪特点和趋势(2017.1-2021.12)[R/OL]. 司法大数据专题报告 (2022-08-01)[2024-02-01]. https://file.chinacourt.org/f.php?id=c9b92b185f359c81&class=enclosure. [3] 最高法:今年以来全国法院共受理案件3051.7万件[EB/OL]. 人民网 (2021-11-23)[2024-02-01]. http://society.people.com.cn/n1/2021/1123/c1008-32289759.html. [4] 王燃. 大数据侦查[M]. 北京:清华大学出版社,2017. [5] 刘品新. 论大数据证据[J]. 环球法律评论,2019,41(1):21-34. [6] 刘品新. 电子证据法[M]. 北京:中国人民大学出版社,2021. [7] 王燃. 大数据时代海量数据的多元化证明机制研究[J]. 中国刑事法杂志,2022(3):87-105. [8] 谢君泽. 论大数据证明[J]. 中国刑事法杂志,2020(2):125-137. [9] 周蔚. 大数据在事实认定中作用机制分析[J]. 中国政法大学学报,2015(6):64-82,160. [10] 高通. 逮捕社会危险性量化评估研究——以自动化决策与算法规制为视角[J]. 北方法学,2021,15(6):131-144. [11] 严剑漪. 揭秘“206”:法院未来的人工智能图景——上海刑事案件智能辅助办案系统164天研发实录[J]. 人民法治,2018(2):38-43. [12] 王燃. 大数据证明的机理及可靠性探究[J]. 法学家,2022(3):57-71,192-193. [13] 孔德伦. 大数据证据在网络犯罪案件中的运用——以镶嵌论为视角[J]. 西南政法大学学报,2020,22(6):85-96. [14] 李建利,李宇尘. 大数据在刑事侦查中的应用研究[M]. 长春:吉林大学出版社,2017. [15] 栗峥. 人工智能与事实认定[J]. 法学研究,2020,42(1):117-133. [16] 程雷. 大数据侦查的法律控制[J]. 中国社会科学,2018(11):156-180,206-207. [17] 徐惠,李晓东. 大数据证据之证据属性证成研究[J]. 中国人民公安大学学报(社会科学版),2020,36(1):47-57. [18] 孙珊. 我国技术侦查证据使用研究[C]// 熊秋红,主编. 诉讼法学研究:第二十五卷. 北京:中国检察出版社,2021:202-214. [19] 程龙. 论大数据证据质证的形式化及其实质化路径[J]. 政治与法律,2022(5):96-114. [20] 马国洋. 论刑事诉讼中人工智能证据的审查[J]. 中国刑事法杂志,2021(5):158-176. [21] 谢永江,杨永兴,刘涛. 个性化推荐算法的法律风险规制[J]. 北京科技大学学报(社会科学版),2024,40(1):77-85. [22] 倪春乐,陈博文. 大数据证据的刑事诉讼应用机理研究[J]. 中国人民公安大学学报(社会科学版),2022,38(2):37-49. [23] 米尔建·R·达马斯卡. 漂移的证据法[M]. 李学军,刘晓丹,姚永吉,等译. 北京:中国政法大学出版社,2003. [24] 杨继文,范彦英. 大数据证据的事实认定原理[J]. 浙江社会科学,2021(10):46-54,156-157. [25] 李慧,田坤. 涉虚拟货币洗钱犯罪刑事治理的实践面向[J]. 人民检察,2021(16):23-27. [26] 最高检通报依法办理六起民营企业职务侵占犯罪典型案例[EB/OL]. 央视网(2022-05-05)[2024-10-17]. https://news.cctv.com/2022/05/05/ARTIT0ot82WLml2BIMDFps2f220505.shtml. -

计量
- 文章访问数: 185
- HTML全文浏览量: 117
- PDF下载量: 17
- 被引次数: 0