【202301062】批量公民个人信息去重问题研究


首页>>司法实务>>人民司法应用2011-2020>>正文


 

 

【202301062】批量公民个人信息去重问题研究
文/魏炜

  作者单位:北京市高级人民法院
  专题分类:个人信息保护
  摘要:
  根据刑法条文及相关司法解释的规定,涉案信息条数是认定侵犯公民个人信息犯罪的重要依据。在法律法规对信息去重方式尚无明确规定的情况下,司法实践中对批量公民个人信息甚至海量信息的去重不仅在技术层面上整体难度较大,去重方式的选择亦因涉案信息类型不同而有所差异。本文立足于北京法院近5年来侵犯公民个人信息犯罪案件审判实践,系统分析了司法资源现状、信息要素数量、信息存储形式等造成批量信息去重难题的根本原因,对批量公民个人信息去重路径进行了再厘清,即以辩方提出达到优势证明标准的抗辩为去重前提,重点考虑信息类型、要素数量、信息变动性、存储形式等因素选择出科学性强、合理性高的去重方法,并在兼顾诉讼效率的目的之下探索适用抽样调查等模式对批量信息数量进行重复性检验。
  期刊栏目:司法理论前沿
  随着科技手段的发展,批量公民个人信息甚至海量信息在侵犯公民个人信息犯罪案件中已十分常见。基于涉案公民个人信息条数渐趋庞大的现实情况及其带来的司法证明难题,2017年最高人民法院、最高人民检察院联合出台《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》(以下简称《解释》),由此确定了批量公民个人信息条数的基本认定规则,但如何对涉案信息进行真实性或重复性检验,法律法规尚无明确规定。在批量信息存在重复屡屡作为辩护理由被控方提出的前提下,涉案信息去重不仅在技术层面整体难度较大,去重方式的选择亦因涉案信息类型不同而有所差异,日渐成为困扰司法实践的一大难题。本文立足于北京法院近5年来侵犯公民个人信息犯罪案件审判实践,系统分析批量信息去重难题的根本原因,提出兼顾证明方式合理性、实践可操作性和诉讼效率的批量信息去重路径。
  一、涉案公民个人信息去重的必要性日益提升
  (一)侵犯公民个人信息案件中涉案信息条数呈现上升趋势
  经统计,2017年至2022年6月底,北京法院审结的侵犯公民个人信息犯罪一审案件共计165件,除其中21起案件以违法所得金额作为入罪或法定刑升档的依据外,其余142案件均以涉案信息条数作为定罪量刑的依据,此类案件占比高达86%(见图1)。近5年来无以犯罪目的、前科劣迹等《解释》规定的其他情节作为定罪量刑依据的案件。
  (图略)
  图1:近5年北京法院审理的侵犯公民个人信息案定罪依据图
  在涉案信息条数作为主要入罪门槛的前提下,案件中被查获的信息数量整体较大,海量信息已成为类案审理中的常态。统计发现,在上述141起以信息条数作为定罪量刑主要依据的案件中,查获的涉案信息数量在500条以下的有4起,500至5000条的有10起,5000至50000条的有52起,50000至500000条的有43起,500000至5000000条的有22起,5000000条以上的有11起(其中4起案件查获的信息条数过亿,最大信息条数约为6.2亿条)。[1]可见,在不区分信息类型的情况下,统计中过半案件中涉案信息条数超过5万条,约1/4案件中涉案信息条数超过50万条(见图2)。
  (图略)
  图2:近5年北京法院侵犯公民个人信息案件涉案信息数量图(略)
  另外,从历年情况看,案件中被查获的涉案信息数量整体上呈现出上升趋势。统计发现,自2017年至2022年6月底,涉案信息条数在50000条以下尤其是5000条以下的的案件占比逐渐减少,涉案信息条数超过5万条尤其是50万条的案件数量整体上呈现出上升趋势(见图3),5000-500000条的数量区间成为涉案信息主要条数区间,批量公民个人信息数量规模日益增大。
  图3:近5年北京法院审理的侵犯公民个人信息犯罪案件涉案信息表(略)
  (二)批量公民个人信息中“批量”的认定标准
  《解释》中有关“批量”的规定。虽然《解释》规定了涉案公民个人信息的条数是与信息用途、违法所得金额、前科劣迹情况等并列的、用以判断行为是否构成情节严重及情节特别严重的依据之一,但涉案信息条数在司法实践中已然成为判断行为性质的核心因素。为解决因涉案信息条数渐趋庞大而带来的司法证明难题,《解释》第11条第3款明确规定,“对批量公民个人信息的条数,根据查获的数量直接认定,但是有证据证明信息不真实或者重复的除外”。基于信息数量已成为定罪量刑主要依据且信息数量日益上升的客观现实,如何理解“批量”概念成为准确认定信息条数进而判断罪与非罪、罪轻与罪重的重要依据。
  笔者认为,在相关规范性文件均未明确规定的情况下,对“批量”的认识应回归到刑法文本本身,并以体系化的思维进行解释和把握。
  1.应明确《解释》第11条第3款的规范目的。就《解释》的制定背景而言,起草者关注到了涉案信息动辄数万条甚至数10万条,在不少案件中甚至将公民个人信息编辑为电子文档后按兆出售的客观情况,本着“坚持问题导向,有效解决司法实务问题”的需求,《解释》以设立司法推定的方式确立了批量公民个人信息的数量认定规则,彰显了严惩侵犯公民个人信息犯罪的立场。[2]因此,对批量信息的理解不应过分限缩。本罪法定刑不高,不属于社会危害性极其严重的犯罪类型,在当前办案资源有限的司法现实下,将批量信息认定标准放宽理解显然有助于平衡司法效率和司法公正之间的关系,否则将违背《解释》相关内容的规定初衷。
  2.应结合刑法条文内容对《解释》相关内容进行体系化理解。“批量”一词在日常生活中意为“一批/成批的数量”,这不意味着对“批量”的理解在任何情况下均可达到词义界限的最宽点。刑法第二百五十三条之一第一款规定:“违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,处3年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处3年以上7年以下有期徒刑,并处罚金。”因此,《解释》第5条规定的有关违法所得数额、信息用途、信息数量、主体身份、主观恶性等方面的认定标准,均属于对刑法中情节严重这类规范的构成要素的细化解释,以避免裁判者在具体法律适用过程中混淆罪与非罪界限。在认定有关违法所得数额、信息用途、主体身份、主观恶性等方面时,《解释》的起草者并未设立司法推定;而《解释》第11条第3款有条件地降低控方证明责任,则隐含了放宽情节严重判断标准的风险。因此,必须严格把握“批量”的最低标准,对解释批量行为进行体系性的控制,[3]由此把握规范解释的限度问题。在认定涉案信息是否属于批量之前,必须考虑信息条数是否达到了刑法规定的入罪或者升格处罚的基本数量要求。质言之,应考虑查获的涉案信息条数超过《解释》第5条规定的情节严重或情节特别严重的标准,再结合个案情况进行具体认定;在涉案信息条数接近或略高于情节严重或情节特别严重的最低条数标准,且法院以信息条数而非行为目的、违法所得等作为定罪量刑的主要依据时,必须检验涉案信息数量的真实性和重复率,避免因司法推定造成的事实认定错误。例如,针对入罪数量较低的50条敏感信息和500条重要信息,必须逐一检验其真实性和重复率,以实现罚当其罪。
  3.应结合个案情况对批量信息保持非固定、非统一的认定标准。由于《解释》属于我国最高司法机关依法对如何具体应用法律问题作出的具有普遍司法效力的解释,对《解释》内容的理解仍需紧密结合法律条文本身。刑法第二百五十三条之一以“情节严重”作为入罪判断标准,本身就是考虑到社会高速发展、科技飞速进步背景下刑法体系开放性的需要。要使刑法文本合乎当下的规范性需要,功能化的解释能有效缓解因外部环境复杂化而对刑法体系造成的冲击。[4]事实上,为了避免成文规范先天的滞后性,《解释》等规范性法律文件将界定批量信息解释权留给了司法机关,故对于批量信息数量标准的判断应根据各地类案办理实际情况具体把握,不宜设立固定的、统一的数量标准。
  (三)涉案信息批量性带来的去重必要性提升
  根据上文分析,当涉案信息数量超过《解释》规定的认定情节特别严重条数最低标准且超过数量较大时,司法机关一般可以综合属地办案实际,认定涉案信息属于批量个人信息。据此,结合上述“批量”概念的认定标准及北京法院审判实践情况,近5年来北京法院审结的超过半数的侵犯公民个人信息犯罪案件均存在批量公民个人信息。当批量性成为类案审理中涉案信息的常态属性时,对批量信息重复性和真实性的质疑也日益成为类案审理中辩方的主要抗辩理由。笔者调研发现,在上述142件以信息条数作为定罪量刑依据的案件中,约32起案件辩护人就涉案批量信息存在重复性问题向法院提出抗辩,占比约为1/4。更加值得注意的是,随着涉案查获信息条数的提升,以批量信息存在重复作为抗辩理由的情况越来越多(见图4)。在提出批量信息存在重复性问题的同时,对批量信息进行去重的申请往往同时由辩方向法庭提出。在辩方提出上述申请及相应证据时,法庭需要对批量信息进行去重。易言之,随着涉案信息条数的不断攀升,在越来越多的侵犯公民个人信息犯罪案件中,为了达到证据真实性的证明要求,对涉案批量信息进行重复性检验成为裁判者必须完成的任务,即批量信息去重必要性呈现上升趋势。
  (图略)
  图4:重复信息抗辩情况图
  二、批量公民个人信息条数去重的困境
  根据《解释》第11条第3款规定,在有证据证明批量公民个人信息不真实或者重复的情况下,不能直接按照查获的信息数量直接认定,而应核查信息的真伪性即重复性。虽然侵犯公民个人信息犯罪案件中批量信息规模日益扩大、去重必要性逐渐提升,但实践中司法机关对批量信息是否应该进行去重、如何选择去重方式都存在不少困惑。
  (一)关于信息存在重复的举证难题
  批量信息的去重难度首先体现在举证难方面。实践中,当涉案公民个人信息数量较大且被认定为批量时,有的公诉机关会直接以查获的全部公民个人信息数量进行指控;有的公诉机关会对涉案信息的基本构罪数量进行实质审核,而其余部分则因无定罪、升格刑罚的节点作用便直接进行认定。对此,辩方虽然会围绕信息真实性或重复性提出抗辩,但相关举证工作的难度较大。原因在于:首先,刑法修正案(九)将本罪犯罪主体由“国家机关或者金融、电信、交通、教育、医疗等单位的工作人员”扩展为一般主体,使得本案犯罪对象可以是任何行业领域中具有交易价值的任何信息,这也导致了部分犯罪人对涉案信息的具体内容并不了解或熟悉。其次,单位犯罪在侵犯公民个人信息犯罪中愈发常见,而相比于个人犯罪,以单位犯罪模式实施的侵犯公民个人信息犯罪往往拥有更强大的技术、人力及财力支持。[5]同时,随着侵犯公民个人信息犯罪产业链的发展成熟,相关犯罪的环节亦逐渐多元和细化。如果犯罪人作为单位犯罪的一员或犯罪链条的一环参与犯罪,其往往只是将经手的大量信息视作整体进行买卖、获利,对于信息的具体细节并不关注。再次,网络爬虫软件等高新技术手段极大提升了信息获取的速度和规模,由于上述软件能够瞬间任意抓取海量信息数据,抓取过程对信息数据的具体内容、访问权限、开放程度在所不问,而抓取后数据则直接被打包传送、处理。另外,公安机关在此类案件侦破时会及时查扣作案使用的服务器等,辩方难以接触涉案信息细节内容。综合以上各类因素,辩方就信息存在重复进行充分有效举证的难度较大。
  由于辩方的举证往往达不到较高的证明程度,法院在审查去重申请时面临审查困境。从准确认定犯罪事实的角度上看,即使能够证明信息条数在符合情节严重、情节特别严重基本条件的范围内不存在重复性疑问,但超过基本条件的部分依然应当依法直面有关信息重复性的质疑和检验。《解释》规定的不能根据查获的数量直接认定信息条数的前提条件是“有证据证明信息不真实或者重复”,而如何理解“有证据证明”,实践中的意见并不一致。法院判断涉案批量信息是否存在去重必要性的问题,归根到底是判断辩方就其所提出的信息重复性抗辩是否进行了有效举证的问题。在侵犯公民个人信息案件审理过程中,公诉机关仍需证明存在批量信息这一基础事实且达到事实清楚,证据确实、充分程度,在此基础上,控方需进一步对批量公民个人信息的真实性和重复性进行必要的核查。但是,部分案件中辩方提供线索或证据指向涉案信息中存在重复,其所提的线索或证据需要达到何种证明标准,才能促使法院在审判阶段启动或重新启动涉案信息去重工作,司法实践中分歧较多,亟待统一标准。
  (二)关于去重方式选择的意见分歧
  除针对是否应当去重存在意见分歧外,在涉案信息已经经过侦诉机关去重的情况下,控辩双方还针对具体去重方法的科学性、合理性存在意见分歧。目前,侦诉机关普遍通过委托鉴定机构对查获的信息条数进行鉴定,如果鉴定中涉及对批量信息数量进行去重,则一般由司法机关或鉴定机构自行选择一个或数个基准信息作为去重依据。这里所说的基准信息,指的是以某种具体的个人信息作为排除重复信息的标准。如在一条公民个人信息包括公民身份证号、家庭住址、车牌号、手机号码等多种信息时,以公民身份证号码作为排除重复信息的标准,剔除多余的同一身份证号相关信息。由于基准信息的选择将直接影响去重结果,辩方往往会对此提出异议。例如,实践中有的辩护律师质疑公诉机关以法人的手机号作为去重基准信息确定所出售的公民个人身份信息条数,有的辩护人则质疑公诉机关采用推算的方式获得去重信息数量。
  相比于没有对信息进行过重复性检验的情况,辩方针对控方已有去重方式的抗辩难度更大。一方面,辩方难以有效证明控方已选去重方法的劣势,同样也难以证明其提出的去重方式的优势。另一方面,批量信息去重工作难度大、周期长。笔者通过走访部分办案法院得知,就公安机关查处、公诉机关移送审查起诉涉案信息量过亿的案件而言,即使是委托专业鉴定机构使用大型计算机进行重复性检验,也需要耗时数周甚至更长的时间,且处理器可能因负荷过大而多次宕机,实践中因处理信息去重问题而依法延长审理期限的情况亦有发生。考虑到证明效果和诉讼效率,相关抗辩难以得到法庭的支持,有的裁判者在判决中直接以“无事实或法律依据”进行回应;有的驳辩称既然辩方无法提出确凿的相反证据,则应该直接认定批量个人信息的真实性或无重复性。
  综上,虽然为了达到证据真实性的证明要求,对涉案批量信息进行重复性检验是司法机关必须面对的任务,但围绕信息重复性、去重方式科学性等问题,辩方的证明难度确实较大,而裁判者亦面临审查举证是否足以启动信息去重工作的困境。部分法院在应对批量信息去重问题时选择直接采纳公诉机关提交的证据材料,对相关辩护意见的重视程度有待提升,且在审核去重结果、选择去重方式方面尚未形成较为成熟的经验做法。
  (三)关于信息去重方式的确定难题
  一方面,部分公民个人信息包含多个要素,去重实际工作量翻倍。在部分侵犯公民个人信息案件中,一条涉案信息会涉及公民姓名、电话号码、文化程度、家庭住址、银行账户、工作单位等多方面信息,其中还可能包括虚拟平台的QQ号、微信号等各类用户名。[6]目前实务界和学界的主流看法认为,虽然《解释》未专门明确一条公民个人信息的认定规则,但对于涉及某一公民多方面信息的一条信息,应当综合实践交易规则和习惯认定为一条公民个人信息。[7]例如,在北京市海淀区法院审理的巧达公司侵犯公民个人信息案中,被告单位利用网络爬虫软件爬取的是信息网络中的海量求职简历,其中一份简历包含姓名、出生日期、手机号、电子邮箱地址、教育背景、工作经历等多方面信息。[8]针对以上这类多要素信息,进行信息去重时需要根据去重基准信息要素个数匹配多方面信息,去重的实际工作量将随着基准要素的个数而翻倍。如果司法机关在处理批量信息去重问题时不能兼顾事实认定与诉讼效率,则《解释》所期望达到的节约司法资源的效果仍无法实现,亦不利于刑事诉讼程序的及时推进。
  另一方面,公民个人信息存储形式多种多样,去重难度因存储形式不同而升级。从北京法院近5年的审判实践来看,侵犯公民个人信息案件中涉案信息类型主要有个人征信、车档、行踪轨迹、租房、保险用户、职业、招生、美团京东等电商用户交易记录信息等;根据信息类型的不同,信息存储形式亦多种多样,主要表现为Excel工作表(格式为xlsx文件等)、图片文件(格式为JPG、PDF文件等)及文档合集(格式为Word、TXT文档等)。在对涉案信息进行去重时,除了需要分析去重基准信息的稳定性之外,还需要充分考虑信息的存储载体。例如,相较于Excel X作表,将多方面个人信息分条存储于同一个图片文件或Word文档中的信息去重难度更大。例如,在北京市东城区人民法院审理的王某侵犯公民个人信息案中,[9]涉案信息公民不动产信息均以JPG图片形式存储,其中一部涉案手机存储的图片就有近7万张。受委托进行去重的鉴定机构以不动产单元号为标准,对涉案图片中房屋信息进行人工去重,认定该部手机中的公民个人信息实际条数为550条。可见,因信息存储形式为JPG图片,该项去重工作难度大、周期长,但去重结果对案件事实认定的影响作用较大。
  三、批量公民个人信息去重路径的再厘清
  (一)以举证达到优势证据程度作为信息去重的前提
  《解释》第11条第3款的设置是在互联网时代大数据背景下为缓解控方证明压力对被告人举证负担的重申,并非证明责任倒置,也非证明程度的降低。[10]故这种高度盖然性的预设必然存在例外,允许被反驳、被推翻。
  1.举证主体。批量认定规则没有确立举证责任倒置的规则,在侵犯公民个人信息犯罪案件处理过程中,涉案信息存储介质、计算机、服务器等作案工具会作为证据移送侦诉机关,辩方收集证据、查证事实等诉讼能力相较控方而处于弱势,举证责任倒置不仅会增加辩方的举证压力,还会使控辩双方之间对抗力量的差距变得愈加悬殊。然而,关于涉案信息真实性和重复性的线索或证据仍应由辩方提供,其理由在于被告人在获取、交易公民个人信息的过程中熟知、掌握涉案信息的来源、主要类型、大致内容、用途等,在被告人认为控方认定的涉案信息中存在不真实或者有重复的情况时,应由其提供相对明确的证据和线索以强化其质疑的合理性。值得注意的是,为保证刑事诉讼程序的顺利有效推进,法庭应对辩方提供有关涉案信息存在重复的线索或证据的方式依法作出限制,[11]如明确要求辩方在诉讼过程中提供线索或证据的实践节点、次数等,禁止其突然地、无限制地提出抗辩以拖延诉讼进程。
  2.证明标准。对于辩方提出的指向涉案信息存在重复的证据,只要达到优势证据的证明标准即可。辩方需要提出相对明确的证据或证据线索,对推定事实的反驳所要达到的证明程度应低于公诉机关事实清楚证据确实、充分要求,只需达到优势证据标准。一方面,推定行为作为一种法律行为,相关的推定事实无法达到十分精确的程度,存在被证伪的风险;另一方面,推定行为中的不利因素指向被告人,基于保障被告人人权的考量,证明标准必然有所降低。[12]需要注意的是,由于多数被告人能够掌握涉案公民个人信息的来源、内容等,故辩方不能仅简单提出抗辩理由,还应该提供内容相对具体、明确、指向性较强的证据或证据线索,以此向法庭证明对信息去重的合法性和必要性。另外,法庭也应当意识到,在侵犯公民个人信息犯罪案件审理过程中,虽然辩方提出的优势证据并不必然减少批量信息的实际条数,但却可以实现使信息的数量存疑或者重新计算的作用,更重要的目的是动摇法官内心形成的对其不利的心证。[13]
  综上,在侦诉机关未进行去重抑或控辩双方对去重结果存在争议,辩方提供了有关涉案信息存在重复的线索或证据且达到优势证据标准的情况下,根据《解释》相关规定,对批量信息真实性及重复性的认可属于司法推定,但该推定允许当事人提出反证,其证明责任只要达到优势证据原则即可,具体查证和证明责任仍应由检察机关承担。例如,在前文所述的巧达公司侵犯公民个人信息案中,被告单位正是利用网络爬虫软件技术快速非法获取了“智联招聘”“58同城”等多个招聘平台上存储的公民个人信息,公安机关查获的涉案信息条数高达2.1亿条。一审过程中辩方向法庭提出了去重申请,并提交了相关证据。法院经审查上述申请认为,由于本案公民个人信息的附着载体为同一时间段内多个大型招聘网站的求职简历,现实中求职者向多家不同招聘平台“海投”简历属于高概率事件,考虑到涉案公司缺失利用网络爬虫软件同时爬取多个招聘平台信息的客观情况,一审辩护人的抗辩和申请具有一定的事实依据,故有必要对涉案批量信息进行去重。
  (二)以信息类型作为选择去重方式的出发点
  对于排除重复信息的理解,首先应该明确何谓重复信息。司法实践中查获的信息经常会针对同一对象并存数条信息,对于这种情况下信息的计算,要考虑交易规则和习惯,宜将其认定为重复信息,应按照一条计算。实践中,在海量信息里甄选出符合上述条件的信息并将其排除,确实是一项极为耗时耗力的工程,需要结合个案具体情况选择适配度高、合理性强的基准信息作为去重工作的基准要素信息。涉案信息由于类型不同,其中包含的要素数量、信息内容、存储形式等均会存在较大差异,故法院在选择去重方式时需要重点考虑涉案信息的具体类型。
  首先,审查涉案信息的要素数量。当前,在部分侵犯公民个人信息案件中,为提升利用信息进行商业推广的针对性,单条公民个人信息所含要素趋于缩减。例如,部分犯罪人非法获取公民个人信息的目的在于产品推销(如推广租房、车辆、母婴用品、保险产品等)。基于上述目的,犯罪人对公民个人信息的非法获取和存储往往只关注信息的针对性而非全面性,其只需以“房屋租户群”“车主群”“保险关系人群”“宝妈群”等方式将信息分类,一再删减群内文件中与推销目的无关的信息,最终导致群内信息只包含银行卡号、学号、电话号码等单一要素。相反,在另一部分案件中,一条涉案信息会涉及一个公民的多方面信息,且根据近年来北京法院的司法实践,此类多要素信息所占比例较大。针对单要素信息,去重基准对象的选择较为简单明了;针对多要素信息,裁判者需要进一步结合信息类型寻找合适的基准要素。
  其次,审查信息类型的变动程度。个人信息的变动性会直接影响去重基准信息的选择。随着社会节奏的加快,个人信息变动日益频繁,其中部分信息具有固定性和永久性,如身份证号码、出生日期、血型等,部分则具有变动性,如工作单位、银行账户、位置信息等。以家庭住址为例,升学、换工作、婚姻状况变化等多种原因都可能使该信息发生变更。如果信息去重时与信息收集时公民的相关个人信息已经发生变化,就将导致原本真实的信息随着时间的推移不再具备识别功能,亦无法与特定的人员相匹配,进而增加去重工作的难度和不准确性。因此,在一条涉案信息包含多方面具体信息的情况下,需要选择若干变动性小、稳定性强的基准信息如“身份证号”“学号”“电子邮箱”“姓名+手机号码”“姓名+出生日期”等作为基准要素以排除重复信息。
  其三,审查信息类型的载体形式。除要素数量和变动程度外,在考虑去重方式时还需要结合信息的具体类型,以选择最大程度上能够适配信息载体形式的基准要素。例如,在前述涉案单位利用软件爬取公民简历的案件中,对简历信息的去重就需要重点考虑简历这种信息记录载体的特征:一方面,教育背景、工作经历识别度低,难以锁定具体公民;公民身份证号虽然能够与个人精准匹配,但一般情况下简历中不要求填写身份证号,故“姓名”“出生日期”“电话号码”等可作为本案中信息去重的基准信息。另一方面,由于公民的求职简历多表现为Word或PDF格式,相比司法实践中比较常见的以EXCEL. TXT等格式存储公民个人信息的情况,WORD或PDF格式中存储的文字信息更为丰富且混杂,有必要选择公众填写格式较为统一且容易抓取的信息如“电话号码”作为信息去重的基准要素。
  (三)以兼顾诉讼质效作为选择去重方式的落脚点
  对去重方法的选择还需要兼顾诉讼质量和效率,避免出现一味追求去重效果的精准性而过分拖延诉讼进程,甚至导致审判质效降低的情况。在涉案信息数量不断增大的趋势之下,批量信息去重工作给刑事诉讼带来的挑战日益提升。当前的司法实践已经显示出,部分侵犯公民个人信息案件中涉案信息数量已逾亿级,故在选择去重方式时兼顾诉讼质效是裁判者必须考虑的因素之一。笔者统计发现,从北京法院司法实践情况看,已有部分法院选择通过抽样方式对批量信息尤其是海量信息进行数量去重。另外,根据学者的实证研究,此类案件中控方运用抽样取证方式开展证据审查工作在我国部分地区的司法实践中已不鲜见,例如,有的法院采取随机抽取方式,抽取部分公民征信报告与中国人民银行查询的征信信息进行比对,[14]有的法院通过抽样统计方式对公民个人信息数量进行查证与说明。[15]上述做法虽然引起了一部分辩护人的不同意见,但展现了司法实践的现实需求,且此类需求不应被轻易忽视抑或否定,相反地,我们应当思考如何提升抽样去重方式的科学性、合理性,使得该类方法能够在特定案件中被有条件地采用,以实现准确认定事实、确保公正司法的目标。
  一方面,选择抽样调查作为去重方式应当以涉案信息数量确实十分巨大且难以按照传统方式进行去重作为前提。由于涉案信息数量是侵犯公民个人信息罪定罪量刑的主要依据,为尽可能地提升事实认定的准确性,以抽样调查作为去重方式之前应先行尝试其他传统去重方式。如经裁判者审查判断,在直接根据查获信息数量进行条数认定存在较大被证伪的风险,且一般的去重方式确实难以应对巨大数据甚至会造成诉讼进程过分迟延的情况下,为确保证明的真实性和客观性,保障被告人的合法权益,提高推定事实的稳定性,可以采取抽样调查、抽样取证等模式对批量信息的数量进行评估和重复性检验。另一方面,选择抽样调查作为去重方式之后,应进一步选择科学性强、合理性高的具体抽样方法。在抽样取证中,确保事实推定得以成立的是科学的抽样统计学原理,司法机关可依据样本证据与待证事实之间的高度盖然性推定待证事实的存在。[16]作为一种科学的调查方法,抽样调查的合理性可以通过选择具体的抽样方式进行提高,如选择整群抽样、多阶段抽样法、等距抽样等误差较小的抽样方法,或根据涉案信息的类型进行针对性抽样。如果由于涉案信息数据本身的局限性,难以选择以上误差较小的抽样方法,也可以使用简单随机抽法样,但在操作方法的选择上,建议采用等约计量[17]等方法计算各类敏感信息数,即随机抽取一定数量个人信息作为样本,以此考察评估总体数量,从而在最大程度上提升犯罪事实认定的准确性,实现兼顾案件办理质效的整体目标。
  【注释】
  作者单位:北京市高级人民法院
  [1]参见北京市密云区人民法院(2017)京0118刑初36号刑事判决书。
  [2]周加海、邹涛、喻海松:“《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》的理解与适用”,载《人民司法》2017年第19期。
  [3]姜涛:“法益衡量中的事实还原运用——刑法解释的视角”,载《法律科学》2021年第1期。
  [4]劳东燕:“功能主义刑法解释的体系性控制”,载《清华法学》2020年第2期。
  [5]于冲:《动态数据与动态信息:大数据时代个人信息的刑法保护进路》,中国法制出版社2021年版,第101页。
  [6]付玉明:“侵犯公民个人信息案件之‘批量公民个人信息’的数量认定规则——〈关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释〉第11条第3款评析”,载《浙江社会科学》2017年第10期。
  [7]喻海松:“侵犯公民个人信息罪的司法适用态势与争议焦点探析”,载《法律适用》2018年第7期。
  [8]参见北京市海淀区人民法院(2020)京0108刑初434号刑事判决书。
  [9]参见北京市东城区人民法院(2019)京0101刑初667号刑事判决书。
  [10]左宁:“论刑事证明责任倒置之误用”,载《法学杂志》2011年第4期。
  [11]房保国:“论辩护方的证明责任”,载《政法论坛》2016年第11期。
  [12]李玉华:《刑事证明标准研究》,中国人民公安大学出版社2008年版,第145~146页。
  [13]毛淑玲:“司法推定的适用条件与要求”,载《法学杂志》2019年第12期。
  [14]万毅、纵博:“论刑事诉讼中的抽样取证”,载《江苏行政学院学报》2014年第4期。
  [15]参见福建省安溪县人民法院(2018)闽0523刑初第116号刑事判决书。
  [16]万毅、纵博:“论刑事诉讼中的抽样取证”,载《江苏行政学院学报》2014年第4期。
  [17]刘品新:“网络犯罪证明简化论”,载《中国刑事法杂志》2017年第2期;罗猛、邓超:“从精确计量到等约计量:犯罪对象海量化下数额认定的困境及因应”,载《网络犯罪研究》2016年第4期。