【202102025】网络爬虫技术使用过界的刑法规制


首页>>刑事案例>>人民司法刑事案例2019-2022>>正文


 

 

【202102025】网络爬虫技术使用过界的刑法规制
文/姜金良;张丹丹;徐东庆

  【裁判要旨】网络爬虫技术爬取的数据必须是数据提供者公开的信息。网络爬虫技术使用的合法性基础是数据提供者知情、同意,行为人未经授权,避开或突破系统保护措施使用网络爬虫技术非法获取普通用户计算机信息数据的,构成非法获取计算机信息系统数据罪。行为人销售捆绑的非法爬虫软件实际上仅是犯罪工具,销售获得的收入均应认定为违法所得,依法予以没收。
  □案号 一审:(2019)苏1091刑初157号
  【案情】
  公诉机关:江苏省扬州经济技术开发区人民检察院。
  被告人:马春雨、莫锡勇。
  扬州经济技术开发区人民法院经审理查明:2017年7月,被告人马春雨雇佣被告人莫锡勇一同开发“探索云盘搜索”网站。在被告人马春雨的策划和安排下,2018年1月,被告人莫锡勇将“探索云盘搜索”网站http://tansuo233.com开发完毕,2018年3月,又开发了“探索云盘搜索”插件与充值会员的功能,每个充值会员缴费后,可任意使用探索云盘搜索、自助下载、PDF转换三项功能。下载并使用“探索云盘搜索”插件的用户只要在这台电脑上登录百度网盘账户,该网盘内关于分享链接的地址和提取码会在用户不知情且未经百度网站授权的情况下上传到tansuo233.com的服务器。2018年9月7日,被告人马春雨、莫锡勇利用“探索云盘搜索”插件非法获取第一个信息。其以充值会员每人每月7元、6个月42元、一年84元、永久使用360元的价格在网络上销售该款软件牟利。自2018年9月7日起至2019年8月1日期间,两被告人共获取违法所得70115元。经鉴定,在安装有“探索云盘搜索”插件的浏览器中登入百度网盘账户,进入“我的分享”时,插件程序会将已登录账户的所有分享链接的地址和提取码上传到服务器tansuo233.com。案发后,两被告人如实供述犯罪事实。
  【审判】
  公诉机关以提供非法控制计算机系统工具罪起诉被告人马春雨、莫锡勇。
  扬州经济技术开发区法院经审理认为,被告人马春雨、莫锡勇违反网络安全法第二十七条“任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动”的规定,在用户不知情,且未经百度网站授权的情况下,利用“探索云盘搜索”的插件自动抓取用户存储于百度网盘的分享链接地址和提取码,并将该信息收录于自己研发的网站上用于牟利,其犯罪数额已达情节特别严重,均已构成非法获取计算机信息系统数据罪。依据刑法第二百八十五条第二款,第二十五条第一款,第二十六条第一款、第四款,第六十七条第三款,第七十二条第一款、第三款,第七十三条第二款、第三款,第五十二条,第六十四条,最高人民法院、最高人民检察院《关于办理危害计算机信息系统安全刑事案件应用法律若干问题的解释》(以下简称《解释》)第1条第2款第(1)项之规定,判决:一、被告人马春雨犯非法获取计算机信息系统数据罪,判处有期徒刑3年,缓刑4年,并处罚金1万元;二、被告人莫锡勇犯非法获取计算机信息系统数据罪,判处有期徒刑3年,缓刑3年6个月,并处罚金1万元。
  一审宣判后,公诉机关未提出抗诉,被告人均未提出上诉,判决已经发生法律效力。
  【评析】
  为确保搜索功能的准确性、高效性,网络爬虫技术使用愈发普及。网络爬虫技术是一种自动提取网页的程序,它是按照指定规则提取所需的网页数据,并下载到本地形成互联网网页镜像备份的程序,其本质是一套实现高效下载计算机系统数据的系统。实践中,网络爬虫技术广泛运用于搜索引擎中,在新兴网络服务器中,网络爬虫技术通过下载网页数据,为搜索引擎系统提供数据来源,再进行数据的过滤、解析,相比传统搜索引擎更具有准确性。但其适用范围与法律边界却不甚明晰,作为新兴技术手段,法律的评价也不一致。从技术手段上分析,利用网络爬虫技术实施犯罪的,涉及计算机类犯罪;为网络空间犯罪提供帮助的,可能构成提供侵入、非法控制计算机信息系统程序、工具罪。笔者以本案为例,对网络爬虫使用过界的法律性质进行分析。
  本案中,被告人马春雨雇佣被告人莫锡勇开发的“探索云盘搜索”插件在用户登录百度网盘账户时,未经授权,突破网络平台保护措施,使用网络爬虫技术获取数据,并将该数据在网络中传播,属于网络爬虫技术过界使用、非法使用。按照行为性质、行为对象的性质认定为非法获取计算机信息系统数据罪,具有法律依据。
  一、网络爬虫技术使用过界的违法性在于行为人未经授权或越权,避开或突破系统保护措施使用网络爬虫技术获取计算机数据
  (一)未经授权或越权,避开或者突破计算机信息系统安全保护措施的行为,属于侵入行为
  网络爬虫技术对获取收集处理计算机信息系统数据具有重要意义。网络安全法第二十七条规定,任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动。只有在秉持尊重数据提供者意愿原则的基础上,才能进行数据开放共享,从而实现数据价值的最大化。无论是从网络从业规则还是从数据提供方来说,网络爬虫技术的使用必须以数据提供者知情同意为基础,爬取的数据是数据提供者同意被获取或者已经被公开的数据。反之,未经相关授权或越权,避开或突破系统保护措施使用网络爬虫技术获取数据的行为,属于网络爬虫技术过界使用行为,属于非法行为。本案中,被告人马春雨雇佣被告人莫锡勇共同开发“探索云盘搜索”的插件,可以在用户不知情的情形下,将用户使用过或者分享过的信息数据地址和提取码一并上传到指定服务器上。该插件实质上是一个运用网络爬虫技术将用户发布在网络上的信息进行收集汇总的工具,属于网络爬虫技术使用插件,是过界使用网络爬虫技术。
  非法获取计算机信息系统数据罪的客观方面表现为行为人违反国家规定,未经授权或越权实施侵入国家事务、国防建设、尖端科学技术领域以外的普通计算机信息系统,或者采用其他技术手段,获取这些计算机信息系统中存储、处理或者传输的数据,并且情节严重。该罪的主要犯罪行为是侵入。虽然《解释》并未对侵入作出解释,但其第2条规定,具有避开或者突破计算机信息系统安全保护措施,未经授权或者超越授权获取计算机信息系统数据功能的,或对计算机信息系统实施控制功能的程序、工具,属于专门用于侵入、非法控制计算机信息系统的程序、工具。根据这一规定,侵入应为未经授权或者超越授权,通过技术手段避开或者突破计算机信息系统安全保护措施进入计算机信息系统,达到窃取他人在计算机系统存储、处理和传输的数据的目的。本案中,被告人马春雨、莫锡勇研发的“探索云盘搜索”插件在用户登录百度网盘账户,进入“我的分享”时,可以避开百度网盘的安全保护措施,且在未经授权或者他人同意的情况下,进入被告人百度网盘,爬取数据并使用,其行为可以认定为非法获取计算机信息系统数据罪中的侵入。
  (二)被告人马春雨、莫锡勇的行为不构成提供侵入、非法控制计算机信息系统的程序、工具罪
  提供侵入、非法控制计算机信息系统程序、工具罪在客观方面具有两种表现形式:一类是提供专门用于侵入、非法控制计算机信息系统的程序、工具的行为;一类是明知他人实施侵入、控制计算机信息系统的行为而为其提供程序、工具,均是帮助行为正犯化。本案中,被告人马春雨、莫锡勇共同研发的“探索云盘搜索”插件,虽然出卖给网上不特定人,但购买下载使用“探索云盘搜索”插件的用户,只是为了搜索方便,对该插件能自动爬取数据的功能并不知晓也未使用,也未利用该插件实施非法控制他人计算机信息系统等违法犯罪行为,不具有违法使用的故意,不属于帮助行为。因此明显不符合第二类行为方式特征,不符合提供侵入、非法控制计算机信息系统程序、工具罪的客观表现。
  对于被告人马春雨、莫锡勇共同研发的“探索云盘搜索”插件是否属于专门用于侵入、非法控制计算机信息系统的程序、工具,需要从插件的行为性质以及认定程序两方面判断。其一,从行为性质上,关于其插件是否属于专门用于侵入、非法控制计算机信息系统的程序、工具。百度网盘的主要功能在于为用户提供可以存储、备份数据的云系统,百度网盘中可以实现特定用户共享实现数据传输,也可以通过公开存储的文件实现随意下载。百度网盘虽然不带有自动搜索功能,但开发特定搜索功能的软件并未一律属于违法行为,如果搜索的对象是获取百度网盘用户公开共享的文件并不违法。本案中被告人马春雨、莫锡勇开发的“探索云盘搜索”插件程序会将已登录账户所有分享链接的地址和提取码上传到服务器tansuo233.com,并未区分对特定用户公开还是全部公开分享的情形,因此从百度网盘的使用功能以及软件开发的性质上认定,其开发的插件不属于专门用于侵入、非法控制计算机信息系统的程序、工具。其二,从认定程序上,因信息网络犯罪专业性较强,是否属于专门用于侵入、非法控制计算机信息系统的程序、工具,根据《解释》第10条的规定,应当委托省级以上负责计算机信息系统安全管理工作的部门检验,司法机关根据检验结论,并结合案件具体情况认定。目前在案证据中相关检验结论无法证明其属于专门用于侵入、非法控制计算机信息系统的程序、工具,因此被告人马春雨、莫锡勇的行为不构成提供侵入、非法控制计算机信息系统程序、工具罪,检察机关指控的罪名不能成立。
  二、非法爬取的百度网盘数据属于刑法中的计算机信息系统数据
  (一)百度网盘属于刑法中的计算机信息系统
  刑法第二百八十五条、第二百八十六条规定了侵入的对象是计算机信息系统、计算机系统。虽然表述不同,但《解释》第11条规定,计算机信息系统、计算机系统是指具有自动处理数据功能的系统,包括计算机、网络设备、通信设备、自动化控制设备等。计算机信息系统、计算机系统认定的关键在于功能性判断,即只要具有自动处理数据功能的系统,都可能被认定为刑法中的计算机信息系统,既包括传统意义上的计算机系统,也包括具备自动处理数据功能的系统,如可以通过无线网络获取数据的手机、内置程序可以获取相关数据的打印机或传真机等。任何内置有操作系统的智能化设备,不论是电脑系统、互联网系统还是智能手机系统,都应该被纳入刑法保护范畴,都可以成为网络犯罪的对象。最高人民法院第34号指导性案件李骏杰等破坏计算机信息系统案,认定行为人对购物网站内部评价系统中的购物评价进行删改属于对计算机信息系统内存储数据进行修改操作,网站系统也属于刑法上的计算机信息系统。
  本案中,被告人马春雨、莫锡勇通过插件获取被害人百度网盘中的资料。百度网盘是百度推出的一项云存储服务,其主要功能在于用户可以将自己的文件上传到网盘上,实现跨终端随时随地查看和分享,其本质在于对用户信息数据进行存储,并依据用户意愿进行处理,属于刑法中的计算机信息系统。因此,被告人马春雨、莫锡勇的侵入对象百度网盘属于刑法中的计算机信息系统。
  (二)未经授权或越权爬取百度网盘内文件的行为属于非法获取计算机信息系统数据
  行为人违背数据提供者意愿,未经相关授权或越权,避开或突破系统保护措施的情况下使用网络爬虫技术获取数据的行为,损害计算机信息系统安全,属于网络爬虫技术使用过界行为。根据网络爬虫技术使用原理,网络爬虫技术使用的对象是互联网上已经发布的,与计算机信息系统相关联的数据。而在计算机科学中,所有能够输入到计算机并被计算机程序处理的符号介质用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量,均属于计算机数据,计算机信息系统中可以复制、显现的文本、图形、图像、动画、音频及视频等多种媒体信息都属于计算机信息系统数据。
  本案中的百度网盘属于刑法中的计算机信息系统,其中存储的文件是由一系列计算机信息系统数据组合而成的,其本质仍属于计算机信息系统数据。被告人马春雨、莫锡勇在用户不知情,且未经百度网盘授权的情况下,避开百度网盘安全保护措施,利用具有网络爬虫技术的“探索云盘搜索”插件自动抓取用户存储于百度网盘的地址和提取码,再将该数据收录复制泄露在网络上。两被告人利用网络爬虫技术未经授权或越权非法获取被害人百度网盘内文件的行为属于非法获取计算机信息系统数据行为,其行为构成非法获取计算机信息系统数据罪。
  三、非法获取计算机信息系统数据罪中的违法所得是指全部犯罪所得
  违法所得通常指通过实施犯罪直接或者间接产生、获得的任何财产,或转变、转化后的财产以及收益。《解释》第1条规定,非法获取计算机信息系统数据或者非法控制计算机信息系统,具有下列情形之一的,应当认定为刑法第二百八十五条第二款规定的情节严重:违法所得5000元以上或者造成经济损失1万元以上的。该规定将违法所得5000元以上作为认定非法获得计算机信息系统数据罪情节严重的标准,主要基于实践中危害计算机信息系统安全犯罪猖獗和泛滥的深层次原因,该类犯罪形成了环环相扣的利益链条,且非法获取计算机信息系统数据行为的主要目的在于牟利。在非法获取计算机信息系统数据罪中,违法所得越多,意味着犯罪行为人获得的数据越多,越能反映非法获取计算机信息系统数据行为的规模、获取条数、持续时间以及后续提供非法获得数据的规模。
  本案中,被告人马春雨、莫锡勇开发了充值会员服务。用户下载插件之后,普通用户每天只能搜索3次资源,如果充值成为会员,可以一天使用搜索、查看、下载的功能200次。7元使用1个月,42元使用6个月,84元使用1年,360元永久使用,充值会员每天可以查看200个资料。“探索云盘搜索”软件的收费服务包括三项:探索云盘搜索、自助下载、PDF转换。辩护律师提出,具有爬取数据的插件与探索云盘搜索使用有关,与其他两项功能无关,因此对行为人违法所得应作相应扣减。这一观点忽略了本案的特殊性。本案中,行为人虽然将多种软件捆绑销售,但购买人主要是为了使用百度网盘的搜索功能,而购买人使用中又成为爬虫插件数据爬取的对象,因此被告人“探索云盘搜索”中的销售资源主要是依靠犯罪行为获取的,其销售收入70115元会员费都应认定为违法所得,依法予以没收。
  【注释】
  作者单位:江苏省扬州市中级人民法院 江苏省扬州经济技术开发区人民法院