第一节 问题提出:数据爬取行为的异化
社会向前发展的每一步都离不开信息获取与传递方式的升级,数据作为信息的主要载体,其获取方式在新技术的整合之后发展出新的附随技术,正如迅速崛起的数据爬取技术成为互联网中高效收集信息数据的有力手段,它可以任意地获取人们想要的数据信息。但数据的获取不是毫无底线的,数据安全问题作为数据开放的主要考量,经历了从静态的硬件式储存到动态的流动于互联网之中,从单纯的独立分布到个人、企业甚至整个社会紧急结合存在的变化,互联网企业尤其是数据企业在这种变化下所承载的数据安全责任逐渐增强,一方面,由于数据企业所获取的数据所承载的信息逐渐具有个体识别性,这种个体属性与隐私权紧紧地结合在一起;另一方面,由于数据获取的“技术密集型”程度提高,人们在网络中不断地提升获取数据的手段,部分甚至达到了“侵入与掠取”的程度。数据爬虫技术随着数据的经济利益不断地迸发已经出现由原有的中立技术异化为违法犯罪行为的可能性,如何规制违法的数据爬取行为、构建数据共享与保护的再平衡成为亟待解决的问题。海淀区法院审理的上海××公司等非法获取计算机信息系统数据一案将数据爬取行为从反不正当经济领域等转向了刑法治理中,而在数据爬取技术异化的背景下,规制数据爬取行为存在恶意数据爬取所侵犯的法益种类多元复杂,刑事违法性边界模糊的问题,而数据爬取入刑的关键在于达成数据开放、数据共享与数据安全保护之间的平衡,明确行业规则、法律规则之间的关系问题。
数据爬虫,又称为网络爬虫、网络蜘蛛,是指根据使用者所设置的指令在不同的网络站点跳转的过程中自动提取网页内容的脚本工具,使用者在万维网上利用这种程序预设规则来筛选、抓取所需要的数据的行为就是数据爬取行为。由于网络信息资源的指数级增长,数据信息的获取已经不再是通过站点式的访问、分析来进行,巨量化的数据筛选与获取往往需要通过搜索引擎、大数据挖掘等技术来实现,作为前述技术底层应用的网络爬虫成为强而有力的数据获取手段。数据爬取长期以来一直被视为中立的技术,但随着数据的经济价值的迸发以及网络爬虫技术所固有的隐蔽性及高效性,数据爬取行为开始表现出其不受控制的违法性的一面,一些数据爬取行为如今已经成为网络“分割化”的有组织犯罪前端的重要一环,进而需要法律对其进行评价。从整体上来说,这种异于正常使用网络爬虫的行为开始异化成违法犯罪行为,或者说数据恶意爬取行为的异化特征主要表现在数据爬取行为的“链条化”“法益侵害多元化”“违法性边界模糊化”。
一、数据爬取行为的“链条化”
由于传统的经济模式无法将个人的敏感信息成规模地流通,侵犯个人信息犯罪曾一直处于小规模发生的状态,但随着“双层社会”形态的形成,网络空间中给储存的个人信息数据渐趋地转化为有驱动力的经济利益,网络空间侵犯个人信息数据构成了网络黑产的关键环节,而数据爬取也成为侵犯个人信息数据犯罪的重要途径。数据爬取行为冲破了技术中立的原则,随着数据产业的纵向链条中下一层级的行为实施变成了具有社会危害性的行为,出现了与这一链条下游犯罪行为成立共同犯罪的情况。比如,在2019年,××科技有限公司——一家从事“大数据风控”公司的高管因涉嫌违规收集数据和助力暴力催收被警方带走。该科技公司所推出的“同业爬虫”产品,能够通过授权在后台收集公民的通话、消费记录等信息,甚至有较高的概率可以爬取用户的职业、银行卡信息、贷款记录、理财信息等,从多方面对借款人进行综合评估,为金融贷款平台的决策作出判断。[1]在此事件中,××科技有限公司违规收集公民的个人信息并交给现金贷机构,对于贷款平台获取客户、推销自己的贷款服务业务甚至暴力催收都提供了重要的帮助。在网络空间的有组织犯罪不再是传统社会中线性的递进过程,而是呈现出一种复杂的网络化一对多、多对多的关系。[2]它们已然形成数据贩卖的整条产业链,以致表现出“组织套组织”的集群化特征,部分贷款机构甚至与网络黑产团队形成合谋对于主要的手机软件所掌握的用户数据进行爬取,以此获取利益。从整体上而言,由于大数据时代的整个纵向产业上都分布着数据的收集、储存、传输与应用等环节,在这些不同环节中也都存在着各种不同的法律要求,要想保持共享网络数据的行为在法律的框架范围之内而防止其成立犯罪,必须对作为“链条”源头的网络爬虫行为的刑事规制必要性进行考量。
二、数据爬取行为的“法益侵害多元化”
在数据爬取行为异化的挑战下,如何平衡数据开放和数据保护成为互联网的新主题,被爬虫爬取的对象——数据的背后所体现的权利类型、法益属性呈现出纷繁复杂的态势,也需要进一步较为系统地明确。过去的司法判决更多的是从认定不正当竞争即恶意利用网络爬虫破坏市场竞争秩序的角度来讨论数据爬取的行为。如在深圳××公司诉武汉××公司不正当竞争案中,武汉××公司利用网络爬虫爬取与其竞争的深圳××公司某软件上实时公交数据为自家的另一个软件使用。法院认为深圳××公司通过付出辛劳而收取、分析、整合的数据信息具有实用性并且能够为其带来一定的经济利益,法院肯定该数据已经具备无形的财产属性,而武汉××公司使用网络爬虫大量爬取这一数据,这种不劳而获的行为在具有主观故意的情况下破坏了他人的竞争优势,扰乱了市场竞争秩序,构成了不正当竞争行为。[3]在××非法抓取使用微博用户信息不正当竞争纠纷案[4]、××网诉××网不正当竞争案[5]等案件中,法院也都认定其中恶意利用网络爬虫的行为是不正当竞争的行为,这为规制网络爬虫提供了很好的思路。但是不当地使用网络爬虫任意地爬取数据所侵犯的不仅仅是竞争秩序,在数据权利化的法律背景下,非法的数据爬取可能会在法律保护上出现公私法的分野,在私法领域关注的是数据的商业化价值与竞争所带来的利益,而在公法领域更多关注的是网络数据安全保护。网络数据恶意的爬取行为给企业知识产权的保护、正常的竞争秩序以及商业秘密甚至国家安全等利益都带来了困扰,这就要求我们必须考察网络爬虫所爬取的数据权利类型,在多元的权益基础上合理回应不同数据主体的利益诉求。
三、数据爬取行为的“违法性边界模糊化”
网络爬虫技术本质上是一种能为人类的发展带来极大帮助的中立技术,网络爬虫虽然在大数据分析、数据筛查与收集方面存在无可比拟的技术优势。但“新技术新应用一方面催生着新威胁形态,为数据安全带来新风险;另一方面导致传统数据安全保护策略的有效性降低甚至失效”[6]。长久以来,由于网络爬虫所侵害的权益关涉不同的部门法,很难确定其承担何种类型的责任,恶意数据爬取一直游走于违反相关的数据管理规定而承担民事责任与违反刑法而承担刑事责任之间。而在刑法规制的层面,刑法中规定的相关的数据犯罪中规定了“违反国家有关规定”“非法”等空白罪状,但对于前置法中的违法性标准并没有进行详细的规定,导致网络爬虫的刑事违法性边界逐渐模糊化,其罪与非罪更加难以界定。在2019年海淀区法院所审理的全国首例爬虫入刑案之后,开启了网络爬虫的刑事规制的讨论,虽然也存在一些争议,但是此后诸如王某某犯非法获取计算机信息系统数据罪案[7]等案件也都是以《刑法》第285条第2款规定的非法获取计算机信息系统数据罪来进行认定,这为思考如何规制网络爬虫,考察如何平衡数据共享与数据安全提供了一个良好的开端。