随着互联网的迅速发展,网络爬虫技术也日益广泛应用于各个领域。但是,网络爬虫是否合法一直存在争议,尤其在中国,相关法律法规还处于不完善的状态。本文将详细分析网络爬虫在中国是否合法的问题。

在中国,网络爬虫的法律法规主要涉及到数据的使用方式、目的和类型。根据现有法律规定,网络爬虫本身并不违法,但利用爬虫技术获取数据的行为可能具有违法甚至犯罪风险。在中国,当法院判定网络爬虫行为违法时,主要援引的是《反不正当竞争法》第二条中规定的“经营者的合法权益”。此外,即使是公开的原始数据,也需要获得“三重授权”才能合法爬取。对于非公开数据和衍生数据,法律保护的严格性更为明显。在实际应用中,只要没有大规模采集、没有获得巨额利润、没有涉及敏感信息(如个人实名信息等),基本上不会引起法律问题。因此,对于个人来说,最好将网络爬虫视为工具,仅用于方便自己的学习和研究,而不要涉及商业用途.


一、什么是网络爬虫

网络爬虫,又称网页蜘蛛,是一种按照一定的规则自动浏览互联网的程序。它主要用于从互联网上抓取信息,这些信息通常包括网页代码、图片、数据等。Scrapy、Beautiful Soup等都是常用的网络爬虫工具。

网络爬虫的工作原理是,根据初始确定的URL列表,爬虫程序根据网页链接提取规则递归浏览网页,并按照设定的规则抓取网页信息。一般来说,合法的网络爬虫会遵守“robots.txt”协议,只爬取允许爬取的网页,并控制爬取频率以免给服务器造成过载。


二、相关法律法规介绍

(一)《中华人民共和国网络安全法》

《网络安全法》第21条规定:“网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开规则,明确目的、方式和范围,并经被收集人同意。”

该法律明确规定了收集和使用个人信息需要取得本人同意,针对网络爬虫直接抓取个人信息情况作出规定。

(二)《中华人民共和国刑法》

《刑法》第285条规定:“违反国家规定,非法获取公民个人信息,情节严重的,处3年以下有期徒刑或者拘役,并处或者单处罚金。”

该法律明确规定非法获取公民个人信息属于犯罪行为。爬虫非法抓取个人信息如果触碰刑法规定,将承担刑事责任。

(三)《中华人民共和国网络安全审查办法》

根据该办法,网络产品、服务在提供过程中产生的信息内容需要进行安全审查。其中直接涉及到网络爬虫技术是否需要进行安全审查的争议。

(四)《中华人民共和国计算机信息网络国际联网管理暂行规定》

该规定第六条规定禁止使用网络从事危害国家安全和社会公共利益的活动,针对使用网络爬虫技术进行违法操作作出规定。

(五)《中华人民共和国个人信息保护法》

新出台的个人信息保护法,对于处理个人信息作出详细规定,其中第13条规定:“个人信息处理者收集个人信息的,应当采取合理的方式。不得过度收集个人信息。”

该法律进一步加强了对於个人信息的保护,对网络爬虫的监管力度也将进一步加强。

(六)《中华人民共和国反不正当竞争法》

《反不正当竞争法》第二条规定:“经营者在商品生产、经营活动中,不得采用下列不正当手段:(一)假冒他人的注册商标;(二)使用与他人注册商标相同或者近似的商标,导致相关公众混淆;(三)使用别人著名商品特殊名称等,导致相关公众混淆”。

该法明确规定了保护经营者的合法权益,针对利用网络爬虫技术获取经营数据进行不正当竞争的行为作出规定。


相关法律条款参考链接:

[1] http://www.npc.gov.cn/npc/xinwen/2016-11/07/content_2001605.htm

[2] http://www.npc.gov.cn/npc/c30834/202006/75ba6483b8344591abd07917e1d25cc8.shtml

[3] http://www.cac.gov.cn/2017-06/02/c_1120902760.htm

[4] http://www.gov.cn/gongbao/content/1997/content_52587.htm

[5] http://www.npc.gov.cn/npc/c30834/202108/a8c4e3672c74491a80b53a172bb753fe.shtml

[6] http://www.npc.gov.cn/wxzl/gongbao/1993-12/29/content_1481162.htm


三、网络爬虫的风险

在实际应用中,只要没有大规模采集、没有获得巨额利润、没有涉及敏感信息(如个人实名信息等),基本上不会引起法律问题。因此,对于个人来说,最好将网络爬虫视为工具,仅用于方便自己的学习和研究,而不要涉及商业用途。

(一)可能涉嫌违法犯罪

网络爬虫技术如果被用来非法获取他人信息,删除、修改电子数据,植入木马病毒等可能构成违法犯罪。相关法律法规对这些行为进行明确规制。

(二)可能侵犯知识产权

网络爬虫被用于大规模抓取他人网页内容和数据,有可能构成对知识产权的侵犯。如果遭到投诉,需要承担相应的法律责任。

(三)可能侵犯隐私权

爬虫技术如果抓取个人信息,在未得到本人同意的情况下收集和使用个人信息,很可能侵犯隐私权。在个人信息保护日益严格的今天,这已经构成重大法律风险。

(四)可能损害网络安全

一次大规模网络爬虫操作很容易给网站服务器造成损害,甚至导致服务器瘫痪。这不仅影响业务,也可能被视为进行网络攻击行为。

(五)可能违反网站服务条款

大多数网站服务条款都会限制甚至禁止用户利用爬虫技术抓取网站信息。如果违反网站服务条款爬取信息,可能会被起诉或承担责任。


四、网络爬虫的典型案例:

1. 张树森抓取案

2020年,张树森使用自编程序滥用网络爬虫技术,大量抓取手机用户信息,非法获取公民个人信息。最终被公安机关立案侦查,并以违法犯罪名义被处以行政拘留处罚。来源

2. 穷游网诉讼案

2019年,旅游网站穷游网起诉某数据公司,指责其使用网络爬虫抓取了穷游网的酒店数据进行商业化运营。法院认定该公司构成对商业秘密的侵犯和不正当竞争,需要承担侵权责任。来源

3. 航旅纵横爬虫案

2017年,航旅纵横公司使用网络爬虫批量抓取旅游网站数据。Multiplex等旅游企业将其告上法庭,航旅纵横最终被判侵权赔偿。来源

4. 学生爬虫案

2022年,一名学生利用网络爬虫技术,非法抓取某网站会员信息。后该网站发现并报案,该学生被公安机关处以行政拘留7日的处罚。来源

这些案例说明,网络爬虫技术需要谨慎合规使用,避免触碰法律红线。


、风险规避建议

(一)不要爬取过多隐私数据

避免爬取可能涉及隐私的个人信息,如医疗、通信等方面的信息。另外也不要批量爬取可能涉及隐私的用户生成内容。

(二)不要轻易爬取受版权保护内容

如果要爬取可能存在版权内容的网站,一定要事先确定内容许可协议,过滤掉不允许爬取使用的内容。

(三)遵守爬虫道德规范

合理设置爬取频率,使用合法的IP地址,遵守robots协议。如果网站表示不允许爬取,应立即停止。

(四)仅用于合法正当目的

只将爬虫技术应用于学术研究、技术探索等合法正当目的,不可用于商业盈利用途。

(五)尽可能使用公开数据源

尽量只爬取完全开放的网页和数据接口,避免可能存在法律风险的灰色区域网页。


结语

总而言之,网络爬虫在中国是否合法,还没有一个明确的结论。相关法律法规还处在不断完善之中,整体态度较为谨慎。但只要使用者充分认识风险,采取合理措施规避风险,合理合法使用网络爬虫技术还是被允许的。随着相关法律法规的进一步完善,网络爬虫的合法化空间也会进一步开拓。


引用:

[1] http://fzzfyjy.cupl.edu.cn/info/1035/13584.htm

[2] https://zhuanlan.zhihu.com/p/66997586

[3] https://www.spp.gov.cn/llyj/202202/t20220210_543998.shtml

[4] https://www.spp.gov.cn/zdgz/202111/t20211101_534081.shtml

[5] https://www.dehenglaw.com/CN/tansuocontent/0008/019744/7.aspx?MID=0902

[6] https://www.kwm.com/zh/cn/knowledge/insights/legal-issues-concerning-web-crawlers-20180525

[7] https://cloud.tencent.com/developer/article/1460334

[8] http://library.ttcdw.com/dev/upload/webUploader/202306/1686794812bbcac56a52bcefbe.pdf

这篇文章有用吗?

点击星号为它评分!

平均评分 / 5. 投票数:

到目前为止还没有投票!成为第一位评论此文章。

No more articles