7月 212012
 

网络爬虫对于非专业人士来说或许是个陌生的概念,但对于互联网、尤其是搜索引擎的发展来说是至关重要的概念。简单得说,网络爬虫就是一种自动抓取网站更新信息的程序,如果网站内容有更新,网络爬虫就对此更新做出相应的处理。

像Google这种搜索引擎,对于我的博客的更新,可以在数分钟之内抓取到,而这种对内容更新的掌握是网站所希望的,至少在大多数情况下是如此。而在一些情况下,比如对一淘网的信息抓取,就不那么受欢迎了。美国亦是如此,亚马逊也对类似的价格比较网站不太感冒,与中国不同,他们之间不是口水战,而是诉诸法庭。这也就是本文的主旨,网络爬虫抓取信息到底侵犯了什么权利?

既然问了侵犯什么权利,那就表明这种行为一定是侵权的,至少信息之上存在着某种权利。不同于传统的动产,占有、使用、支配、处分的权利规定的很明白,没有我的邀请进入我家就侵犯了我的不动产物权、隐私权,我可以要求你滚出去。但一家网站的内容,基本都是队外开放,随意读取,而网络爬虫与一个正常的访问者无异,只是在访问速度上比正常的访问者要快上多倍。

如果是个人对网站信息浏览后,将其中资料整理,发到自己的网页上,除非是涉及著作权方面的问题,被浏览网站很少有兴趣干涉。而对一淘网对电子商务网站信息的抓取很难称得上侵犯著作权(根本就不是),这些抓取的信息同样不属于商业秘密,毕竟都是公开的资料。不正当竞争?拜托,那是兜底的罪名,最好别用。

类比一下现实

如果按照类推的方法,那么徘徊于电子商务网站的网络爬虫就好比是潜入超市的价格抄录员。这种人通常为店家所不齿,『同行莫入』的标语多能在小店门口看到。但法律上这算什么?从合同法的角度看:顾客去光顾商店,这中间是存在合同关系的,商店会规定顾客不得做XXX,顾客进入商店即视为同意这些规定,算是一些格式条款。商店也许会规定什么什么样的顾客我们不接待,有权请离,这是一种合同关系。但在大多数情况下这些格式条款都是无关痛痒的,也没人会去注意。

除了债权,还有物权。店家即使没有其场地的所有权,也有使用权。这同样赋予了使用权人/所有权人不接待特点用户的权利。有权按照自己的意愿去使用财产。

但网络上如何呢?以违约责任为依据是有可能的,因为有个网络用户协议(Terms of Service)在那里,可以在用户协议里规定限制网络爬虫的使用,不过大多数网站用户协议的效力都是需要打上一个大大的问号的(参见《网络用户协议的法律研究》),其中条款被宣告无效也不是什么困难的事情。

而从物权方面入手就比较困难了,因为要把网站与物权联系起来在民法理论上还有许多步要走,尤其是需要对物权的范围进行扩展,网络时代有些新的物权涌现出来。如果虚拟财产的理论能够被法律所确定,从物权方面解决法律爬虫的法律问题也不是什么难事了。

看看美国经验

美国的eBay v. Bidder’s Edge案中,eBay就对Bidder’s Edge网站(Bidder’s Edge主要对eBay商品信息进行聚合)提出起诉,诉由市侵犯动产(trespass to chattels)。历经波折法院支持了eBay的禁制令请求,指出其中权利并未明确,但eBay无疑对此拥有某种动产权利,值得保护,禁止Bidder’s Edge自动程序获取eBay拍卖信息。

但是,这个判决所确定的原则被后来的案例推翻了。在Intel Corp. v. Hamidi案中:

Ken Hamidi在1995年被Intel集团辞退后,以Intel的劳资政策不公平为由,用几千Email轰炸Intel的电子邮件系统,为此Intel6年前开始起诉Ken Hamidi,并称,Ken Hamidi通过发送不必要的Email到公司服务器上,侵犯了公司财产权。

加州最高法院认为Intel无法证明自己的财产或是其他法律权利受到了损害,故没有支持Intel的诉讼请求。

胡乱总结

希冀于法律能够阻挡网络爬虫,还有很长的路要走,不过好在从技术上阻止并不是什么困难的事情。几行代码就可以做到无数法律文书做不到的事情,何乐而不为。当然对骂就更解决不了问题了。

互联网法律关系的基础问题就是始终还是那么几个,传统民法的边界如何被互联网所改变。不同于判例法制度,我们需要用严谨的法律语言去定义这些新的概念,划清它们的范围。当然这不是一蹴而就的。

  2 Responses to “网络爬虫的法律问题”

  1. 刚好,http://e.weibo.com/1880224970/yz6RwfXPS 京东和一淘正闹着呢

 Leave a Reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

(required)

(required)