写爬虫的要小心罗,爬数据要被判刑滴

2018-06-20 17:43:25 +08:00
 norain

万金油罪名:非法入侵计算机系统

http://tech.sina.com.cn/csj/2018-06-19/doc-iheauxvz7582325.shtml

29059 次点击
所在节点    程序员
68 条回复
vansl
2018-06-21 23:50:22 +08:00
借楼,微博关键词接口,最多只翻 100 页,怎么破?
snw
2018-06-22 00:42:46 +08:00
判决文书:
http://wenshu.court.gov.cn/content/content?DocID=cc5d28b2-ecca-45a9-9409-a85600ef4202

从判决中来看,关键是两点:
1.“在数据抓取的过程中使用伪造 device_id 绕过服务器的身份校验,使用伪造 UA 及 IP 绕过服务器的访问频率限制。”
2.“造成被害单位北京字节跳动网络技术有限公司损失技术服务费人民币 2 万元。”

第 2 条是因为该罪名入罪标准之一是“(四)违法所得五千元以上或者造成经济损失一万元以上的;”
至于第 1 条嘛,只能说这种罪名其实就是口袋。再多说的话大概要被降权了……
hundan
2018-06-22 02:16:15 +08:00
@menc 用爬虫的理由告盗窃?说实话是不是真的盗窃我们还真不关心,我们关心的只是,从文书看来,居然用 爬虫 的理由去告还告成功了,丝毫没有提到盗窃的问题
binux
2018-06-22 03:03:09 +08:00
@hundan #63 爬虫只是做了什么,而不是理由。理由是「由侯明强指使被告人郭辉破解北京字节跳动网络技术有限公司的防抓取措施」
你怎么知道 “ tt_spider ”文件中 的 「头条号视频列表、分类视频列表、相关视频及评论 3 个接口」不是对内接口?
你怎么知道「伪造 device_id 绕过服务器的身份校验」不是内部白名单 device_id ?
hareandlion
2018-06-22 08:36:09 +08:00
这就是个口袋罪名,和寻衅滋事一样,运用之妙存乎一心
Marsss
2018-06-22 08:43:10 +08:00
照这么说,浏览器翻页点快了也要被判刑了。
marcong95
2018-06-22 09:38:43 +08:00
@binux
@menc 公开可查只是 @centralpark 说公开可查,那我就查了一下。用我为数不多的法律知识思考了下,2w 我觉得真的只是为了凑个起刑点。但是这件事我觉得既然你们说没经授权用了内部接口,那找个罪名还不容易么,明明有合情合理的罪名,就非要就一个无关紧要的事实大做文章,贻笑大方
wbswjc
2018-06-22 14:17:53 +08:00
@paloalto 争论不能解决; 在永无止境的夜; 关掉你的嘴; 唯一的恩惠;

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/464477

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX