每周送免费 10 个爬虫项目

2018-11-04 17:57:43 +08:00
 ucun

最近在攻爬虫

实操是最好的老师

所以每周我会在留言里按时间选 10 个项目

因为是免费的,所以得加些限制

 单应用,即不需要代理、没有很变态的验证码、没有很复杂的 JS 解析
 python3
 只负责写爬虫,运行得自己的机子

先留言占位,然后私信我详细的需求。私信尽量简介、全面。你只有一次私信需求的机会。

我会私信你是否接受和大概完成的时间。每天 20:点之前我会看完当日所有需求,20:00 以后按第二天算

单名一个 c 后缀 freelancecn.com

5392 次点击
所在节点    Python
30 条回复
saran
2018-11-05 01:36:55 +08:00
@binux tangut unicode 和 unicode-id 没表下呐。。
legiorange
2018-11-05 10:32:39 +08:00
脉脉
主要是我和我家人收到这垃圾 app 的短信
ddzzhen
2018-11-05 14:18:48 +08:00
请大神协助,这个网站我关注很久了,死活爬不到,貌似用的 socket 传的数据,不得要领,只要能够每小时爬取一次就行的,地址: http://www.usdebtclock.org/
ucun
2018-11-05 15:47:20 +08:00
@loading

py 文件下载 https://omnas.ml/s/55YrRydoQZdBSib

效果图 https://i.loli.net/2018/11/05/5bdff52b41c2c.png

需求不详细,所以只有当日份的吐槽。也只能是命令行查看。
loading
2018-11-05 15:56:06 +08:00
@ucun 可以了,剩下的我自己改,也学一下爬虫。

您的行为很赞。
soulm
2018-11-05 16:43:25 +08:00
豆瓣电影搜索(输入电影名,输出搜索结果),要用到 post
foxyier
2018-11-07 10:14:52 +08:00
看了看评论, 已经知道拿什么网站练手了
foxyier
2018-11-07 11:15:09 +08:00
@ddzzhen 这个爬了会不会被抄水表= =。。
locoz
2018-11-08 12:54:15 +08:00
“单应用,即不需要代理、没有很变态的验证码、没有很复杂的 JS 解析”。。那不就是写 xpath 和正则吗,这种难度其实没啥必要拿来练手。
直接找个应用商店把热度排行前 100 里大厂的社交媒体类 APP 的网站版和 APP 版都爬一遍,这种有难度的才能叫练手。
ilovemeizi
2019-03-03 15:00:15 +08:00
您好,请问您现在还爬吗,能否帮我爬取百度招聘所有招聘数据保存下来用于个人的毕业设计,

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/504359

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX