有没有可能自动抓取网上文章并自动在自己的网站发布?

2013-06-23 10:25:09 +08:00
 zippera
比如网站做好并设置好之后,每天自动到九点、startupnews类似的网站上抓取十篇文章附带评论,然后自动发布到自己的网站,全程无人监守。

能否实现?有没有已经实现的?
12010 次点击
所在节点    程序员
42 条回复
yaotian
2013-06-23 18:41:38 +08:00
@xieren58 你那站3k ip, 应该不会占太多资源,一个linode可以复制好几个呢,加油
xieren58
2013-06-23 18:46:52 +08:00
@yaotian 买不起vps,放在免费的heroku呢,大家都没想到吧~我就投入一个域名钱而已~
huazhouji
2013-06-23 18:55:21 +08:00
垃圾站不是很容易被搜索引擎降权之类的吗?需要采集后做什么处理吗?还是采集的渠道有讲究?望赐教〜〜
efi
2013-06-23 19:20:04 +08:00
有没有可能自动抓取网上邮箱并自动向邮箱发送广告?
lovejoy
2013-06-23 19:20:16 +08:00
最讨厌这种网站,尤其是有些完全是关键字没有内容的网站
zippera
2013-06-23 20:25:37 +08:00
@efi 这个有,所以很多人把邮箱做成图片。
yaotian
2013-06-23 22:59:33 +08:00
@xieren58 真没看出来,不错。 我们建友情链接吧? 目前 http://sche.mobi 已经搞得相对满意了。
timothyye
2013-06-23 23:00:43 +08:00
这类的程序很多的
quake0day
2013-06-24 00:25:24 +08:00
这个自己写都不难,Python基础的urllib,urllib2库就能搞定。至于定时,用Crontab控制就行了。
zlwens
2013-06-24 00:44:12 +08:00
原来拉圾站是这么有搞头啊
PrideChung
2013-06-24 00:51:02 +08:00
建议你不要做这种无耻的行为。
xieren58
2013-06-24 01:12:52 +08:00
@yaotian 友情链接已经搞好,我的网站叫17轻松,你改改名字~
tarsier
2013-06-24 01:25:46 +08:00
不是我自视清高,我觉得在这里讨论垃圾站采集站复制别人内容来赚钱的行为不好。
xiiing
2013-06-24 07:36:36 +08:00
网上原创文章并不多,很多门户网站也是转来转去的。转的时候加上来源是不是好一些?
zippera
2013-06-24 08:01:54 +08:00
@PrideChung 想到这个问题时纯粹是从技术角度出发的,也想练练手。看到大家讨论才意识到有些垃圾站是这么来的。但是,美味阅读这样的网站不也是采集来的吗?
zippera
2013-06-24 08:02:40 +08:00
@xiiing 从道德法律角度都是必要的
zippera
2013-06-24 08:03:40 +08:00
@timothyye 能否举例几个?
zippera
2013-06-24 08:04:18 +08:00
@quake0day 好,我了解下,谢谢
timothyye
2013-06-24 10:27:56 +08:00
@zippera google关键词 “自动 采集 程序”
yaotian
2013-06-24 10:52:26 +08:00
@xieren58 已改。

我仔细的看了你的站,有些细节做的很不错,能运行在免费主机上,相当了不起。

鼓励你给大家开一帖,讨论站长运营。比如如何让你不降级,让搜索引擎更多收录,等等

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/73299

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX