V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ty10086  ›  全部回复第 2 页 / 共 2 页
回复总数  22
1  2  
2019-02-18 18:31:21 +08:00
回复了 ty10086 创建的主题 Python 调用 Google 付费翻译 API 翻译整个 html 网站,这个有人搞过吗?
@xy2401
@wbrobot
@lbuzhi
@ninestep
@tadtung
我摸索了几个月,也搭建了测试站。1、通过 wget xxx.com+参数,整个目标站点全部镜像为 html,可以不镜像 pdf、zip、rar 等大文件。唯一问题,有的 js 不能很好渲染,比如 js 类型的菜单、ajax 的页面点击会有错误、点击无动作执行。(话说除了 wget 有啥更好的渲染工具?)
接着调用 google translate api 翻译(付费的,100 万字符 /20 美金),是可以翻译的,自动不翻译 html 标签。但是如果整个站点翻译需要切片 5000 字符分割段落,并组合回去不知道如何弄。有达人会的话,请赐教,能搞的话我外包,做一个长期的技术支持顾问。
2、尝试用 python 全站渲染后爬取的思路,也是切片与组合回去的问题。
3、tadtung 大兄弟说的反代,挺想试试的。不过看起来有法儿将翻译后内容储存起来并开放么。不用实时翻译,毕竟专业术语还要全局替换下。
我相信这个是一个刚需,还请各位大兄弟讨论下献计~
2018-09-13 19:19:03 +08:00
回复了 iray1991 创建的主题 问与答 打包下载一个网站的所有网页和资料,用哪款软件比较好?
@013231 您好大兄弟,是否可以帮忙下载一个网页?
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3949 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms · UTC 05:26 · PVG 13:26 · LAX 22:26 · JFK 01:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.