V2EX › ty10086 的所有回复 › 第 2 页 / 共 2 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 2

❮

❯

2019-02-18 18:31:21 +08:00

回复了 ty10086 创建的主题 › Python › 调用 Google 付费翻译 API 翻译整个 html 网站，这个有人搞过吗？

@xy2401
@wbrobot
@lbuzhi
@ninestep
@tadtung
我摸索了几个月，也搭建了测试站。1、通过 wget xxx.com+参数，整个目标站点全部镜像为 html，可以不镜像 pdf、zip、rar 等大文件。唯一问题，有的 js 不能很好渲染，比如 js 类型的菜单、ajax 的页面点击会有错误、点击无动作执行。（话说除了 wget 有啥更好的渲染工具？）
接着调用 google translate api 翻译（付费的，100 万字符 /20 美金），是可以翻译的，自动不翻译 html 标签。但是如果整个站点翻译需要切片 5000 字符分割段落，并组合回去不知道如何弄。有达人会的话，请赐教，能搞的话我外包，做一个长期的技术支持顾问。
2、尝试用 python 全站渲染后爬取的思路，也是切片与组合回去的问题。
3、tadtung 大兄弟说的反代，挺想试试的。不过看起来有法儿将翻译后内容储存起来并开放么。不用实时翻译，毕竟专业术语还要全局替换下。
我相信这个是一个刚需，还请各位大兄弟讨论下献计~

2018-09-13 19:19:03 +08:00

回复了 iray1991 创建的主题 › 问与答 › 打包下载一个网站的所有网页和资料，用哪款软件比较好？

@013231 您好大兄弟，是否可以帮忙下载一个网页？

1 2

❮

❯