Fffys 最近的时间轴更新
Fffys

Fffys

V2EX 第 590988 号会员,加入于 2022-08-12 03:45:29 +08:00
根据 Fffys 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Fffys 最近回复了
@PerFectTime #1 应该提供怎样的文件呢?老板让我说明,我不是很懂怎样的文件才算有法律效应
后续,关于这个任务那之后只是让我做调查没让我爬,但是昨天又让我爬了,并且同意只爬取公共领域的书籍。
但是坐标欧陆,欧洲的公共领域的定义和美国不同而网站几乎全是美国网站,这一点我已经跟老板说了,老板回复手不用我担心法律责任公司会负责。
让老板在邮件里正式声明或者提供 formal document ,老板让我“describe the approach”,根据上下文我不是很确定是要我提供我爬取的 approach 还是相关文档

如果是我的方法:
- 老板有提供一个书籍列表,希望我找到尽可能多的书单上的书籍:
1. 通过古登堡计划的官网的指示用 rsync 或其他方法下载整个网站的存档并存到公司内部电脑
2. 通过 API 在以下网站上查找不在古登堡里的书籍,检查相关书籍的版权状态,如果是公共领域,检查是否有资源,如果网站提供指向资源的链接,就获取资源;如果指向外部网站的链接,就记录网站名称和相关链接
- internet archive
- hathitrust
- wikidata
- openlibrary
- ...
你们认为这样可以吗?
如果是要求 formal document ,我要要求提供怎样的文件呢?
区块链真的又火了吗?记得上次关注还是很久之前,当时地里都看衰,最近找实习,记得当初论坛里的观点,拒了一个区块链的实习找了普通的数据分析的职位……亏了?
找个 xx-like 或者 xx-copy 微调改改,遇到什么不懂的就谷歌,多看几个,差不多就能自己写了
不然就问 AI 要几个范例,配合官方文档或者找找别人做的现成的笔记来理解
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2628 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 12:16 · PVG 20:16 · LAX 05:16 · JFK 08:16
Developed with CodeLauncher
♥ Do have faith in what you're doing.