原创!在文章中添加“文字指纹”,追踪盗版源头

2021-04-29 12:07:26 +08:00
 sillydaddy

帖子“ 有没有办法防止 app 内资源被提取呢 ”里面提到了对自己著作权内容被盗取的担心。

这个问题的背景就不多说了,说多了都是泪。直接呈上我思考的方案,欢迎点赞+批判:


我的方案


  1. 要有注册机制,以便区分不同的用户

  2. 对于同一篇著作内容,在分发给不同的用户前,都加上独特可区分的水印,一旦出现盗版,可以知道是哪个用户泄露

  3. 定位盗版源头后,永封源头用户,钱款不退。提高用户被永封后的直接损失,把走法律诉讼这种高成本的动作转移给对方。

  4. 重点讨论给纯文字添加水印的方法,要让这种水印不能轻易被抹除、篡改。方法包括:

    • 文字替换,同义词替换
    • 句子的顺序调换
    • 句子、段落的增+,减-

盗版者的手段和困境


抹除水印的方法,说白了就是对带有水印的内容,进行“扭曲变形”,让水印无法再辨别。那么文字的“扭曲变形”,就只能是修改文字自身的内容了。那么,分析一下针对上面 3 种“文字水印”的破环手段和效果:

  1. 针对特定的“文字替换,同义词替换”

    只要我把文章中的所有字词都用同义词替换一遍,原有的替换效果就全被破坏了

  2. 针对特定的“句子的顺序调换”

    只要我把文章中的句子顺序都打乱,原有的调换效果就被破坏了

  3. 针对特定的“句子、段落的增+,减-”

    只要我把文章中的句子段落随机增删,原有的增+减-效果就被破坏了

等一下。。看起来哪里不对劲。。替换文章所有字词还算勉强可行,但随意增+删-,以及调换句子顺序,那文章还能读吗?

对,这就是试图破坏这些水印所面临的困难!也是这些水印可行的原因!


三维水印空间


字词替换、句子顺序调换、句子增+减-,这 3 种方法中,每一种下面都有 N 多种具体的选择,都可以选择文章中具体的某个字词、某个句子进行操作。用个比喻的话,这 3 种方法可以看作是文字水印的 3 个维度。而具体的水印,则是这“三维水印空间”中的某 1 点:

盗版者并不知道所加水印点的具体位置,所以要破环它,只有尽量扰乱整个水印空间,也就是说,

这意味着什么呢:

而添加水印对创作者的难度呢:

大家怎么看


可以看出,水印空间的维度越高,破坏水印越困难,而添加水印则越简单。上面给出的是一个 3 维的水印空间,也就是添加“文字水印”的 3 种方法,还有其他的方法吗?

11556 次点击
所在节点    奇思妙想
106 条回复
clf
2021-04-30 15:10:15 +08:00
文字追踪盗版源头有点难的。

要么是影响用户阅读体验的改变,比如同义词替换,的、地、得替换。

要么是替换了个寂寞,比如标点符号中英文替换( OCR 软件才不管你是英文逗号句号,统一翻译成中文或者英文的)

所以最好的办法是保留自己的著作权,然后遇到盗版的 app,养韭菜一样的一个个去起诉。也就只能这样。
shoa
2021-04-30 17:35:17 +08:00
这种做法早就在用了吧
某些机密文件的分发只发纸质版,一人一份而且接收者不知道都有谁收到了这个文件,文章中的标点和某些字精心安排可以用于溯源(而且加入了校验算法)
直接对文件拍照一定可以查到源头,按意思复述一份也有概率可以查到
c0xt30a
2021-05-04 16:21:58 +08:00
这样折腾出来的文字质量不可避免地受到影响。
对于质量不高的文字,可以简单地通过 中文 -> 英文 -> 中文 这样翻译一圈来洗稿。
Fu4ng
2021-07-03 16:30:06 +08:00
如果我拿别人的版本去盗版呢。。
sillydaddy
2021-07-04 14:06:14 +08:00
@Fu4ng
怎么拿别人的?拿谁的谁就被封账号。
ttys001
2023-03-14 09:18:34 +08:00
受 op 启发,我想到一个针对中文的绝妙的防盗 idea ,可惜不能公布于众,不然很容易破解了,我决定用在我的博客上。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://yangjunhui.monster/t/774059

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX