庄羽提议郭敬明成立反剽窃基金，AI：反剽窃，不行；剽窃，行！

网事来源：互联网

Mark wiens

发布时间：2021-01-02

网红作为现在发展得最好的行业之一，现如今很多发展得非常好的网红都备受大家关注，不仅知名度非常高，这些网红所受到的关注度甚至比娱乐圈中的一些明星艺人都还要高。今天小编要来和大家曼联vs斯旺西

庄羽提议郭敬明成立反剽窃基金，AI：反剽窃，不行；剽窃，行！曼联vs斯旺西

文摘菌大数据文摘

大数据文摘出品

作者：王烨

郭敬明终于道歉了。

2020年12月31日零时，郭敬明就当年小说《梦里花落知多少》抄袭庄羽的作品《圈里圈外》一事在微博上道歉。

同时郭敬明还表示，将把《梦里花落知多少》的版权收入全部赔偿给庄羽女士，“如果庄羽女士不愿意接受，我会把这笔钱捐给公益慈善机构”。

郭敬明道歉后，庄羽也很快进行了回应：时隔十五年，收到郭敬明的道歉，如郭敬明先生所说，这的确是一份迟来的歉意，我接受郭敬明先生的道歉。

除了接受郭敬明的道歉，庄羽还提议将《圈里圈外》这本小说出版后获得的线上线下所有版税以及全部收益同《梦里花落知多少》的收益合并在一起成立一个反剽窃基金，用以帮助作者维权。

至于具体的维权方式，尽管庄羽没有表示，但可以想见只可能是用于支持作者在发现别人抄袭自己后，维护自身权益的各种举措。

而以目前的网络文学数量来看，作者最需要的——也是最难的一点——是及时发现自己被剽窃了。

如果只是靠人力，多大规模的反剽窃基金都很难做到及时发现剽窃现象。

那这事儿，能不能靠AI？

AI 反剽窃，并不容易

一提到反抄袭、反剽窃，我们的第一反应一般都是论文的自动查重系统。无数学子都曾在“降重”（降低重复率）的路上被论文查重系统按在地上反复摩擦。

传统的论文查重系统并不能称为现在意义上的AI，比如我们熟知的知网论文查询，就是以连续十三个字符重复为原理，通常是以句子为单位，就是说一句话当中如果有连续十三个以上含十三个字符重复的，则该句被判定为重复率的概率就比较高。

但是这一呆板系统有着明显的缺陷，简单的更换同义词、更换语序就能很大程度上避开这种查重。

这就涉及到了NLP领域一个非常有意思的领域——文本语义相似度计算。

举个例子，智能客服如何理解人类针对同一个问题的同一个提法？

“花呗如何还款”&“花呗怎么还款”

“花呗如何还款”& “我怎么还我的花被呢”

“花呗分期后逾期了如何还款”&“花呗分期后逾期了哪里还款”

对AI来说，理解这些相似的问题并不容易。从传统的特征工程方法，到现在的深度学习方法，这一问题都没有得到很好的解决。

Kaggle针对这一问题也有一些比赛，主要是针对搜索引擎和QA系统，这也侧面说明了目前AI连单个句子的相似性分析都很难准确判断，更别谈对整个文章甚至书籍相似度的剽窃判断了。

更何况，即使往后AI解决了文本语义相似度的问题，抄袭者如果在文学作品中只抄袭故事架构和情节，AI想要判断就难上加难了，这个难度甚至超越了AI对于语义的理解，上升到了AI对人类复杂社会和情感关系的理解。

当然了，如果是直白的抄袭，改写都懒得改写，那么最简单的查重系统都可以查出来，比如下面这个。

反剽窃不行，AI剽窃却很在行

AI是把双刃剑，这句话用在剽窃和反剽窃上太合适不过了。

尽管刚才说了目前AI剽窃可能还不能做的很好，但是剽窃这事儿，AI现在却很在行。

在百度上随便搜一下，都能搜到一些可以用AI洗稿的工具，号称可以通过AI识别他人的文章，然后通过改写生成一篇“伪”的文章。

就针对上面那句话，文摘菌找了一个有线上版本的AI智能改写工具试了一下。顺便看了看工具的介绍，上面列举了几个耳熟能详的NLP技术：情感分析、信息分类、实体识别。

这么一看，效果貌似还行，但还是很容易就看出来是改写的，比如第三句只是将“号称”改成了“声称”。

也许这种改写工具很难对付严格的学术审查，但是对付像微信公众号校验这样的反抄袭机制呢？

我们不妨来试试。

首先选择一篇文摘的文章，然后进行改写。

之后我们再将改写后的文章复制到后台发送，看能不能通过校验。

点击发送之后，微信公众号后台并没有弹出校验不通过的选项，而是可以直接发送。

很显然，至少这个工具可以成功剽窃微信公众号文章而不被校验机制发现。

这么看来，难道AI真的有点不厚道，反剽窃不行，剽窃却很在行？

小伙伴们，你们怎么看？

原标题：《庄羽提议郭敬明成立反剽窃基金，AI：反剽窃，不行；剽窃，行！》

阅读原文

曼联vs斯旺西这张8年前和8年前的照片对比，照片中8年前的他戴着墨镜，看上去仍然是一副小鲜肉的模样，很帅，即使放在现在看来，也是个男子汉，但8年后的他，一脸掉满了腮帮子，整个人看起来很沧桑，虽然多了点男子

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186

Lily and people like this Comments

庄羽提议郭敬明成立反剽窃基金，AI：反剽窃，不行；剽窃，行！

Mark wiens

丈量 2020

在蒸蒸日上跑开启全新一年，这里有习惯、希冀和浓浓人情味

相关信息

西虹市首富：谁花王多鱼的钱最多？夏竹倒三，第..

曾多次上春晚成最火喜剧女星，却因体重遭嘲..

官宣了！太原街、苏家屯将迎来大型商业落地！..

西虹市首富：谁花王多鱼的钱最多？夏竹倒三，第一..