• Debora Weber-Wulff

查重软件真的会对论文做出客观的测评吗?对于许多期刊编辑、教授及管理人员对此似乎给出的答案是肯定的。不过,最近署名为 的在自然官网发表了一篇题为的文章,文中其结合自身的经历,再次提醒那些过分依赖查重软件的编辑学者们要慎重对待查重结果。

 

Debora Weber-Wulff在过去的15年里,一直在测试盗版检测软件。结果往往难以解释,难以理解,有时甚至是错误的。许多系统误报了常见短语、机构的长名称甚至参考信息。软件也会产生漏报。如果被剽窃文本的来源未被数字化、包含拼写错误或软件系统无法使用,则系统可能无法发现剽窃。许多剽窃的案例是发生在材料被翻译或从多个来源剽窃时,这些都没有被发现。评估取决于所使用的算法和可供比较的数据库。对于检查随机样本的系统,几分钟后重复文档测试可能会产生不同的结果。她也曾见过不同的查重系统把一篇文章列为完全或部分抄袭,或不抄袭。

 

然而,这些测试系统产生的数字——被称为“原创性评分”、“非独特内容”或“水平”——通常只是表面价值。尽管有几十种可用的系统,但很少寻求第二种意见。实际上,仔细阅读软件生成的报告可以发现正确引用的材料,比如正确引用的方法部分,被标记为剽窃。

 


但是时间紧迫的编辑、教授和管理人员在做出对学者和学术界至关重要的决定时,往往只关注这个简单的数字。如果查重软件报告的数字很低,评估论文的人可能会忽略明显的剽窃迹象,比如风格的变化、拼写错误、字体的变化或加下划线的单词,这些都表明文章是从维基百科上粘贴过来的。她声称在几十篇博士论文和科学出版物中都看到了这一点。

 

如果软件报告的数字很高,编辑或教授可能会不公正地认为提交的论文是明确的剽窃。大学正式定义了“可接受的”剽窃水平,由软件对不同学位水平的论文进行评估。老师们希望软件能标记出“坏”论文,这样他们就不用阅读它们了。但是,学生们担心自己不小心被软件判定为剽窃,所以使用相同的系统重写作业,用同义词替换单词,重新排列句子,直到数字看起来不错为止,但这不利于文章的可读性。

 

期刊编辑们把这些数字作为辅助他们的拐杖,借此迅速过滤掉那些他们可以直接拒绝的论文,或者那些他们可以毫不担心地发表的论文(如果审稿人表示赞同)。一些期刊和会议甚至在网上发布他们的门槛。

 

复制和剽窃论文是有害的:它们扭曲了学者们真实的学术成果,使文献更难以探索理解。这是无法容忍的,但这些可疑的数字并不是解决方案。多年来,Debora Weber-Wulff一直与期刊编辑就有问题的出版物进行沟通。重复发表是指那些本质上具有相同文本(甚至数据)并且共享至少一个作者的出版物。在一些情况下,标题和摘要是不同的,作者被添加、删除或打乱。抄袭的文章没有共同的作者。

 

Debora Weber-Wulff联系的一些编辑都很惊讶。他们使用查重软件,所以他们希望自己不受牵连。但是由于许多原因,重复无法被检测到。潜在的资源,如博士论文,可能存储在存储库或付费墙后面,无法进行比较。那些经过巧妙(甚至是算法)改写的文章也将低于阈值。

 

今年,提交给世界研究诚信会议的摘要通过软件进行了分析,文本重叠阈值设定为30%。事实上,在449个提交的摘要中,有38个提交的摘要超过这个级别。 调查后,15人被认为是抄袭,23人包含了作者之前发表的研究文本。 大多数摘要都被拒了; 在一些作者循环回收自己文章的情况下,摘要被降格为海报。 这种剽窃和重复是令人震惊的,特别是对于学术诚信会议而言; 它也可能被低估了。

 

软件不能判定抄袭;它只能指向一些匹配文本的情况。这些系统可以用来标记问题,但不能用来区分原创和抄袭。这个判断必须人来做。发现剽窃最重要的方法是阅读一篇文章,并研究参考文献中的不一致之处。使用互联网搜索引擎进行抽查,从一段话中使用三到五个单词,或者一个特别好的短语,可以发现抄写者。搜索一个看起来很奇怪的引用可能会找到一个以同样方式破坏引用的源。只有当文本以某种方式关闭,在线搜索没有帮助时,才应该咨询软件系统。在这些情况下,最好使用两个或三个测试系统,并阅读报告,而不要只看数字的表面价值。

 

学术诚信是一个社会问题;不能把尽职调查甩给仍然存疑的算法。保持科学的真诚依赖于科学家愿意努力工作,以保护文献资料。

 

分享給你的同事

推荐阅读

机器学习算法让论文图片查重自动化成为可能

有效降低学术论文重复率的方法

推荐阅读

什么是自我抄袭?

sci论文避免自我抄袭,重新改写应怎么撰写