知网查重样例–知网AMCL检测系统主要不足

2017-09-24 作者:小编

知网查重样例--知网AMCL检测系统主要不足

4.1 自身功能的缺陷

(1)文章格式不同检测结果不一致。系统虽支持多种格式的对比,但实际检验结果差异很大。13|,这是由于机检对字符判断不一造成的。论文排版格式差异也导致检测结果变化。很多编辑部是以方正书版10.0的格式传给中国知网,由于方正书版软件不能直接将排版结果文件转成文本文件,转成PDF文件也只能是图片式的,只能通过第三方专业软件转成可识别的PDF或c旬文件,文章外观形式一样,但编码变化致使比对结果差异较大。笔者做过试验,在中国知网检索题名“学术不端”文献,按PDF和caj格式随机下载10篇文章进行检测,理论上应为100%,但没有1篇是100%,大多在80%左右,低的仅有43%,可见存在辨识不清、比对不准确问题。

(2)无法识别图片、公式和完整识别表格。相似语境中即使叙述的数据或符号不同,也会被认为文字重复。图表、图形、公式、数据是科技论文表述核心科学内涵不可或缺的关键要素,若不能对此进行准确比对,其科学性难以服众。

4.2检测结果的局限性

只能按文字相同或相似来检测文字复制比,无法做到语义分析,智能程度不高。仅提示涉嫌抄袭,对合理引用和抄袭不能正确区分。检测结果显示的仅是文字复制率,检测报告中的参考文献字数不是文中引用的参考文献字数,而是文后的参考文献字数。系统在“查全”“查准”和“查实”问题上表现不理想,检测结果也不具法律效应,是否抄袭系统无法给出准确判定。

4.3检测内容的表面性

AMCL是基于外形上的检测比对,仅判断文字是否相似,主要是实词,不能深及文字下的内涵。对“原版抄袭”敏感,但对“改版抄袭”无能为力。系统仅给出重复率,依据《著作权法》作者有引用的权利,系统却未能保障,至于重复内容是否为不当引用内容,系统无法鉴别。

4.4本身的工具性

由于系统本身的工具和技术性质使其极易走向相反方向,不同人使用会产生不同效应,工具性特点极易被利用,可以成为“正义之剑”,也可成为“邪恶帮凶”,助纣为虐,使学术不端行为变得更隐蔽、检测更难。虽然中国知网进行了严格意义上的授权控制,但使用者只要是社会意义上的人,其负面作用就会显现。

4.5自身的依附性

检测系统必须依靠数据库。数据库的完备程度,直接影响检测结果。有部分期刊并未加入CNKI网。数据的有限性影响了AMLC检测系统的准确度。另外未实现跨语言匹配,对外文文献检测存在技术障碍,而利用“翻译法”“Google法”等二次逆向翻译规避学术不端检测,也是隐性学术不端者常用的手段。

4.6检测与刊载不匹配

文章虽见刊,但上网有滞后期,若马上抄袭刚刚刊载的纸质版文章,因电子版尚未进入数据库,此时系统检测不出。作者投稿后,逐步上网的文章与稿件个别语句的“暗合”也造成检测数据不断提升。另外,对各编辑部存在的大量待审、待刊稿件还无法实现比对,存在一稿多投的检测盲区。

.—— END ——.