设定检测报告分项的权重系数

2017-10-01 作者:小编

基于笔者对已发论文检测原理和影响检测结果的主客观因素的分析,中国知网论文查重根据“学术不端行为检测系统”的标准,“一篇论文与数据库的文字重合率≥10%,属于句子抄袭;30%-50%间属于段落抄袭;≥50%则被判断为整体抄袭。”[3]若以该标准作为终检测结果判定的数字标准,则需要对系统认定的“文字复制比”进行仔细辨别,必要时需要对检测报告提供的“文字复制比”进行权重系数调配。

(一)增加疑似抄袭部分的权重系数有些文章初步检测结果不错,系统显示没有抄袭嫌疑,但是该篇文章的研究主题比较陈旧,就存在隐性抄袭的可能。

1.“文字复制比”+“关键部位抄袭率”*权数1.5有的文章对其他研究者的观点、主题进行拼盘式抄袭,并无个人见解,或者关键部分抄袭率较高,但全文的抄袭率不高,这种抄袭隐蔽,性质恶劣,一旦被发现,要增加1.5倍的权重系数,或者视情节轻重实行一票否决制。这种抄袭一般的机器检测法很难发现,只能通过增加公示环节,以同行间的监督和专家的评议来实现检测。

2.“文字复制比”+“疑似抄袭比n”这里n是指数学公式、研究方法等很难通过机器检测出的项目占全文的比例。有研究者指出检测系统对于含数学公式和表格的PDF、WORD格式的文件具有一定的局限性,检测效果不理想。[7]因为研究方法、研究数据等方面的抄袭比较难以检测,可以在检测报告中明确指出占全文比重多少的部分有抄袭嫌疑并建议通过人工辨别的方法确认是否存在抄袭现象。

(二)降低疑似抄袭部分的权重值1.“文字复制比”-“前半部分的抄袭率”*权数0.5前半部分抄袭度较高,但是核心位置没有抄袭的文章应该如何计算其终的抄袭率是很值得探讨的。相对应后半部分及核心部位的抄袭,文章前半部分出现的抄袭现象是比较轻度的抄袭。因为前半大部分属于文献综述、历史、现实情况介绍等,无论哪位作者写客观情况基本是一样的,疑似度也会比较高,关键看其观点和核心部分是否有创新。基于此,笔者认为非核心部位的抄袭应该有一个能够适度降低抄袭率的系数,这样既保护了作者文章的原创性,又在一定程度上对作者不谨慎的科研行为进行了惩罚,笔者以为这个系数0.5为宜。

2.“文字复制比”-“疑似抄袭比n”(1)n为公有领域中思想等内容占全文的比例我国著作权法有“思想与表达二分法”原则,认为作品中思想不受著作权法保护,是因为思想是创造表达性作品的基本建筑材料,体现的是人类文明的承袭,但是,著作权法明确提出要保护作品表达的形式,包括书写风格、电影作品的版次等方面。将这个原则翻译为研究者需要遵守的行为规范为:其他研究者可以借鉴该研究者的思想,如果是原文引用,须以参考文献的形式进行标注,如果是经过了研究者的再次加工,则无需标注。有研究者特别指出,要注意“需要将作品中属于公有领域中思想的表达加以排除,因为这部分内容不属于著作权之保护范围”。[8]例如对法律条款、数据、事实、公理、定律等的引用出现了标红的现象要将这部分文字在全文中所占的比重n减掉。

(2)n为下面3种情况所占全文的比例以下三种情况指论文中明确注明为引自其他论文中内容;系统收录不全导致的抄袭率;本人硕士、博士毕业论文中内容[9]。对于论文中明确注明为引自其他论文中的内容,要区别对待,有一种情况是作者不小心引用了已经被认定为抄袭或者系统收录不全导致的文字复制比,应该被扣除,必要时可以请作者通过申诉等途径完成。但是也有一种是作者随意标注参考文献的现象,看起来标注了,但是按照作者提供的参考文献去找,根本找不到,这种情况一旦发现还是要计入文字复制比的。建议可以通过下面的途径判断:系统标红的地方右键会显示来源,将该来源与作者提供的参考文献进行比对,情况一目了然。另外一种情况,博、硕士论文虽然印刷及被cnki收录,但是没有正式的刊号及书号,不属于真正意义上的公开发表,这个原因导致的文字复制比也应被扣除。

对cnki知网检测出来的结果要区别对待,这在未发论文检测者中已经有了比较明晰的认识,但是对于已发论文检测者来说,由于检测者的专业、第三方检测模式,文件类型等一系列主客因素的限制,仅仅按照系统检测报告提交给使用者可能对被检测者不公,希望检测方能合理利用以上论及的增减权重值的方法,在提交检测报告的同时对“文字复制比”进行科学分析,以求得更高程度的公平公正。

.—— END ——.