整個論文查重報告的相似率是由每一個單獨匹配來源的重複率累加所得,相似度為20%的論文可能包含20個不同的匹配源,每一組匹配的文本重複1%。交叉核對資料庫檢索SCI論文後給出的相似度大致可分為三類:
第一類:相似率低於10%-不太可能成為問題(忽略)
一般來說,在這些文章中檢測到的相似率是來自相對分散來源的匹配文本或常見短語。通常,每個匹配源的相似度僅佔1%~3%,在期刊允許的合理範圍內。這類重複檢查的結果對識別論文是否抄襲的影響很小,幾乎可以忽略不計。
類型2:相似率介於10%和50%之間(簡要回顧)
大多數作者的重複報告結果都可能在這個範圍內,這是一個相對適中的百分比。在這個範圍內,可能會有一些直接提取的文本,此時可能被認為是剽竊的,但不一定主要取決於每個匹配源的相似度,儘管總體相似度較高。但是,也有可能只有一個部分的提取物所佔比例特別大,因此至少需要確認一個來源的重複率高於10%,然後重寫重複較多的部分。
第三類:超過50%的相似性-可能問題(仔細審查)
相似度超過50%的比例太高,說明一個或多個單獨的匹配源有很高的重複度,即大句子與資料庫中的某些文檔一致,需要警惕。這很有可能被認為是剽竊。因此,必須重新評估和仔細改寫語言。
此外,複製報告的相似率結果還需要注意兩種特殊情況:
第一種情況:總體相似度較高,但包含多個低重複匹配源。例如,一份相似率超過30%的文件可被認為是可疑的,但如果仔細分析報告發現每個匹配源的重複率低於5%或更低,一般不會指出此時正在進行。只需做簡單的語言調整。
第二種情況:總體相似率很低,但只包含一個或兩個高重複率匹配源。例如,相似度為12%(幾乎可以忽略不計)的論文只有兩個相似的來源,分別為11%和1%。所以這篇文章也需要額外的注意。11%的重複部分可能包含幾個大的摘錄,必須保持警惕,以免在提交後由《日刊》指出,從而造成不必要的麻煩。
綜上所述,對SCI論文複製的檢查標準不固定,需要具體分析。在覆核報告中第一眼看到的相似度只是一個參考。不要擔心太多,即使是略高於20%。最主要的是確保每個匹配源的相似度是合理的。這就要求作者根據審查報告進行具體的分析,以便進行有針對性的語言評價。