論文標題:Paraphrasing tools, language translation tools and plagiarism: an exploratory study
期刊:International Journal for Educational Integrity
作者:Felicity M. Prentice and Clare E. Kinden
發表時間:2018/12/19
數字識別碼:10.1007/s40979-018-0036-7
原文連結:https://edintegrity.biomedcentral.com/articles/10.1007/s40979-018-0036-7?utm_source=other&utm_
medium=other&utm_content=null&utm_campaign=BSCN_2_WX_edintegrity_arti_scinet
微信連結:https://mp.weixin.qq.com/s/veGfO2vLbmXZUlz0vMS_gQ
最近發表在 International Journal for Educational Integrity上的一項探索性研究對學生的論文(特別是需要使用標準醫學術語的論文)進行了分析,這些論文的特點是均不符合語言規範且難以理解。該研究表明,使用與上下文不符的同義詞取代專業術語的論文。更容易指向作者使用了在線改寫工具而非語言翻譯工具。
圖片來源: Jason Leung, Unsplash.com
抄襲早已不是新鮮事了,但科技的發展為抄襲提供了各種新的機會;過去的抄襲往往是直接從其他來源進行複製粘貼,現在則發展為學生直接求助他人完成所有的作業來當作是自己的成果。當然,技術也為我們提供了識別潛在抄襲和剽竊的機會。Turnitin®等文本匹配軟體可以生成相似性報告,即使文本中沒有提到原始來源,我們也能據此找到原始來源。然而,現在又產生了一個能蒙蔽這類詞彙匹配軟體的最新技術——在線改寫工具。
最近,在健康科學課程中,我們遇到了來自學生的形形色色的論文,這些論文會夾雜一些不符合語言習慣的表達,有些極端糟糕的論文甚至出現了令人幾乎難以理解的表述。由於這些學生中有許多人的母語並非英語,因此我們推測他們是先用母語完成論文撰寫,然後再使用在線語言翻譯工具將其轉換為英語。
然而,事實遠非如此簡單。我們偶然發現了一種免費的在線英英改寫工具。很顯然,學生們從其他來源獲取了文本內容,並通過能自動替換同義詞的軟體將其進行「喬裝」,從而隱藏了這些文本與原始來源的相似性。
例如,以下句子:
一天,當Dou外出散步時,他感到頭昏眼花,隨後便失去意識,倒在了地上。
One day while Doug was out walking, he felt lightheaded and then lost consciousness and fell to the ground.
經過在線改寫工具的改造,可能會變成:
一個恆星日,Doug外出散步,他感到頭昏眼花,隨後便失去知覺,摔得粉碎。
One sidereal day, while Doug was out walk, he felt lightheaded and then lost knowingness and downslope to the pulverization.
不管怎麼說,學生們使用語言翻譯軟體將自己所寫的內容進行轉換,這至少表明撰寫內容的工作是其自身智慧的成果。但使用改寫工具則是另一種情況,表明他們想要隱藏內容的原始來源。
有兩篇文章讓我印象深刻。其中一篇文章中描述到計算機軸向斷層掃描(CAT)是從各個不同角度(原文中angels拼寫錯誤,正確應為angles)獲得的X線圖像。而在另一篇文章中,則將CAT掃描圖像描述為從各個不同的祝福信使(blessed messengers,angels的同義詞)中獲取的圖像。很明顯,第一篇文章是第二篇文章的原始來源,而第二篇文章是作者使用改寫工具處理得出的。
缺乏學科專業術語是抄襲的標誌
於是我們不禁要問,是否可以確定出一些標誌來區分文本是進行過了語言翻譯工具的處理,還是經過了英英同義詞替換工具的加工?
為了探索這一點,我們選擇了一個包含大量醫學術語的文本語料庫。整個醫療保健領域均要求使用標準的醫學術語來減少歧義並促進清晰的溝通。學生必須對這些術語了如指掌,在使用這些術語時不應做改動,並且不用同義詞進行替代。我們用谷歌翻譯將該文本字面翻譯成EAL(English as an Additional Language)學生所熟悉的六種語言;並用六種免費在線改寫工具將其進行改寫。
結果顯示,在文本所包含的21個標準醫學術語中,改寫工具生成並替代產生了73個同義詞,而谷歌翻譯只產生了7個替代術語。 例如,對於術語「醫院」,改寫工具生成了以下同義詞:治療機構,醫生機構,治療中心,修復辦公室和療養院。而谷歌翻譯並沒有產生替代文本。
這項研究結果表明,雖然在線改寫工具可能會使Turnitin®等文本匹配軟體無法查重,但是其生成的語言有時很難理解。更具體地說,當出現使用與上下文不符的同義詞取代學科專業術語的情況時,更大程度上意味著作者使用了在線改寫工具,而非語言翻譯工具。
摘要:
In a recent unit of study in an undergraduate Health Sciences pathway course, we identified a set of essays which exhibited similarity of content but demonstrated the use of bizarre and unidiomatic language. One of the distinct features of the essays was the inclusion of unusual synonyms in place of expected standard medical terminology.
We suspected the use of online paraphrasing tools, but were also interested in investigating the possibility of the use of online language translation tools. In order to test the outputs of these tools, we used as a seed document a corpus of text which had been provided to the students as prompt for the essay. This document was put through six free online paraphrasing tools and six separate iterative language translations through the online Google Translate™ tool.
The results demonstrated that free online paraphrasing tools did not identify medical terminology as standardised or accepted nomenclature and substituted synonyms, whereas Google Translate™ largely preserved medical terminology.
We believe that textual indicators such as the absence of standard discipline-based terminology may be of assistance in the identification of machine paraphrased text.
閱讀論文全文請訪問:
https://edintegrity.biomedcentral.com/articles/10.1007/s40979-018-0036-7?utm_source=other&utm_
medium=other&utm_content=null&utm_campaign=BSCN_2_WX_edintegrity_arti_scinet
期刊介紹:
The IJEI(https://edintegrity.biomedcentral.com/) is an international refereed journal where research on educational integrity is disseminated in an accessible and cost-effective format. The journal challenges readers to consider the changing nature of education in a globalised environment, and the impact that conceptions of educational integrity have on issues of pedagogy, academic standards, intercultural understanding and equity.
Articles of interest to the IJEI readership may include but are not limited to the following areas as they relate to educational integrity: plagiarism, cheating, academic integrity, honour codes, teaching and learning, institutional integrity and student motivation. Submissions may include original research (including practitioner research), theoretical discussions and review papers.
(來源:科學網)
特別聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。