調查動機
網際網路內容生產市場的拼殺日趨白熱化,優質原創內容可謂網際網路上的「兵家必爭之地」。在此背景下,不少平臺推出網絡作品申請原創功能,此舉既可以保護原創作者的合法權益,也推動優質內容不斷出現。然而,有不少人卻瞄準了原創市場,炮製出「偽原創」作品。「偽原創」手段有哪些?《法制日報》記者展開了調查。
□ 本報記者 張昊
內容生產無疑是當前網際網路經濟的一大「風口」。不管是傳統媒體的轉型者,還是自媒體人,都將內容生產視作網際網路經濟的一個富礦,文字、視頻、音頻等產品不斷出現在各種網絡平臺。
既然是內容生產,就涉及到內容的版權問題,衍生出了網絡作品盜版侵權現象。不過,與傳統的盜版侵權相比,網絡原創作品還面臨一種新的侵權形式——「偽原創」,即通過各種手段將原作者的原創作品變成侵權者的「原創」。
「偽原創」手段花樣百出
劉思含目前在北京一家視頻新媒體公司市場部工作,主要業務是負責公司生產內容的版權保護。
「我們是做科普、知識類視頻的新媒體公司,在微信、微博等很多平臺上投放醫學、汽車等多個領域的內容。我們製作的每一個原創內容由三個部分組成,視頻和詳細的畫外音講解,還有相對精簡的文字。」劉思含說。
一個原創內容包含視頻、音頻、文字三部分,按理說是不容易被他人直接「拿走」的,但劉思含恰恰遇到了這種情況。
2016年12月27日,劉思含所在的公司上傳了一篇關於汽車外觀的原創內容。「今年2月中旬,某微信公眾號發出一篇文章,用了我們原創視頻的截圖,複製粘貼了文字版,把畫外音整理成文字。在這個基礎上,剽竊者給文章加了個開頭和從網上扒來的圖片。就這樣,對方把我們的原創內容變成了他的原創作品。」劉思含說。
劉思含在微信後臺與對方交涉,對方不承認。之後,劉思含所在的公司向平臺投訴,並要求對方把稿子刪掉,對方回復,「既然你們都投訴了,那就交給平臺方處理吧」。
「被抄襲的不僅是我們的汽車公眾號,我們製作的其他領域的視頻,每周會發現並舉報幾次剽竊行為。」劉思含說。
記者調查發現,目前網上的「偽原創」抄襲方法還有不少。例如「洗稿」,就是把類似的幾篇文章拼在一起,之後申請「原創」。
目前,常見的平臺審查機制主要由機器完成,即按文字內容的比例來判斷是否存在抄襲。不過,機器審查存在一個弱點,就是很難識別視頻和漫畫。
「我們公司以創作漫畫或視頻為主,抄襲者直接對視頻進行截屏,將原創文章中的文字內容轉換成圖片,不使用文字,機器就很難識別出抄襲。」劉思含說,「我們與粉絲的互動是問答式的。在讀者留言中會有一些提問,我們在互動中作出相應解答。我了解到,有的公號甚至抄襲我們和讀者互動的內容,將這些問答內容搬到自己的文章中。」
在線自動生成「偽原創」
記者在調查中發現,除了劉思含提到的各種「偽原創」手法,還有一種模式——在線自動生成「偽原創」。
記者通過閱讀多個「偽原創」工具的說明並試用,梳理出其製作過程和原理。「偽原創」的目標是通過同義詞替換的方式,讓搜尋引擎認為是一篇原創文章,從而提高在搜索結果中的排名。「偽原創」工具或在線生成網站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費後才可以使用。
「用『偽原創』工具可以把在網際網路上複製的文章瞬間變成您自己的原創文章。」一個「偽原創」網站的說明這樣寫到。此類「偽原創」工具還可以在文章中隨意植入想被讀者看到的關鍵詞或網址,以達到宣傳作用。
記者把原創文章複製粘貼到這樣的網站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標記出來。
在這個過程中,記者發現,專業類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線「偽原創」工具還附帶相似度檢測、關鍵詞排序、關鍵詞統計、關鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換後的文章可讀性降低,網站建議對文章進行人工修改提升可讀性。一個「偽原創」網站在說明中稱,「『偽原創』文章最好將文章開頭和結尾用自己的語言組織,這樣的效果更好一些」。
記者使用相似度檢測對原創和「偽原創」進行對比發現,機器識別出相似度在85%至98%之間。
記者在網站上看到一個生成記錄,內容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之後的文章相似度為92.6%,如此高的相似度怎麼辦?這些網站給出了進一步的「解決方案」。
「在線生成文章,將其粘貼入前兩步已做好的『偽原創』文章後一段即可」。記者點擊「在線生成文章」發現,生成的並不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最後,相似度降低到84.3%。
除了用亂碼降低相似度,這些網站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。
此外,記者發現,網上還可以搜索到大量關於「如何製作『偽原創』」的教程。
原創維權依然麻煩
作者的原創內容遭「偽原創」剽竊,將會有哪些損失?
「就商業價值而言,一篇文章招廣告,賣價要看這個公眾號的粉絲量有多少。大一點兒的公眾號,一篇頭條文章去年的價格大約是5萬元;剽竊我們的公號,估計一篇頭條文章的賣價在幾千元到兩三萬元之間。保守估計也可以賣出幾千元。」劉思含說。
劉思含告訴記者,從後臺數據來看,如果是關於熱點問題的原創,剽竊的作品可能在至少一個星期時間內對原創產生影響。對於科普內容而言,大部分都是沒有時效性的,剽竊對於原創的影響時間持續更久。
面對「偽原創」侵權,原創者是否想過維權?又該如何維權?
「對原創作者來說,他們需要投入大量精力去製作優質內容,讓他們去做維權的事情非常消耗精力。特別對於個人原創者而言,或許這一天或者一個星期特別有靈感,能寫一篇特別好的文章,結果被抄襲的事情一鬧,可能這一段時間他什麼也做不了了。」劉思含說。
據劉思含介紹,對於公司而言,遭遇剽竊後的主要訴求就是讓對方把文章刪除。「我們會時不時在後臺搜一搜關鍵字,看是否有未經授權的轉載。沒有經過授權的,就算是有些人標註了來自我們的公號,我們還是會聯繫對方把文章刪掉。大部分抄襲的人都挺心虛,都會刪稿。遇到不刪除的,效率比較高的做法就是向平臺方舉報」。
記者調查了解到,不同的平臺對原創舉報的處理周期不同。有的平臺,原創作者當天投訴,過幾個小時就會出處理結果,有些平臺審核過程會比較麻煩。「尤其是公司機構,需要出示一個企業聲明,載明哪篇文章被抄襲,要加蓋公章,掃描,上傳。整個過程耗時短則兩三天,也可能更長。」劉思含說,「走法律途徑保護原創穫得賠償的方式,對公司機構而言太耗精力,不划算。」
劉思含所在的公司鋪設了「全網」運營渠道,不管在什麼平臺上發現抄襲,都可以與平臺方聯繫,將抄襲的文章刪掉。「但是,對於個人原創者,這個工程則無法完成。一是他們發作品平臺非常有限,不可能跟很多平臺合作保護自己的原創。二是他們沒有精力去溝通。」劉思含說。
近期,有平臺推出一個叫做「維權賠付」的功能,意思是通過後臺與平臺方籤訂協議,如果遭遇抄襲由平臺幫原創者維權。平臺方先賠付50元,然後平臺再幫原創作者走訴訟途徑維權。訴訟成功後,再賠付100元。
「不管被剽竊的是什麼內容,不管是視頻還是文字,都是同一個價格。籤訂這個協議,意味著平臺按照固定的價格賠付作者。然而,製作漫畫和視頻的成本高於純文字的內容,我們認為這個賠付金額太少了。如果不籤協議,我們確實不會走訴訟的途徑。」劉思含說。
製圖/高嶽