網絡作品「偽原創」花樣多:工具可自動生成文章

2020-12-11 中國新聞網

  調查動機

  網際網路內容生產市場的拼殺日趨白熱化,優質原創內容可謂網際網路上的「兵家必爭之地」。在此背景下,不少平臺推出網絡作品申請原創功能,此舉既可以保護原創作者的合法權益,也推動優質內容不斷出現。然而,有不少人卻瞄準了原創市場,炮製出「偽原創」作品。「偽原創」手段有哪些?《法制日報》記者展開了調查。

  □ 本報記者 張昊

  內容生產無疑是當前網際網路經濟的一大「風口」。不管是傳統媒體的轉型者,還是自媒體人,都將內容生產視作網際網路經濟的一個富礦,文字、視頻、音頻等產品不斷出現在各種網絡平臺。

  既然是內容生產,就涉及到內容的版權問題,衍生出了網絡作品盜版侵權現象。不過,與傳統的盜版侵權相比,網絡原創作品還面臨一種新的侵權形式——「偽原創」,即通過各種手段將原作者的原創作品變成侵權者的「原創」。

  「偽原創」手段花樣百出

  劉思含目前在北京一家視頻新媒體公司市場部工作,主要業務是負責公司生產內容的版權保護。

  「我們是做科普、知識類視頻的新媒體公司,在微信、微博等很多平臺上投放醫學、汽車等多個領域的內容。我們製作的每一個原創內容由三個部分組成,視頻和詳細的畫外音講解,還有相對精簡的文字。」劉思含說。

  一個原創內容包含視頻、音頻、文字三部分,按理說是不容易被他人直接「拿走」的,但劉思含恰恰遇到了這種情況。

  2016年12月27日,劉思含所在的公司上傳了一篇關於汽車外觀的原創內容。「今年2月中旬,某微信公眾號發出一篇文章,用了我們原創視頻的截圖,複製粘貼了文字版,把畫外音整理成文字。在這個基礎上,剽竊者給文章加了個開頭和從網上扒來的圖片。就這樣,對方把我們的原創內容變成了他的原創作品。」劉思含說。

  劉思含在微信後臺與對方交涉,對方不承認。之後,劉思含所在的公司向平臺投訴,並要求對方把稿子刪掉,對方回復,「既然你們都投訴了,那就交給平臺方處理吧」。

  「被抄襲的不僅是我們的汽車公眾號,我們製作的其他領域的視頻,每周會發現並舉報幾次剽竊行為。」劉思含說。

  記者調查發現,目前網上的「偽原創」抄襲方法還有不少。例如「洗稿」,就是把類似的幾篇文章拼在一起,之後申請「原創」。

  目前,常見的平臺審查機制主要由機器完成,即按文字內容的比例來判斷是否存在抄襲。不過,機器審查存在一個弱點,就是很難識別視頻和漫畫。

  「我們公司以創作漫畫或視頻為主,抄襲者直接對視頻進行截屏,將原創文章中的文字內容轉換成圖片,不使用文字,機器就很難識別出抄襲。」劉思含說,「我們與粉絲的互動是問答式的。在讀者留言中會有一些提問,我們在互動中作出相應解答。我了解到,有的公號甚至抄襲我們和讀者互動的內容,將這些問答內容搬到自己的文章中。」

  在線自動生成「偽原創」

  記者在調查中發現,除了劉思含提到的各種「偽原創」手法,還有一種模式——在線自動生成「偽原創」。

  記者通過閱讀多個「偽原創」工具的說明並試用,梳理出其製作過程和原理。「偽原創」的目標是通過同義詞替換的方式,讓搜尋引擎認為是一篇原創文章,從而提高在搜索結果中的排名。「偽原創」工具或在線生成網站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費後才可以使用。

  「用『偽原創』工具可以把在網際網路上複製的文章瞬間變成您自己的原創文章。」一個「偽原創」網站的說明這樣寫到。此類「偽原創」工具還可以在文章中隨意植入想被讀者看到的關鍵詞或網址,以達到宣傳作用。

  記者把原創文章複製粘貼到這樣的網站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標記出來。

  在這個過程中,記者發現,專業類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線「偽原創」工具還附帶相似度檢測、關鍵詞排序、關鍵詞統計、關鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換後的文章可讀性降低,網站建議對文章進行人工修改提升可讀性。一個「偽原創」網站在說明中稱,「『偽原創』文章最好將文章開頭和結尾用自己的語言組織,這樣的效果更好一些」。

  記者使用相似度檢測對原創和「偽原創」進行對比發現,機器識別出相似度在85%至98%之間。

  記者在網站上看到一個生成記錄,內容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之後的文章相似度為92.6%,如此高的相似度怎麼辦?這些網站給出了進一步的「解決方案」。

  「在線生成文章,將其粘貼入前兩步已做好的『偽原創』文章後一段即可」。記者點擊「在線生成文章」發現,生成的並不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最後,相似度降低到84.3%。

  除了用亂碼降低相似度,這些網站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。

  此外,記者發現,網上還可以搜索到大量關於「如何製作『偽原創』」的教程。

  原創維權依然麻煩

  作者的原創內容遭「偽原創」剽竊,將會有哪些損失?

  「就商業價值而言,一篇文章招廣告,賣價要看這個公眾號的粉絲量有多少。大一點兒的公眾號,一篇頭條文章去年的價格大約是5萬元;剽竊我們的公號,估計一篇頭條文章的賣價在幾千元到兩三萬元之間。保守估計也可以賣出幾千元。」劉思含說。

  劉思含告訴記者,從後臺數據來看,如果是關於熱點問題的原創,剽竊的作品可能在至少一個星期時間內對原創產生影響。對於科普內容而言,大部分都是沒有時效性的,剽竊對於原創的影響時間持續更久。

  面對「偽原創」侵權,原創者是否想過維權?又該如何維權?

  「對原創作者來說,他們需要投入大量精力去製作優質內容,讓他們去做維權的事情非常消耗精力。特別對於個人原創者而言,或許這一天或者一個星期特別有靈感,能寫一篇特別好的文章,結果被抄襲的事情一鬧,可能這一段時間他什麼也做不了了。」劉思含說。

  據劉思含介紹,對於公司而言,遭遇剽竊後的主要訴求就是讓對方把文章刪除。「我們會時不時在後臺搜一搜關鍵字,看是否有未經授權的轉載。沒有經過授權的,就算是有些人標註了來自我們的公號,我們還是會聯繫對方把文章刪掉。大部分抄襲的人都挺心虛,都會刪稿。遇到不刪除的,效率比較高的做法就是向平臺方舉報」。

  記者調查了解到,不同的平臺對原創舉報的處理周期不同。有的平臺,原創作者當天投訴,過幾個小時就會出處理結果,有些平臺審核過程會比較麻煩。「尤其是公司機構,需要出示一個企業聲明,載明哪篇文章被抄襲,要加蓋公章,掃描,上傳。整個過程耗時短則兩三天,也可能更長。」劉思含說,「走法律途徑保護原創穫得賠償的方式,對公司機構而言太耗精力,不划算。」

  劉思含所在的公司鋪設了「全網」運營渠道,不管在什麼平臺上發現抄襲,都可以與平臺方聯繫,將抄襲的文章刪掉。「但是,對於個人原創者,這個工程則無法完成。一是他們發作品平臺非常有限,不可能跟很多平臺合作保護自己的原創。二是他們沒有精力去溝通。」劉思含說。

  近期,有平臺推出一個叫做「維權賠付」的功能,意思是通過後臺與平臺方籤訂協議,如果遭遇抄襲由平臺幫原創者維權。平臺方先賠付50元,然後平臺再幫原創作者走訴訟途徑維權。訴訟成功後,再賠付100元。

  「不管被剽竊的是什麼內容,不管是視頻還是文字,都是同一個價格。籤訂這個協議,意味著平臺按照固定的價格賠付作者。然而,製作漫畫和視頻的成本高於純文字的內容,我們認為這個賠付金額太少了。如果不籤協議,我們確實不會走訴訟的途徑。」劉思含說。

  製圖/高嶽

相關焦點

  • 打開「洗稿」工具網站,一鍵生成「偽原創」文章
    (圖為網絡來源,與本文無關)讓網上「剪刀手」無處可藏人民視覺人民日報8月9日消息,打開「洗稿」工具網站,一鍵生成「智能偽原創」文章,充值會員還能獲得內容優化、圖片轉換等服務;同一視頻在不同平臺被熱轉,上傳者卻個個不同,原作者甚至未開通該平臺帳號;兜售標價
  • 視頻變截圖文字轉圖片 網絡作品"偽原創"現象調查
    然而,有不少人卻瞄準了原創市場,炮製出「偽原創」作品。「偽原創」手段有哪些?《法制日報》記者展開了調查。   內容生產無疑是當前網際網路經濟的一大「風口」。不管是傳統媒體的轉型者,還是自媒體人,都將內容生產視作網際網路經濟的一個富礦,文字、視頻、音頻等產品不斷出現在各種網絡平臺。   既然是內容生產,就涉及到內容的版權問題,衍生出了網絡作品盜版侵權現象。
  • 人民日報調查自媒體「洗稿」工具:一鍵生成偽原創,盜播他人錄音
    人民視覺人民日報8月9日消息,打開「洗稿」工具網站,一鍵生成「智能偽原創」文章,充值會員還能獲得內容優化、圖片轉換等服務;同一視頻在不同平臺被熱轉,上傳者卻個個不同,原作者甚至未開通該平臺帳號;兜售標價398元的在線課程,內容卻盜自他人直播錄音……《中國網絡版權產業發展報告(2018)》顯示,2017年我國網絡版權產業市場規模達
  • 偽原創工具 獨有的同義詞和反義詞引擎,可以適當改變文章語義
    軟體介紹:偽原創工具是一款SEO高級工具,專門用來生成原創及偽原創文章,使用偽原創工具可以製作出網際網路上具有唯一性的偽原創文章,支持中文和英文偽原創。本軟體是一款免費的專業偽原創文章生成器,其專門針對百度和google的爬蟲習慣以及分詞算法而開發,通過本軟體優化的文章,將更被搜尋引擎所青睞。本軟體是網絡寫手,群發用戶,SEO者不可多得的利器,也是網站推廣者必備工具。
  • 不少網絡文章騙人騙錢 您認真閱讀的文章 可能是自動生成的
    拿著手機瀏覽文章,老蕭總覺得被忽悠了,「怎麼內容都大同小異啊?」老蕭不知道,他認真閱讀的文章,是由一種營銷文生成器自動生成的。這種可以批量複製的垃圾文章,正充斥著網絡。克隆營銷文 一秒就生成「世界失控了」「華商太難了」「多國女子都想嫁到中國」……最近,這種千篇一律的批量複製文章,常常能引起關注和轉發。「這些文章並不是人寫出來的,而是軟體直接生成的。」網際網路小編點點深諳營銷文套路,他告訴記者,如今網上流傳「垃圾文章」,其源頭其實是文章生成軟體——營銷文生成器。
  • 揭秘自媒體「偽原創」產業:5元就能僱人洗稿,號稱一鍵生成
    這些軟體售價從5元到298元不等,有的軟體並沒有「偽原創」的功能,只能將今日頭條等自媒體平臺上當天的熱點文章進行集中搜索和呈現,供使用者參考;而有的軟體則集「搜集熱點文章」「一鍵偽原創」「原創檢測」功能為一體。除了這些明碼標價的「偽原創」軟體,法治周末記者在網絡上還找到了大量的免費「偽原創」軟體和「偽原創」在線創作網頁。
  • 文章偽原創是如何產生的?
    偽原創的撰寫,對原始文章二次編輯:當他們得到原文,將第二次修訂,調整段落,替換文本,用自己的語言來進行調整。然而,一些人直接使用在線偽原始工具來替換關鍵字,這常常導致語句流差,這往往取決於偽原始工具識別語義的能力,但通常情況下,關鍵字替換依賴於偽原始工具的識別能力。編輯團隊無法審查通過此類文章,因此建議您不要使用偽原創工具來撰寫文章。除了一款愛發狗AI偽原創軟體外,它除了關鍵字替換等其他軟體有的,還有更深層次的語句修改。
  • 七種文章偽原創的方法,手把手教你 SEO 文章為原創
    01 什麼是偽原創 偽原創是指把一篇原創的文章進行再加工,使其讓搜尋引擎認為是一篇原創文章,從而提高網站權重,主要用的方法有字替換法、詞語替換法、文字排序法、首段總結法、尾部總結法、新增加圖片、段落替換法、關鍵詞替換添加法。
  • 怎麼可以做到文章的偽原創
    我個人喜歡先寫文章,例如,如果這篇文章要寫1000個單詞,我將根據文章的組成大致分配單詞的數量。當然,這裡主要跟大家分享怎麼可以做到文章的偽原創,例如,在本文的開頭,我將寫大約200個單詞。然後,在文章末尾,我還將寫大約200個字。
  • Python 打造站長工具之軟文偽原創工具
    摘要作為一個站長,在網站日常運營的時候,經常需要寫一些軟文,以提高網站訪問流量,可是作為一個屌絲,文筆肯定沒有那麼好,想寫點文章,可惜肚子裡面沒有墨水,這個時候,我們肯定想到轉載抄襲他人的文章,這樣做其實對seo的優化不好,因為不是原創,所以對
  • 自動生成原創文章
    我相信很多人都不太容易做到,並且保持原創,因為寫作是要長期鍛鍊的。平時很少寫東西的人,如果突然讓你寫個幾百字真不是一件簡單的事情,除非你是在網上找的,但是這樣別人一搜索你就露餡了。其實寫作真的是一件受益終生的事情,建議大家還是有意識地多培養自己寫東西的習慣。別不當回事,不然連人工智慧寫出來的東西可能都會碾壓你。
  • 自媒體行業浮現"逐利泡沫" "原創"文章一鍵生成
    從理論體系到實踐操作,從批量註冊到打造文章,一名北京女孩去年曾花費2500元,接受了一場「事無巨細」的線上培訓,主題便是如何經營自媒體賺錢。  「震驚!」「快轉發給你身邊重要的人」「你一定會後悔沒點開這篇熱文」……當前一些自媒體作品長得越來越像:醒目吸睛的標題設置,模式化的內容安排,過渡生硬的起承轉合。本應千文千面的原創作品如今有了一種流水線生產的意味。
  • 批量修改文章圖片MD5變原創工具
    提高內容質量,內容原創度是對從事網絡推廣朋友的基本要求,一篇好的文章往往具有言簡意賅、通俗易懂,圖文並茂的特點。但從事推廣營銷的朋友都深知編輯內容是相當燒腦耗精力的,有時為了達到好的曝光度需要批量發布,但又不得不顧忌各網站平臺對文章原創度的要求。
  • AI智能寫作來了,這個工具可以自動寫原創文章
    如果你還覺得人工智慧寫作還離你很遠,那麼看了今天要介紹給大家的這個工具,你就不會這麼想了。這是一款叫做 SmartNovel 的工具,它來自吾愛論壇的 jimmyzang,你只要輸入一句話,它就能根據你選的主題自動幫你寫成 100-500 字,乃至 1000 字的一篇文章。
  • 吳峰少 公眾號文章寫作方法,文章偽原創的方法
    你扣一兩段出來偽原創就好了。 下面我實操幾段偽原創給大家看! 原文: 、有很多人經常會問,賺錢咋這麼難呢,為什麼別人的腦子都那麼靈光,想到這麼多賺錢 的路子,難道他們的腦子都是高配版,而我的是入門級的CPU嗎?其實說句實話,賺錢真不難。
  • 文章如何自動生成短視頻?
    CreateLab百度智能創作中心,可實現文章導入,自動生成短視頻。該CreateLab提供直觀而炫酷的動態圖表視頻自動創作能力,幫助用戶完成結構化數據到視頻的跨越。生成的視頻可直觀地解釋數據,亦可作為後續優質的備用素材。
  • 「果殼商學院」6款新媒體偽原創在線AI編輯神器
    點擊全選複製,即可放入word文本中愛發狗1、瀏覽器輸入網址:http://www.ifagou.com/,選擇AI偽原創2、輸入標題和文本內容,選擇基礎偽原創不需要積分,如果只能偽原創需要積分3、點擊查看
  • 「小說生成器」即刻生成幾千字文 但作品毫無邏輯可言
    原標題:即刻生成一篇幾千字的文章,但產出的作品毫無邏輯可言 「小說生成器」能否成就網絡寫手 記者隨機挑選了一款網絡小說生成器,小說書名、男女主角名字、門派勢力、魔法招式、靈丹妙藥等都可自動生成。例如點選物品類,可自動生成天材異寶「綠靈藤柏根」,功法秘籍「輕侯星夜真訣」。雖然不知道這些神秘法寶有何效用,但一聽就感覺很「玄幻」。 進入「外貌描寫生成器」,點選服飾類型、臉型、年齡、性格等附加條件後,生成器會一次性生成10條同樣句式的外貌描寫。
  • 如何讓搜尋引擎喜歡你的偽原創文章?
    對於搜尋引擎來說,大部分情況是不會喜歡偽原創的,但是你的偽原創有價值,搜尋引擎還是有可能喜歡你的偽原創,但是還是需要適當的創新。那麼,如何讓搜尋引擎喜歡你的偽原創文章呢?呢?重構成偽原創內容這一步自然極為重要,也是決定偽原創是否被搜尋引擎喜歡,而這一步也涉及到很多小細節。比如:關鍵詞的設置,在標題中設置相應的關鍵詞,文章中也可以設置一些關鍵詞。
  • 用案例科普:抄襲、洗稿、偽原創的區別是什麼?
    「洗稿」不是新的行為,但相對來說是一個新的概念,經常會和「抄襲」、「偽原創」等概念同時出現,容易引發理解上的混淆。今天我借著大家的興致,撇開差評一事不談,儘可能的通過案例,用白話解讀下這幾個概念的區別所在。抄襲抄襲的概念很好理解,指將他人作品或者作品的片段竊為己有發表。