作者:Mia
設計:瓜瓜
前兩天,收到一個今日頭條的朋友發來的新功能內測邀請——靈犬反低俗助手。
靈犬誕生於2018年3月,是由今日頭條開發的一款反低俗小程序,可以檢查文字、圖片和語音的健康指數。
朋友表示,這次測試是新增了「靈犬反低俗助手」的視頻識別功能。
支持視頻檢測後,靈犬反低俗助手對全網內容創作者都會有很大幫助!
體驗一番後,我發現頭條的這個助手小程序確實有點香!
下面我們先來聊聊,靈犬到底是什麼,為什麼對於內容創作者來說真香?
01靈犬5.0:低俗終結者?
我們知道,對於任何一個內容生態,低俗內容的整治都是巨大的挑戰。即便是谷歌、facebook這些老牌大廠們也都養著數量眾多的人工內容審核。
在國內的很多內容平臺,同樣有大量的低俗內容泛濫。
很多曾經優質的社區都是因為低俗內容泛濫,劣幣驅逐良幣,最終導致用戶體驗極差、社區衰落。
1)靈犬是今日頭條創造的「低俗終結者」
像開頭提到的,靈犬反低俗助手是脫胎於今日頭條的一個審核模型。
最初,今日頭條為了審核發布內容是否合規,運行了一套算法,後來在 2018 年,又將模型公開。同年 3 月,今日頭條在完善這套算法和模型的基礎上,上線了「靈犬反低俗助手」小程序,主要用來識別文字的「低俗檢測」。到 2019 年 3 月,靈犬使用人次已經突破240萬。
隨後靈犬又在幾次改版中陸續增加了圖片、語音識別,截至2020年11月底,「靈犬」使用人次已經突破522萬。
根據頭條發布的官方報告顯示,截至今年 3 月,靈犬共收到 861 萬次內容申請,成功查出低俗內容53萬條。
可以說,靈犬從被開發出來的第一天起,其角色就是要做「低俗內容終結者」的。
2)視頻審核上線後,靈犬功能「齊活了」
而在今天,靈犬微信小程序5.0 版的視頻反低俗功能正式上線。
也就是說,靈犬小程序已經可以支持檢測視頻、文字、圖片、語音四類內容形式。
幾乎涵蓋了所有主流內容形式。在對各類內容品類的檢測上,稱得上齊活了。
剩下的工作就是識別準確度提升,而算法優化正是頭條系最擅長做的東西。比如靈犬背後的文本分類模型,已經經過 3 次大版本迭代,每一次都是代際升級:
第一代靈犬採用詞向量技術,簡單點理解就是將文字拆解,然後匹配對應的文字庫,預測準確率 79%;
第二代靈犬採用 LSTM 技術,對長句很好地識別,準確率達到85%;
第三代靈犬採用 Bert 半監督技術,直接將準確率提高到 91%
02
「靈犬」有多香?
產品開發側致力於完備檢測品類、不斷提高準確率,那麼,這個靈犬小程序的使用側體驗到底怎樣呢?
1)向全網開放的智能檢測AI
實際上,現在市面上幾個優質內容平臺都有開發內容檢測程序。
比如知乎去年上線了專治「答非所問」的機器人瓦力,通過機器學習處理答非所問、辱罵、貼標籤等不友善內容,微信也有自己的安全助手小程序。
但它們大部分都是平臺自審使用。而靈犬則是罕見的面向全網創作者、用戶開放的智能檢測 AI ,用戶在今日頭條、微信小程序上直接搜索「靈犬反低俗助手」即可使用。
我在文字、圖片、語音、視頻四個方面都進行了測試:
在文字準確度檢測測試中,我首先選取了兩篇正規權威媒體的熱文(一篇為環球網、一篇為新京報),複製連結到靈犬小程序進行檢測。
結果一篇 98% 健康概率,一篇為 89% 健康概率,都獲得了不錯的結果。
隨後,我又在網上找了兩條標題黨或隱含色情的標題,輸入檢測:
1. 羞羞!他們嘗試了100次後,終於找對了姿勢……(暗含色情引導)
2. 美軍百架戰機逼停我艦隊,隨後我傻眼了!(誇大其辭標題黨)
第一條暗含色情的文字健康概率被評為 37%,靈犬表示「眉頭一皺,覺得有問題」。
第二條標題黨的文字,靈犬並沒有直接識別出來,表示「一時無法確認」(可能是因為單純的文字太短,無法有效判斷)。
隨後,我又測試了一篇看起來標題有些出格,但實則是環球網發布的正規文章。
女子酒後懷孕,丈夫做親子鑑定後,傻眼了……
結果靈犬表示,89% 概率健康。
可見,在文字識別方面,靈犬還是很準的。除了少數字數過短且比較隱蔽的文字,大部分都能給出正確的評分。
在圖片檢測環節,我首先找來幾張衣著相對較少,但沒有明顯性暗示的圖片測試。
結果雖然有兩張的分數沒那麼高,但靈犬依然準確給出了「內容健康」的評價。
隨後,我又上傳了一對男女芭蕾舞演員跳舞的照片。
結果顯示,「靈犬無法判斷是否健康,需要人工審核」。
可見,對涉及到諸如男女親密舉動這類有可能打色情擦邊球的圖片內容,靈犬的算法相對會更為謹慎,在客觀檢測的基礎上,為了避免矯枉過正、草木皆兵的誤傷,會觸發人工審核,提高審核的準確度。
同樣的方法,我又測試了幾條語音和短視頻。也還是很準的,能發現語音裡的髒話、粗口,也能簡單識別短視頻的畫面內容是否含有色情低俗、暴力血腥等內容。
總體來說,今日頭條靈犬做得還是不錯的,在檢測精度和操作體驗方面都相當有競爭力。
2)「靈犬」多有用?
回到開頭的那個問題:對於創作者來說,靈犬又可以起到哪些作用?
幫創作者自查、提效的助手
對於創作者來說,靈犬最直接的作用就是:幫助創作者自查作品是否存在不良信息,避免出現發布後內容不過審、被限流的情況。
這一作用對於頭條內容生態的創作者來說,絕對是真香的。
比如我在頭條上就發現一位「育兒領域」的優質創作者曾發布過這樣一條微頭條:
自己認真寫的一個回答,但遲遲沒有閱讀量,也沒有被首推;
結果用靈犬一查才發現,自己的一張配圖被標記為低俗圖片;
刪除問題照片後,很快就獲得了流量。
甚至還有用戶把靈犬當作文章「優化助手」,將一篇閱讀量正常只有 2 萬的微頭條,通過用詞、語句優化到 65萬+ 閱讀量。
到了現在靈犬5.0 發布,可以支持短視頻檢測,對於做抖音和喜歡拍視頻的創作者們就非常有用了。
再也不用發布視頻發現沒流量後,盲猜哪裡違反了推薦規則,可以直接使用靈犬幫助自己找出問題並優化。
雖然現在靈犬5.0 還只支持 15 秒視頻的檢測,但相信以頭條的技術能力,很快就能有新的突破。
當然,對於非字節跳動內容生態的創作者來說,靈犬自查一下也能有效避免踩「低俗的坑」,畢竟各大平臺幾乎都有低俗內容審核機制。
實現「反低俗內容」審查流程的前置
什麼叫審查流程的前置呢?
簡單來說,就是目前主流的內容審查流程是「事後整治」。
內容平臺通過算法篩除低俗內容,並對帳號進行限流、刪禁等處罰。
但靈犬的推出,是在「事後整治」的基礎上,又增加一個事前審查的流程。既幫助一些誤加入低俗元素的創作者提前發現作品問題,也能減輕平臺事後審查的工作量。
03
結語
當然,目前的靈犬小程序還是有很多不足的。
即便是準確率最高的文字審查,也只做到了 91% 的準確率,在網際網路海量的數據下,被誤判的絕對數量也是不少的。
但讓我們欣慰的是,隨著不斷地優化,靈犬反低俗工具能檢測的內容種類正越來越多,精確度也越來越高。
身為內容創作者,我們在創作內容的時候也可以多嘗試下靈犬反低俗助手,對圖、文、視頻進行檢測,以便文章獲得更多的流量推薦,也能讓我們擁有更好的創作、閱讀環境。
你怎麼看「靈犬反低俗助手」?
歡迎留言和我們分享