大數據時代,給人最明顯而直接的感觸就是信息量突然變得龐大而多樣。據IDC統計,預計2020年全世界所產生的數據總量將增長44倍。
顯然,單一的長文本已經無法滿足手機網民多樣化的閱讀、交流需求,圖片、視頻類信息內容在閱讀上也簡潔直觀,更吸引人。在信息交互方式上,網民從純閱讀行為,可以體驗到點讚、評論、轉發等多種交互行為模式。
據Facebook統計,Facebook每天產生4PB的數據,包含100億條消息,以及3.5億張照片和1億小時的視頻瀏覽。此外,在Instagram上,用戶每天要分享9500萬張照片和視頻,Twitter用戶每天要發送5億條信息。從這類數據上看,在各類網際網路平臺上,除了文本信息,隨處可見的就是圖片信息。
所以巨量圖片暴露出來的風控隱患不得不引起網際網路平臺的重視。例如大量涉政、低俗、暴恐等違法違規內容信息潛藏在各種圖片中,而這類圖片也帶給用戶極差體驗感,無意點擊甚至會引發盜號危機,讓人防不勝防。
重點維護未成年人「清朗」網絡環境
根據《中國網際網路發展狀況統計報告》顯示,截至2019年6月,我國網民規模達8.54億,網際網路普及率達61.2%,手機網民規模達8.47億,在手機網際網路應用發展方面,網絡支付、網絡文學、網絡音樂、即時通信、網絡購物和網上外賣的用戶規模半年增長率均超過5%。
所以當前,網際網路平臺主要還在分享近十億手機網民帶來的紅利,覆蓋面已經廣泛涉及到金融、電商、社交、教育、航旅、遊戲等行業,且這一紅利還在不斷增長。
從網民的組成結構來看,2019年我國未成年網民規模為1.75億,未成年人網際網路普及率達到93.1%。由於未成年人汲取知識能力強,個人價值觀和世界觀的認知大多是從網絡信息獲取而來,所以網信辦對未成年人網絡環境的關注會更為深入與密切。
每天面對成千上萬種各類APP和公開型社交網站的內容輸出,數美人工智慧研究院發現,在泛娛樂場景下的漫畫、網文、遊戲、直播、視頻等應用,部分圖片會涉及到校園暴力、霸凌等網絡有害信息,極易誤導甚至扭曲未成年人價值觀,嚴重影響未成年人健康文明上網環境。
結合「淨網2020」專項行動,公開數據顯示,截止2020年9月,全國網信系統累計暫停更新網站64家,會同電信主管部門取消違法網站許可或備案、關閉違法網站6907家。有關網站平臺依據用戶服務協議關閉各類違法違規帳號群組86萬餘個。
因此,網際網路平臺該如何應對圖片信息帶來的違法違規風險?數美人工智慧研究院得知,內容審核方面,網際網路平臺不再完全依賴於人審,不僅成本高耗時長,還無法滿足當前巨量圖片的審核需求。而圖片智能識別技術不僅是內容審核的重點,也是網際網路平臺一直想要攻克的難點。
智能圖片過濾具體識別場景
數美人工智慧研究院研究發現,不同的網際網路平臺,對圖片內容的審核標準截然不同。隨著視頻、圖片數據量的不斷增多,最高效的方法當是解放人審的初審壓力,應將人審放在監管和抽查崗位上。
針對不同場景下的審核標準和審核需求,數美人工智慧研究院採用基於深度學習的圖片識別技術和基於畫像的用戶行為分析技術,構建強大的圖片識別引擎,精準識別圖片中涉黃、涉恐、政治敏感內容、欺詐廣告等違規違法內容,並對低俗汙穢等內容進行程度分級,有效識別低俗、辱罵內容,適應平臺不同審核標準。
此外,數美人工智慧研究院依據國家政策法規要求與海量圖片庫、圖片主要違法違規內容,分為以下四類識別方式:
涉政違規識別:基於海量人臉庫和專業審核人員的審核標準,利用深度學習技術,識別正常、漫畫、惡搞、負面涉政人物的違規信息,降低違規風險,覆蓋涉政人物500餘個。
政治敏感人物庫儘可能覆蓋全面,包括國家領導人、敏感事件人物、英雄烈士等,形式包括藍底照片、生活照片、歷史照片、漫畫惡搞、代表形象等。實時監測政治敏感事件和熱點事件,發現問題圖片及時加入政治敏感人物庫中。
暴力恐怖識別:通過海量暴恐圖片庫,依託深度學習引擎,支持國旗國徽,恐怖主義,軍裝,槍枝道具,血腥暴亂,兒童邪典等不同類型的圖片識別。國旗國徽包括主流國家國旗國徽、各大政黨旗黨徽、香港特別行政區區旗徽、澳門特別行政區旗徽、共青團旗幟或團徽、國內各種軍徽章等。
色情汙穢識別:利用大規模GPU集群和深度學習技術,準確快速穩定地識別色情,低俗,性感圖片,解決直播,視頻,電商,社區網站,論壇等圖像內容的黃反問題。
幫助企業降低傳播汙穢、色情、低俗內容的風險,大規模提升人工審核團隊效率,增強用戶瀏覽體驗。支持重度色情、色情、性感、低俗、正常等多種級別,靈活適應不同應用、場景、角色的個性化審核標準。
廣告及變體識別:通過OCR識別、垃圾文本識別、廣告分類模型,識別手機號,微信,QQ,淘寶,微博,網址,二維碼,水印等近10種聯繫方式及其變體。
數美智能圖片識別技術優勢
針對不同的識別場景,數美人工智慧研究院創建了可視化Web審核後臺,即智能圖片過濾提供API調用接口和可視化Web審核後臺,可以在趨勢分析中查看風險內容的趨勢,在歷史記錄中查看篩選內容詳情,在名單服務中自定義添加和管理敏感圖片。
在技術實現上,數美智能圖片過濾採用業界一流的圖片識別技術,包括基於海量圖片樣本和大規模GPU計算的深度學習,圖片相似度匹配算法,基於用戶畫像的行為分析等。
其中,在色情識別、暴恐識別、廣告識別等場景下,數美人工智慧研究院利用圖片分類模型,即智能圖片過濾基於Inception深度定製圖片分類模型,也能成功實現,且效果顯著,識別精準度高達99%以上。
2012年AlexNet做出歷史突破以來,直到GoogLeNet出來之前,主流的網絡結構突破大致是網絡更深(層數),網絡更寬(神經元數)。為了增加網絡深度和寬度的同時減少參數,Inception應運而生。
Inception 模型的網絡,將1x1,3x3,5x5的conv和3x3的pooling,堆疊在一起,一方面增加了網絡的width,另一方面增加了網絡對尺度的適應性。
此外,除了上文提到的圖片分類模型,深度學習模型還包括目標檢測模型、人臉識別模型等多種。針對不同的識別模型研究分析,智能圖片過濾基於YOLO優化目標檢測模型,可應用於LOGO檢測、特殊物體檢測等場景;以及基於MTCNN實現人臉檢測,針對亞洲和中國人臉進行優化,應用於涉政人物識別等場景。
在技術優勢上,數美智能圖片識別具有精準識別圖片內容風險、海量圖片數據樣本、標準靈活策略定製、完善用戶畫像系統等優勢,對於網際網路平臺的圖片審核給予高效的協同能力,彌補其在高本低效方面的短板。
例如,以全人審核300人為例,工作制8h/天,工資8000元/月來算,每人最多可審核300*30000張圖片,但是將耗費2880萬/年的成本。但是全量機審+人審配合,原人審每天900萬張圖片,便只需要7人來完成,成本只需67.2萬/年。通過以上數據顯示,數美科技智能圖片識別可直接助力圖片內容審核提效80%。
數美科技智能圖片過濾系統採用模塊化程序設計方法,既便於系統功能的各種組合和修改,又便於未參與開發的技術維護人員補充、維護。
數美科技長期深耕在圖片內容審核領域,現已服務全球千家客戶,全心全意為客戶的在線業務風控提供全方位支持。