數美科技智能圖片識別怎麼樣助力圖片審核提效80%|數美AI研究院

2020-12-24 數美科技

大數據時代,給人最明顯而直接的感觸就是信息量突然變得龐大而多樣。據IDC統計,預計2020年全世界所產生的數據總量將增長44倍。

顯然,單一的長文本已經無法滿足手機網民多樣化的閱讀、交流需求,圖片、視頻類信息內容在閱讀上也簡潔直觀,更吸引人。在信息交互方式上,網民從純閱讀行為,可以體驗到點讚、評論、轉發等多種交互行為模式。

據Facebook統計,Facebook每天產生4PB的數據,包含100億條消息,以及3.5億張照片和1億小時的視頻瀏覽。此外,在Instagram上,用戶每天要分享9500萬張照片和視頻,Twitter用戶每天要發送5億條信息。從這類數據上看,在各類網際網路平臺上,除了文本信息,隨處可見的就是圖片信息。

所以巨量圖片暴露出來的風控隱患不得不引起網際網路平臺的重視。例如大量涉政、低俗、暴恐等違法違規內容信息潛藏在各種圖片中,而這類圖片也帶給用戶極差體驗感,無意點擊甚至會引發盜號危機,讓人防不勝防。

重點維護未成年人「清朗」網絡環境

根據《中國網際網路發展狀況統計報告》顯示,截至2019年6月,我國網民規模達8.54億,網際網路普及率達61.2%,手機網民規模達8.47億,在手機網際網路應用發展方面,網絡支付、網絡文學、網絡音樂、即時通信、網絡購物和網上外賣的用戶規模半年增長率均超過5%。

所以當前,網際網路平臺主要還在分享近十億手機網民帶來的紅利,覆蓋面已經廣泛涉及到金融、電商、社交、教育、航旅、遊戲等行業,且這一紅利還在不斷增長。

從網民的組成結構來看,2019年我國未成年網民規模為1.75億,未成年人網際網路普及率達到93.1%。由於未成年人汲取知識能力強,個人價值觀和世界觀的認知大多是從網絡信息獲取而來,所以網信辦對未成年人網絡環境的關注會更為深入與密切。

每天面對成千上萬種各類APP和公開型社交網站的內容輸出,數美人工智慧研究院發現,在泛娛樂場景下的漫畫、網文、遊戲、直播、視頻等應用,部分圖片會涉及到校園暴力、霸凌等網絡有害信息,極易誤導甚至扭曲未成年人價值觀,嚴重影響未成年人健康文明上網環境。

結合「淨網2020」專項行動,公開數據顯示,截止2020年9月,全國網信系統累計暫停更新網站64家,會同電信主管部門取消違法網站許可或備案、關閉違法網站6907家。有關網站平臺依據用戶服務協議關閉各類違法違規帳號群組86萬餘個。

因此,網際網路平臺該如何應對圖片信息帶來的違法違規風險?數美人工智慧研究院得知,內容審核方面,網際網路平臺不再完全依賴於人審,不僅成本高耗時長,還無法滿足當前巨量圖片的審核需求。而圖片智能識別技術不僅是內容審核的重點,也是網際網路平臺一直想要攻克的難點。

智能圖片過濾具體識別場景

數美人工智慧研究院研究發現,不同的網際網路平臺,對圖片內容的審核標準截然不同。隨著視頻、圖片數據量的不斷增多,最高效的方法當是解放人審的初審壓力,應將人審放在監管和抽查崗位上。

針對不同場景下的審核標準和審核需求,數美人工智慧研究院採用基於深度學習的圖片識別技術和基於畫像的用戶行為分析技術,構建強大的圖片識別引擎,精準識別圖片中涉黃、涉恐、政治敏感內容、欺詐廣告等違規違法內容,並對低俗汙穢等內容進行程度分級,有效識別低俗、辱罵內容,適應平臺不同審核標準。

此外,數美人工智慧研究院依據國家政策法規要求與海量圖片庫、圖片主要違法違規內容,分為以下四類識別方式:

涉政違規識別:基於海量人臉庫和專業審核人員的審核標準,利用深度學習技術,識別正常、漫畫、惡搞、負面涉政人物的違規信息,降低違規風險,覆蓋涉政人物500餘個。

政治敏感人物庫儘可能覆蓋全面,包括國家領導人、敏感事件人物、英雄烈士等,形式包括藍底照片、生活照片、歷史照片、漫畫惡搞、代表形象等。實時監測政治敏感事件和熱點事件,發現問題圖片及時加入政治敏感人物庫中。

暴力恐怖識別:通過海量暴恐圖片庫,依託深度學習引擎,支持國旗國徽,恐怖主義,軍裝,槍枝道具,血腥暴亂,兒童邪典等不同類型的圖片識別。國旗國徽包括主流國家國旗國徽、各大政黨旗黨徽、香港特別行政區區旗徽、澳門特別行政區旗徽、共青團旗幟或團徽、國內各種軍徽章等。

色情汙穢識別:利用大規模GPU集群和深度學習技術,準確快速穩定地識別色情,低俗,性感圖片,解決直播,視頻,電商,社區網站,論壇等圖像內容的黃反問題。

幫助企業降低傳播汙穢、色情、低俗內容的風險,大規模提升人工審核團隊效率,增強用戶瀏覽體驗。支持重度色情、色情、性感、低俗、正常等多種級別,靈活適應不同應用、場景、角色的個性化審核標準。

廣告及變體識別:通過OCR識別、垃圾文本識別、廣告分類模型,識別手機號,微信,QQ,淘寶,微博,網址,二維碼,水印等近10種聯繫方式及其變體。

數美智能圖片識別技術優勢

針對不同的識別場景,數美人工智慧研究院創建了可視化Web審核後臺,即智能圖片過濾提供API調用接口和可視化Web審核後臺,可以在趨勢分析中查看風險內容的趨勢,在歷史記錄中查看篩選內容詳情,在名單服務中自定義添加和管理敏感圖片。

在技術實現上,數美智能圖片過濾採用業界一流的圖片識別技術,包括基於海量圖片樣本和大規模GPU計算的深度學習,圖片相似度匹配算法,基於用戶畫像的行為分析等。

其中,在色情識別、暴恐識別、廣告識別等場景下,數美人工智慧研究院利用圖片分類模型,即智能圖片過濾基於Inception深度定製圖片分類模型,也能成功實現,且效果顯著,識別精準度高達99%以上。

CNN結構演化圖

2012年AlexNet做出歷史突破以來,直到GoogLeNet出來之前,主流的網絡結構突破大致是網絡更深(層數),網絡更寬(神經元數)。為了增加網絡深度和寬度的同時減少參數,Inception應運而生。

Inception 模型的網絡,將1x1,3x3,5x5的conv和3x3的pooling,堆疊在一起,一方面增加了網絡的width,另一方面增加了網絡對尺度的適應性。

Inception模型圖

此外,除了上文提到的圖片分類模型,深度學習模型還包括目標檢測模型、人臉識別模型等多種。針對不同的識別模型研究分析,智能圖片過濾基於YOLO優化目標檢測模型,可應用於LOGO檢測、特殊物體檢測等場景;以及基於MTCNN實現人臉檢測,針對亞洲和中國人臉進行優化,應用於涉政人物識別等場景。

在技術優勢上,數美智能圖片識別具有精準識別圖片內容風險、海量圖片數據樣本、標準靈活策略定製、完善用戶畫像系統等優勢,對於網際網路平臺的圖片審核給予高效的協同能力,彌補其在高本低效方面的短板。

例如,以全人審核300人為例,工作制8h/天,工資8000元/月來算,每人最多可審核300*30000張圖片,但是將耗費2880萬/年的成本。但是全量機審+人審配合,原人審每天900萬張圖片,便只需要7人來完成,成本只需67.2萬/年。通過以上數據顯示,數美科技智能圖片識別可直接助力圖片內容審核提效80%。

數美科技智能圖片審核結果比對

數美科技智能圖片過濾系統採用模塊化程序設計方法,既便於系統功能的各種組合和修改,又便於未參與開發的技術維護人員補充、維護。

數美科技長期深耕在圖片內容審核領域,現已服務全球千家客戶,全心全意為客戶的在線業務風控提供全方位支持。

相關焦點

  • 好聲方入人心,數美科技智能音頻識別方案為音頻內容消費保駕護航
    數美科技發現,語音審核除了要考量文本內容是否涉及敏感信息,同時還存在擬聲詞、感嘆詞和語氣詞的審核難度,例如涉及色情信息的嬌喘、呻吟等。這為語音審核提出了更高的挑戰。而目前很多語音內容提供平臺都採用人工審核的方式進行內容檢查,這種方法雖然能夠提供較好的審核能力,但需要對音頻文件進行整段察驗,對音頻流進行實時監控,造成了較高的時間成本和人力投入。
  • 美到家:數據+AI助力美業數位化轉型
    而光有科技能力遠遠不夠,還需要更精準的數據、更深入的洞察,領先的創新技術且能快速迭代,而更重要的則是對行業深深的了解。,助力行業智能化升級。美到家CEO曾莞晴表示,經過在美業的持續探索與人工智慧領域的深入學習,美到家推出了集人臉識別、人臉區域定位、AI測膚、妝容定製、增強現實,造型師上門服務等於一體的個性化美妝生態應用,滿足客戶全時空、多層次的需求;此外,美到家還開發了集大數據人臉分析系統應用與美妝師專業經驗相結合的智能上妝分析系統,為品牌商、渠道商、平臺商提供全套解決方案。
  • 數美科技:為業務網際網路化保駕護航的幕後英雄
    第二天,該平臺發表聲明,數千萬元優惠券被盜。作為數美科技黑產研究院院長,潛伏在羊毛黨電報群裡的Sw0rdH01der(化名)又一次近距離目睹了一場黑產狂歡。有利益的地方就有黑產。偷襲者魔高一尺,狙擊者道高一丈,先進的科技武器被逐一納入應用,精彩程度不亞於一部鬥智鬥勇的激烈諜戰片。而Sw0rdH01der所在的數美科技,正是揭開這一幕的一個絕佳視角:自2015年6月成立以來,數美一直戰鬥在對抗黑產的最前線。從流量紅利到流量吃緊,數美成立時恰逢移動網際網路開啟「下半場」,黑產對抗需求劇增。
  • 數美科技攜手一點萬象 為華潤置地「商業+網際網路」安全護航
    日前,數美科技與中國商業地產行業領軍企業華潤置地旗下平臺一點萬象正式籤署合作協議。數美科技將通過天網——全棧式智能風控引擎,為華潤置地商業官方線上顧客服務平臺「一點萬象」APP及小程序提供實時業務風險防禦,精準識別惡意欺詐行為,確保良好的用戶體驗,實力護航「商業+網際網路」活力煥新。
  • 晚報|曠視助力智慧公園落成,AI使新藥研發提效15倍
    9月3日科技領域又發生哪些新鮮事,以下內容將帶你一覽全球科技大事!據曠視消息,其已與海澱區東升鎮合作,從市民健身運動與公園管理需求,從智能步道、智能健身、智慧零售、人機互動、智慧安全五個方面入手進行東升文體公園改造,計劃今年年底落成。
  • 行業資訊 | 京東數科可穿戴AI仿生手 可實現0.5秒快速識別肌電信號且準確率接近100%
    京東數科也透露其自主研發的可穿戴AI仿生手可在0.5秒之內快速識別和響應肌電信號,且準確率接近100%,基於此助力特種人群勞動效率大幅提升50%。想了解更多肌電最新資訊、一手行業乾貨,各種有趣有料的業內人士快來加入「神經肌電學術圈」社區京東數科自主研發的可穿戴AI仿生手可實現靈活握手功能清華大學人工智慧研究院智慧機器人研究中心主任孫富春教授在公開課中指出
  • 重磅發布|AI + 5G +機器人 美雲智數智能自動化集成產品正式面世
    繼重磅發布美的工業網際網路2.0、揭幕美的工業網際網路品牌「美擎」後,一系列融合最新科技的精品不斷升級,在5G、AI、機器人等技術加持下,糅合數位化、自動化實踐,AI質檢&智能物流自動化集成產品,於12月23日正式亮相!此次新品發布,有何看點?
  • 數智科技,全球突破|悅家套系X9榮獲美的集團第25屆科技月「設計...
    2020年10月15日,在美的集團內有「科研奧斯卡」之稱的「科技月」在廣東順德美的全球創新中心舉辦。這個始於1996年的活動,一直被美的視為科技創新實力和科技人員風採的內部展示與交流平臺,以對獲獎者的重金獎勵而著稱。美的集團歷年在「科技月」表彰超過兩百餘名科技明星,從2005年至今,投入鼓勵科研創新的獎金累計已接近3億元。
  • 美年大健康布局AI助力早篩,築牢醫質壁壘
    美年大健康成立十年,上市五年,以「守護每個中國人的生命質量」為企業使命,積極響應國家政策,主動履行社會責任,助力大健康產業蓬勃發展。美年大健康也一直在發展科技力量,近幾年加大科技投入,布局AI發展癌症早篩,用科技創新為大眾提供更多更優質的服務。日前,美年健康(002044.SZ)披露了2020年前三季度業績報告。
  • 每日投融資速遞 | 醫鳴技術獲得數千萬人民幣B輪融資,mCube收購...
    智盈科技獲得百萬級人民幣天使輪融資 智盈科技是一家基於計算機視覺的無人便利店解決方案提供商,基於圖像識別技術推出無人收銀機,並通過人工智慧算法讓機器具備識別各種標品的能力,達到人類肉眼識別商品的程度,同時還可以識別蔬菜、水果、衣服、圖書等非標品,智盈科技現已完成了大概50種貨品的識別。
  • 成本下降80% 美的洗衣機是如何做到的?
    撰文/藍科技新品市場周期縮短45%,成本下降80%,美的洗衣機在這一輪數位化競爭中,亮出了工業網際網路這張底牌。這張底牌,是美的洗衣機持續加碼競爭力的關鍵。細節見真章。站在美的集團工業網際網路背景下看美的洗衣機的變化,則是其全面數智化的縮影,而這些降低成本、提升效益的有效工具和方法,成為很多企業的參照物。8月27日,由美雲智數牽頭,聯合美的洗衣機、KUKA 中國、安得智聯舉辦的「走進美的工業網際網路」無錫站活動在無錫新湖鉑爾曼酒店正式開啟。亮點之一,在於「美的洗衣機智能製造工廠參觀」的線下活動。
  • 「數智引擎 虞見未來」——杭州電子科技大學數智科技成果發布會在...
    12月15日,杭州電子科技大學、紹興市上虞區科學技術局、杭州電子科技大學上虞科學與工程研究院共同舉辦了「數智引擎 虞見未來——杭州電子科技大學數智科技成果發布會」,全面展現杭州電子科技大學在人工智慧、智能製造、數字媒體等數智高科技成果,充分發揮杭州電子科技大學上虞科學與工程研究院助力上虞企業產業升級和數字經濟發展的動能
  • 品覽Pinlan李一帆:從此拒絕人工計數,AI物品識別助力降本提效
    3.大部分生產、物流、零售企業的業務痛點在於效率低、易出錯、成本高,通過AI物品識別就可以做到降本提效。以下為演講實錄:今天將為大家分享4個關鍵詞:AI、SaaS、數據和物品識別,這其中融合了品覽Pinlan的介紹,也包括了我對最近所做事情的思考。大約在2015年左右,我在移動網際網路時代的尾聲加入了創業浪潮。
  • 圖片識別軟體
    文字識別掃描儀是一款自動掃描圖片並轉換其中文字的App 它能夠讀取相機或圖庫中的圖片,由您指定識別區域,自動轉換為文字 它能夠極大提高您的輸入效率,快來使用吧 文字識別支持功能
  • 百度大腦產品上新&技術升級:圖像處理、智能寫作平臺、語音識別
    您可以從 PC 端訪問百度 AI 開放平臺(ai.baidu.com)申請邀測,或使用最新產品。新開放 AI 技術能力語音識別語音識別極速版支持60秒內音頻使用 REST API 方式進行調用,簡單易用。採用國際領先的注意力(Attention)模型,實時率小於0.1,5 s 音頻不到500 ms 即可完成識別過程,極大提升語音交互的體驗。
  • 中數智匯 金融科技賦能銀行「零接觸」對公開戶
    中數智匯更懂銀行需求,推出集軟體、API、SDK、數據服務為一體的工具包——融e開。智能審核+電子營業執照+客戶盡職調查+受益所有人識別+企業在線身份認證等多項科技賦能,助力銀行實現企業「零接觸線上服務」。北京中數智匯是央行第一批備案的企業徵信公司、中關村金融科技企業,專注服務金融機構準入管理、貸前審核和貸後智能風控,是業內領先的企業在線開戶一體化解決方案提供者。
  • 助力高端大牌爆發式增長,數聚智連成京東美妝TOP5服務商
    憑藉獨佔優勢的綜合評分,在京東Q3季度「美力聯盟」評比中,數聚智連旗下東連科技從眾多品牌中脫穎而出成為平臺TOP5運營商,被京東美妝認證為五星優質服務商。數聚智連旗下東連科技榮獲京東美妝五星認證優質服務商作為中國領先的品牌爆發引擎,數聚智連以實現品牌營銷與銷售ROI最大化為使命和夢想,連接平臺、品牌和中國消費者;以效果營銷驅動銷售的理念,以運營垂直化、效果營銷化為策略,致力於幫助國內外品牌在中國實現爆發,讓中國消費者享受更多更優質的全球好貨。
  • 京東AI研究院在業界頂級人臉檢測榜單「WIDER FACE」三項評測排名...
    然後第一個多通道數的卷積層進行拆分,來儘可能少地增加計算量與顯存的情況: 京東AI研究院計算機視覺與多媒體實驗室一直致力於人臉識別、人臉檢測、人臉關鍵點檢測、人臉防偽、人臉屬性識別與模型壓縮等計算機視覺領域的技術研究,並有豐富的算法、產品方面的經驗積累。
  • 數智賦能未來,第十六屆信息化領袖峰會暨2020美業數智...
    時間一天又一天飛逝,「數智賦能未來」第十六屆信息化領袖峰會暨2020美業數智生態峰會啟幕在即!沒有報名的小夥伴們要抓緊時間啦!趕緊隨我來看大會議程!:30-09:50 威馬汽車的數位化轉型案例分享威馬汽車科技集團副總裁兼首席數位技術官吳國林09:50-10:10 Weboffice的協作賦能金山辦公助理總裁 晁雲曈10:10-10:30 零售數智生態評估及升級美數思享會秘書長 陳偉華10:30-10:50 智慧辦公新物種賦能企業升級華為
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    醫美視覺方案 黑眼圈/眼袋檢測能力開放邀測提供精準的黑眼圈/眼袋檢測能力,毫秒級識別響應,並分類別返回對應位置信息,實現黑眼圈/眼袋的像素級語義分割,對醫美、互動娛樂及美顏等場景有較高的應用價值。OCR 智能結構化識別開放邀測結構化識別各類卡證、票據,無需配置結構化對應關係、無需提取關鍵詞、無需定製開發,直接上傳圖片即可獲得結構化識別信息;適用於政務審批、證件信息錄入、境外證件讀取等場景>>申請試用