給AI系統做「安全體檢」,阿里安全提出自動化AI對抗平臺CAA | AAAI...

2020-12-12 騰訊網

出品 | AI科技大本營(ID:rgznai100)

安全人員曾為某車企自動駕駛系統做過一次安全測試,用物理對抗攻擊欺騙Autopilot車道檢測系統,導致汽車在Autopilot不發出警告的情況下駛入錯誤車道。假如這是一場真實的攻擊,後果不堪設想。

事實上,AI系統如果沒有足夠的「免疫力」,甚至會被一張圖片欺騙,如將停車標誌識別為通行,在醫療應用中將有問題的醫療影像識別為正常圖像等。

為幫助AI應用從源頭構建安全性,阿里安全圖靈實驗室整理歸納了學界針對AI模型提出的32種攻擊方法,以此為基礎搭建了一個自動化AI對抗攻擊平臺CAA,幫助檢測AI系統存在的安全漏洞。

經CAA「體檢」後,AI安全專家可針對被檢測AI的薄弱地帶提出安全建議,助力AI魯棒性(穩定性)檢測,以此增強AI系統的安全性。

近日,該研究成果《Composite Adversarial Attacks》被人工智慧頂會AAAI2021接收。AAAI2021從7911篇有效投稿中錄取了1692篇論文,錄取率約為21%。

自動化搜索技術合成多個攻擊算法的組合

阿里安全圖靈實驗室整理歸納了學界針對AI模型提出的32種攻擊方法,以此為基礎搭建了一個自動化對抗攻擊平臺CAA。

橫向對比業界的其他工具箱,圖靈實驗室的自動化對抗攻擊平臺首度實現對抗攻擊的「工具化」。它讓攻擊者在沒有任何專業領域知識的情況下,也可以進行AI模型的對抗攻擊和魯棒性測試。

除此之外,阿里對抗攻擊平臺通過自動化搜索技術來合成多個攻擊算法的組合,該特性提升了現有模型攻擊方法的性能和效率。

該論文通過實驗表明,CAA超越了最新提出的攻擊方法,是威脅當前AI系統安全的最強攻擊。

對抗攻擊是當下AI系統的新威脅,它使得很多在現實世界中應用的AI系統存在的安全漏洞極大地暴露了出來,例如特斯拉汽車自動駕駛Autopilot的車道檢測系統被來國內安全研究人員通過物理對抗攻擊所欺騙,導致汽車在Autopilot在不發出警告的情況下駛入錯誤車道。

除了自動駕駛,在每天信息爆炸增長的網際網路上,一些暴力色情的信息也需要AI模型去自動過濾,但是經過對抗攻擊處理的信息可以輕易的繞過識別模型,影響清朗的網絡空間。

近年來,學界提出了多種實現對抗攻擊的方法,他們都被集成在各大工具箱中。如圖1所示,研究者通常利用這些工具箱實現的攻擊算法,在原圖上添加肉眼不可感知的對抗擾動,從而欺騙目標模型使得一張色情圖片被錯誤判斷為正常。

圖1:通過對抗攻擊繞過色情識別系統的簡單圖例

圖2:左圖為合成對抗攻擊示意圖,右圖是CAA和現有方法的對比

算法自動選擇最優攻擊組合和參數

在不知道目標模型的防禦細節的情況下,研究者很難根據經驗選擇到對當前模型最優的攻擊算法。

例如,對抗訓練的模型對PGD,FGSM等梯度優化攻擊很魯棒,但是對圖片的Spatial transform很脆弱,反之經過圖像平移旋轉數據增強的模型對Spatial transform魯棒,而PGD,FGSM則很容易攻擊成功。

這個現象說明利用現有工具箱實現的攻擊方法去盲目嘗試和微調是低效的,因此,為了更精準的檢查目標模型的漏洞,獲得全面的魯棒性報告,通常需要合成多個對抗攻擊。

其次,在實際中,完成對抗攻擊有很高的門檻,研究者需要從多個工具箱集成的多個攻擊算法不斷的嘗試,調整參數,這一步要求攻擊者具備一定的領域知識和經驗,並且具備一定規模的計算資源。

以事前「攻擊演練」檢測AI系統的安全性,是當前提升安全AI的有效方法,也是阿里提出新一代安全架構,從源頭構建安全的核心理念。

但如果不知道目標模型的防禦細節,研究者通常很難根據經驗選擇到對當前模型最優的攻擊算法,從而難以驗證「體檢」的真實效果。

為了解決這個問題,阿里安全圖靈實驗室的專家首次提出將自動化技術引入到對抗攻擊中,使得所有攻擊對抗細節和參數作為一個黑箱,而研究者只需要提供目標模型和數據,算法就會自動選擇最優的攻擊組合和參數。

基於以上分析,該論文提出了兩點改進。

首先文章探究了如何更高效的合成多個對抗算法,如圖2左所示,通過對比單攻擊、多攻擊並行合成、多攻擊串行合成三種方式,文章發現多攻擊串行進行攻擊合成的形式更加通用且具備更強的攻擊效果。

通過引入恆等變換操作,即不進行任何處理的IdentityAttack、單攻擊、多攻擊並行合成可以看作多攻擊串行合成的特例,因此文章採用後者作為多攻擊合成的方式。在圖2左的例子中,相比前兩者,CAA的攻擊合成機制可以造成目標模型更大的分類錯誤率。

其次,阿里安全圖靈實驗室首次研究了在自動化技術輔助下的對抗攻擊,CAA實現了32種常用的攻擊算法作為攻擊的候選池,並且使用搜索算法從候選池中選擇最優的組合和每個算法的超參數,而目標函數則是最小化目標模型的分類準確率和計算複雜度(在攻擊中量化為需要後向計算目標模型梯度的次數)。

文章對比分析了三種在自動機器學習中常用的技術:貝葉斯優化、強化學習、遺傳算法。

在該問題下,基於全局優化的遺傳算法取得了更好的效果和收斂速度,論文最終採用NSGA-II非支配排序遺傳算法進行攻擊算法和超參數的搜索。

在實驗中,研究人員把攻擊場景分為兩種:擾動受限和擾動不受限,如圖3左上所示,CAA在linf攻擊設定下實現了7種攻擊進行搜索,而在l2攻擊和擾動不受限攻擊設定下分別實現了7種和20種。圖3展示了這兩種場景下的對抗樣本。

通過在3個數據集(Cifar10,ImageNet,Bird&Bicycle)和11種不同防禦上的測試,實驗表明CAA在擾動受限和擾動不受限兩種攻擊模式下均超越了現有模型,尤其是在擾動不受限攻擊上,幾乎使得現有防禦模型的分類準確率降低至0%。

圖3:左上為本文實現的32種基礎攻擊算法,

左下是不同攻擊策略生成的對抗樣本示例,右圖為擾動不受限對抗樣本示例

對於暴恐、色情識別等安全防控AI,模型可靠性和魯棒性顯得尤為重要,而阿里安全圖靈實驗室提出的自動化對抗攻擊平臺現已經在內部場景進行使用,對業務場景的識別模型進行更加可信的魯棒性評估。

同時,算法開發人員可以根據魯棒性評估結果檢查模型的安全漏洞。以AI體檢AI,以AI訓練AI。

阿里安全圖靈實驗室算法專家蕭瘋認為,對識別黃、賭、毒等不良內容的安全檢測AI而言,模型可靠性和魯棒性顯得尤為重要。

目前,在鑑黃算法上,圖靈實驗室正在藉此技術方法提升曝光、模糊、低畫質等極端分類場景下的模型識別能力,並且逐漸提升模型在極端場景下的魯棒性,為業界提供更安全可靠的AI算法能力。

論文地址:

https://arxiv.org/pdf/2012.05434.pdf

相關焦點

  • FXCM與Capitalise.ai合作提供自動化交易工具
    原標題:FXCM與Capitalise.ai合作提供自動化交易工具   交易自動化平臺提供商Capitalise.ai和
  • 檢測技術接連發現35個蘋果系統漏洞 阿里安全研究論文被國際頂會收錄
    在這種緊迫的安全需求下,阿里安全研究團隊提出了iDEA,可幫助安全研究人員對蘋果系統驅動模塊進行「安全體檢」,及時發現漏洞,甚至實現定製化的「漏洞體檢」。阿里安全的研究者通過這項工具發現了35個可實現「內存破壞」的漏洞,其中5個高危漏洞甚至可導致iOS、macOS等蘋果系統崩潰,讓攻擊者在用戶系統安裝後門,獲取最高權限和竊取用戶隱私數據等。
  • 騰訊安全雲鼎實驗室利用騰訊安全自主研發的系統到底是什麼
    騰訊安全雲鼎實驗室利用騰訊安全自主研發的「defylibrary」和騰訊安全開放雲平臺聯合打造了基於anyway.os的開源系統——anywaylab系統。騰訊安全雲鼎實驗室表示:「anywaylab計劃旨在面向未來企業級系統應用,開發高效、可擴展、安全的解決方案,創建跨運營商、雲計算、ai、5g、物聯網等多場景大生態,推動產業創新發展。」
  • AI無間道!清華團隊推出AI安全平臺,欺騙頂尖人臉算法後又修復漏洞
    然而AI安全作為一個新興領域,儘管對抗樣本等攻擊手段日益變得複雜,在開源社區、工具包的加持下,高級攻擊方法快速增長,相關防禦手段的普及和推廣卻難以跟上。在AI算法研發和應用的過程中,對抗樣本等算法漏洞檢測存在較高的技術壁壘,目前市面上缺乏自動化檢測工具,而大部分企業與組織不具備該領域的專業技能來妥善應對日益增長的惡意攻擊。
  • SECURITI.ai榮獲RSA Conference 2020創新沙盒冠軍
    SECURITI.ai榮獲RSA Conference 2020創新沙盒冠軍 當地時間2月24日,萬眾矚目的RSAC2020在美國舊金山正式開幕。在有著「網絡安全風向標」之稱的創新沙盒環節,SECURITI.ai從十家初創企業中脫穎而出,拔得頭籌。
  • 阿里安全新一代安全架構核心AI技術獲國際頂會認可
    阿里安全圖靈實驗室算法工程師向溪介紹,為更好地檢測部分篡改的DeepFake視頻,阿里安全圖靈實驗室提出了一種全新的檢測方法,這種方法標註簡單,並能幫助神經網絡更好地學習人臉特徵,實現更好的檢測效果。阿里安全圖靈實驗室還發現了攻擊者篡改視頻時露出的馬腳,由於攻擊者對視頻實行單幀篡改,導致同一人臉在相鄰幀上會有一些抖動,因此研究人員設計了新檢測模塊來發現這些抖動,輔助識別。
  • 華為發布HiSec Insight安全態勢感知系統:自進化AI加持 威脅檢測...
    據介紹,華為HiSec Insight安全態勢感知系統是一款基於自進化AI檢測引擎,對整個企業網絡安全態勢進行精準預測,以提升網絡的威脅處置能力和安全運維效率的網絡安全態勢感知系統,是華為面向企業全場景智能威脅檢測推出的安全大腦。在雲計算、大數據、人工智慧技術的廣泛應用下,企業數位化轉型在迅速發展的同時,也面臨著愈演愈烈的網絡安全威脅。
  • 2021年AI網絡安全發展趨勢
    這些工具為簡化工作提供了很多機會,但同時也帶來了一些安全風險。 不可否認,一些企業已經開始實施居家辦公的政策,以確保其在全球範圍內的業務正常運行。但是由於人們不再使用企業防火牆和其他企業安全系統來保護其官方數據,導致網絡安全方面的挑戰也日益增加。
  • CB Insight發布創業百強榜單 AI成功案例最強盤點【附下載】|智東西
    Captricity的雲解決方案功能是通過深度學習技術實現的,提取源文件,如掃面文件、傳真、郵件、電話中心、網頁表單等,自動連結到後端系統,減免手工數據輸入過程。17、Chorus.ai據稱,iCarbonX已與多家研究機構、製藥工廠、體檢中心、醫院、保險公司、健康管理公司合作。48、InsideSales.com
  • 在這個時代,ai應用可能被做什麼?
    如今,ai將成為大型企業、政府和其他組織的組成部分,ai對它們業務的影響,至少從機會和風險來看,將變得越來越重要。投資ai的風險與投資人工智慧的風險無法相比:ai可能會打擊人工智慧的商業應用,以及去年的交通擁堵、健康、金融服務和安全性等問題中出現的嚴重漏洞。
  • 2017年,開發者需要關注哪些AI國際峰會?看這篇就夠了
    地點:舊金山時間:2 月 4–9 日, 2017官方網址:http://www.aaai.org/Conferences/AAAI/aaai17.php關注原因:本月初,全球頂級 AI 工程師、參會的皆為「樂於提出合理問題、發現只得解決的問題」的量化研究人員。這是一個為期一天,主要內容為思路分享、技術實踐和人際溝通的大會,旨在提供數據科學前沿技術的真實情況報導。4. Machine Intelligence Summit
  • 極光無限:用AI賦能安全 解決安全行業人才緊缺難題
    記者日前接觸到的網絡安全公司——「極光無限」也是一家這樣的公司,其成立於2019年,成立的目標是將AI技術和安全技術相結合,從漏洞挖掘和滲透測試這兩個安全訴求出發,用新型技術提升產品的效果和效率。極光無限當前主打維陣和極光獵手兩款產品。其中,維陣是一款AI自動化漏洞挖掘系統,能夠用於軟體上線前的安全分析,滿足時下較流行的DevSecOps理念。
  • 全球三十大最佳 AI 創業公司公布
    3、Darktrace Darktrace 成立於 2013 年,致力於應用 AI 技術應對網絡安全挑戰。Darktrace 開發了世界上第一個企業免疫系統,該系統能夠使企業的安全網絡在沒有預先知道特定威脅的情況下,檢測出繞過傳統網絡安全工具的威脅和異常行為,並能夠對網絡攻擊進行主動防禦。
  • 機器學習吧面向ai的中文機器學習資源與分享平臺
    關於自動化機器學習的研究很早以前就有過非常系統化的論文和書籍,如果你感興趣我推薦一下孫向祥的機器學習分析,然後是西方機器學習理論,英文版的如果你沒時間翻的話國內有很多人翻譯過譯作,如果你時間多可以看coursera的opendatamlcourse如果你時間有限我推薦你這門early-resolutionmachinelearning
  • AI每日精選:海澱醫院引入影像AI肺炎輔診系統;阿里推出AI防疫師
    以下新聞選自人工智慧信息平臺「機器之心Pro」:花最少的時間,看最重要的新聞。3.中國聯通升級大數據與人工智慧服務平臺:預算528.3萬元2月12日消息,中國聯通日前發布公告正式宣布採購大數據與人工智慧服務平臺(機器學習與模型孵化系統)應用軟體1套。主要功能包括機器學習平臺功能升級、定製化開發服務、模型服務等。項目採購預算為528.3萬元(不含稅)。
  • 阿里安全高效分類AI獲計算機視覺頂會冠軍 極速保護商標不被侵權
    阿里安全高效分類AI獲計算機視覺頂會冠軍 極速保護商標不被侵權 iwangshang / 網商君 / 2020-08-06 摘要:為數字基建的安全建設提供樣本參考。
  • 三國志13ai武將文官類威名技能效果解析,如何讓ai快速升級威名
    在上一篇文章中小編為大家詳細解說了ai武將的威名只有被動技能有效,主動技能則不會主動使用,然而並不是每個威名都均衡分配了被動技能。因此ai武將有的威名則完全不會發動技能,除了威名自帶的戰術外則相當於白板。今天小編為大家詳細解析一下ai武將文官類威名的價值,幫助大家選擇有威名技能的ai隊友,對於自創武將也可以設置ai能觸發技能的威名為理想威名。
  • 2020年值得關注的十大網絡安全公司
    · 雲安全平臺和應用程式的銷售額預計將從2020年的6.36億美元增長到2023年的163億美元,複合年增長率(CAGR)為36.8%,並領先於所有類別的信息和安全風險管理系統。去年,他們發布了自己的 BloxOne威脅防禦 平臺,這是一個雲原生平臺,可利用DDI提供的數據來監視網絡流量,主動識別威脅並迅速將安全漏洞通知安全系統和網絡管理員,並與現有的安全堆棧一起快速,自動地識別和緩解安全威脅,更有效。BloxOne威脅防禦平臺提供了一個安全的集成平臺,用於集中管理整個網絡中的身份數據和服務。
  • Chorus.ai產品介紹,國內有沒有類似競品
    1 Chorus.ai公司介紹Chorus.ai是美國一家SaaS軟體公司,成立於2015年,目前已獲得B輪融資,總融資金額5530萬美金,其產品通過AI語義分析技術對銷售電話錄音,視頻進行分析,幫助企業發現銷售過程中的問題與機遇,提升銷售培訓的效果,進而提升企業的銷售業績。
  • VR社交遊戲平臺Roblox收購Loom.ai IPO或延期至明年
    據外媒報導,業內著名VR社交遊戲平臺Roblox已正式收購了Loom.ai,並希望此次收購能給用戶創造更加逼真的3D頭像。不過,具體的收購價格並未披露,同時華爾街日報也就此事進行了報導,表示Roblox的首次公開募股將推遲到明年。