把松鼠當海獅、蜻蜓當井蓋……為什麼圖像識別AI會犯這些「低級...

2021-01-08 前瞻網

目前的人工智慧技術已經非常擅長識別圖像中的物體,但仍然很容易犯些「低級錯誤」。

在部分情況下,只需在人眼不可見的靜態噪聲中添加一些可選的筆觸或圖層,就可以「愚弄」AI圖像識別系統,這有時甚至會造成致命的後果。

例如,曾有研究人員將列印的塗鴉貼在路牌上導致AI自動駕駛系統將限速標誌識別為禁行,騰訊科恩實驗室也曾發布報告稱路面上難以注意到的小貼紙就能誤導特斯拉錯誤判斷並駛入反向車道。

這些誤導標誌被稱為「對抗補丁」,研究人員現在正忙於開發保護人工智慧系統不受這些例子影響的方法。

但在去年的一篇論文中,Google Brain和普林斯頓大學的一組研究人員,包括該領域最早的研究人員之一Ian Goodfellow,認為這些新研究過於理論化,沒有抓住重點。

他們說,雖然大部分研究的重點是保護系統免受特別設計的標誌的幹擾,但黑客可能會選擇一種更直接的方法:使用一張完全不同的照片,而不是在現有照片上疊加噪音圖案。這也可能導致系統誤判斷。這一批評促使加州大學伯克利分校的博士生Dan Hendrycks編寫了一個新的圖像數據集。

這個數據集中包括一些容易被誤判的圖像,比如松鼠(它們通常會被誤認為是海獅)或蜻蜓(它們會被誤認為是井蓋)。他表示:「這些例子似乎更難防範。」

人工合成的對抗標誌需要知道所有的人工智慧系統是如何防範誤判的。但相比之下,即使人工智慧系統各自的防範措施不同,這些自然的例子也能很好地發揮作用。

Hendrycks上周在國際機器學習會議上發布了該數據集的早期版本,包含大約6000幅圖像。他計劃在幾周內發布最終版本,其中包括近8000個圖像。他打算讓研究團體使用該數據集作為基準。

換句話說,與其直接在圖像上訓練圖像識別系統,不如將其保留下來只用於測試。他說:「如果人們只是用這些數據集訓練系統,那麼系統僅僅只是記住了這些例子。這樣雖然系統已經解決了誤判這些圖像的問題,但它們對新圖像的誤判程度並沒有得到改善。」

破解這些令人困惑的誤判背後的邏輯,可能會讓系統的適應性更廣。「為什麼系統會把蜻蜓和鱷梨色拉醬搞混?」Hendrycks開玩笑道,「根本不清楚為什麼會犯這樣的錯誤。」

為什麼人工智慧會誤判?

有些人工智慧系統的底層計算機制是已知的,有些則不是,這被稱為「黑箱」,即該系統的開發者可能都無法完全了解系統如何做出決策。

對於圖像識別技術來說,有時原因是因為給定的訓練數據集出了問題。比如近日Facebook人工智慧實驗室的一項新研究就表明,科技巨頭銷售的物體識別算法在識別來自低收入國家的物品時表現得更差。

據報導,研究人員測試了五種流行的現成對象識別算法——微軟Azure、Clarifai、谷歌Cloud Vision、亞馬遜Rekognition和IBM Watson。而測試的圖像包括來自全球不同階級的家庭的家中用品的圖像。這些圖像可能來自非洲蒲隆地的一個月收入27美元的家庭,也可能來自烏克蘭一個月收入1090美元的家庭。

研究人員發現,與月收入超過3500美元的家庭相比,當被要求識別月收入50美元的家庭的物品時,物體識別算法的出錯率要高出10%左右。

而且在識別來自美國的照片時,算法的準確性也比識別來自索馬利亞或布吉納法索的照片要高出15%至20%。

研究人員稱,在一系列用於圖像識別的商業雲服務中,這些發現具有一致性。

人工智慧算法的這種「偏見」還有很多別的例子,其中一種常見的推測原因是用於培訓的數據有了偏頗——它們往往反映了相關工程師的生活和背景。由於這些人通常是來自高收入國家的白人男性,他們訓練的算法所要識別的世界也是如此。

研究人員稱,視覺算法的訓練數據主要來自歐洲和北美,「在人口眾多的地理區域,特別是非洲、印度、中國和東南亞,對視覺場景的採樣嚴重不足」。

由於美國科技公司在人工智慧領域處於世界領先地位,這可能會影響到從照片存儲服務、圖像搜索功能到更重要的AI安全攝像頭、自動駕駛汽車等系統的方方面面。

「評估人工智慧系統並不一定容易,因為沒有執行這類評估的標準基準。」幫助開展這項研究的Facebook人工智慧研究科學家勞倫斯·范德馬頓(Laurens van der Maaten)在接受採訪時表示。

「對抗這種偏見最重要的一步是,在培訓AI系統之前的數據收集環節就要謹慎得多。」

值得注意的是,科技公司們經常把自家人工智慧產品宣傳為「人人平等、人人可得」,但實際上,它們可能只是在按照自己的形象來評估、定義和塑造世界。

本文來源前瞻網,轉載請註明來源。本文內容僅代表作者個人觀點,本站只提供參考並不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯繫:service@qianzhan.com) 品牌合作與廣告投放請聯繫:0755-33015062 或 hezuo@qianzhan.com

相關焦點

  • 目前換臉技術識別人臉的模型是不能更換的
    能否採用ai技術實現真人換臉呢?真人臉動漫人物換臉怎麼做呢?百度前端團隊總結了一些實現ai換臉的工作方法,總結如下。不考慮代碼實現,只考慮從人臉辨識到換臉的全流程。以眼睛為準,將所有參數同步到ai模型。
  • 盤點全球被卡呆萌動物:卡在井蓋的小松鼠/組圖
    原標題:盤點全球被卡呆萌動物:卡在井蓋的小松鼠/組圖   毛茸茸的肉球固然很萌,可是這也擺脫不了是個胖子的事實。低估自己體型的呆萌動物們往往會為此付出代價,比如說被卡在洞裡,或者什麼別的地方。比如說卡在洞裡的小浣熊、卡在井蓋裡的小松鼠什麼的。
  • 藉助AI圖像識別技術 ,抖音火山小視頻推出「貓臉貼紙」
    就跟普通人臉貼紙一樣,選取使用特定的貼紙特效後,將貓放在鏡頭裡,系統就會自動識別貓臉,並匹配相應的效果。此外,不同種類的貓面部特徵存在顯著差異,貼紙需要對不同種類的貓都能做出準確識別,並對應優化效果。」此次的貓臉貼紙特效是抖音、火山與今日頭條的AI Lab合作,搜集了海量的貓視頻,進行圖像分析,對不同的貓臉進行分析識別,建立起相關模型。此前,抖音尬舞機、火山拍紅包玩法背後也是基於今日頭條AI Lab的圖像識別技術。
  • 基於百度EasyDL定製化圖像識別平臺的海洋魚類識別方法
    【方法】本文提出了一種基於百度EasyDL定製化圖像識別平臺的海底魚類識別方法。首先使用伽馬校正法和暗通道先驗算法對圖片數據進行預處理,提高圖片亮度和清晰度,接著利用百度EasyDL定製化圖像識別平臺構建初魚類識別模型,再使用數據增強等方法對模型進行調優,提高模型識別能力。
  • 5秒數清一池魚 這家甬企AI圖像識別技術準確率達99%
    5秒數清一池魚 這家甬企AI圖像識別技術準確率達99% 2019年03月24日 09:49:20來源:中國寧波網  記者 易鶴 通訊員 張文勝 鬱安昌 經過實測,這項AI圖像識別技術準確率高達
  • AI大事件丨Paige.ai斥資將機器學習帶入癌症病理學
    :神經網絡記住事物的類別,並在下次遇到它們時,或多或少地能夠可靠地識別它們。在這個簡短的視頻中,您將了解他們來自哪裡以及我們為什麼在ML中使用它們。迄今為止,在這些領域所取得的進展僅限於個別任務,其中為每項任務調整和培訓了獨立的代理。在這項工作中,研究人員探索在培訓同一代理完成多個任務上挑戰。
  • 快看看別人家的井蓋,這些可愛的神奇寶貝井蓋,你捨得踩上去嗎?
    最近日本北海道就宣布將在北海道各市推出相應的寶可夢下水道井蓋,而井蓋上的C位主角就是我們可愛的六尾。下面我們先來欣賞一下這些可愛的井蓋吧。這兩隻六尾就像是在北海道地區旅遊一般,一路邂逅各種各樣的寶可夢和風景,然後記錄下它們的可愛身姿,真的非常可愛了。
  • 可解釋性AI圖像識別創企獲美國空軍資助 技術可用於自動駕駛汽車等
    蓋世汽車訊 據外媒報導,軟體初創公司Z Advanced Computing(ZAC)得到了美國空軍(US Air Force)的資助,後者將利用其3D圖像細節識別技術(該技術基於可解釋性AI技術),用於無人機(UAV)進行空中圖像/目標識別。
  • AI如何改變教育?機器學習教父、好未來、松鼠AI等大佬有話說
    電腦可以幫助我們更好的識別圖像和人臉、把語言轉化成文字等等,這些技術都是現成的。他認為,未來十年,這個發展趨勢還會繼續延續。基於這三點原因,Tom Mitchell認為,AI能夠讓學生的分數提高兩個等級,還能幫助老師進一步輔助學生進步。基於這三點原因,加上AI技術飛快發展,Tom Mitchell最終決定投身於AI+教育的研究上。
  • 基於慣性導航、RFID 及圖像識別的 AGV 融合導航系統
    多數AGV 採用雷射導航和磁導航方式,雖然這些導航技術已是成熟技術,但其成本高,難以維護和改造,因此,新的導航方式越來越受到人們的關注。其中,慣性導航技術作為一種不依賴外界輔助的獨立導航方式,在適用範圍和布局上具有得天獨厚的優勢。另一方面,伴隨著物聯網的興起,無線射頻識別(RFID)技術被引入,該技術成本低,使用靈活,抗汙染能力強。
  • 驗證碼識別實例,python簡單圖像處理和實現
    基本識別原理概述:1、每一幅圖像在構成上,都是由一個個像素組成的矩陣,每一個像素為單元格。2、 彩色圖像的像素的由三原色(紅,綠,藍)構成元組,灰度圖像的像素是一個單值,每個像素的值範圍為(0,255)。
  • 什麼是樹脂井蓋,樹脂井蓋就是塑料井蓋嗎?
    什麼是樹脂井蓋?這個問題好多人都問,樹脂井蓋就是塑料井蓋嗎?樹脂井蓋(複合井蓋)自2009年國家頒布了檢查井蓋GB/T23858-2009標準,明確了複合材料井蓋作為檢查井蓋的一種,並說明其特性:用聚合物作基體材料,加入增強材料、填充料等,通過一定的工藝複合而成的檢查井蓋。
  • 谷歌AI 將黑人識別成「大猩猩」兩年後:就算能識別,也不敢識別了
    這一尷尬的變通方案表明,谷歌和其他科技公司在推進圖像識別技術方面仍舊面臨著諸多困難,儘管這些公司希望能夠在自動駕駛汽車、個人助理和其他產品上使用這些技術。《連線》雜誌用4萬張圖片對谷歌照片服務進行了測試,這些照片中有很多動物。谷歌照片在尋找包括熊貓和貴賓犬在內的許多動物上表現得非常棒。但當使用「大猩猩」、「黑猩猩」和「猴子」等詞進行搜索時,谷歌照片反饋稱「沒有結果」。
  • 【AI造夢】哈佛大學用GAN+遺傳算法,創造圖像控制猴子大腦
    無獨有偶,在一項新實驗中,哈佛大學的科學家們把猴子的大腦與神經網絡連接起來,試圖刺激猴子大腦中負責識別面部的單個神經元。他們利用 AI 生成圖像,然後向猴子展示這些圖像,試圖儘可能地激活這些特定的神經元。最終,AI 系統學會了生成能夠激活單個腦細胞、而不會同時激活它的相鄰細胞的圖像。
  • 河大學生創意手繪200多個「二次元」井蓋
    「灰頭土臉」的井蓋華麗變身,瞬間逆襲成為「萌萌噠」的「藝術品」……4月16日上午,有網友反映,河北大學校本部裡正在舉行「校園紐扣」井蓋美化活動,一個個極具創意的「井蓋塗鴉」,網友感嘆「捨不得踩下去,差點萌哭了。」
  • AI人像攝影和科學防抖怎麼做到的?本文帶你科普自動圖像識別算法
    短視頻可以捕捉到這些動態,但是由於它們太動態,因此它們像在線人像一樣笨拙。視頻可以包含相機和背景運動,以及頭部和身體的大範圍運動。它們也有一個時間表,開始,中間和結束。電影攝影是一種結合了靜態圖像和視頻優點的新媒介。大部分幀是靜態的,但是某些部分以無縫循環的形式進行動畫處理。
  • 除了識別人臉 動物的臉也納入了AI工作表
    來源:科技日報臉部識別在人類世界的應用正風生水起,從安防擴展到零售、營銷和金融等行業。然而,在人臉識別之外,動物臉部識別作為生物識別技術的一個分支,也在悄然升起。比如狗臉識別,由於狗的品種很多,臉的變化也很大,一起識別有難度;然而對於某些同一品種、體型大小相似的狗來說,其面部特徵又區別不大,在很多情況下,動物臉的相似性比人臉高,這也增加了識別難度。「人臉有更結構化的特徵,方便提取,鼻子眼睛耳朵等部位的相對位置也較為穩定,便於識別。」溫誌慶說,但是動物的臉部有毛髮,還有紋理變化等幹擾因素,這些都增加了動物臉識別的難度。
  • 為什麼日本人最愛的「國蟲」,是我們司空見慣的它?
    圖:日本的昆蟲標本不過,這些昆蟲都算不上日本人感情最深的昆蟲。會格鬥的昆蟲,對日本人只是娛樂,沒有感情寄託。只有一種昆蟲,出沒於日本列島的每處田畔水邊,貫穿於無數動漫作品之中,縈繞在每個日本人童年的夢中,堪稱日本的國蟲——那是一種中國人小時候也非常熟悉的飛蟲。蜻蜓。
  • 文本秒生成圖像,震驚業界,詳解OpenAI兩大AI模型
    CLIP全稱是Contrastive Language-Image Pre-training,根據字面意思,就是對比文本-圖像預訓練模型,只需要提供圖像類別的文本描述,就能將圖像進行分類。怎麼分?為什麼能分?CLIP靠的就是預訓練階段,OpenAI從網際網路中收集的4億個文本-圖像對。
  • 文本秒生成圖像,震驚業界!詳解OpenAI兩大AI模型
    為什麼能分?CLIP靠的就是預訓練階段,OpenAI從網際網路中收集的4億個文本-圖像對。接著,憑著與GPT-2/3相似的「zero-shot」設計,CLIP在不直接針對基準進行優化的同時,表現出優越的性能:魯棒性差距(robustness gap)縮小了75%,性能和深度殘差網絡ResNet50相當。