「人工智障」拖垮「人工智慧」,智能體如何應對訓練中的故意碰瓷

2020-12-24 大數據文摘

大數據文摘出品

作者：曹培信

人們通常會派出最強大的選手和場景訓練人工智慧，但是，智能體如何應對訓練中故意碰瓷兒的「弱」對手呢？

來看看下邊的兩個場景：兩個AI智能體正在「訓練場「進行一場激烈的足球賽，一個守門、一個射門。當守門員忽然自己摔倒，攻方沒有選擇乘勝追擊，也忽然不知所措了起來。

在相撲的規則下也一樣，當其中一個隊員開始不按套路出牌時，另一個對手也亂作一團，雙方立刻開始毫無規則扭打在一起。

這樣「人工智障」的場景可不是隨意配置的遊戲，而是一項對AI對抗訓練的研究。

我們知道，通常情況下，智能體都是通過相互對抗來訓練的，無論是下圍棋的阿法狗還是玩星際爭霸的AlphaStar，都是通過海量的對局來訓練自己的模型，從而探索出獲勝之道。

但是試想一下，如果給阿法狗的訓練數據都是圍棋小白亂下的對局，給AlphaStar提供的是小學生局，結果會是如何？

近期，來自伯克利的研究人員就進行了這樣的實驗。紅色機器人與已經是專家級別的藍色機器人進行對抗訓練，紅色機器人採取一定的對抗策略攻擊藍色機器人進行的深度學習。這項研究的論文作者也在NIPS大會上對該研究進行了展示。

論文連結：

https://arxiv.org/pdf/1905.10615.pdf

在實驗中，紅色機器人為了不讓藍色機器人繼續從對抗中學習，沒有按照應有的方式玩遊戲，而是開始「亂舞」起來，結果，藍色機器人開始玩得很糟糕，像喝醉了的海盜一樣來回搖晃，輸掉的遊戲數量是正常情況下的兩倍。

研究發現，在採取對抗性政策的對局中，獲勝不是努力成為一般意義上的強者，而是採取迷惑對手的行動。研究人員通過對對手行為的定性觀察來驗證這一點，並發現當被欺騙的AI在對對手視而不見時，其表現會有所改善。

我們都知道，讓人工智慧變得更聰明的一個方法是讓它從環境中學習，例如，未來的自動駕駛可能比人類更善於識別街道標誌和避開行人，因為它們可以通過海量的視頻獲得更多的經驗。

但是如果有人利用這一方式進行研究中所示的「對抗性攻擊」 ——通過巧妙而精確地修改圖像，那麼你就可以愚弄人工智慧，讓它對圖像產生錯誤的理解。例如，在一個停車標誌上貼上幾個貼紙可能被視為限速標誌，同時這項新的研究也表明，人工智慧不僅會被愚弄，看到不該看到的東西，還會以不該看到的方式行事。

這給基於深度學習的人工智慧應用敲響了一個警鐘，這種對抗性的攻擊可能會給自動駕駛、金融交易或產品推薦系統帶來現實問題。

論文指出，在這些安全關鍵型的系統中，像這樣的攻擊最受關注，標準做法是驗證模型，然後凍結它，以確保部署的模型不會因再訓練而產生任何新問題。

因此，這項研究中的攻擊行為也真實地反映了在現實環境中，例如在自動駕駛車輛中看到的深度學習訓練策略，此外，即使被攻擊目標使用持續學習，也會有針對固定攻擊目標進行訓練的策略，攻擊者可以對目標使用模擬學習來生成攻擊模型。

或者，在自動駕駛車輛，攻擊者可以通過購買系統的副本並定期在工廠重置它，一旦針對目標訓練出了敵對策略，攻擊者就可以將此策略傳輸到目標，並利用它直到攻擊成功為止。

研究也對今後的工作提出了一些方向：深度學習策略容易受到攻擊，這突出了有效防禦的必要性，因此在系統激活時可以使用密度模型檢測到可能的對抗性攻擊，在這種情況下，還可以及時退回到保守策略。

相關焦點

「人工智慧」變「人工智障」?

大概是這些年看的科幻小說、科幻電影的原因，人們對於人工智慧的期望值很高，但目前我們的科技還遠遠達不到人們的期盼，更像是「人工智障」。。。。。。現在，大家對人工智慧應該都聽膩了，AI的牛也似乎吹到了盡頭。各種智慧機器人屢屢出錯，「人工智障」落為人們笑柄。
人工智慧or人工智障

人工智慧（Artificial Intelligence），英文縮寫為AI。它是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。以上是百度百科的解釋，我自己對人工智慧的理解就是，讓機器以人類的方式去學習，已達到彌補人類某些缺陷的高級計算機操作。
人工智慧=人工智障?

說起AI人工智慧，這傢伙那就不得了了，號稱現在最NB的三大技術之一（A：人工智慧.B：大數據.C：雲計算）。人工智慧技術已經在生活中出現了不少，人臉識別、汽車自動駕駛、智能家居……等等。據說日本還研發了機器人老婆，這倒是個好消息呀，解決了不少宅男的婚姻大事。
這哪是什麼人工智慧分明是「人工智障」

有時候，哪有什麼人工智慧，都是人工智障，真的！我們都知道，高速入口有不少替代收費員的工作機械。有不少地方乾脆推出了「機械手」，看上去不錯，然而……街頭的自助拍照機，能讓害羞的你免去不少尷尬，但結果可能更尷尬……是遺照嗎這個？自動垃圾清運車，也有不想幹活的時候。不想幹了，下班！
我,AI博物館PM,也是人工智障圖片標註師

當你看到有的程式設計師經常蹲在十字路口有的產品經理天天對著手機跳舞有的HR主業是寫書評不是招人有的人爆料自己是無人車碰瓷專員……相信很多人的第一反應是：瓦特？真的看不懂這個世界了！明明是同行，別人幹的事情為什麼就辣麼有趣？
總給隊友插刀,我的助戰是「人工智慧」還是「人工智障」?

打遊戲的時候總會遇到各式各樣的難題，比如忽然被約好的隊友放鴿子，比如好不容易搶到的野怪讓對家給收了，甚至戰鬥中還有助戰NPC臨時背叛，反手插你兩刀，讓你大呼這是"人工智慧"還是"人工智障"？
她自稱人工智慧虛擬偶像可大家都叫她人工智障

在這部視頻中，絆愛對自己的定位是「二次元虛擬主播」，並表示今後會在視頻網站上製作更多視頻，甚至遊戲直播、VR。這個專門更新絆愛視頻的頻道叫做「A.I.Channel」，「A.I」除了取自「愛」發音以外，還包含了另外一層含義。　　「人工智慧」　　當然絆愛怎麼可能是人工智慧呢？
7年,從人工智慧到人工智障蘋果到底對Siri做了什麼?

可問題是，和「後浪」亞馬遜Alexa、小米小愛同學相比，Siri已經出道7年了，怎麼就從「人工智慧」淪落成「人工智障」，從老司機到被新手吊打的呢？從之前「吊打」亞馬遜、谷歌，到如今的「人工智障」，蘋果花了長達7年的時間，對於如今全球5億活躍用戶的Siri來說，未來的路如何走，能否在AI大戰中站穩腳跟，或許連蘋果自己都看不清吧！- END -
AI被攻擊者濫用後,是人工智慧還是「人工智障」?

AI技術正在被積極應用到各行各業中，然而有研究報告警告，這種新興技術很容易被網絡犯罪分子、不法黑客所利用。一份由學術界、社會團體以及行業人士所撰寫的報告《人工智慧的惡意使用（Malicious Use of Artificial Intelligence）》指出，任何科技都有其雙面性，在大力發展AI技術的時候，有必要注意防止該技術被濫用的可能性。
如何判斷被「碰瓷」?發生「碰瓷」後該怎麼辦?這回說清楚了

那麼如何判斷自己是否遭遇「碰瓷」?發生「碰瓷」後該怎麼辦呢?一、注意疑點疑點一：輕微剮蹭車輛嚴重受損。碰瓷車輛緊跟目標車輛，在其變道時猛踩油門撞上去，與目標車輕輕剮蹭，但車上的零部件會出現嚴重斷裂或破損，然後以此索取修理費。
智能體的奇幻漂流之「成都摺疊」篇

也許在很多人看來，鵬城智能體究竟是不是個案，意味著智能體在產業中是「概念車」還是「量產車」？而讓人意想不到的是，距離鵬城智能體才幾天，智能體落戶城市的下一站就已經有了眉目。9月29日，成都高新區管委會與華為籤署了人工智慧大數據中心項目合作框架協議，宣布共建蓉城智能體。
OpenAI發布「宇宙」平臺,用1000+訓練環境賦予AI「類人智力」

掌握人類的「普通智力」OpenAI官網的介紹是：Universe軟體平臺，通過全世界的遊戲、網頁和其它應用，來測量和訓練AI的普通智力。在Universe上，AI智能體像人一樣使用電腦：觀看視頻，並操作鍵盤和滑鼠（只不過是虛擬的）。總而言之：人類可以在網絡上做的事情，Universe都可以讓AI智能體經歷一遍，目的就是訓練智能體掌握類似於人類的「普通智力」。
全場景智慧加速落地成都,成都市與華為聯合打造蓉城智能體

【中國,成都,2020年9月29日】今日,成都高新區管委會與華為籤署了人工智慧大數據中心項目合作框架協議,並宣布攜手共建蓉城智能體。結合成都市的新基建以及智慧城市建設規劃,華為將發揮在5G、雲、AI、計算等方面的技術優勢,幫助成都市建設成都智慧城市數字底座和城市智能中樞,通過打造蓉城智能體實現全場景智慧,提升城市治理能力,讓企業和市民享受無所不在的智能、高效和貼心服務。
AlphaGo原來是這樣運行的,一文詳解多智能體強化學習基礎和應用

反事實多智能體策略梯度法方法（Counterfactual Multi-Agent Policy Gradients, COMA）在合作式的多智能體學習問題中，每個智能體共享獎勵（即在同一個時刻獲得相同的獎勵），此時會存在一個「置信分配」問題（credit assignment）：如何去評估每個智能體對這個共享獎勵的貢獻
人工智慧|未來生活中AI智能將無處不在!

從可應用性看，人工智慧大體可分為專用人工智慧和通用人工智慧。面向特定任務（比如下圍棋）的專用人工智慧系統由於任務單一、需求明確、應用邊界清晰、領域知識豐富、建模相對簡單，形成了人工智慧領域的單點突破，在局部智能水平的單項測試中可以超越人類智能。人工智慧的近期進展主要集中在專用智能領域。
頂級配置情聖一號V1擎天柱應對碰瓷罰單

魚龍混雜的行車記錄儀市場，如何選購一款合適的頂級配置的行車記錄儀，應對罰單碰瓷，頂級配置情聖一號V1擎天柱，雲升級電子狗，行車記錄一體機。全面解決碰瓷遇到碰瓷怎麼辦，別著急，擎天柱幫您作證在無記錄儀取證的情況下，遇到碰瓷情況先不要急於下車。
人工智慧如何模擬人的大腦獎賞機理?

這種行為是如何在人的大腦中起作用的？仍然是一個千年之謎。但是我們知道，我們的行為的產生是由於環境中的刺激所產生的反應，或是個體的生命史中所形塑而成的結果；特別個體在環境及生命史中所受到的懲罰、激勵、刺激與行為結果所造成的經驗強化。所以，人工智慧基於這一原理，開發了基於獎懲機制的強化學習方式。
從人工智障到人工智慧,它還差一個「聽得懂人話」的距離

這不知道是多少人做夢都想聽到的一句話，然而現實中，頂多也就個幾塊錢、幾百塊到帳的消息。近日，支付寶還貼心的推出了方言版，分別有武漢話、上海話、廣東話、東北話以及成都話5個版本，讓網友直呼親切，其他地區的網友也紛紛催促：河南話呢？長沙話呢？溫州話啊通通安排起來！
人工智慧還是人工智障?——大型算法翻車現場

今天的算法其實還遠沒有到完善的地步，很多被稱之為人工智慧的東西某種意義上只能算人工智障，衛夕帶大家看幾個大型算法翻車現場——一、翻車的超級計算機2017年3月19日，香港地產大亨李建勤（Li Kin-Kan）在杜拜飯店的午餐中第一次遇見到了義大利金融家科斯塔
這個人工智障真是太可愛了!

在二次元世界中，不知道什麼時候，智障竟然也能成為ACG萌屬性中的一種，你們的母性光芒以及父性光芒也實在太耀眼了吧。而在二次元中，也有著各種著名的智障擔當，智障女神阿庫婭，猿神花畑佳子，1+1等於9的琪露諾以及著名的人工智障，絆愛。

「人工智障」拖垮「人工智慧」,智能體如何應對訓練中的故意碰瓷

相關焦點

「人工智慧」變「人工智障」?

人工智慧or人工智障

人工智慧=人工智障?

這哪是什麼人工智慧 分明是「人工智障」

我,AI博物館PM,也是人工智障圖片標註師

總給隊友插刀,我的助戰是「人工智慧」還是「人工智障」?

她自稱人工智慧虛擬偶像 可大家都叫她人工智障

7年,從人工智慧到人工智障 蘋果到底對Siri做了什麼?

AI被攻擊者濫用後,是人工智慧還是「人工智障」?

如何判斷被「碰瓷」?發生「碰瓷」後該怎麼辦?這回說清楚了

智能體的奇幻漂流之「成都摺疊」篇

OpenAI發布「宇宙」平臺,用1000+訓練環境賦予AI「類人智力」

全場景智慧加速落地成都,成都市與華為聯合打造蓉城智能體

AlphaGo原來是這樣運行的,一文詳解多智能體強化學習基礎和應用

人工智慧|未來生活中AI智能將無處不在!

頂級配置情聖一號V1擎天柱應對碰瓷罰單

人工智慧如何模擬人的大腦獎賞機理?

從人工智障到人工智慧,它還差一個「聽得懂人話」的距離

人工智慧還是人工智障?——大型算法翻車現場

這個人工智障真是太可愛了!

這哪是什麼人工智慧分明是「人工智障」

她自稱人工智慧虛擬偶像可大家都叫她人工智障

7年,從人工智慧到人工智障蘋果到底對Siri做了什麼?