AI研究:如何讓機器學習算法解釋自己的決策?

2020-12-05 36氪

編者按:本文來自網易智能,編譯:編譯:網易見外智能編譯平臺;36氪經授權發布。

我們發現神經網絡如此神秘,這可能並不奇怪,因為它們基本上是基於人類大腦而建立的,我們也在努力破譯這些神經網絡。他們學習的模型並不像傳統的電腦程式那樣整齊地存儲在資料庫中,而是由成千上萬的虛擬神經元之間的連接組成。

這些連接不是由人類程式設計師設定的,相反,神經網絡本質上是通過在大量數據中尋找模式來進行編程。因此,雖然你可以測試一個神經網絡在照片中檢測到貓的效果,但要判斷出它們的存在與否,你很難辨明它們的視覺模式。

「當涉及到照片中貓的檢測時,這並不是什麼大問題,但這項技術正在悄然進入一些領域,在這些領域,能夠解釋這些決定可能很重要。」

說到檢測到貓的存在,這並不是什麼大問題,但這項技術正在悄然進入一些領域,在這些領域中,能夠解釋這些決策可能很重要,比如金融交易和疾病診斷。這導致了越來越多的研究試圖讓這些算法的決策能解釋得更清楚。

本月上旬,麻省理工學院的工程師們公布了一項技術,該技術有望提供關於任何自然語言處理網絡的洞察和分析,而不管其背後的軟體是什麼。這是因為它的工作原理是簡單地把輸入轉換成算法,並測量對輸出的影響。

該研究小組利用他們自己的神經網絡,對自然句子進行壓縮和解壓,得出與之相關的句子,然後將這些句子輸入到被訪問的神經網絡中。通過分析輸入的細微變化如何改變輸出,研究人員能夠發現網絡對特定詞彙和短語的反應。

他們進行的一項測試是在微軟Azure雲服務的一項翻譯服務上進行的。法語有不同的名詞形式,這些名詞形式取決於主語的性別。例如,男舞者是「danseur」,而女性舞者則是「danseuse」。

研究人員發現,在包含諸如博士、教授等職業的句子中,這種模型容易表現出男性化的傾向,比如聰明的或有天賦的,而在模型表現成女性化的形式時,則傾向於迷人的或者富有同情心的主體,比如舞者或護士。

這種性別傾向很難通過簡單地搜索翻譯服務的神經網絡架構來發現,但其影響可能是潛在的。能夠發現這種傾向是促使神經網絡更容易解釋的關鍵因素,但它也可以幫助研究人員排除那些導致錯誤的假設,從而提高他們的表現。

麻省理工學院的這一研究也遵循了華盛頓大學的類似研究,該研究也使用了輸入的變量來觀察模型的預測行為。它解決了分類算法更簡單的問題,但它也可以通過突出顯示圖像的某些部分來進行預測,從而在圖像處理算法方面發揮作用。

英偉達提出了一種更簡單的方法,可以在處理自動駕駛汽車的PilotNet系統所使用的視頻時實現同樣的效果。通過把網絡的更高層次的輸出疊加到下層上,他們就能創建一個「可視化的面具」,突出顯示網絡認為重要的實時視頻消息流的功能。

更進一步的話,一些研究人員試圖創造出人工智慧來解釋它的決定,而不僅僅是專家來進行解釋。來自美國和德國的研究人員最近公布了一種算法,該算法不僅可以分析圖片,回答「哪種運動正在播放」等問題,還可以用「棒球員手握球棒」這樣的短語來回答「棒球」這樣的問題。

Mark Riedl是位於亞特蘭大的喬治亞理工學院娛樂情報實驗室的主任,他讓一些人玩了電腦遊戲「青蛙」,並在他們玩的過程中解釋他們的策略。他將這些數據與描述遊戲狀態的代碼一起記錄下來,然後在這兩種情況下訓練了一個神經網絡。當他把這個網絡連接到另一個設計遊戲的網絡時,他創造了一個人工智慧,使其可以在玩遊戲的過程中合理化自己的行為。

雖然對可解釋的人工智慧研究還處於初級階段,但歐盟最近的一項指令可能會給該領域的研究增添一種緊迫感。定於明年生效的通用數據保護條例(GDPR)將有效地創造一種「解釋權」,使公民能夠要求做出關於算法決策背後的邏輯。

正如埃森哲的分析師在一篇博客文章中指出的那樣,關於這種新權利的程度存在爭議,但他們仍然建議企業接受可解釋的人工智慧,以便在未來證明自己的企業不受監管機構的影響。

這一領域也可能會有大筆資金投入。金融巨頭Capital One正在研究如何讓機器學習算法來解釋他們的決策,美國國防高級研究計劃局(DARPA)正在資助13個致力於解決這個問題的研究小組。這其中包括來自俄勒岡州立大學的一個小組,他們計劃用第二個神經網絡來分析神經網絡,以確定神經活動對特定決策的影響。

但谷歌的研究主管Peter Norvig最近質疑這些方法最終會有多大用處。他說,即使有了人類,認知心理學家也發現,當你讓別人解釋他們的決定時,他們通常會以可能與實際決策過程無關的方式來理解他們的行為。他在雪梨的一次活動上說:「因此,我們可能會在機器學習領域處於同一個位置,在這個階段我們訓練一個系統來獲得答案,考慮到第一個系統的輸入,然後我們才會訓練另一個系統,現在你的工作就是做出解釋。」

相反,他說,隨著時間的推移,研究這些算法的輸出可能會更有用,以識別偏差和錯誤。那麼,問題是這是誰的責任:是過度擴張的公共機構、還是學術機構或企業,在保護其人工智慧能力的聲譽方面擁有既得利益。

在現實中,這可能需要兩者的結合。人工智慧開發者需要找到方法來解釋他們的創意所做出的決定,但我們不能只接受他們的說法。還需要對這些決定如何影響人們的生活進行密切的觀察。(選自:singularity hub 編譯:網易見外智能編譯平臺 審校:Simone)

相關焦點

  • 機器學習-決策樹(ID3算法)
    本篇文章採用python實現ID3算法,代碼取自於《Machine Learning in Action》,網上關於本書的代碼很多,但是很多都是直接照搬代碼運行,少數會帶有一些注釋,對於python新手或者小白來說非常不友好。
  • 算法之「算法」:所有機器學習算法都可以表示為神經網絡
    圖源:unsplash大概從20世紀50年代的早期研究開始,機器學習的所有工作就都是隨著神經網絡的創建積累而來的。隨後出現了一個又一個新算法,從邏輯回歸到支持向量機。但是眾所周知,神經網絡是算法的算法及機器學習的巔峰。我們可以說,神經網絡是對機器學習的普遍概括,而不是僅僅一次嘗試。
  • 為你的回歸問題選擇最佳機器學習算法
    【IT168 編譯】在處理任何類型的機器學習(ML)問題時,我們有許多不同的算法可供選擇。而機器學習領域有一個得到大家共識的觀點,大概就是:沒有一個ML算法能夠最佳地適用於解決所有問題。不同ML算法的性能在很大程度上取決於數據的大小和結構。
  • 人工智慧(AI) 機器學習(ML) 深度學習(DL),到底他們哥仨是什麼關係?
    在1985-1986年,神經網絡研究人員(魯梅爾哈特,辛頓,威廉士-赫,尼爾森)相繼提出了使用BP算法訓練的多參數線性規劃(MLP)的理念,成為後來深度學習的基石。> 在另一個譜系中,昆蘭於1986年提出了一種非常出名的機器學習算法,我們稱之為「決策樹」,更具體的說是ID3算法。
  • 算法預測銷量準確率90%!智能決策公司ToB,想用AI做人想不到的事
    有這樣一家AI技術公司在用深度學習等算法,為各類公司進行企業決策,這戰績還真不少:為大型藥廠預測流感藥銷量,從數百個影響因素中挑出70個構建深度學習模型,準確率達到了80%。連續籤約了四家大型車企,運用算法幫助他們提升銷量。
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    機器學習是用數據來學習、概括、預測的研究。近幾年,隨著數據的開發、算法的改進以及硬體計算能力的提升,機器學習技術得以快速發展,不斷延伸至新的領域。由於我們需要這些數據來訓練機器學習算法,所以獲取高質量的數據集是如今機器學習領域的最大挑戰之一。算法:如何處理和分析數據機器學習算法可利用數據執行特定的任務,最常見的機器學習算法有如下幾種:1.監督學習。
  • 英雄聯盟如何指揮團戰?AI幫你做決策
    選自TowardsDataScience,作者:Philip Osborne,機器之心編譯。英雄聯盟是一個需要默契團隊配合的多人對戰遊戲。在瞬息萬變的戰鬥中,如何做出正確的決策非常重要。該項目由三部分組成,旨在將 MOBA 遊戲《英雄聯盟》的對戰建模為馬爾科夫決策過程,然後應用強化學習找到最佳決策,該決策還考慮到玩家的偏好,並超越了簡單的「計分板」統計。
  • AI賜子?學習百萬個胚胎發育過程,算法將試管嬰兒成功率提高3倍
    這一「輔助懷孕算法」的研究負責人Ron Maor說,其在各種現成的AI、機器學習和深度學習應用程式之上構建了自己的「定製」層。Maor說,這些工具「處理胚胎圖像存在自身的特點,這與大多數AI任務截然不同。」 據IEEE報導,AiVF的ML技術涉及獲取在孵化器中創建發育中的胚胎的延時視頻,在五天的視頻中顯示了胚胎發育中的各種裡程碑階段。
  • AI賜子?學習數百萬個胚胎發育過程,算法可將試管嬰兒成功率提高3倍
    這一「輔助懷孕算法」的研究負責人Ron Maor說,其在各種現成的AI、機器學習和深度學習應用程式之上構建了自己的「定製」層。Maor說,這些工具「處理胚胎圖像存在自身的特點,這與大多數AI任務截然不同。」據IEEE報導,AiVF的ML技術涉及獲取在孵化器中創建發育中的胚胎的延時視頻,在五天的視頻中顯示了胚胎發育中的各種裡程碑階段。
  • 一文就讀懂機器學習及其在遙感中的應用
    在他們的論文中,黃和延森(1997)討論了如何利用人類專家的最低輸入來建立一個知識基礎,然後創建決策樹來從專家系統的人工輸入中推斷規則。生成的規則被用於薩凡納河上的一個研究地點。結論詳細說明了與當時的傳統方法相比,機器學習輔助專家系統方法的準確度是最高的。在類似的發展之後,機器學習很快成為遙感社區的一個重要工具。
  • 讓機器像人類一樣學習? 伯克利 AI 研究院提出新的元強化學習算法!
    在本文中,我們簡要介紹了元強化學習的研究現狀,然後提出了一種新算法—— PEARL,該算法使得樣本效率得到數量級的大幅度提升。這篇文章除了提出新的算法外,還對當時人們對元學習的興趣激增做了調查統計,結果表明無論是當時還是現在,元學習的關鍵思路就是把複雜的問題簡化成我們已經知道如何解決的問題。在傳統的機器學習中,研究者會給定一組數據點用來匹配模型;而在元學習中,則用一組數據集來替換這些數據點,其中每個數據集都對應一個學習問題。
  • 表徵學習、圖神經網絡、可解釋的 AI,ML & 機器人七大研究進展一覽
    去年我們看到了使用 GNN 完成對其他表徵學習方法(如量子化學)極具挑戰的有趣目標的工具,呈爆炸式的增長。今年,隨著用於構建和使用圖網絡的工具日趨成熟,研究人員開始將 GNN 用於解決他們自己的問題,在機器學習和機器人技術的交叉研究方向開展了一些有趣的工作。
  • 電子郵件分類的最佳機器學習算法
    Udacity的「機器學習簡介」提供了算法和項目的全面研究:https://www.udacity.com/course/intro-to-machine-learning--ud120幾年前,羅琳寫了一本書《布穀鳥的呼喚》,作者名是羅伯特·加爾布雷思。這本書受到了一些好評,但是沒有人關注它,直到Twitter上的一位匿名線人說這是J.K.羅琳。
  • 人工智慧、機器學習及認知計算初學者指南
    千年以來,人類一直在思考如何構建智能機器。從那時起,人工智慧 (AI) 經歷過高潮與低谷,既展現了成功的一面,也有許多潛力有待發掘。時至今日,採用機器學習算法來解決新問題屢屢見諸報端。較早期的研究主要專注於強人工智慧,但在這一時期所引入的概念構成了當今所有機器學習與深度學習算法的基礎概念。
  • CB Insights:2017全球AI企業100強(附下載) | 網際網路數據資訊網...
    使命是通過情感識別技術將情感智力帶入數字世界,人類化人類和系統如何相互作用。 Affectiva的SDK和API使開發人員能夠將情感感知和分析添加到自己的應用程式,遊戲,設備和數字體驗中。2. Almotive來自布達佩斯的軟體公司,為完全自動駕駛汽車開發全套軟體組件。AImotive的算法依靠攝像頭作為主要傳感器完成對象識別和分類、本地化、決策、軌跡規劃和車輛控制的任務。
  • 如何用免費GPU學習AI算法?這篇算法資源大集錦別錯過
    進階學習者如何利用好AI studio學習深度學習算法深度學習進階總是痛苦的,主要的原因是沒有足夠示例,有示例也不夠詳細,有詳細的示例但又不知道從哪個看起。其實情感分類是一個很重要的技術,我之前做過對股票市場的情感分析算法,可以找出市場情感對股市走向的影響。不過如果你覺得情感分類還是太簡單的話,那恭喜你,你的進步是飛快的。那你接下來可以試試更難的,就是機器翻譯。飛槳框架收集了一個叫WMT-14的數據集,提供了193319條訓練數據和6003條測試數據,應該夠你探索的了。詳情請查看《深度學習進階NLP-機器翻譯》。
  • 想入門機器學習?機器之心為你準備了一份中文資源合集
    機器之心整理參與:機器之心編輯部機器學習日益廣為人知,越來越多的計算機科學家和工程師投身其中。不幸的是,理論、算法、應用、論文、書籍、視頻等信息如此之多,很容易讓初學者迷失其中,不清楚如何才能提升技能。本文作者依據自身經驗給出了一套快速上手的可行方法及學習資源的分類匯總,機器之心在其基礎上做了增益,希望對讀者有所幫助。
  • 用反向傳播算法解釋大腦學習過程?Hinton 等人新研究登上 Nature...
    機器之心報導魔王、Jamin、杜偉反向傳播可以解釋大腦學習嗎?近日 Hinton 等人的研究認為,儘管大腦可能未實現字面形式的反向傳播,但是反向傳播的部分特徵與理解大腦中的學習具備很強的關聯性。該研究將之前的相關研究置於「NGRAD」框架下,NGRAD 算法利用活動狀態的差異驅動突觸更新,這與反向傳播類似。
  • 如何實現算法決策公平?_湃客_澎湃新聞-The Paper
    03如何實現決策公平1.基於公平性約束的機器學習分類模型框架在釐清了算法公平性的概念後,該團隊嘗試提出一種公平性決策(分類)算法框架,該框架的核心思想是在分類模型的訓練過程中加入公平性約束在要求保證模型分類準確性的情境下(business necessity clause),該團隊也提出了如何對該框架進行調整來適應這種情境的方案。(見原文4.3)3.如何基於這一框架來設計一個公平的分類模型?
  • 自動化決策算法的法律規制
    在這些引起全球性產業變革和行業競爭態勢變化的科技創新過程中,如何在現有法律的框架內解決算法自動化決策的法律問題,以及在未來的立法和監管制度上平衡高科技企業的利益、個人權益和社會安全,需要從國際視野和「數字中國」建設實際兩個方面出發進行思考。