作為谷歌Brain的高級研究員,Kim專門研究人工智慧心理學。和她之前的認知心理學家一樣,她開發了各種方法來探索人工神經網絡(ANNs)的外星思維,深入研究它們的血淋淋的細節,以便更好地理解模型及其對輸入的反應。
推理表明,ANNs的可解釋性越強,就越容易發現其推理中的潛在缺陷。如果我們了解什麼時候或者為什麼我們的系統會阻塞,我們就會知道什麼時候不使用它們——這是構建負責任的人工智慧的基礎。
已經有幾種方法可以利用人工智慧推理,但Kim解開人工智慧黑盒子的靈感來自一個完全不同的領域:認知心理學。這個領域的目標是發現人類思維的基本規律——本質上也是一個誘人的黑盒子——如何運作,Kim和她的同事寫道。
在一篇上傳至預發布伺服器arXiv的新論文中,該團隊描述了一種對神經網絡進行人類認知測試的方法。這個測試探究我們如何自動地完成我們所看到的東西的間隙,從而使它們形成完整的物體——例如,從一串排列在鐘面上的鬆散點感知一個圓圈。心理學家稱之為「完成定律」,這是一個非常有影響力的觀點,它解釋了我們的大腦如何將數據歸納成概念。
由於機器視覺中的深層神經網絡鬆散地模仿了視覺皮層的結構和連接,作者自然會問:神經網絡也表現出完成的規律嗎?這告訴我們人工智慧是如何思考的?
進入德國
完成律是格式塔心理學一系列觀點的一部分。回到20世紀20年代,遠在現代神經科學出現之前,一群德國實驗心理學家就提出了這樣一個問題:在這個混亂、浮華、不可預測的世界裡,我們如何把輸入拼湊在一起,形成有意義的感知?
其結果是一組被稱為格式塔效應的原則:大腦自我組織形成一個整體。用完形心理學家庫爾特·科夫卡(Kurt Koffka)更著名的話說,我們的知覺形成了一個整體,它「不是各部分之和」。「不超過;就不同。
儘管這一理論受到了批評,但隨後對人類和動物的研究表明,完成法則發生在認知和神經解剖學層面。
請看下圖。你立即「看到」一個形狀實際上是負面的:一個三角形或正方形(a和B)。或者你進一步感知三維球(C),或一個蛇形蠕動(D)。你介意填寫空白的地方,所以,最後的感覺不僅僅是黑色的形狀你顯式地給出。
神經科學家現在認為這種影響來自於我們的視覺系統如何處理信息。較低層次的神經元(那些首先對數據進行糾纏的神經元)被安排在多層和列中,它們傾向於提取更簡單的特徵,比如線條或角度。在格式塔的語言中,他們「看到」了部分。
然後,一層一層地,感知變得更加抽象,直到更高層次的視覺系統直接解釋人臉或物體——或不存在的東西。也就是說,「整體」出現了。
實驗設置
受這些經典實驗的啟發,Kim和他的團隊開發了一個協議來測試格式塔對前饋神經網絡的影響:一個簡單,另一個被稱為「Inception V3」,它要複雜得多,在機器視覺社區中被廣泛使用。
其主要思想與上面的三角形圖相似。首先,該團隊生成了三個數據集:一個數據集顯示了完整的普通三角形。第二個是「虛幻」集,顯示了去掉邊緣但角完好無損的三角形。由于格式塔效應,對我們人類來說,這些看起來仍然像三角形。第三組也只顯示了不完整的三角形角。但是在這裡,角是隨機旋轉的,所以我們不能再想像一條線把它們連接起來——因此,不再有三角形。
為了生成足夠大的數據集來梳理出小的效果,作者改變了數據集的背景顏色、圖像旋轉和其他方面。他們總共製作了近1000張圖片來測試他們的神經網絡。
「在高層次上,我們比較了神經網絡在這三組刺激中的激活相似性,」作者解釋道。這個過程分為兩個步驟:首先,在完全三角形上訓練AI。其次,在數據集上測試它們。如果錯覺集和完整的三角形之間的響應更相似,而不是隨機旋轉的三角形,那麼它應該表明網絡中存在一種格式塔閉合效應。
機器完形
研究小組馬上得到了答案:是的,ANNs似乎確實表現出了閉合定律。
當對自然圖像進行訓練時,與隨機連接權值或對白噪聲進行訓練的網絡相比,網絡將錯覺集更好地分類為三角形。
當團隊深入探究「為什麼」時,事情變得更加有趣。完成圖像的能力與網絡的泛化能力相關。
人類潛意識裡經常這樣做:任何有陶瓷把手的東西,無論形狀如何,都很容易成為杯子。ANNs仍然在努力掌握它們的共同特徵——這些線索會立即告訴我們「嘿,那是一個杯子!」但當他們這樣做的時候,有時可以讓網絡更好地概括。
「我們在這裡觀察到的是一個能夠概括展示的網絡……更多的是封閉效應(強調他們的),暗示封閉效應反映的不僅僅是學習特徵,」該團隊寫道。
更重要的是,與視覺皮層非常相似的是,「高」水平的神經網絡比低水平的神經網絡表現出更多的關閉效應,也許並不奇怪,網絡的層次越多,它表現出的關閉效應就越多。
隨著網絡的發展,它們從碎片中映射出物體的能力也得到了提高。當研究小組擺弄圖像的亮度和對比度時,人工智慧仍然學會了從樹上看到森林。
「我們的研究結果表明,用自然圖像訓練的神經網絡確實表現出閉合,」研究小組總結道。
AI心理學
這並不是說ANNs概括了人腦。正如谷歌的「深夢」(Deep Dream)所清楚展示的那樣,機器視覺看到了一些真正奇怪的東西。
相比之下,因為它們是模仿人類視覺皮層的,所以這些網絡在我們處理信息的過程中也表現出更高層次的固有屬性,或許並不那麼令人驚訝。
但對Kim和她的同事來說,這正是問題所在。
他們寫道:「心理學領域已經開發出了研究人腦的有用工具和洞見——我們或許可以借用這些工具來分析人工神經網絡。」
通過調整這些工具,以更好地分析機器思維,作者們能夠洞察到,他們從我們的角度看世界是多麼相似或不同。這就是問題的關鍵:關鍵不是說ANNs感知世界的方式有點類似於人類。它是利用人類幾十年來建立的大量認知心理學工具,來探索神經網絡的認知功能。
「這裡的工作只是在更長的道路上邁出的一步,」作者總結道。
「了解人類和神經網絡的不同之處,將有助於研究這兩個有趣物種之間的根本區別,從而有助於解釋性的研究。」