原創 Kevin Hartnett 酷炫腦
vchalup
以下為朗讀小姐姐全文音頻
作者 | Kevin Hartnett
翻譯 | 茹小茹
審校 | 酷炫腦主創
朗讀 | 胡恩
美工 | 雪今晶
編輯 | 湘蓉
在某些方面,計算機的視覺優於人類,但從另一角度而言,它們可能永遠無法與人類媲美。
當工程師們第一次嘗試教計算機感知周圍環境時,他們理所當然地認為計算機和人類一樣具有視覺。約克大學的計算機科學家約翰 · 索特索斯說,20世紀60年代關於計算機第一個假說就是「它們同樣受到人類視覺特性的驅使」。
但自那以後,人工智慧領域發生了翻天覆地的變化。
到目前為止,計算機視覺已經從石破天驚的設想發展為了一個廣闊的領域。在給相似動物進行分類,或者檢測醫學影象中的病理情況時,計算機的表現甚至超越了人類。可以說,人工「神經網絡」 與人類處理視覺信息的方式差異越來越大了。它們已經可以做到另闢蹊徑,並在人類設計的遊戲中擊敗了我們自身。
計算機的視覺神經網絡其實相當簡單。它們接收一個輸入圖像,然後通過一系列步驟對其進行處理(首先檢測像素,進而是邊緣和輪廓,最後對整個物體的類型做出猜測)。這一系列流水線般的既定設置又被稱為前饋系統。
人類對視覺形成還有很多未知,但我們能夠確定某些假說一定是不成立的。在廣達雜誌最近的一篇文章《數學模型解開的視覺奧秘》中,作者描述了一個全新的數學模型,以解釋人類視覺的核心理論,即大腦的視覺皮層是如何根據視網膜接收到的有限信息,重建出生動而準確的三維世界的。
該模型表明,視覺皮層可以通過一系列神經反饋迴路,將外部世界數據具體化,進而呈現為眼前的圖像。這種反饋過程與計算機視覺的前饋方法大相逕庭。
康奈爾大學的神經系統科學家喬納森·維克多說: 「這項研究啟發我們,人類和計算機視覺是多麼的複雜而不同。」。
但是計算機的確在某些視覺任務處理時擊敗了人類。那麼問題來了: 計算機與人類的視覺通路究竟有沒有共同之處呢?
在某些方面,答案顯然是否定的。到達視覺皮層的信息受到解剖結構的限制: 連接視覺皮層和外部環境的神經相對較少,這大大削減了大腦皮層可獲得的視覺數據。
計算機並不面臨這種「帶寬問題」,因而也不必掙扎於過低的信息量。
「如果計算能力和內存趨於無限,機器還需要對信息進行壓縮處理嗎?答案大概是否定的。」。
但是索特所斯認為,人類視覺的優越之處也不可忽視。
圖源網絡
他說,當今計算機擅長的分類工作是一種低級智能,僅需要從海量數據中搜索相關度就可完成。而對於其他高階任務,比如物體的多方位掃描識別(類似於繞著雕像環走並觀察熟悉它的外形)而言 ,單純的相關度搜索就顯得不太夠了。此時的計算機需要人類手動確認才能正常運行。
在去年接受《廣達》雜誌採訪時,人工智慧先驅朱迪亞•珀爾籠統地闡述了這一觀點,他認為從長遠來看,相關度訓練並不會給人工智慧系統帶來光明的未來。
例如,人類視覺的一個重要特徵就是能夠重複觀察。視覺信息處理之後,我們會對所見物體做出判斷。當這個結論不太對勁時,人類可以再看一遍,而這一次我們通常得以窺得事情的真相。以前饋方式工作的計算機視覺系統往往缺乏這種能力,因而即使面對這很簡單的視覺任務,計算機也會出現明顯的失誤。
人類視覺還有一個更微妙的、計算機永遠無法擁有的特性。
人類的視覺系統需要多年時間才能成熟。2019年,索特所斯和他的合作者在一篇論文中闡述道,直到17歲左右,人們才能完全掌握在嘈雜環境中排除幹擾和專注於既定目標的能力。其他研究則發現,直到20歲之前,人類對面孔的感知能力都在不斷提高。
計算機視覺系統通過內化大量的數據來進行工作,這種基本程序是固定的,不會像大腦那樣隨著發育時間的推移而成熟。既然潛在的學習機制如此不同,二者的運行結果可能一樣嗎?索特索斯認為計算機視覺系統的前景不容樂觀。
「這些深度學習方法與人類毫無關係,」他說。這暗示我們瓶頸期即將來臨,或許日後人工智慧系統的發展將寸步難行。」
參考文獻
[1] Wong-Kee-YouAMB, Tsotsos JK, Adler SA. Development of spatial suppression surrounding thefocus of visual attention. J Vis. 2019;19(7):9. doi:10.1167/19.7.9
酷炫腦長期徵集腦科學、心理學類文章,歡迎投稿
投稿請發郵箱:2829023503@qq.com
點這裡,讓朋友知道你熱愛腦科學
原標題:《計算機會超越人類的視覺能力嗎?》
閱讀原文