計算機會超越人類的視覺能力嗎?

2021-01-13 澎湃新聞

原創 Kevin Hartnett 酷炫腦

vchalup

以下為朗讀小姐姐全文音頻

作者 | Kevin Hartnett

翻譯 | 茹小茹

審校 | 酷炫腦主創

朗讀 | 胡恩

美工 | 雪今晶

編輯 | 湘蓉

在某些方面,計算機的視覺優於人類,但從另一角度而言,它們可能永遠無法與人類媲美。

當工程師們第一次嘗試教計算機感知周圍環境時,他們理所當然地認為計算機和人類一樣具有視覺。約克大學的計算機科學家約翰 · 索特索斯說,20世紀60年代關於計算機第一個假說就是「它們同樣受到人類視覺特性的驅使」。

但自那以後,人工智慧領域發生了翻天覆地的變化。

到目前為止,計算機視覺已經從石破天驚的設想發展為了一個廣闊的領域。在給相似動物進行分類,或者檢測醫學影象中的病理情況時,計算機的表現甚至超越了人類。可以說,人工「神經網絡」 與人類處理視覺信息的方式差異越來越大了。它們已經可以做到另闢蹊徑,並在人類設計的遊戲中擊敗了我們自身。

計算機的視覺神經網絡其實相當簡單。它們接收一個輸入圖像,然後通過一系列步驟對其進行處理(首先檢測像素,進而是邊緣和輪廓,最後對整個物體的類型做出猜測)。這一系列流水線般的既定設置又被稱為前饋系統。

人類對視覺形成還有很多未知,但我們能夠確定某些假說一定是不成立的。在廣達雜誌最近的一篇文章《數學模型解開的視覺奧秘》中,作者描述了一個全新的數學模型,以解釋人類視覺的核心理論,即大腦的視覺皮層是如何根據視網膜接收到的有限信息,重建出生動而準確的三維世界的。

該模型表明,視覺皮層可以通過一系列神經反饋迴路,將外部世界數據具體化,進而呈現為眼前的圖像。這種反饋過程與計算機視覺的前饋方法大相逕庭。

康奈爾大學的神經系統科學家喬納森·維克多說: 「這項研究啟發我們,人類和計算機視覺是多麼的複雜而不同。」。

但是計算機的確在某些視覺任務處理時擊敗了人類。那麼問題來了: 計算機與人類的視覺通路究竟有沒有共同之處呢?

在某些方面,答案顯然是否定的。到達視覺皮層的信息受到解剖結構的限制: 連接視覺皮層和外部環境的神經相對較少,這大大削減了大腦皮層可獲得的視覺數據。

計算機並不面臨這種「帶寬問題」,因而也不必掙扎於過低的信息量。

「如果計算能力和內存趨於無限,機器還需要對信息進行壓縮處理嗎?答案大概是否定的。」。

但是索特所斯認為,人類視覺的優越之處也不可忽視。

圖源網絡

他說,當今計算機擅長的分類工作是一種低級智能,僅需要從海量數據中搜索相關度就可完成。而對於其他高階任務,比如物體的多方位掃描識別(類似於繞著雕像環走並觀察熟悉它的外形)而言 ,單純的相關度搜索就顯得不太夠了。此時的計算機需要人類手動確認才能正常運行。

在去年接受《廣達》雜誌採訪時,人工智慧先驅朱迪亞•珀爾籠統地闡述了這一觀點,他認為從長遠來看,相關度訓練並不會給人工智慧系統帶來光明的未來。

例如,人類視覺的一個重要特徵就是能夠重複觀察。視覺信息處理之後,我們會對所見物體做出判斷。當這個結論不太對勁時,人類可以再看一遍,而這一次我們通常得以窺得事情的真相。以前饋方式工作的計算機視覺系統往往缺乏這種能力,因而即使面對這很簡單的視覺任務,計算機也會出現明顯的失誤。

人類視覺還有一個更微妙的、計算機永遠無法擁有的特性。

人類的視覺系統需要多年時間才能成熟。2019年,索特所斯和他的合作者在一篇論文中闡述道,直到17歲左右,人們才能完全掌握在嘈雜環境中排除幹擾和專注於既定目標的能力。其他研究則發現,直到20歲之前,人類對面孔的感知能力都在不斷提高。

計算機視覺系統通過內化大量的數據來進行工作,這種基本程序是固定的,不會像大腦那樣隨著發育時間的推移而成熟。既然潛在的學習機制如此不同,二者的運行結果可能一樣嗎?索特索斯認為計算機視覺系統的前景不容樂觀。

「這些深度學習方法與人類毫無關係,」他說。這暗示我們瓶頸期即將來臨,或許日後人工智慧系統的發展將寸步難行。」

參考文獻

[1] Wong-Kee-YouAMB, Tsotsos JK, Adler SA. Development of spatial suppression surrounding thefocus of visual attention. J Vis. 2019;19(7):9. doi:10.1167/19.7.9

酷炫腦長期徵集腦科學、心理學類文章,歡迎投稿

投稿請發郵箱:2829023503@qq.com

點這裡,讓朋友知道你熱愛腦科學

原標題:《計算機會超越人類的視覺能力嗎?》

閱讀原文

相關焦點

  • 人類視覺的十大奇異能力
    人類的生物學研究得很好。但是這個器官的能力仍然讓專家們感到驚訝。成年人再也看不到他們的全部現實,有些孩子像海豚一樣潛水。人類也可以看到看不見的東西,或者被自己的眼睛欺騙,錯過眼前看得見的東西。
  • 美國西北大學新系統在智力測試中超越75%民眾,人類的推理能力也不...
    近日,美國西北大學的科研團隊研發了一個全新的計算模型,在瑞文氏標準推理測試中達到或超越了75%美國普通大眾的表現。被媒體譽為人工智慧史上的又一裡程碑。要知道,根據2016年的數據顯示,一般18歲成年人的平均智商為97,6歲兒童的平均智商為55.5,相比之下谷歌人工智慧系統的智商則為47.3,微軟小冰是24.5。人工智慧的智商還不及6歲兒童的平均水平。
  • AI看圖說話首超人類!微軟認知AI團隊提出視覺詞表預訓練超越...
    能看圖會說話的AI,表現還超過了人類?最近,Azure悄然上線了一個新的人工智慧服務,能精準的說出圖片中的內容。而背後的視覺詞表技術,更是超越了基於Transformer的前輩們,拿到nocaps挑戰賽冠軍。有沒有發現,搜索出來的圖片有時相關性很差?
  • 計算器扼殺了我們的計算能力?
    一方面,人們更加相信計算器的計算結果;另一方面,計算器滲透我們這個世界的三十多年的時間裡,是否已經影響了或者更直接說是降低了我們自身的計算能力?三十年前,計算器的問世向人們宣告人類勞動力將被從與數字搏鬥的千萬年中解放出來。發明者和支持者認為這是前所未有的一項大進步,儘管古人有算盤等其他計算工具,但是計算器有著其它工具不可比擬的優越性能。
  • 在機器人的眼裡能看到什麼,它們和人類的視覺系統類似嗎?
    有些遊客對機器人的精彩表演連連稱讚;有些則認為機器人反應遲緩、顯得笨重,相比人類的表現,令人失望。識別這些行李對於機器人來說是不是很困難?機器人在視覺方面能否做得更好,能否識別更複雜的對象?它們的目力能否超過人類?它們究竟能看到什麼?這些問題將我們引向了一個新興的熱門領域:計算機視覺。
  • 有這三個核心能力,人工智慧就能打敗90%的人類
    那你真的清楚人工智慧技術都會被應用在什麼方面嗎?在業界的技術人員看來,人工智慧的核心能力主要體現在三個方面:計算智能,感知智能、認知智能。 剛開始大家可能都會覺得很不可思議,其實AlphaGo作為人工智慧機器,具備超強的存儲能力和超快的計算能力,可以基於海量數據進行深度學習,利用歷史經驗指導當前環境。隨著計算力的不斷發展,儲存手段的不斷升級,計算智能可以說已經實現。除了AlphaGo以外,電商平臺也會基於對用戶購買習慣的深度學習,進行個性化商品推薦等。
  • 未來的機器人將取代人類嗎?
    第六條路徑是製造以量子計算為基礎的人工智慧。隨著量子力學的發展及其對量子特性了解的增多,許多著名科學家都「提出了人類意識的量子假設」,猜測「人類智能的底層機理就是量子效應」。於是有人認為,「以量子計算為基礎的人工智慧」可以成為超越人類能力的人工智慧,這種超級人工智慧會成為取代人類的「後人類」。
  • 人類為什麼喪失了夜視能力?仔細看看獅子是怎麼捕食的
    在二疊紀末期,爬行動物迅速的崛起,恐龍站上了整個食物鏈的頂端,因為恐龍是冷血動物,在夜間溫度較低的時候,行動會變得非常緩慢,所以弱小的哺乳動物就被迫長期居住在洞穴裡生存,晝伏夜出,由於長期生活在光線昏暗的環境中,導致辨別顏色的需求慢慢弱化,適應黑暗的能力佔據主導。
  • 視覺語言導航:造就高智商機器人
    有專家這樣說,人類開發人工智慧的未來目標,如同現在科幻電影所呈現的場景一樣,智能機器可以獨立「看、聽、思、行」,具備像人類一樣的語言理解系統、視覺感知系統、自我理解與行動的能力,最終成為人類的完美「替身」。如今,世界科技飛速發展,視覺語言導航技術日臻成熟,高智商的機器人正向我們走來。
  • 視覺感知堪比人眼!這款突破性傳感器模仿人類視網膜,有望帶來 AI...
    視覺、聽覺、嗅覺、味覺、觸覺是人類最基本的五種感覺,其中視覺極為關鍵,畢竟隨著物種進化,眼睛作為人類最為精細、複雜的器官,感知能力無與倫比。曾有神經科學、認知心理學研究表明,80% 以上的外界信息都是通過視覺進入了我們的大腦。
  • 計算機處理圍棋複雜的能力壓倒了人類||視頻
    作者:陳經 (亞洲視覺科技)計算機處理圍棋複雜的能力壓倒了人類:AlphaGo技術原理分析 2015 年11 月,「美林谷杯」首屆世界計算機圍棋錦標賽在北京舉辦,連笑七段(現八段,名人、天元)與獲得冠軍的韓國程序Dolbram 進行指導對局。
  • 雷射SLAM與視覺SLAM的現狀與趨勢
    視覺SLAM也具有類似特點,它可以從環境中獲取海量的、富於冗餘的紋理信息,擁有超強的場景辨識能力。早期的視覺SLAM基於濾波理論,其非線性的誤差模型和巨大的計算量成為了它實用落地的障礙。近年來,隨著具有稀疏性的非線性優化理論(Bundle Adjustment)以及相機技術、計算性能的進步,實時運行的視覺SLAM已經不再是夢想。通常,一個VSLAM系統由前端和後端組成(圖2)。
  • 世通資訊:視覺數據的「暗物質」可以幫助AI了解像人類一樣的圖像
    是什麼使我們人類如此擅長於理解視覺數據?幾十年來,這個問題一直困擾著人工智慧和計算機視覺科學家。迄今為止,在重現人類視覺能力方面的努力取得了值得讚揚的結果,但仍然有很多不足之處。 我們當前的人工智慧算法可以以極高的準確性檢測圖像中的對象,但前提是它們已經看到了許多(數千個甚至數百萬個)示例,並且前提是新圖像與以前所看到的圖像差別不大。
  • 人類的量子信息革命:上帝擲骰子嗎?
    來源:新浪科技新浪科技訊 1月13日消息,回顧2019年的科學進展,量子物理領域收穫頗豐:人類首次拍攝到量子糾纏的照片,親眼看到這種「幽靈般的超距作用」;谷歌實驗證明「量子優越性」,演示了量子計算超越經典計算機超級計算能力,一個新的信息技術時代迎來新曙光。
  • 象棋提升最根本的是提高計算能力
    象棋有三力:想像力、洞察力、計算力,其中計算能力是象棋的根本。象棋競賽的本質是一種計算能力的比拼。象棋對弈的過程其實就是對弈雙方通過眼光棋盤,在腦海中模擬棋局的後續變化,從中選擇出棋手認為最優的行棋方法,依此類推,直至對弈雙方決出勝負。
  • 讀書筆記|「人類智能」與「人工智慧」
    數理邏輯是指有效地計算、測量、推理,同時可以進行複雜的數學運算的能力。空間智能是指準確感知視覺空間和周圍的一切事物,同時還能夠以圖畫的形式將自己感覺到的形象表現出來。身體運動智能是善於用整個身體表達想法和感覺,同時用雙手去生產和改造事物的能力。音樂智能表現為個人對音樂節奏、音調、旋律的敏感度,以及通過演奏和歌唱表現音樂的能力。人際智能是指能夠有效地理解人際關係,並有與人交往的能力。
  • 大數據將人類的目光由局部轉向整體,極大地提升了人類的認知能力
    人類進入數據時代並不太久,據研究,網際網路上的數據每年增長50%,每兩年翻一倍,目前世界上90%以上的數據都是最近幾年才產生的。在網際網路時代以前,數據並不稀缺,但能被利用的數據有限。這些數據被記錄在書籍裡,出現在媒體上,存儲在資料庫裡。傳統的數據挖掘和分析,側重於利用數據價值高的局部數據。
  • 計算機處理圍棋複雜的能力壓倒了人類 | 陳經
    對計算機有所了解的棋手認為,計算機可能在局部計算上利用窮舉死算的威力佔得上風,但在更高級的全局思維與棋理上弱於人類,從而因「境界」的差距而毫無機會。應該如何下圍棋,人類有很多知識與教育傳承體系。網絡出現後,高手們互相對局的機會極大增加,成長為頂尖高手需要的時間縮短,少年高手層出不窮。與前輩相比,棋手們的整體實力和頂尖選手的絕對棋力都有上升。
  • 李開復:AlphaGo兩年內打敗人類
    還有什麼以上未考慮的因素,導致AlphaGo獲勝嗎?如果谷歌刻意未出全力和樊麾對抗,或者有其它學習或並行計算方面超越了Nature裡面的描述,那AlphaGo完全有可能獲勝。既然寫了這麼多,就對這個題目再發表一些看法:AlphaGo 是什麼?
  • 人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類
    去年,DeepMind 推出的 MuZero 在 51 款雅達利遊戲中實現了超越人類的表現。時隔數月,DeepMind 在這一方向上更進一步,在 57 款雅達利遊戲中全面超越人類,在這一領域尚屬首次。DeepMind 在最新發布的預印本論文和博客中介紹了這一進展。