AlphaGo 早已擊敗圍棋冠軍,計算機視覺還是 3 歲的「智力」

2021-01-09 開源中國

20 世紀 50 年代和 60 年代,計算機視覺並沒有被看成重頭戲,人們認為視覺系統很容易複製,而教計算機下棋更加困難。但是現在,AlphaGo 已經擊敗圍棋冠軍,IBM Watson 也在 Jeopardy 中擊敗人類競賽者,而大多數計算機視覺軟體最多只能完成 3 歲兒童的任務……

理論與實踐不斷證明,人類視覺神經非常複雜,計算機視覺實現並非易事。計算機視覺研究從上世紀 50 年代興起之後,也歷經了狂歡、冷靜,又重新燃起希望的階段。

本篇編譯整理自計算機視覺相關文章,介紹計算機視覺各階段的理論支撐與外部輿論變化。

最早的人工智慧想像

大多數人都認為,是現代人創造了人工智慧的概念,實際上遠古祖先也提出了思考型機器人的理論。

大約3000年前,荷馬描述了火神赫菲斯託斯(Hephaestus)的故事。赫菲斯託斯用黃金塑造了機械侍女,並賦予她們理性和學習能力。在無人駕駛汽車問世之前的幾個世紀,古希臘作家阿波羅紐斯(Apollonius)用想像力創造了塔洛斯(Talos),這是一個青銅自動機,負責保衛克裡特島。

但這些歷史性的敘述並不能準確描述當今正在開發的人工智慧的種類。因為儘管現在大多數人工智慧程序無法將其目標任務之外的知識概括化,但是對於本身給定的預期,他們已經達到或超過人類水平。

人的視覺與計算機視覺

人類視覺系統非常特別,超過50%的神經組織直接或間接地與視覺有關,其中超過66%的神經活動僅為處理視覺。今天人們對視覺、知覺的了解大部分來自1950年代和1960年代對貓進行的神經生理學研究。

 

上世紀50年代初期,哈佛醫學院的兩位神經科學家 David Hubel 和 Torsten Wiesel 在貓的視覺皮層上進行了一項實驗。通過研究神經元對各種刺激的反應,兩位科學家觀察到,人類的視覺是分級的。神經元檢測簡單的特徵,例如邊緣,然後輸入更複雜的特徵,如形狀,最後再輸入更複雜的視覺表示。基於這些知識,計算機科學家就可以專注於以數字形式重建人類神經結構。

早期樂觀

人工智慧領域成立於1956年在達特茅斯學院舉行的夏季研討會上,來自不同領域的科學家們聚集在一起,以闡明並發展關於「思維機器」的觀點。

1960年代,大學開始認真進行計算機視覺研究,並將該項目視為人工智慧的奠基石。

麻省理工學院的神經科學家戴維·馬爾(David Marr)在70年代出版了一本《VISION》,匯集了一些方法,作出了可檢測的預測,提供解決神經科學問題的框架,並激發一代年輕科學家研究大腦及計算。該書提出了一種用於研究生物視覺系統的計算範例,並介紹信息處理系統的三個不同分析層次概念,即計算理論層次、表示形式和算法層次、以及實現層次。他們分別指向:計算的目標是什麼;解決問題、實現目標的陳述與流程;這些表示和過程的物理實例化,例如如何在神經元中完成特定任務。這三個層次劃分的意義是,研究者從視覺系統的宏觀表示出發進行思考,而不是查看如單個神經元式的微觀實體。

Marr 建立了視覺表示框架,任何視覺系統感知到的強度,都是四個主要因素的函數:幾何形狀,意指形狀和相對位置;可見表面的反射率和絕對吸附特性,即物理特性;照明,即光源;相機,包含光學。

早期研究人員對相關領域的未來非常樂觀,並提倡把人工智慧作為一種可以改變世界的技術。一些人預測,一代人的時間內就會創造出像人類一樣聰明的機器,這種炒作為研究人員贏得了數百萬美元的公共和私人資金,研究中心在全球湧現。但是由於接下裡的發展未能達到人們的高預期,國際上的人工智慧開發工作受到了限制。

AI 視覺的冬天

研究人員以極大的樂觀度,將公眾的期望提高到了令人難以置信的高度,卻未能體會到他們為自己設定的挑戰的難度。當研究人員承諾的預期未能達成時,這個研究領域遭到了猛烈的批評,和嚴重的財務挫折。

早期的計算資源在技術上無法跟上科學家提出的複雜問題,即使是最令人印象深刻的項目也只能解決微不足道的問題。此外,大多數研究人員都是在孤立的小組內工作,缺乏比較有意義的,可以推進該領域科學進展的方式。

有一則故事可以反映當時研究人員的美好預期、以及預期落空後他們自身及和外界的失落與嘲諷。

1966年,美國計算機科學家、麻省理工學院 AI 實驗室聯合創始人馬文·明斯基(Marvin Minsky)獲得了暑期津貼,聘請了一年級的本科生傑拉爾德·蘇斯曼(Gerald Sussman),讓他花費整個夏天的時間把一臺攝像機與計算機連接起來,並讓計算機描述它看到了什麼。「不用說,蘇斯曼沒有在截止日期前完成,」Motion Metrics 的機器學習開發人員 Hooman Shariati 曾說,「在接下來的四十年中,視覺成為人工智慧領域最困難、最令人沮喪的挑戰之一。正如機器視覺專家貝特霍爾德·霍恩(Berthold Horn)曾經指出的那樣,蘇斯曼選擇不再在視覺領域工作。」

到70年代中期,政府和公司對人工智慧失去了信心,行業資金枯竭。數學家詹姆斯·萊特希爾(James Lighthill)1973年發表了一篇論文,批評早期人工智慧研究,這為後來英國政府撤回對該領域的支持奠定了研究基礎。

隨後的這段時間被稱為「人工智慧的冬天」。雖然20世紀80年代和90年代研究還在繼續,也有過一些小規模的復興,但人工智慧基本上被被歸入了科幻小說的範疇,嚴肅的計算機科學家都避免使用這個詞。

卷積神經網絡出現與多倫多大學的突破

隨著網際網路成為主流,計算機科學家有了可以訪問更多數據的權限。計算機硬體在繼續改進,成本則在下降。80年代到90年代,基本神經網絡和算法得到改進。

1998年,Bengio、Le Cun、Bottou 和 Haffner 在一篇論文中首次介紹了第一個卷積神經網絡 LeNet-5,能夠分類手寫數字。

卷積神經網絡可以做到平移不變形,即使對象的外觀發生某種方式的變化,也可以識別出對象。卷積神經網絡通過監督學習和反向傳播對輸入到卷積網絡中的數據做訓練,並反覆、自我校正。和同樣可以做反向傳播的深度神經網絡相比,卷積神經網絡的特殊之處在於神經元之間的連結結構和獨特的隱藏架構的方式,這是由人類視覺皮層內部的視覺數據處理機制啟發得來的。此外,CNN 中的圖層按照寬度、高度和深度三個維度進行組織。

卷積網絡最重要的屬性之一就是,不管有多少層,整個 CNN 系統僅由兩個部分組成:特徵提取和分類。通過對特定特徵的選擇,以及通過前饋連結增加空間不變性,這也是人工視覺系統如 CNN 非常獨特的原因。

(視覺皮層和卷積神經網絡有許多相似)

深度神經網絡研究應用也有進步,並且使人們信心大增。2012年,人工智慧在 ImageNet 大規模視覺識別挑戰(ILSVRC)上取得突破。

ILSVRC 是一個年度圖像分類比賽,研究團隊在給定的數據集上做視覺識別任務,評估算法準確性。2010年和2011年,ILSVRC 獲獎者的錯誤率一直在26%左右。2012年,來自多倫多大學的團隊帶來一個名為 AlexNet 的深度神經網絡,實現了16.4%的錯誤率。在接下來的幾年中,ILSRVC 的錯誤率下降到了幾個百分點。

基於 AI 的計算機視覺的未來

當下,人們已經知道,視覺能力是人類承擔的生物學生最複雜的任務之一,對計算機視覺的研究和預期也更加貼近世界。同時,基於對人類視覺能力了解的深入,計算機視覺研究人員也在不斷更新算法和理論。

CNN 已經廣泛用於需要處理視覺和空間信息的系統中。但隨著人工智慧需要解決更高級的問題,對計算和電力資源的增長需求成為 CNN 最突出的問題之一。研究人員的注意力也在逐漸轉向尖峰神經網絡 SNN,這是一種新型的 ANN ,受大腦神經動力學的啟發,具有事件驅動,快速推理和省電的特性,也被認為是第三代神經網絡。

接下來 SNN 要優化解決的一個問題是視覺注意 VA 與智力。人類可分散的注意力使得人能同時執行多個任務,注意力轉移可以使人快速訪問新信息。視覺注意力研究的核心目標是要使處理的視覺信息量最少,以解決複雜的高級任務,例如對象識別。

計算機視覺任務主要涉及處理靜態圖像,人類眼睛在檢測到場景變化向大腦傳遞信息——這是一個事件,生物視覺系統的這一關鍵特性允許將注意力選擇性地集中在場景的顯著部分上,從而大量減少需要處理的信息量。

假設針對一張人在草地上打高爾夫的圖像。傳統的傳感器中,數據以幀的形式傳輸,圖像上的所有內容都要經過處理,而重要的信息是人的運動,以及帶動的球桿和球的運動。這時,基於事件的傳感器並不會讀取每個像素並且以恆定速率發送幀,而是在檢測到像素局部亮度變化是,從每個像素異步發送數據包或事件,從而減少計算、傳輸的數據和功耗。

研究人員認為,CNN 非常適合靜態圖像中的對象識別,但它缺乏動態特性來處理基於事件的傳感器的實時數據集。因此,SNN 被寄予厚望。

現在人工智慧已經無縫集成到日常生活的多方面。研究人員表示,近年來,人工智慧在許多研究領域都取得了巨大的成功。像 AlphaGo 這樣的遊戲系統已經使用強化學習來自學,助聽器使用深度學習算法過濾掉環境噪音,這些技術甚至為自然語言處理與翻譯、對象識別以及模式匹配系統提供了動力,我們已經對谷歌、亞馬遜、iTunes 等提供的類似服務習以為常。這種趨勢也絲毫沒有放慢的跡象,人們可以用計算機自動化執行許多小的重複性任務以節省時間。

儘管人工智慧領域取得了令人難以置信的進步,但計算機視覺的應用仍有很長的路要走,因為距離計算機可以像人類一樣地去解釋圖像還需要很長時間。就像文章開頭提到的那樣,AlphaGo 早已擊敗了人類圍棋冠軍,計算機視覺的識圖能力僅相當於一個3歲的小孩。

參考連結:

相關焦點

  • Google人工智慧擊敗歐洲圍棋冠軍, AlphaGo 究竟是怎麼做到的?
    就在今天,《Nature》雜誌以封面論文的形式,介紹了 Google DeepMind 開發的人工智慧程序 AlphaGo,它擊敗了歐洲圍棋冠軍樊麾,並將在 3 月和世界冠軍李世乭對戰!Google 特地為此準備了 100 萬美元獎金。
  • 人工智慧擊敗世界圍棋冠軍 "阿爾法狗"為什麼厲害
    2016圍棋人機大戰第五盤賽況,右為圍棋世界冠軍韓國棋手李世石。人民視覺 谷歌的圍棋人工智慧程序和人類圍棋冠軍之間的比賽,堪稱人工智慧發展的一個重要裡程碑,也讓全世界的目光聚焦在人工智慧這個熱門科技領域。谷歌的人工智慧程序是怎樣贏了人類?人工智慧對人類來說到底意味著什麼,會帶來什麼?它會不會有一天在智能上也超過人類?
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    這個系統和深藍不同,不是一臺超級計算機,而是一個由許多個數據中心作為節點相連,每個節點內有著多臺超級計算機的神經網絡系統。就像人腦,是由 50-100 億個神經元所組成的,這也是為什麼這種機器學習架構被稱為神經網絡。
  • AlphaGo是如何學會下圍棋的
    圍棋界的風雨欲來時,亦是AI界的重要突破日,本文將為你重現人工智慧來臨時代的重要進步時刻。 第一縷星火 人工智慧領域取得了一項重要突破----一在圍棋項目中,一個由谷歌研究團隊開發的計算機系統AlphaGo擊敗了歐洲的頂尖職業棋手。在此之前,這個關於戰略性和直觀判斷的古老東方競技遊戲,已經困擾了人工智慧專家們數十年之久。
  • AlphaGo後裔AlphaZero創造奇蹟,不到24小時訓練擊敗西洋棋、圍棋...
    據稱,新的算法經過不到 24 小時的訓練後,可以在西洋棋和日本將棋上擊敗目前業內頂尖的電腦程式(這些程序早已超越人類世界冠軍水平),也可以輕鬆擊敗訓練 3 天時間的 AlphaGo Zero。 整理 | 微胖 王藝對於 DeepMind 來說,其最終目的遠非在棋盤遊戲中擊敗人類。他們希望可以打造出一種通用人工智慧,解決更多的人類問題。
  • 谷歌AlphaGo對決李世石在即,9位世界冠軍、圍棋九段賭誰贏?-虎嗅網
    比賽最終決定採用中國圍棋競賽規則,黑貼3又3/4子(7.5目),用時為每方2小時,3次1分鐘讀秒。DeepMind公司youtube頻道和韓國棋院圍棋TV將對本次比賽進行全程直播報導。之前0:5不敵AlphaGo的歐洲圍棋冠軍樊麾,作為比賽裁判團隊一員參與其中。本次比賽無論進程如何都將下滿五局,獲得三勝者贏得獎金100萬美元(約11億韓元)。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了Nature微博原文:【可以自學成才的AlphaGo Zero】本周Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後,人工智慧進入大眾的視野,今年5月27日,中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。
  • 李開復:AlphaGo對決世界冠軍勝率僅1.1%
    谷歌AlphaGo人工智慧與圍棋世界冠軍李世乭的世紀對決將在3月9日開戰,這是在1997年IBM公司「深藍」擊敗西洋棋世界冠軍之後又一次備受關注的人機對決。不過,對於AlphaGo能夠在對決中勝出,李開復並不看好,他預測「AlphaGo這次的比賽打敗李世乭比較懸,但是1-2年之內必然完勝人類」。
  • 圍棋AI大賽騰訊「絕藝」奪冠!AlphaGo未參賽
    【PConline 資訊】在3月19日,研發的「絕藝」圍棋AI贏得了第10屆UEC杯世界計算機圍棋賽冠軍。第10屆UEC杯世界計算機圍棋賽決賽中,AI Lab(騰訊人工智慧實驗室)研發的圍棋人工智慧程序「絕藝」(Fine Art)擊敗了日本開發的「DeepZenGo」(天頂)奪冠,戰績為11戰全勝。騰訊騰訊今年共有30支軟體參加此次大賽。繼18日的循環積分賽中,「絕藝「以七局全勝戰績進入16強後,在今天決賽又以四連勝戰績奪得本屆UEC杯冠軍,日本「DeepZenGo」獲亞軍。
  • 圍棋:從「堯造」的遊戲到「人類的智力競技高地」
    中新網3月11日電(宋宇晟) 北京時間3月10日16時27分,谷歌旗下人工智慧公司DeepMind開發的智能系統AlphaGo(阿爾法圍棋)和韓國職業圍棋選手李世石九段的第二場比賽結束。擁有14個世界冠軍頭銜的李世石再次輸掉了比賽。  人類棋手兩次敗北,這讓不少人都開始重新審視人與機器的關係。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    從官網上可以看到,該工具通過利用 231000 盤人類棋手對局、75 盤 AlphaGo 與人類棋手對局的數據,能對圍棋近代史上 6000 種比較常見的開局給出分析。通過這個工具,大家可以探索圍棋奧妙,比較 AlphaGo 的下棋路數與專業選手、業餘選手的不同點,從中學習。官網上對於工具的使用也有相關說明:如何使用這一工具?
  • AlphaGo 圍棋教學工具已發布
    3. 所有AlphaGo的勝率與推薦下法,AlphaGo都思考將近10分鐘(1000萬次模擬)。4. 每一個開局變化,AlphaGo都固定延伸20步棋。加上AlphaGo的下法,整個教學工具約有2萬個分支變化,37萬個盤面。受限於投稿《自然》雜誌的時程,本教學工具使用的版本是AlphaGo Master。
  • 新版「阿爾法圍棋」從零開始40天稱王
    圖/視覺中國不依靠人類圍棋知識;「從零開始」自學圍棋,僅3天就擊敗前輩版本據新華社電 人工智慧「阿爾法圍棋」在幾次世界矚目的人機大戰後站在圍棋之巔,又以一種新的方式超越了自己:新版本「從零開始」學習圍棋,僅用3天就擊敗前輩版本,40天成為新的王者。
  • 阿爾法圍棋ALPHAGO 紀錄片
    >)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。樊麾 (二段) 是一名職業圍棋手,也是2013年至2015年的歐洲圍棋冠軍。他一生所學的一切都繞不開圍棋,就像是面鏡子。他看到圍棋就好像看到了自己。
  • 棋壇至尊AlphaGo Zero,不止震驚了圍棋界
    Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge中提到,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • 新圍棋啟蒙者AlphaGo,和它打開的新世界大門……
    ,直到在對局周睿羊九段的第 59 局比賽之後,Master 才主動透露了自己的身份「我是 AlphaGo 的黃博士(黃士傑)」,揭曉了那個所有人都早已猜到的謎底。就像李白《俠客行》詩中寫的那樣,「十步殺一人,千裡不留行」。
  • AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料
    曾經,「深藍」與卡斯帕羅夫的西洋棋人機大戰令全球關注,人類在西洋棋領域被AI擊敗。在東方,圍棋這個古老的智力遊戲始終沒有被AI攻破,直到谷歌研發的新計算機圍棋軟體「阿爾法圍棋(AlphaGo)」在去年擊敗歐洲冠軍樊麾。今天中午十二點,AlphaGo將挑戰李世石,上演最強大的腦力對決。人腦VS電腦,大戰在即,作為人類的你,必須知道以下幾件事。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    經過大約40天的訓練(約2900萬場自玩遊戲),AlphaGo Zero擊敗了AlphaGo Master(今年早些時候擊敗了世界冠軍柯潔)。對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    2016年3月,第一次「人機大戰」,Alpha Go1.0版4比1擊敗14個世界冠軍獲得者李世石九段;自我對弈40天後,Alpha Go Zero變得更為強大,超過了此前擊敗當今圍棋第一人柯潔的Master亦即Alpha Go2.0版。