AlphaGo 早已擊敗圍棋冠軍,計算機視覺還是 3 歲的「智力」

2020-12-26 開源中國

20 世紀 50 年代和 60 年代,計算機視覺並沒有被看成重頭戲,人們認為視覺系統很容易複製,而教計算機下棋更加困難。但是現在,AlphaGo 已經擊敗圍棋冠軍,IBM Watson 也在 Jeopardy 中擊敗人類競賽者,而大多數計算機視覺軟體最多只能完成 3 歲兒童的任務……

理論與實踐不斷證明,人類視覺神經非常複雜,計算機視覺實現並非易事。計算機視覺研究從上世紀 50 年代興起之後,也歷經了狂歡、冷靜,又重新燃起希望的階段。

本篇編譯整理自計算機視覺相關文章,介紹計算機視覺各階段的理論支撐與外部輿論變化。

最早的人工智慧想像

大多數人都認為,是現代人創造了人工智慧的概念,實際上遠古祖先也提出了思考型機器人的理論。

大約3000年前,荷馬描述了火神赫菲斯託斯(Hephaestus)的故事。赫菲斯託斯用黃金塑造了機械侍女,並賦予她們理性和學習能力。在無人駕駛汽車問世之前的幾個世紀,古希臘作家阿波羅紐斯(Apollonius)用想像力創造了塔洛斯(Talos),這是一個青銅自動機,負責保衛克裡特島。

但這些歷史性的敘述並不能準確描述當今正在開發的人工智慧的種類。因為儘管現在大多數人工智慧程序無法將其目標任務之外的知識概括化,但是對於本身給定的預期,他們已經達到或超過人類水平。

人的視覺與計算機視覺

人類視覺系統非常特別,超過50%的神經組織直接或間接地與視覺有關,其中超過66%的神經活動僅為處理視覺。今天人們對視覺、知覺的了解大部分來自1950年代和1960年代對貓進行的神經生理學研究。

 

上世紀50年代初期,哈佛醫學院的兩位神經科學家 David Hubel 和 Torsten Wiesel 在貓的視覺皮層上進行了一項實驗。通過研究神經元對各種刺激的反應,兩位科學家觀察到,人類的視覺是分級的。神經元檢測簡單的特徵,例如邊緣,然後輸入更複雜的特徵,如形狀,最後再輸入更複雜的視覺表示。基於這些知識,計算機科學家就可以專注於以數字形式重建人類神經結構。

早期樂觀

人工智慧領域成立於1956年在達特茅斯學院舉行的夏季研討會上,來自不同領域的科學家們聚集在一起,以闡明並發展關於「思維機器」的觀點。

1960年代,大學開始認真進行計算機視覺研究,並將該項目視為人工智慧的奠基石。

麻省理工學院的神經科學家戴維·馬爾(David Marr)在70年代出版了一本《VISION》,匯集了一些方法,作出了可檢測的預測,提供解決神經科學問題的框架,並激發一代年輕科學家研究大腦及計算。該書提出了一種用於研究生物視覺系統的計算範例,並介紹信息處理系統的三個不同分析層次概念,即計算理論層次、表示形式和算法層次、以及實現層次。他們分別指向:計算的目標是什麼;解決問題、實現目標的陳述與流程;這些表示和過程的物理實例化,例如如何在神經元中完成特定任務。這三個層次劃分的意義是,研究者從視覺系統的宏觀表示出發進行思考,而不是查看如單個神經元式的微觀實體。

Marr 建立了視覺表示框架,任何視覺系統感知到的強度,都是四個主要因素的函數:幾何形狀,意指形狀和相對位置;可見表面的反射率和絕對吸附特性,即物理特性;照明,即光源;相機,包含光學。

早期研究人員對相關領域的未來非常樂觀,並提倡把人工智慧作為一種可以改變世界的技術。一些人預測,一代人的時間內就會創造出像人類一樣聰明的機器,這種炒作為研究人員贏得了數百萬美元的公共和私人資金,研究中心在全球湧現。但是由於接下裡的發展未能達到人們的高預期,國際上的人工智慧開發工作受到了限制。

AI 視覺的冬天

研究人員以極大的樂觀度,將公眾的期望提高到了令人難以置信的高度,卻未能體會到他們為自己設定的挑戰的難度。當研究人員承諾的預期未能達成時,這個研究領域遭到了猛烈的批評,和嚴重的財務挫折。

早期的計算資源在技術上無法跟上科學家提出的複雜問題,即使是最令人印象深刻的項目也只能解決微不足道的問題。此外,大多數研究人員都是在孤立的小組內工作,缺乏比較有意義的,可以推進該領域科學進展的方式。

有一則故事可以反映當時研究人員的美好預期、以及預期落空後他們自身及和外界的失落與嘲諷。

1966年,美國計算機科學家、麻省理工學院 AI 實驗室聯合創始人馬文·明斯基(Marvin Minsky)獲得了暑期津貼,聘請了一年級的本科生傑拉爾德·蘇斯曼(Gerald Sussman),讓他花費整個夏天的時間把一臺攝像機與計算機連接起來,並讓計算機描述它看到了什麼。「不用說,蘇斯曼沒有在截止日期前完成,」Motion Metrics 的機器學習開發人員 Hooman Shariati 曾說,「在接下來的四十年中,視覺成為人工智慧領域最困難、最令人沮喪的挑戰之一。正如機器視覺專家貝特霍爾德·霍恩(Berthold Horn)曾經指出的那樣,蘇斯曼選擇不再在視覺領域工作。」

到70年代中期,政府和公司對人工智慧失去了信心,行業資金枯竭。數學家詹姆斯·萊特希爾(James Lighthill)1973年發表了一篇論文,批評早期人工智慧研究,這為後來英國政府撤回對該領域的支持奠定了研究基礎。

隨後的這段時間被稱為「人工智慧的冬天」。雖然20世紀80年代和90年代研究還在繼續,也有過一些小規模的復興,但人工智慧基本上被被歸入了科幻小說的範疇,嚴肅的計算機科學家都避免使用這個詞。

卷積神經網絡出現與多倫多大學的突破

隨著網際網路成為主流,計算機科學家有了可以訪問更多數據的權限。計算機硬體在繼續改進,成本則在下降。80年代到90年代,基本神經網絡和算法得到改進。

1998年,Bengio、Le Cun、Bottou 和 Haffner 在一篇論文中首次介紹了第一個卷積神經網絡 LeNet-5,能夠分類手寫數字。

卷積神經網絡可以做到平移不變形,即使對象的外觀發生某種方式的變化,也可以識別出對象。卷積神經網絡通過監督學習和反向傳播對輸入到卷積網絡中的數據做訓練,並反覆、自我校正。和同樣可以做反向傳播的深度神經網絡相比,卷積神經網絡的特殊之處在於神經元之間的連結結構和獨特的隱藏架構的方式,這是由人類視覺皮層內部的視覺數據處理機制啟發得來的。此外,CNN 中的圖層按照寬度、高度和深度三個維度進行組織。

卷積網絡最重要的屬性之一就是,不管有多少層,整個 CNN 系統僅由兩個部分組成:特徵提取和分類。通過對特定特徵的選擇,以及通過前饋連結增加空間不變性,這也是人工視覺系統如 CNN 非常獨特的原因。

(視覺皮層和卷積神經網絡有許多相似)

深度神經網絡研究應用也有進步,並且使人們信心大增。2012年,人工智慧在 ImageNet 大規模視覺識別挑戰(ILSVRC)上取得突破。

ILSVRC 是一個年度圖像分類比賽,研究團隊在給定的數據集上做視覺識別任務,評估算法準確性。2010年和2011年,ILSVRC 獲獎者的錯誤率一直在26%左右。2012年,來自多倫多大學的團隊帶來一個名為 AlexNet 的深度神經網絡,實現了16.4%的錯誤率。在接下來的幾年中,ILSRVC 的錯誤率下降到了幾個百分點。

基於 AI 的計算機視覺的未來

當下,人們已經知道,視覺能力是人類承擔的生物學生最複雜的任務之一,對計算機視覺的研究和預期也更加貼近世界。同時,基於對人類視覺能力了解的深入,計算機視覺研究人員也在不斷更新算法和理論。

CNN 已經廣泛用於需要處理視覺和空間信息的系統中。但隨著人工智慧需要解決更高級的問題,對計算和電力資源的增長需求成為 CNN 最突出的問題之一。研究人員的注意力也在逐漸轉向尖峰神經網絡 SNN,這是一種新型的 ANN ,受大腦神經動力學的啟發,具有事件驅動,快速推理和省電的特性,也被認為是第三代神經網絡。

接下來 SNN 要優化解決的一個問題是視覺注意 VA 與智力。人類可分散的注意力使得人能同時執行多個任務,注意力轉移可以使人快速訪問新信息。視覺注意力研究的核心目標是要使處理的視覺信息量最少,以解決複雜的高級任務,例如對象識別。

計算機視覺任務主要涉及處理靜態圖像,人類眼睛在檢測到場景變化向大腦傳遞信息——這是一個事件,生物視覺系統的這一關鍵特性允許將注意力選擇性地集中在場景的顯著部分上,從而大量減少需要處理的信息量。

假設針對一張人在草地上打高爾夫的圖像。傳統的傳感器中,數據以幀的形式傳輸,圖像上的所有內容都要經過處理,而重要的信息是人的運動,以及帶動的球桿和球的運動。這時,基於事件的傳感器並不會讀取每個像素並且以恆定速率發送幀,而是在檢測到像素局部亮度變化是,從每個像素異步發送數據包或事件,從而減少計算、傳輸的數據和功耗。

研究人員認為,CNN 非常適合靜態圖像中的對象識別,但它缺乏動態特性來處理基於事件的傳感器的實時數據集。因此,SNN 被寄予厚望。

現在人工智慧已經無縫集成到日常生活的多方面。研究人員表示,近年來,人工智慧在許多研究領域都取得了巨大的成功。像 AlphaGo 這樣的遊戲系統已經使用強化學習來自學,助聽器使用深度學習算法過濾掉環境噪音,這些技術甚至為自然語言處理與翻譯、對象識別以及模式匹配系統提供了動力,我們已經對谷歌、亞馬遜、iTunes 等提供的類似服務習以為常。這種趨勢也絲毫沒有放慢的跡象,人們可以用計算機自動化執行許多小的重複性任務以節省時間。

儘管人工智慧領域取得了令人難以置信的進步,但計算機視覺的應用仍有很長的路要走,因為距離計算機可以像人類一樣地去解釋圖像還需要很長時間。就像文章開頭提到的那樣,AlphaGo 早已擊敗了人類圍棋冠軍,計算機視覺的識圖能力僅相當於一個3歲的小孩。

參考連結:

相關焦點

  • AlphaGo 早已擊敗圍棋冠軍,計算機視覺還是 3 歲的 「智力」
    20 世紀 50 年代和 60 年代,計算機視覺並沒有被看成重頭戲,人們認為視覺系統很容易複製,而教計算機下棋更加困難。但是現在,AlphaGo 已經擊敗圍棋冠軍,IBM Watson 也在 Jeopardy 中擊敗人類競賽者,而大多數計算機視覺軟體最多只能完成 3 歲兒童的任務……理論與實踐不斷證明,人類視覺神經非常複雜,計算機視覺實現並非易事。計算機視覺研究從上世紀 50 年代興起之後,也歷經了狂歡、冷靜,又重新燃起希望的階段。
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    這個系統和深藍不同,不是一臺超級計算機,而是一個由許多個數據中心作為節點相連,每個節點內有著多臺超級計算機的神經網絡系統。就像人腦,是由 50-100 億個神經元所組成的,這也是為什麼這種機器學習架構被稱為神經網絡。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了Nature微博原文:【可以自學成才的AlphaGo Zero】本周Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • AlphaGo若打敗世界冠軍,意味著什麼?
    AlphaGo不是打敗了歐洲冠軍嗎?有些人認為AlphaGo去年底擊敗了歐洲冠軍樊麾,所以挑戰(前)世界冠軍應有希望。但是,樊麾只是職業二段(Elo 3000左右),而李世石是職業九段(ELO 3532)。這兩位的差別是巨大的,完全不能混為一談。就比如說一個人桌球打敗了非洲冠軍,並不代表他就可以成功挑戰中國冠軍。
  • AlphaGo是如何學會下圍棋的
    圍棋界的風雨欲來時,亦是AI界的重要突破日,本文將為你重現人工智慧來臨時代的重要進步時刻。 第一縷星火 人工智慧領域取得了一項重要突破----一在圍棋項目中,一個由谷歌研究團隊開發的計算機系統AlphaGo擊敗了歐洲的頂尖職業棋手。在此之前,這個關於戰略性和直觀判斷的古老東方競技遊戲,已經困擾了人工智慧專家們數十年之久。
  • AlphaGo已下線,AlphaGo Zero從0-1不帶人類尬棋了!
    AlphaGo下線了!2015年10月面世,擊敗歐洲冠軍樊麾。2016年3月,擊敗人類頂尖棋手之一李世石。 而面對阿法元的出現,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的…對於alphago的自我進步來講…人類太多餘了。」
  • 電腦再贏人機大戰 谷歌人工智慧擊敗歐洲圍棋冠軍
    谷歌人工智慧擊敗歐洲圍棋冠軍  昨天谷歌宣布,其人工智慧研究團隊近期取得了一項重要突破:谷歌團隊構建的AlphaGo系統通過計算機學習掌握了圍棋這項古老的技藝,近期AlphaGo挑戰了三度問鼎歐洲圍棋桂冠的職業棋手樊麾二段,成績是5比0。
  • 人物 Demis Hassabis:AlphaGo圍棋程序就是他編寫的
    ▎智東西  文 | 海中天李世石是世界圍棋冠軍,一直以來,人們都認為古老的中國圍棋是最複雜的遊戲。本周,DeepMind(一家英國公司,為谷歌所有)開發的AlphaGo圍棋程序打敗了李世石,五輪比賽,前三輪全都贏了。
  • 熱點人機大戰只結束了第一回合,勝負早已出來了!
    比賽一方為谷歌公司研製的人工智慧程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世石九段。經過3個半小時的鏖戰,李世石九段投子認輸,輸掉了這五番棋中的第一場。 現在人類只剩下世界上最複雜的智力遊戲——圍棋,這一底褲了。
  • 【熱點】人機大戰只結束了第一回合,勝負早已出來了
    比賽一方為谷歌公司研製的人工智慧程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世石九段。經過3個半小時的鏖戰,李世石九段投子認輸,輸掉了這五番棋中的第一場。執黑先行的李世石,在中盤局勢領先的情況下,在右下角局部戰鬥中出現失誤,AlphaGo敏銳捕捉到戰機隨即重新獲得主動權。
  • 面對谷歌圍棋AI,人類最後的智力驕傲崩塌了……
    歐美傳統裡的頂級人類智力試金石,在電腦面前終於一敗塗地,應了四十多年前計算機科學家的預言。 至少還有東方,人們自我安慰道。圍棋AI長期以來舉步維艱,頂級AI甚至不能打敗稍強的業餘選手。這似乎也合情合理:西洋棋中,平均每回合有35種可能,一盤棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤棋可以長達150回合。
  • 電腦秒殺歐洲圍棋冠軍!人類的智力驕傲如何一步步崩潰……
    剝奪了人類最後的智力優越感與「阿爾法圍棋」軟體一較高下的棋手,是2013年至2015年的歐洲圍棋冠軍、生於中國的職業二段樊麾。這場對抗實際上是2015年10月進行的,電腦5:0把圍棋職業棋手剃了光頭。在歐美人最喜歡的,同時也認為是最複雜的智力遊戲——西洋棋上,1997年電腦「深藍」與當時的世界冠軍卡斯帕羅夫(被視為棋壇神一般的存在,比賽一年也難於輸一盤給對手的偉大棋手)大戰6局,電腦3.5:2.5險勝。這是一個人工智慧發展領域的標誌性事件,轟動世界。此後電腦逐漸超越了世界冠軍的水準,人機對抗不再具有轟動效應。
  • AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料
    曾經,「深藍」與卡斯帕羅夫的西洋棋人機大戰令全球關注,人類在西洋棋領域被AI擊敗。在東方,圍棋這個古老的智力遊戲始終沒有被AI攻破,直到谷歌研發的新計算機圍棋軟體「阿爾法圍棋(AlphaGo)」在去年擊敗歐洲冠軍樊麾。今天中午十二點,AlphaGo將挑戰李世石,上演最強大的腦力對決。人腦VS電腦,大戰在即,作為人類的你,必須知道以下幾件事。
  • 柯潔與alphago的三局,棋盤上到底都發生了什麼
    文 | 春光炸裂我作為圍棋國家二級運動員,儘量講清楚柯潔與alphago的三局,棋盤上到底都發生了什麼。
  • 世紀人機大戰:李世石對戰 AlphaGo
    一方是擁有十多個圍棋世界冠軍頭銜的最高級別人類選手;一方是現階段人工智慧領域最厲害的圍棋程序,北京時間今天中午 12 時,全球都會將目光聚焦首爾。「這是一場新鮮而陌生的比賽,是全新的挑戰。我很難保證 5 比 0 全勝,畢竟我的對手從來不會失誤。」昨日的賽前發布會上,李世石雖然一改此前的自信滿滿,但依舊認為「目前還是人類比人工智慧強」。
  • 柯潔與Alphago的三局人機大戰,棋盤上到底都發生了什麼?
    【弈客圍棋APP 記錄你的圍棋人生】
  • 圍棋世界冠軍常昊走進松江,分享他的「圍棋與人生」時,這樣說……
    中國圍棋協會副主席、圍棋世界冠軍常昊站在中間,八位小學生圍棋手分坐兩排,常昊依次在八張棋盤上「出招」,八位小棋手目光炯炯盯著棋盤,積極「應對」……昨天下午,「與世界大師對弈,做智力運動冠軍」——圍棋世界冠軍常昊校園行在上海師範大學附屬外國語中學舉行,這也是我區校園智力運動「一條龍」布局系列活動之一。
  • AlphaGo教學工具上線!人人可用,柯潔稱要重新學圍棋
    △ 黃士傑博士的朋友圈也就是說,曾經擊敗過世界頂級圍棋選手李世石和柯潔的AlphaGo重出江湖,化身圍棋老師,開始教人類下圍棋了。△ 原來這裡還可以飛項目地址:(樊麾溫馨提示:打開時請耐心等待幾秒)https://alphagoteach.deepmind.com
  • Master擊敗世界圍棋第一人柯潔,人類就真的無法阻擋AI進擊的腳步了?
    文 | 緩緩君首發 | 緩緩說繼阿爾法狗之後,圍棋界再一次引發腥風血雨。一個網名為Master的神秘帳號,在著名圍棋對戰平臺上大殺四方,擊敗中日韓一流圍棋高手,更在昨晚擊敗了世界圍棋第一人柯潔。至此,Master已輕鬆連勝51場。
  • alphago 50盤自戰棋譜的簡單解讀
    目前,所知幾乎所有職業棋手,都在認真研讀和分析這些棋譜,而很多圍棋業餘愛好者也試圖通過這些棋譜,去更好的理解圍棋。作為業餘中的俗手,如果試圖去理解和解讀每一步棋的妙處,我自認為是沒有資格的,只是粗略的根據棋譜的感受,做一些簡單的總結,希望對愛好者更好的了解alphago和圍棋,有所幫助。1、目前貼目規則白棋有利。