AlphaGo 早已擊敗圍棋冠軍,計算機視覺還是 3 歲的「智力」

2020-12-11 開源中國

20 世紀 50 年代和 60 年代,計算機視覺並沒有被看成重頭戲,人們認為視覺系統很容易複製,而教計算機下棋更加困難。但是現在,AlphaGo 已經擊敗圍棋冠軍,IBM Watson 也在 Jeopardy 中擊敗人類競賽者,而大多數計算機視覺軟體最多只能完成 3 歲兒童的任務……

理論與實踐不斷證明,人類視覺神經非常複雜,計算機視覺實現並非易事。計算機視覺研究從上世紀 50 年代興起之後,也歷經了狂歡、冷靜,又重新燃起希望的階段。

本篇編譯整理自計算機視覺相關文章,介紹計算機視覺各階段的理論支撐與外部輿論變化。

最早的人工智慧想像

大多數人都認為,是現代人創造了人工智慧的概念,實際上遠古祖先也提出了思考型機器人的理論。

大約3000年前,荷馬描述了火神赫菲斯託斯(Hephaestus)的故事。赫菲斯託斯用黃金塑造了機械侍女,並賦予她們理性和學習能力。在無人駕駛汽車問世之前的幾個世紀,古希臘作家阿波羅紐斯(Apollonius)用想像力創造了塔洛斯(Talos),這是一個青銅自動機,負責保衛克裡特島。

但這些歷史性的敘述並不能準確描述當今正在開發的人工智慧的種類。因為儘管現在大多數人工智慧程序無法將其目標任務之外的知識概括化,但是對於本身給定的預期,他們已經達到或超過人類水平。

人的視覺與計算機視覺

人類視覺系統非常特別,超過50%的神經組織直接或間接地與視覺有關,其中超過66%的神經活動僅為處理視覺。今天人們對視覺、知覺的了解大部分來自1950年代和1960年代對貓進行的神經生理學研究。

 

上世紀50年代初期,哈佛醫學院的兩位神經科學家 David Hubel 和 Torsten Wiesel 在貓的視覺皮層上進行了一項實驗。通過研究神經元對各種刺激的反應,兩位科學家觀察到,人類的視覺是分級的。神經元檢測簡單的特徵,例如邊緣,然後輸入更複雜的特徵,如形狀,最後再輸入更複雜的視覺表示。基於這些知識,計算機科學家就可以專注於以數字形式重建人類神經結構。

早期樂觀

人工智慧領域成立於1956年在達特茅斯學院舉行的夏季研討會上,來自不同領域的科學家們聚集在一起,以闡明並發展關於「思維機器」的觀點。

1960年代,大學開始認真進行計算機視覺研究,並將該項目視為人工智慧的奠基石。

麻省理工學院的神經科學家戴維·馬爾(David Marr)在70年代出版了一本《VISION》,匯集了一些方法,作出了可檢測的預測,提供解決神經科學問題的框架,並激發一代年輕科學家研究大腦及計算。該書提出了一種用於研究生物視覺系統的計算範例,並介紹信息處理系統的三個不同分析層次概念,即計算理論層次、表示形式和算法層次、以及實現層次。他們分別指向:計算的目標是什麼;解決問題、實現目標的陳述與流程;這些表示和過程的物理實例化,例如如何在神經元中完成特定任務。這三個層次劃分的意義是,研究者從視覺系統的宏觀表示出發進行思考,而不是查看如單個神經元式的微觀實體。

Marr 建立了視覺表示框架,任何視覺系統感知到的強度,都是四個主要因素的函數:幾何形狀,意指形狀和相對位置;可見表面的反射率和絕對吸附特性,即物理特性;照明,即光源;相機,包含光學。

早期研究人員對相關領域的未來非常樂觀,並提倡把人工智慧作為一種可以改變世界的技術。一些人預測,一代人的時間內就會創造出像人類一樣聰明的機器,這種炒作為研究人員贏得了數百萬美元的公共和私人資金,研究中心在全球湧現。但是由於接下裡的發展未能達到人們的高預期,國際上的人工智慧開發工作受到了限制。

AI 視覺的冬天

研究人員以極大的樂觀度,將公眾的期望提高到了令人難以置信的高度,卻未能體會到他們為自己設定的挑戰的難度。當研究人員承諾的預期未能達成時,這個研究領域遭到了猛烈的批評,和嚴重的財務挫折。

早期的計算資源在技術上無法跟上科學家提出的複雜問題,即使是最令人印象深刻的項目也只能解決微不足道的問題。此外,大多數研究人員都是在孤立的小組內工作,缺乏比較有意義的,可以推進該領域科學進展的方式。

有一則故事可以反映當時研究人員的美好預期、以及預期落空後他們自身及和外界的失落與嘲諷。

1966年,美國計算機科學家、麻省理工學院 AI 實驗室聯合創始人馬文·明斯基(Marvin Minsky)獲得了暑期津貼,聘請了一年級的本科生傑拉爾德·蘇斯曼(Gerald Sussman),讓他花費整個夏天的時間把一臺攝像機與計算機連接起來,並讓計算機描述它看到了什麼。「不用說,蘇斯曼沒有在截止日期前完成,」Motion Metrics 的機器學習開發人員 Hooman Shariati 曾說,「在接下來的四十年中,視覺成為人工智慧領域最困難、最令人沮喪的挑戰之一。正如機器視覺專家貝特霍爾德·霍恩(Berthold Horn)曾經指出的那樣,蘇斯曼選擇不再在視覺領域工作。」

到70年代中期,政府和公司對人工智慧失去了信心,行業資金枯竭。數學家詹姆斯·萊特希爾(James Lighthill)1973年發表了一篇論文,批評早期人工智慧研究,這為後來英國政府撤回對該領域的支持奠定了研究基礎。

隨後的這段時間被稱為「人工智慧的冬天」。雖然20世紀80年代和90年代研究還在繼續,也有過一些小規模的復興,但人工智慧基本上被被歸入了科幻小說的範疇,嚴肅的計算機科學家都避免使用這個詞。

卷積神經網絡出現與多倫多大學的突破

隨著網際網路成為主流,計算機科學家有了可以訪問更多數據的權限。計算機硬體在繼續改進,成本則在下降。80年代到90年代,基本神經網絡和算法得到改進。

1998年,Bengio、Le Cun、Bottou 和 Haffner 在一篇論文中首次介紹了第一個卷積神經網絡 LeNet-5,能夠分類手寫數字。

卷積神經網絡可以做到平移不變形,即使對象的外觀發生某種方式的變化,也可以識別出對象。卷積神經網絡通過監督學習和反向傳播對輸入到卷積網絡中的數據做訓練,並反覆、自我校正。和同樣可以做反向傳播的深度神經網絡相比,卷積神經網絡的特殊之處在於神經元之間的連結結構和獨特的隱藏架構的方式,這是由人類視覺皮層內部的視覺數據處理機制啟發得來的。此外,CNN 中的圖層按照寬度、高度和深度三個維度進行組織。

卷積網絡最重要的屬性之一就是,不管有多少層,整個 CNN 系統僅由兩個部分組成:特徵提取和分類。通過對特定特徵的選擇,以及通過前饋連結增加空間不變性,這也是人工視覺系統如 CNN 非常獨特的原因。

(視覺皮層和卷積神經網絡有許多相似)

深度神經網絡研究應用也有進步,並且使人們信心大增。2012年,人工智慧在 ImageNet 大規模視覺識別挑戰(ILSVRC)上取得突破。

ILSVRC 是一個年度圖像分類比賽,研究團隊在給定的數據集上做視覺識別任務,評估算法準確性。2010年和2011年,ILSVRC 獲獎者的錯誤率一直在26%左右。2012年,來自多倫多大學的團隊帶來一個名為 AlexNet 的深度神經網絡,實現了16.4%的錯誤率。在接下來的幾年中,ILSRVC 的錯誤率下降到了幾個百分點。

基於 AI 的計算機視覺的未來

當下,人們已經知道,視覺能力是人類承擔的生物學生最複雜的任務之一,對計算機視覺的研究和預期也更加貼近世界。同時,基於對人類視覺能力了解的深入,計算機視覺研究人員也在不斷更新算法和理論。

CNN 已經廣泛用於需要處理視覺和空間信息的系統中。但隨著人工智慧需要解決更高級的問題,對計算和電力資源的增長需求成為 CNN 最突出的問題之一。研究人員的注意力也在逐漸轉向尖峰神經網絡 SNN,這是一種新型的 ANN ,受大腦神經動力學的啟發,具有事件驅動,快速推理和省電的特性,也被認為是第三代神經網絡。

接下來 SNN 要優化解決的一個問題是視覺注意 VA 與智力。人類可分散的注意力使得人能同時執行多個任務,注意力轉移可以使人快速訪問新信息。視覺注意力研究的核心目標是要使處理的視覺信息量最少,以解決複雜的高級任務,例如對象識別。

計算機視覺任務主要涉及處理靜態圖像,人類眼睛在檢測到場景變化向大腦傳遞信息——這是一個事件,生物視覺系統的這一關鍵特性允許將注意力選擇性地集中在場景的顯著部分上,從而大量減少需要處理的信息量。

假設針對一張人在草地上打高爾夫的圖像。傳統的傳感器中,數據以幀的形式傳輸,圖像上的所有內容都要經過處理,而重要的信息是人的運動,以及帶動的球桿和球的運動。這時,基於事件的傳感器並不會讀取每個像素並且以恆定速率發送幀,而是在檢測到像素局部亮度變化是,從每個像素異步發送數據包或事件,從而減少計算、傳輸的數據和功耗。

研究人員認為,CNN 非常適合靜態圖像中的對象識別,但它缺乏動態特性來處理基於事件的傳感器的實時數據集。因此,SNN 被寄予厚望。

現在人工智慧已經無縫集成到日常生活的多方面。研究人員表示,近年來,人工智慧在許多研究領域都取得了巨大的成功。像 AlphaGo 這樣的遊戲系統已經使用強化學習來自學,助聽器使用深度學習算法過濾掉環境噪音,這些技術甚至為自然語言處理與翻譯、對象識別以及模式匹配系統提供了動力,我們已經對谷歌、亞馬遜、iTunes 等提供的類似服務習以為常。這種趨勢也絲毫沒有放慢的跡象,人們可以用計算機自動化執行許多小的重複性任務以節省時間。

儘管人工智慧領域取得了令人難以置信的進步,但計算機視覺的應用仍有很長的路要走,因為距離計算機可以像人類一樣地去解釋圖像還需要很長時間。就像文章開頭提到的那樣,AlphaGo 早已擊敗了人類圍棋冠軍,計算機視覺的識圖能力僅相當於一個3歲的小孩。

參考連結:

相關焦點

  • AI戰勝歐洲圍棋冠軍 圍棋界怎麼說
    對於去年圍棋AI的對戰成果,谷歌近日才予以公布,而樊麾作為蟬聯多屆的歐洲冠軍又表現不佳。一石激起千層浪,《Science》等權威科學雜誌,中西方各大媒體紛紛以頭條消息報導,谷歌股價也隨之大漲。網絡中「谷歌AI橫掃歐洲冠軍」,「谷歌圍棋AI是裡程碑性的進步」等溢美之詞隨處可循,「人類最後智力驕傲即將崩塌」等「人工智慧威脅論」的字眼也屢見不鮮。
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    這個系統和深藍不同,不是一臺超級計算機,而是一個由許多個數據中心作為節點相連,每個節點內有著多臺超級計算機的神經網絡系統。就像人腦,是由 50-100 億個神經元所組成的,這也是為什麼這種機器學習架構被稱為神經網絡。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    從官網上可以看到,該工具通過利用 231000 盤人類棋手對局、75 盤 AlphaGo 與人類棋手對局的數據,能對圍棋近代史上 6000 種比較常見的開局給出分析。通過這個工具,大家可以探索圍棋奧妙,比較 AlphaGo 的下棋路數與專業選手、業餘選手的不同點,從中學習。官網上對於工具的使用也有相關說明:如何使用這一工具?
  • 面對谷歌圍棋AI,人類最後的智力驕傲即將崩塌
    歐美傳統裡的頂級人類智力試金石,在電腦面前終於一敗塗地,應了四十多年前計算機科學家的預言。 至少還有東方,人們自我安慰道。圍棋AI長期以來舉步維艱,頂級AI甚至不能打敗稍強的業餘選手。這似乎也合情合理:西洋棋中,平均每回合有35種可能,一盤棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤棋可以長達150回合。
  • AlphaGo對圍棋研究謝幕 留下輔助學棋的軟體
    這也標誌著AlphaGo對圍棋研究的謝幕。不過12月11日晚間,DeepMind公司在官網上線了AlphaGo教學工具。當今世界圍棋第一人柯潔隨後轉發此條微博,並評論道:「重新學圍棋。」AlphaGo抽身離去,圍棋卻已離不開它了。  留下無人超越的高度AlphaGo雖然離去,職業棋手卻沒有鬆口氣的感覺。
  • AlphaGo 是如何被訓練成圍棋之神的?
    袁行遠:19年前計算機擊敗西洋棋冠軍卡斯帕羅夫的情景還歷歷在目,現在計算機又要來攻克圍棋了嗎?虛竹在天龍八部裡自填一子,無意中以「自殺」破解「珍籠」棋局,逍遙子方才親傳掌門之位。難道以後「阿爾法狗」要出任逍遙派掌門了?
  • AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料
    曾經,「深藍」與卡斯帕羅夫的西洋棋人機大戰令全球關注,人類在西洋棋領域被AI擊敗。在東方,圍棋這個古老的智力遊戲始終沒有被AI攻破,直到谷歌研發的新計算機圍棋軟體「阿爾法圍棋(AlphaGo)」在去年擊敗歐洲冠軍樊麾。今天中午十二點,AlphaGo將挑戰李世石,上演最強大的腦力對決。人腦VS電腦,大戰在即,作為人類的你,必須知道以下幾件事。
  • 谷歌阿爾法圍棋AlphaGo背景資料照片 兩個大腦介紹(圖)
    上世紀90年代,IBM超級計算機「深藍」擊敗西洋棋世界冠軍,引發了「電腦是否超越人腦」的熱議。然而,圍棋因其變化莫測的招式成為了AI(ArtificialIntelligence,人工智慧)難以攻克的「禁地」。當然,這個世界總有「不信邪」的人。DeepMind開發的AI程序AlphaGo,擊敗了歐洲圍棋冠軍樊麾。AlphaGo是什麼來歷?
  • AlphaGo首現Bug 圍棋算法死穴在哪兒?
    再可怕的怪物也是有弱點的,AlphaGo為什麼會下臭棋讓大家大跌眼鏡,圍棋人工智慧第二代第三代的死穴是什麼?圍棋人工智慧第三代的死穴在哪兒?韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之後,執白棋居然扳回一局。
  • 從「深藍」到AlphaGo:那些年,那四場劃時代人機大戰
    1997年5月3日,卡斯帕羅夫在紐約與『深藍』對弈。 視覺中國 資料深藍——蠻算的「硬漢」 1997年,美國IBM公司的「深藍」超級計算機以2勝1負3平戰勝了當時世界排名第一的西洋棋大師卡斯帕羅夫。「深藍」的運算能力當時在全球超級計算機中居第259位,每秒可運算2億步。
  • 電腦程式ZEN比「深藍」更深 它或是圍棋終結者
    還好,還有圍棋(圍棋新聞,圍棋說吧)(圍棋新聞,圍棋說吧)。  計算機在圍棋方面一直很「弱智」。究其原因,圍棋充滿模糊性,沒有規律可循,計算機難以捕捉。  但日本電腦程式ZEN的出現,使得這個懸念變得撲朔迷離。
  • 圍棋「人機大戰」升級版將上演,電腦能打敗人腦嗎?
    編者按:3月9日,舉世矚目的圍棋「人機大戰」將在韓國首爾上演,比賽一方為谷歌公司研製的人工智慧程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世石九段。雙方將進行5盤較量,勝者將贏得100萬美元的獎金。
  • 厲害了,中國13歲小將吳依銘發揮出色,強勢擊敗韓國世界冠軍
    7月28日,「尋根中國 遇見名城」2020第八屆中信置業杯中國女子圍棋甲級聯賽終於在山西大同代王府落子,實在不容易,疫情改變了很多人的生活,也同樣影響了體育運動的開展。正如傳奇女棋手芮乃偉感慨:「盼星星盼月亮,終於開賽了」。
  • 圍棋愛好者們,3月「翻牆」去YouTube看AlphaGo挑戰李世石啊-虎嗅網
    哈薩比斯表示:「比賽日為3月9日、10日、12日、13日和15日,屆時YouTube將進行直播。詳情隨後公布。我們很高興前往韓國。」此次五番棋比賽將在韓國首爾進行,獎金為100萬美元。谷歌此前並未直播AlphaGo與歐洲圍棋冠軍樊麾的比賽,當時AlphaGo取得了5:0的壓倒性勝利。谷歌的這一成果隨後發表在《自然》雜誌上。預計AlphaGo和李世石的比賽將吸引上萬,甚至上百萬人的實時收看。
  • 中國「阿法狗」來了 騰訊「絕藝」奪世界圍棋AI冠軍
    在半個月後的第10屆UEC杯計算機圍棋大賽上,騰訊 AI 產品亮出「肌肉」。騰訊AI Lab(騰訊人工智慧實驗室)中一支由13人團隊研發近一年的圍棋人工智慧程序「絕藝」(Fine Art)首次參加比賽,一路過關斬將,在積分賽七連勝進入16強後,在決賽中經過50多分鐘的「鏖戰」,二度擊敗來自日本的 DeepZenGo,以四連勝戰績奪得本屆UEC杯冠軍。
  • 孩子6歲可學圍棋 明年起廈門全市小學一年級將推廣遊戲化圍棋
    「廈門有超過20多所中小學把圍棋當成校本課來推廣,學棋少年兒童超過3萬人。廈門許多少兒小棋手也在全國、全省的圍棋比賽中獲得佳績。」葉宏介紹,每年廈門都會組織舉辦各類大小群眾性圍棋賽事,比如,最受市民歡迎的群眾性體育盛會———全民健身運動會,每年都把圍棋列為比賽項目。
  • 零基礎學圍棋丨杭州棋院金牌講師免費教你學圍棋
    錢江晚報·小時新聞記者 張峰受到疫情影響,目前學校仍舊沒有開學,宅在家裡的「小神獸」們早已躁動不已,如何能讓他們靜下心來,成了不少家長頭疼的難題。而圍棋,作為一項蘊含了中國傳統文化和智慧的智力運動,既能開發智力,鍛鍊腦力,還能培養耐心和提高專注力。如果能讓宅家的「小神獸」們安心下盤圍棋,相信會解決不少人的難題。即日起,錢江晚報小時新聞客戶端聯合中國棋院杭州分院,推出「零基礎學圍棋」系列公益課程。將由杭州棋院的圍棋教師從零開始手把手教你學圍棋,不管你是大人還是小孩,只要每天3分鐘,就能輕鬆學會下圍棋。
  • 1998年張璇苦戰擊敗黃焰 成為第三位女子圍棋世界冠軍
    1998年張璇苦戰擊敗黃焰 成為第三位女子圍棋世界冠軍 張璇作為中國圍棋老一輩金花的代表人物之一
  • 十大女將:圍棋的傳說!
    個性恬靜、長相清秀的中華臺北美女棋手俞俐均,四歲半開始學圍棋,2013年成為職業初段,被稱為"小黑嘉嘉"。2016年,俞俐均到韓國學棋追尋自己的理想,新年伊始,作為替補參加韓國女子聯賽。吳侑珍2016年新科女子世界冠軍吳侑珍,韓國女子圍棋選手。吳侑珍1998年生,今年18歲。她2012年定段,2015年就獲得韓國女子圍棋聯賽的MVP,迅速成長起來。
  • AlphaGo之父解答人工智慧八大疑問
    我一定要擊敗阿爾法狗!」對於5月23日至27日與圍棋人工智慧程序AlphaGo(阿爾法狗)的對弈,目前世界排名第一的中國職業九段柯潔放出豪言。然而,AlphaGo(阿爾法狗)之父卻說,「我們發明阿爾法狗,並不是為了贏取圍棋比賽。」