AlphaGo 為什麼能戰勝人類?

2020-11-24 donews

DoNews 3月14日消息(記者 周勤燕)在13日結束的AlphaGo與李世石五番棋對決中的第四局,李世石勝出。連敗三局之後,人類終於扳回一局。但這場勝利來得有些遲,AlphaGo此前已經痛快得贏得這場人機大賽的勝利。這場生生奪走一周眼球的人機圍棋大戰,人們最想追問的是,AlphaGo為什麼能戰勝人類?

賽前,無論是職業棋手還是科技界,並不看好機器勝利

機器贏了人類,這個結果讓無數人感到吃驚與意外。在這場比賽開始前,很多職業棋手認為 AlphaGo 不可能贏得比賽。棋聖聶衛平在賽前下定論認為:電腦和人下圍棋,百分之百是人贏。

而科技界對 AlphaGo 是否能贏得比賽表示謹慎看好,並沒有十足信心。這從 AlphaGo 創始人德米什 · 哈薩比斯(Demis Hassabis)在第二場比賽結束後的發言可以看出,他當時認為 AlphaGo 的勝利難以置信。

在與李世石對弈前,AlphaGo 於去年 10 月與歐洲圍棋冠軍樊麾進行了對弈,以 5:0 戰勝了樊麾,而在非正式對局當中, 樊麾則 2 次中盤戰勝了 AlphaGo。

這也被外界認為 AlphaGo 很難戰勝李世石的原因。樊麾的等級為職業棋手二段,李世石為職業九段。圍棋界公認,這兩人的圍棋水平為:樊麾是踏在了職業門檻,而李世石則是職業頂尖,前圍棋世界第一人,代表了人類圍棋最高水平。

但僅僅過了 5 個月,AlphaGo 在五番棋中以 3:0 戰勝了李世石,並且在比賽過程中下出了很多令專業人士都非常驚訝的妙手。

很多關注人機大戰的人都想要知道一個問題:

Google是怎麼設計AlphaGo的?

比如,AlphaGo 的運行機理是什麼?進入自我學習的階段之後,谷歌團隊是否還需要人工對其進行不斷的人工優化、改良以及提升?還是完全憑藉其自身的學習能力來提升?

最近兩天 ,DoNews 記者在 Twitter 上就該問題向德米什 · 哈薩比斯進行了兩次提問,但德米什 · 哈薩比斯沒有進行回應。

在對外公布的所有信息中,包括其在《Nature》上發表過的兩篇論文中,都只提到了他們的 AlphaGo 能夠做什麼,都沒有透露 AlphaGo 的運行機制是什麼,即 AlphaGo 到底是怎麼做到的。

德米什 · 哈薩比斯僅透露,就 AlphaGo 的對弈水平而言,他們的神經網絡訓練算法遠比它使用的那些硬體重要得多。此外,這次人機對戰所消耗的計算量差不多與 AlphaGo 和樊輝對弈中消耗的相當,使用的是分布式方案搜尋,能有效節省決策用時。

人工智慧戰勝人類,為何引起這麼多關注?

圍棋這項發源於中國的有兩千年歷史的智力遊戲,曾被認為是最後一個人工智慧不能超越人類的遊戲。圍棋遊戲的規則是:棋盤由縱橫各十九條等距離、垂直交叉的平行線構成。形成 361 個交叉點,在圍棋中簡稱為 「點」。對局雙方各執一色棋子,輪流下子,最後誰佔的點多,誰就贏。

雖然圍棋規則簡單,但建立在此規則之上的各種策略、棋理、布局、定式、手筋、手段,卻是無窮無盡的。

聶衛平曾解釋了其中的原因,圍棋棋盤上有 361 個點,其理論變化值是 361 階乘,階乘到底本身就是一個無限大的數,無法表達。

比如,棋手在下第一手時有 361 個點可以選,下第二手有 360 個點,第三手是 359,361×360×359×……2×1,即 361 階乘。(有數據統計,結果約是 1.43 乘以 10 的 768 次方。)

這個數字有多大呢?Google 靈感來源於一個單詞 Googol,以表示知識之海無窮無盡。Googol 代表 「10 的 100 次方」,這個數字是人類目前最有想像力的數字。即使人類已知宇宙中原子數量,也不過是 10 的 80 次方。

同時,在圍棋對弈中,還包含著很多變化:打二還一,打三還一,打劫,倒撲等,每一種變化都會衍生出無數的變化。

在下棋過程中,棋手需要有一種判斷。而此前,電腦被認為無法承擔這種判斷,因為這不是計算就能夠完成的。

AlphaGo 是怎麼做到的?

AlphaGo 結合了 3 大塊技術:蒙特卡洛樹搜索 (MCTS) 是大框架,這也是很多博弈 AI 都會用的算法;強化學習 (RL) 是學習方法,用來提升 AI 的實力;深度神經網絡 (DNN) 是工具,用來擬合局面評估函數和策略函數。

我們在這裡用比較通俗的語言來解釋一下:棋盤上有 361 個點,AlphaGo 會進行一層層分析:下在哪個點或區域是有利的?這時它會參考輸入的過往的棋譜,對局和模擬,進行選擇、推演,並對推演結果進行估值。AlphaGo 能夠理解會根據「贏」這個目標來進行估值,選擇出一個對「贏」足夠優的解。

圍棋?AI 能超越人類的還有很多.......

AlphaGo 的勝利,引發了大討論。因為人類開始面臨著一個前所未有的情況:人類造出了,在智能的某個點上,超越自己的東西。 通過黑白紋枰上的勝利,AI 已經在人類的智力圍牆打開了第一個缺口,但這絕非最後一個。

在過往漫長的歲月裡,機器都只是人類勞動的一種替代與工具,無論飛機、汽車、起重機還是電子計算機、網際網路,儘管看上去有著無限的能力,但卻從未侵入由人類大腦所把持的領域——「創造」。

而隨著 AlphaGo 的勝利,這一天或許將成為歷史。實際上,過去幾天,這臺人工智慧在圍棋盤上發揮的創造能力,已經超越了人類兩千年於此道上積累的智慧結晶。

如果我們檢索人類的「資源庫」,會發現,複雜程度超越圍棋的智力行為並不多見。這也意味著很多傳統人類腦力勞動的形態,發生改變。很多從事創作、設計、推演、歸納的工作,都將被 AI 部分替代。

如果將思路拓展出去,可以應用在音樂的創作,等其他類似於元素組合式的創造,從某中意義上說,它能夠擊敗圍棋的頂尖高手,也就有可能讓人難辨真假的音樂和旋律。甚至做出更多我們想不到的事情。

按照德米什 · 哈薩比斯的設想,人工智慧未來的主要用途將是醫療、智能助理和機器人。

而人們通過這次比賽擔憂的是,如果人工智慧擁有創造性的思維,加上遠超出人類的運算能力,是否有一天會統治人類。

就像網友評論裡說的段子一樣,「第四局AlphaGo輸了,是不是AlphaGo故意輸的?細思極恐」。(完)

相關焦點

  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」這些專家系統,很多是借用海量人類經驗和數據開發出來的。然而,在有些特定問題上,人類的知識要麼過於昂貴,要麼不靠譜,要麼無法獲得。因此,人工智慧研究的一個長期目標就是跳過這一步,創造能在最有挑戰性的領域,不用人類輸入就達到超人水平的算法。我們發表在《自然》期刊上的最新論文,展示了實現該目標的關鍵一步。
  • 新版Alphago棋風更穩健
    柯潔與Alphago的人機大戰第一場結束,Alphago執白戰勝了柯潔,勝四分之一子。柯潔經過一天的苦戰在失利已成定局的情況下,依舊堅持下完比賽;經過改進的Alphago則依靠穩健的棋風拿下了對手。新版Alphago採用了增強學習的策略,下棋技巧上遠勝初代依靠監督學習戰勝李世石的初代Alphago,它曾化名Master拿下所有高手,加之谷歌在人工智慧底層架構TensorFlow的提升,讓Alphago速度更快。柯潔身為現圍棋世界冠軍,此次也是有備而來,並宣稱用所有的熱情與Alphago進行了對決。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說,主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • AlphaGo Zero戰勝AlphaGo告訴我們什麼?
    AlphaGo通過記住所有圍棋大師的棋術,戰勝了人類;而AlphaGo Zero,只是在最初被輸入基礎算法,它自己按照這個算法迭代成長,最終戰勝了AlphaGo。這是個讓人震驚的結果,意義非凡。由此我們必須深入思考,它告訴了我們什麼?
  • 唯一戰勝AlphaGo一局的人類棋手李世石退役
    2016年3月在首爾的人機大戰中,李世石1-4不敵AlphaGo,但他贏得了人類棋手唯一一次戰勝AlphaGo的一局,也是截止目前的最後一次。
  • AlphaGo再度升級 AlphaGoZero100:0戰勝AlphaGo
    在前段時間人工智慧AlphaGo在國際圍棋賽上擊敗了人類的頂級圍棋選手,讓人工智慧走進了人們的視線,最近AlphaGo有進行了升級完成了AlphaGo Zero。這個AlphaGo Zero究竟怎麼樣?小編和大家一起看看吧。  在前不久,人工智慧AlphaGo在圍棋上戰勝多位人類頂尖棋手的消息吸引了人們的關注。
  • 你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!
    前段時間,阿爾法狗戰勝圍棋天才李世石的消息在網上迅速走紅,當即很多網友稱,在以後,人類再也不能在圍棋界稱霸了,但是幸運的是,阿爾法狗研發公司稱,以後阿爾法狗不會在和人類進行圍棋比賽。可是,你真的以為只有圍棋你們下不過人工智慧機器人嗎?現在就連DOTA你也玩不過它!
  • 徹底擺脫人類,比戰勝柯潔還厲害的AlphaGo要來了
    AlphaGo Zero完全不依賴於人類數據,因此,這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下,在最具挑戰性的領域實現超越人類能力的算法——邁進的一大步。這也是為什麼接下來我們要介紹的這篇論文如此重要——它不僅是很多人期盼已久的技術報告,也是人工智慧一個新的技術節點。在未來,它將得到很多引用,成為無數AI產業和服務的基礎。迄今最強大的圍棋程序:不使用人類的知識DeepMind這篇最新的Nature,有一個樸素的名字——《不使用人類知識掌握圍棋》。
  • 為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行? ​
    為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行?非洲豬瘟病毒並不感染人,但是會摧毀生豬的免疫系統。所以非洲豬瘟病毒不會感染人、馬、牛、羊、雞、鴨、鵝等動物。
  • 柯潔vsAlphaGo圍棋比賽日期時間
    柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。而那個說著「AlphaGo贏不了我」的少年,終於站到了AI面前。  其中,人機配對賽將由連笑和古力與AlphaGo組隊,了解人類如何與AI配合。而團隊人機賽則是由羋昱廷、時越、唐韋星、周睿羊、陳耀燁五位棋手組隊,聯手向AlphaGo發起挑戰。
  • AlphaGo戰勝李世石:機器人的勝利意義無需放大
    在開局上,李世石保持了主動權,機器人AlphaGo的發揮與人類頂尖高手的差距仍然不小。機器人AlphaGo最大的優勢在狀態穩定和超凡的計算能力,無論何種情況下,都能不受環境因素幹擾而保持清醒的頭腦,而這恰恰是人類所無法比擬的。儘管機器人AlphaGo也會在某些環節出現判斷不佳的情況,但只是最優和次優之間作出選擇的問題,並不會出現原則性的致命失誤。
  • ...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master
    AlphaGo Zero 的開發使用了許多與 AlphaGo Master 相似的方法,但在開始進行自玩遊戲之前,它就開始被使用人類數據進行訓練。值得注意的是,儘管 AlphaGo Zero 在幾周的訓練中掌握了幾個關鍵概念,但它的學習方式不同於人類棋手。此外,AlphaGo Zero 比之前產品的學習能力高效得多。
  • AlphaGo並不是第一個戰勝人類冠軍的機器。早在23年前,就曾有過
    圍棋界公認阿爾法圍棋的棋力已經超過人類職業圍棋頂尖水平,在GoRatings網站公布的世界職業圍棋排名中,其等級分曾超過排名人類第一的棋手柯潔。人工智慧在圍棋領域大放異彩。然而在23年前,人機對戰早已上演。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆:完全拋開人類圍棋知識,去年論文裡提到的許多特徵和rollout全部去掉,兩個神經網絡合為一個,只給定棋盤、棋子和規則。
  • AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?
    早在20世紀90年代,IBM的深藍超級計算機已經戰勝了西洋棋世界冠軍。但是相比圍棋,西洋棋或跳棋等遊戲就顯得小兒科。圍棋棋盤上的可能性是個天文數字,據推測和已知宇宙中原子數量相當,這導致圍棋無法預測,也無法蠻力解決。
  • 李世石出現「神之一手」 第四局戰勝AlphaGo
    13日下午,谷歌人工智慧「阿爾法圍棋」(AlphaGo)與韓國棋手李世石繼續在韓國首爾鍾路區四季酒店進行第四場較量,經過4個多小時的比賽,最終李世石戰勝AlphaGo迎來首勝,終結三連敗的同時將比分扳成以1:3。今天的第四局比賽,李世石執白終於戰勝AlphaGo,為人類也更為他自己贏得一局可以保留顏面的勝利。