AlphaGo 為什麼能戰勝人類?

2020-11-24 donews

DoNews 3月14日消息（記者周勤燕）在13日結束的AlphaGo與李世石五番棋對決中的第四局，李世石勝出。連敗三局之後，人類終於扳回一局。但這場勝利來得有些遲，AlphaGo此前已經痛快得贏得這場人機大賽的勝利。這場生生奪走一周眼球的人機圍棋大戰，人們最想追問的是，AlphaGo為什麼能戰勝人類？

賽前，無論是職業棋手還是科技界，並不看好機器勝利

機器贏了人類，這個結果讓無數人感到吃驚與意外。在這場比賽開始前，很多職業棋手認為 AlphaGo 不可能贏得比賽。棋聖聶衛平在賽前下定論認為：電腦和人下圍棋，百分之百是人贏。

而科技界對 AlphaGo 是否能贏得比賽表示謹慎看好，並沒有十足信心。這從 AlphaGo 創始人德米什 · 哈薩比斯（Demis Hassabis）在第二場比賽結束後的發言可以看出，他當時認為 AlphaGo 的勝利難以置信。

在與李世石對弈前，AlphaGo 於去年 10 月與歐洲圍棋冠軍樊麾進行了對弈，以 5：0 戰勝了樊麾，而在非正式對局當中, 樊麾則 2 次中盤戰勝了 AlphaGo。

這也被外界認為 AlphaGo 很難戰勝李世石的原因。樊麾的等級為職業棋手二段，李世石為職業九段。圍棋界公認，這兩人的圍棋水平為：樊麾是踏在了職業門檻，而李世石則是職業頂尖，前圍棋世界第一人，代表了人類圍棋最高水平。

但僅僅過了 5 個月，AlphaGo 在五番棋中以 3：0 戰勝了李世石，並且在比賽過程中下出了很多令專業人士都非常驚訝的妙手。

很多關注人機大戰的人都想要知道一個問題：

Google是怎麼設計AlphaGo的？

比如，AlphaGo 的運行機理是什麼？進入自我學習的階段之後，谷歌團隊是否還需要人工對其進行不斷的人工優化、改良以及提升？還是完全憑藉其自身的學習能力來提升？

最近兩天，DoNews 記者在 Twitter 上就該問題向德米什 · 哈薩比斯進行了兩次提問，但德米什 · 哈薩比斯沒有進行回應。

在對外公布的所有信息中，包括其在《Nature》上發表過的兩篇論文中，都只提到了他們的 AlphaGo 能夠做什麼，都沒有透露 AlphaGo 的運行機制是什麼，即 AlphaGo 到底是怎麼做到的。

德米什 · 哈薩比斯僅透露，就 AlphaGo 的對弈水平而言，他們的神經網絡訓練算法遠比它使用的那些硬體重要得多。此外，這次人機對戰所消耗的計算量差不多與 AlphaGo 和樊輝對弈中消耗的相當，使用的是分布式方案搜尋，能有效節省決策用時。

人工智慧戰勝人類，為何引起這麼多關注？

圍棋這項發源於中國的有兩千年歷史的智力遊戲，曾被認為是最後一個人工智慧不能超越人類的遊戲。圍棋遊戲的規則是：棋盤由縱橫各十九條等距離、垂直交叉的平行線構成。形成 361 個交叉點，在圍棋中簡稱為「點」。對局雙方各執一色棋子，輪流下子，最後誰佔的點多，誰就贏。

雖然圍棋規則簡單，但建立在此規則之上的各種策略、棋理、布局、定式、手筋、手段，卻是無窮無盡的。

聶衛平曾解釋了其中的原因，圍棋棋盤上有 361 個點，其理論變化值是 361 階乘，階乘到底本身就是一個無限大的數，無法表達。

比如，棋手在下第一手時有 361 個點可以選，下第二手有 360 個點，第三手是 359，361×360×359×……2×1，即 361 階乘。（有數據統計，結果約是 1.43 乘以 10 的 768 次方。）

這個數字有多大呢？Google 靈感來源於一個單詞 Googol，以表示知識之海無窮無盡。Googol 代表「10 的 100 次方」，這個數字是人類目前最有想像力的數字。即使人類已知宇宙中原子數量，也不過是 10 的 80 次方。

同時，在圍棋對弈中，還包含著很多變化：打二還一，打三還一，打劫，倒撲等，每一種變化都會衍生出無數的變化。

在下棋過程中，棋手需要有一種判斷。而此前，電腦被認為無法承擔這種判斷，因為這不是計算就能夠完成的。

AlphaGo 是怎麼做到的?

AlphaGo 結合了 3 大塊技術：蒙特卡洛樹搜索 (MCTS) 是大框架，這也是很多博弈 AI 都會用的算法；強化學習 (RL) 是學習方法，用來提升 AI 的實力；深度神經網絡 (DNN) 是工具，用來擬合局面評估函數和策略函數。

我們在這裡用比較通俗的語言來解釋一下：棋盤上有 361 個點，AlphaGo 會進行一層層分析：下在哪個點或區域是有利的？這時它會參考輸入的過往的棋譜，對局和模擬，進行選擇、推演，並對推演結果進行估值。AlphaGo 能夠理解會根據「贏」這個目標來進行估值，選擇出一個對「贏」足夠優的解。

圍棋？AI 能超越人類的還有很多.......

AlphaGo 的勝利，引發了大討論。因為人類開始面臨著一個前所未有的情況：人類造出了，在智能的某個點上，超越自己的東西。通過黑白紋枰上的勝利，AI 已經在人類的智力圍牆打開了第一個缺口，但這絕非最後一個。

在過往漫長的歲月裡，機器都只是人類勞動的一種替代與工具，無論飛機、汽車、起重機還是電子計算機、網際網路，儘管看上去有著無限的能力，但卻從未侵入由人類大腦所把持的領域——「創造」。

而隨著 AlphaGo 的勝利，這一天或許將成為歷史。實際上，過去幾天，這臺人工智慧在圍棋盤上發揮的創造能力，已經超越了人類兩千年於此道上積累的智慧結晶。

如果我們檢索人類的「資源庫」，會發現，複雜程度超越圍棋的智力行為並不多見。這也意味著很多傳統人類腦力勞動的形態，發生改變。很多從事創作、設計、推演、歸納的工作，都將被 AI 部分替代。

如果將思路拓展出去，可以應用在音樂的創作，等其他類似於元素組合式的創造，從某中意義上說，它能夠擊敗圍棋的頂尖高手，也就有可能讓人難辨真假的音樂和旋律。甚至做出更多我們想不到的事情。

按照德米什 · 哈薩比斯的設想，人工智慧未來的主要用途將是醫療、智能助理和機器人。

而人們通過這次比賽擔憂的是，如果人工智慧擁有創造性的思維，加上遠超出人類的運算能力，是否有一天會統治人類。

就像網友評論裡說的段子一樣，「第四局AlphaGo輸了，是不是AlphaGo故意輸的？細思極恐」。（完）

相關焦點

柯潔回應新版本AlphaGo問世:人類太多餘了

對此，柯潔回應稱：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」這些專家系統，很多是借用海量人類經驗和數據開發出來的。然而，在有些特定問題上，人類的知識要麼過於昂貴，要麼不靠譜，要麼無法獲得。因此，人工智慧研究的一個長期目標就是跳過這一步，創造能在最有挑戰性的領域，不用人類輸入就達到超人水平的算法。我們發表在《自然》期刊上的最新論文，展示了實現該目標的關鍵一步。
新版Alphago棋風更穩健

柯潔與Alphago的人機大戰第一場結束，Alphago執白戰勝了柯潔，勝四分之一子。柯潔經過一天的苦戰在失利已成定局的情況下，依舊堅持下完比賽；經過改進的Alphago則依靠穩健的棋風拿下了對手。新版Alphago採用了增強學習的策略，下棋技巧上遠勝初代依靠監督學習戰勝李世石的初代Alphago，它曾化名Master拿下所有高手，加之谷歌在人工智慧底層架構TensorFlow的提升，讓Alphago速度更快。柯潔身為現圍棋世界冠軍，此次也是有備而來，並宣稱用所有的熱情與Alphago進行了對決。
能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了

谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》（Nature）上發表論文，宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習，其水平超過此前所有AlphaGo（阿爾法狗）。
谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

谷歌團隊發布AlphaGo Zero：柯潔稱人類太多餘了（圖片來自於推特）在這款軟體發出之後，柯潔也對這款軟體發表了自己的看法，他認為：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說，主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
AlphaGo 圍棋教學工具已發布

在Deepmind所謂的「教學工具」發布之前，小編曾在腦海出現萬千猜想……但今天揭底才知道，原來只是一個平平淡淡的網頁……（建議複製到電腦上打開，因為據有的棋友反映手機打不開，小編這裡實測手機能打開，只是讀取了較長時間）
柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

【文/觀察者網周遠方】昨夜，「半狗」柯潔贏了一隻41連勝的「小狗」，輾轉難眠…… 他在今天（18日）凌晨0時23分發微博感嘆：一個AI滿地走的時代...除了alphago以外，這個暱稱為「符合預期」的AI尤其強，實力應該已經遠超當時與李世石對弈的alphago了吧？...
柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo

人類AI圍棋之爭，還在繼續。今年5月底，人機圍棋大戰終極對決，最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後，柯潔在接受採訪時直言，AlphaGo太完美，看不到任何勝利的希望。
AlphaGo Zero戰勝AlphaGo告訴我們什麼?

AlphaGo通過記住所有圍棋大師的棋術，戰勝了人類；而AlphaGo Zero，只是在最初被輸入基礎算法，它自己按照這個算法迭代成長，最終戰勝了AlphaGo。這是個讓人震驚的結果，意義非凡。由此我們必須深入思考，它告訴了我們什麼？
唯一戰勝AlphaGo一局的人類棋手李世石退役

2016年3月在首爾的人機大戰中，李世石1-4不敵AlphaGo，但他贏得了人類棋手唯一一次戰勝AlphaGo的一局，也是截止目前的最後一次。
AlphaGo再度升級 AlphaGoZero100:0戰勝AlphaGo

在前段時間人工智慧AlphaGo在國際圍棋賽上擊敗了人類的頂級圍棋選手，讓人工智慧走進了人們的視線，最近AlphaGo有進行了升級完成了AlphaGo Zero。這個AlphaGo Zero究竟怎麼樣?小編和大家一起看看吧。　　在前不久，人工智慧AlphaGo在圍棋上戰勝多位人類頂尖棋手的消息吸引了人們的關注。
你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!

前段時間，阿爾法狗戰勝圍棋天才李世石的消息在網上迅速走紅，當即很多網友稱，在以後，人類再也不能在圍棋界稱霸了，但是幸運的是，阿爾法狗研發公司稱，以後阿爾法狗不會在和人類進行圍棋比賽。可是，你真的以為只有圍棋你們下不過人工智慧機器人嗎？現在就連DOTA你也玩不過它！
徹底擺脫人類,比戰勝柯潔還厲害的AlphaGo要來了

AlphaGo Zero完全不依賴於人類數據，因此，這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下，在最具挑戰性的領域實現超越人類能力的算法——邁進的一大步。這也是為什麼接下來我們要介紹的這篇論文如此重要——它不僅是很多人期盼已久的技術報告，也是人工智慧一個新的技術節點。在未來，它將得到很多引用，成為無數AI產業和服務的基礎。迄今最強大的圍棋程序：不使用人類的知識DeepMind這篇最新的Nature，有一個樸素的名字——《不使用人類知識掌握圍棋》。
為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行?

為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行？非洲豬瘟病毒並不感染人，但是會摧毀生豬的免疫系統。所以非洲豬瘟病毒不會感染人、馬、牛、羊、雞、鴨、鵝等動物。
柯潔vsAlphaGo圍棋比賽日期時間

柯潔 vs AlphaGo圍棋比賽日期時間介紹：　　這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」，讓人們期待了足足一年有餘。而那個說著「AlphaGo贏不了我」的少年，終於站到了AI面前。　　其中，人機配對賽將由連笑和古力與AlphaGo組隊，了解人類如何與AI配合。而團隊人機賽則是由羋昱廷、時越、唐韋星、周睿羊、陳耀燁五位棋手組隊，聯手向AlphaGo發起挑戰。
AlphaGo戰勝李世石:機器人的勝利意義無需放大

在開局上，李世石保持了主動權，機器人AlphaGo的發揮與人類頂尖高手的差距仍然不小。機器人AlphaGo最大的優勢在狀態穩定和超凡的計算能力，無論何種情況下，都能不受環境因素幹擾而保持清醒的頭腦，而這恰恰是人類所無法比擬的。儘管機器人AlphaGo也會在某些環節出現判斷不佳的情況，但只是最優和次優之間作出選擇的問題，並不會出現原則性的致命失誤。
...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master

AlphaGo Zero 的開發使用了許多與 AlphaGo Master 相似的方法，但在開始進行自玩遊戲之前，它就開始被使用人類數據進行訓練。值得注意的是，儘管 AlphaGo Zero 在幾周的訓練中掌握了幾個關鍵概念，但它的學習方式不同於人類棋手。此外，AlphaGo Zero 比之前產品的學習能力高效得多。
AlphaGo並不是第一個戰勝人類冠軍的機器。早在23年前,就曾有過

圍棋界公認阿爾法圍棋的棋力已經超過人類職業圍棋頂尖水平，在GoRatings網站公布的世界職業圍棋排名中，其等級分曾超過排名人類第一的棋手柯潔。人工智慧在圍棋領域大放異彩。然而在23年前，人機對戰早已上演。
AlphaGo Zero用40天成為世界最強圍棋AI

棋士柯潔：一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆：完全拋開人類圍棋知識，去年論文裡提到的許多特徵和rollout全部去掉，兩個神經網絡合為一個，只給定棋盤、棋子和規則。
AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?

早在20世紀90年代，IBM的深藍超級計算機已經戰勝了西洋棋世界冠軍。但是相比圍棋，西洋棋或跳棋等遊戲就顯得小兒科。圍棋棋盤上的可能性是個天文數字，據推測和已知宇宙中原子數量相當，這導致圍棋無法預測，也無法蠻力解決。
李世石出現「神之一手」第四局戰勝AlphaGo

13日下午，谷歌人工智慧「阿爾法圍棋」(AlphaGo)與韓國棋手李世石繼續在韓國首爾鍾路區四季酒店進行第四場較量，經過4個多小時的比賽，最終李世石戰勝AlphaGo迎來首勝，終結三連敗的同時將比分扳成以1:3。今天的第四局比賽，李世石執白終於戰勝AlphaGo，為人類也更為他自己贏得一局可以保留顏面的勝利。

AlphaGo 為什麼能戰勝人類?

相關焦點

柯潔回應新版本AlphaGo問世:人類太多餘了

新版Alphago棋風更穩健

能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

AlphaGo 圍棋教學工具已發布

柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo

AlphaGo Zero戰勝AlphaGo告訴我們什麼?

唯一戰勝AlphaGo一局的人類棋手李世石退役

AlphaGo再度升級 AlphaGoZero100:0戰勝AlphaGo

你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!

徹底擺脫人類,比戰勝柯潔還厲害的AlphaGo要來了

為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行? ​

柯潔vsAlphaGo圍棋比賽日期時間

AlphaGo戰勝李世石:機器人的勝利意義無需放大

...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master

AlphaGo並不是第一個戰勝人類冠軍的機器。早在23年前,就曾有過

AlphaGo Zero用40天成為世界最強圍棋AI

AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?

李世石出現「神之一手」 第四局戰勝AlphaGo

能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了

為什麼人類的免疫系統能戰勝非洲豬瘟病毒但是豬卻不行?

李世石出現「神之一手」第四局戰勝AlphaGo