輸了!今天這場據說賭上了「人類最後尊嚴」的人機圍棋大賽第一局落下帷幕,結果是計算機獲勝!很多人表示出乎意料之外……
3月9日下午,韓國首爾四季酒店,在一場關乎競技、算法、AI(人工智慧)發展乃至哲學的圍棋「人機大戰」中,代表人類出戰的韓國著名棋手李世石九段不敵AlphaGo(阿爾法圍棋,是一款圍棋人工智慧程序,也被中國網友親切稱為「阿爾法狗」)。人類智慧先丟一局。
如今網友也不得不接受這個事實:
吉力馬札羅的Pig:機器人贏了還好最怕的是機器人故意輸了
怡紅水木生:在這千鈞一髮的時刻,機智的李世石放出了終極大招:拔插頭!阿爾法卒。
Gisar_喜兒:圍棋人機大戰第一場以機器勝出告終。從整個過程看,機器贏在了其定式,而人則輸在了情緒。對於人而言,是不可能不受到情緒波動幹擾的,在局面好與不好的情況下都會出現情緒波動,從而影響到穩定性的發揮。機器則不會這樣,無論領先還是落後,依然是按照既定的程式分析決策。情緒是人與機器的根本區別。
諸葛紫默:你們人類也真是的,不就是贏了一場嗎?倫家就從「阿爾法」變成「阿爾法狗」了
衛樂含:凡是具有明確規則的智力遊戲,程序都有人類無法比擬的優勢,計算的深度,沒有心理、體能等,期待接下來的兩局機器人能否全勝
seaborne:狗勝呀,你總算熬出頭啦
3月9日下午3點30分,人機世紀大戰第一場結束,谷歌人工智慧系統AlphaGo挑戰世界圍棋冠軍李世石成功,李世石認輸。
第一局棋是最大的懸念,誰都不知道AlphaGo的棋力有多大的進展。從開局來看,李世石九段下了一個很不同尋常的開局,機器的回應也不是人類正常的反應,也是下出意外的布局。
開局之初,AlphaGo與李世石的對攻就顯得驚心動魄,一度AlphaGo還處於領先位置,不過,在「開戰」2個小時後,李世石的優勢逐漸開始明顯,AlphaGo陷入到劣勢。
△完整棋譜
中國圍棋世界冠軍古力點評說,從今天來看,AlphaGo圍棋水平首先比歐洲冠軍樊麾要強,已經具備職業強手的素質,但是細節方面剛好離專業差一點。
AlphaGo處於業餘六七段。
不過,到比賽進行到第三個小時時,棋局又發生了很大變化,AlphaGo反而越戰越勇,還後發而至,與李世石又形成僵持局面,甚至還佔有優勢。李世石面臨的局勢又變得非常兇險。
在對抗AlphaGo贏面已非常大的情況下,李世石過於求穩,反而被AlphaGo追上,且出現明顯失誤,損失三目棋。現場解說員表示,AlphaGo與李世石這一番廝殺,自己都受不了了。
李世石似乎也出現情緒上的波動。機器與圍棋手的對抗會給圍棋手的心理帶來很大變化。
此前對抗AlphaGo失敗的歐洲圍棋冠軍樊麾也表示,對面和你下棋的不是人,這個就顯得很彆扭。「兩個人下棋的時候,你常常會觀察和琢磨對方的情感和心理。對方是緊張了,害怕了,你在想像對方的同時,這種作用對方也會感到到,折射回來。」
最終李世石投子認負。
李世石,韓國職業圍棋選手。1983年生於韓國全羅南道,1995年入段,2003年升為九段。李世石的圍棋生涯戰功赫赫,棋風「穩,準,狠」。
為什麼此次「人機大戰」中谷歌選擇了李世石呢?李世石是韓國圍棋九段選手,也是近10年來獲得世界冠軍最多的棋手。而接受AlphaGo圍棋挑戰,李世石也只考慮了不到5分鐘,原因是「出於對『AlphaGo』的好奇」。
圍棋被認為是人類發明的最複雜的遊戲,一個古老而震撼人心的問題再次被提出:機器人能夠戰勝人類嗎?被戲稱為「人族代表」的李世石也在採訪中表示,要「捍衛人類的尊嚴」。
△李世石帶女兒入場
AlphaGo的強大在於模擬人類大腦的神經元結構,如何結合深度學習與強化學習兩套神經網絡,簡單來說,一方面它迅速汲取10萬圍棋高手的棋局,充分利用人類棋手的即有經驗;另一方面是「左右互搏」,每天跟自己(不同的分身)下上幾十萬盤,在不斷的試錯中自我完善、自我進化……而左右互搏,自我冥想對弈恰恰也是李世石賽前備戰的方法。
儘管這場比賽是5盤3勝,下滿5盤,然而在人工智慧領域的科學家看來,AlphaGo並不需要拿下整場比賽,甚至在5盤中拿下1盤其實就取得了勝利。
英國《衛報》稱,帝國理工學院認知機器人學教授穆雷·沙那罕認為在AlphaGo戰勝樊麾後,已經說明了「AI在發展中達到了一個重要的裡程碑」,而只要戰勝李世石這位頂尖棋手一盤,就證明「人工智慧已經取得了驚人的成就,它可以在短時間裡不斷學習,變得更加強大。」
與「人機大戰」一樣火爆的話題是,AlphaGo贏下比賽能否證明人工智慧已經超越人類?
復旦大學哲學學院教授、人工智慧哲學專家徐英瑾在接受採訪時指出,即便李世石輸掉比賽,這並不意味著人工智慧已比人類聰明。
徐英瑾舉了個例子,AlphaGo是訓練了2000萬局棋後,才能戰勝職業圍棋選手,而一個人在成長為職業九段高手前,訓練的棋局數量遠小於2000萬。
「儘管擁有了深度學習能力,但它勝過人類的主要原因仍和以前的電腦程式一樣:運算速度快、不受生物屬性限制。」
而從與李世石的第一盤比賽來看,AlphaGo就像李世石說的那樣,「過分拘泥於局部價值,欠缺整體的完善感。」也就是說,尚欠大局觀,這也與它自我學習的方式有關。
1996年,世界西洋棋冠軍卡斯帕羅夫與 IBM 的 「 深藍 」電腦,進行較量
雖然,對戰的第一局就敗給了 「 深藍 」 ,但最後卡斯帕羅夫還是以總比分 4:2 的結果,碾壓了人工智慧。
就在人們揶揄嘲笑人工智慧的時候。。。
1997年, 「 深藍 」 與卡斯帕羅夫再戰,卡斯帕羅夫以1勝2負3平 敗給了人工智慧。。。
2008年,在賭城拉斯維加斯,一臺名為 「 北極星2 」 的電腦,在德州撲克上連續擊敗了6名頂級職業選手。
要是以後能帶著這臺機器去賭場的話。。。
呸呸呸。。怎麼能生出這種邪念呢,好歹用猜拳來贏得世界啊。。。
喂喂喂,說好的純靠運氣呢,一臺猜拳永遠不會輸的機器人居然通過觀察,能在極短的時間內分析出對手的手勢,迅速出拳,未有敗績。
據悉阿法狗有兩套學習功能,第一個是對高手棋譜的學習,第二個是自我對弈。
計算機可以利用自己存儲和運算的優勢將無數棋譜記住,而且在去年11月份,谷歌的阿法狗已經自行對弈了3000萬盤了。。。直到現在應該也還沒有停下來吧。。。
阿法狗還具備 「 深度學習 」 這項神經網絡技術,它是可以模擬人腦中神經元網絡的軟硬體網絡。
神經網絡不會依靠蠻力或預先輸入的規則,而是會分析大量數據,「學習」特定的方法。
從而可以獲得下面的能力:
第一步快速判斷:用於快速的觀察圍棋的盤面,類似於人觀察盤面獲得的第一反應
第二步深度模仿 :AlphaGo學習近萬盤人類歷史高手的棋局來進行模仿學習,用得到的經驗進行判斷。這個深度模仿能夠根據盤面產生類似人類棋手的走法。
第三步自學成長:AlphaGo不斷與「自己」對戰,下了3000萬盤棋局,總結出經驗作為棋局中的評估依據。
第四步全局分析:利用第三步學習結果對整個盤面的贏面判斷,實現從全局分析整個棋局。
嗯哼,可能谷歌給阿法狗的戰術就是,利用開局庫和殘局庫將與其對弈的選手趕到一個套路裡,然後按著套路下棋,選手改變策略時,它也換成與之相敵的方法。
當然到底機器人先進到何種程度,還是要看接下來的比賽。
先回顧下比賽規則:
7天5盤棋,不許請假,必須下完,中間不能休息刷朋友圈
谷歌為這次比賽埋了大單,獎金100萬美元,還有追加獎勵,7天下5盤棋,每天4-5個小時,中間不設休息。關鍵是谷歌還設定了一個特殊規則:即使李世石3比0領先、按照5局3勝已經贏了,剩下兩盤也要下完。(據說是為了讓阿爾法狗多學點套路……)
昨天在首爾的賽前最後一次新聞發布會,谷歌方面就表示,這套系統就是通過與頂尖高手的對決去測試人工智慧是否存在瓶頸。人類在學習圍棋的過程中會有導師指導,但AlphaGo除了已有的數據以外,沒有導師來告訴它哪一步棋是正確的,所以每盤和頂尖高手的對決,都是它完善系統、擴充資料庫的好機會。
人機大戰圍觀指南
● 賽程:第一局3月9日、第二局3月10日、第三局3月12日、第四局3月13日、第五局3月15日,北京時間12時開賽。
● 賽制:比賽採用中國規則,黑貼3又3/4子(黑貼7目半)。比賽用時每方2小時,1分鐘讀秒3次。
● 獎金:5局3勝,勝者可獲100萬美元獎金。另外,李世石下滿5局可獲15萬美元出場費,每勝一局可獲2萬美元勝局獎金。如果李世石5戰全勝,最多可獲得125萬美元。
明天12:00 (韓國時間13:00),雙方將在同一場地進行第二局比賽,你認為誰會贏?
來源:央視新聞、都市快報、鳳凰新聞、新浪微博、差評(chaping321)等