圍棋人機大戰一周年:被AlphaGo改變的世界

2021-01-20 量子位
舒石、若樸 發自 凹非寺
量子位·QbitAI 報導

去年今日,三連敗的李世乭扳回一局。

然而這一針興奮劑很快失效,隨後李世乭再折一陣,最終以1:4輸給AlphaGo。在圍棋的人機大戰中,頂級人類選手完敗給人工智慧。

人工智慧一戰成名,李世乭留下落寞側影。為AlphaGo落子的黃士傑一年後回憶說:「當時我代表AlphaGo下棋,必須保持冷靜」。

從那時起到現在,人類始終生活在一個被AlphaGo改變的世界。

一年回望

站在圍棋人機大戰一周年的節點上,該如何回顧過去、展望未來呢?量子位先把幾個問題拋給創新工場AI工程院副院長王詠剛。

量子位:一年後再看AlphaGo有何改變?有什麼記憶猶新的片段?

王詠剛:AlphaGo出世一年,其實進入大家視野的是三個版本:5:0擊敗樊麾的內測版本,4:1擊敗李世石的版本,以Master網名60:0快棋挑落中日韓高手的版本。三個版本演進脈絡明顯,每次迭代都有重大升級。

最震撼的是計算機在人類傳統認為極其玄妙的、電腦無法掌握的「大局觀」上突飛猛進,遠遠將人類選手甩在身後。電腦計算「大局觀」的方式,和人類培養「大局觀」的思路,有根本的差別。人類沒可能在這方面趕上電腦。

和樊麾對局的棋譜基本上還看不出AlphaGo的大局觀有多強,和李世石對局就下出了聶衛平讚不絕口的五路肩衝,到了Master的60局,大局觀體現在兩個地方:

1)從始至終對局勢的把握,比如第60局古力用AlphaGo的思路對付AlphaGo,把中央撐得很滿,但AlphaGo不緊不慢,總是恰到好處地保持勝勢。

2)已經深刻影響人類對布局的思考,大飛守角之類的變化迅速被人類棋手模仿,這和當年深藍問世後,西洋棋的布局革命是一樣的。

量子位:過去一年,有什麼具體產品或研究,是基於AlphaGo的麼?

王詠剛:AlphaGo用的是AI領域應用非常普遍的算法:深度學習、蒙特卡洛算法、增強學習等。

從概念上可以說,機器視覺相關的深度學習技術,包含環境-決策-反饋的智能系統,裡面都有AlphaGo的影子。當然,直接的代碼實現層面,肯定沒有複製、粘貼這樣直接借用的關係,因為AlphaGo的深度學習模型畢竟是圍繞圍棋的特徵建立的。

DeepMind去年發布的讀唇術LipNet,與英國國家醫療服務體系NHS合作推出的醫療輔助應用Streams,與眼科醫院合作幫助眼部疾病診斷等等,可以說都是與AlphaGo同源的技術。

量子位:AlphaGo是否已經攻克圍棋?未來可提升的空間還有哪些?

王詠剛:「攻克圍棋」,如果說戰勝人類選手的話,AlphaGo已經實現了,而且現在「絕藝」,DeepZen之類的程序對人類勝率也很高了。

未來最多三年必將發生的是,手機上的本地APP就可以戰勝人類職業高手,現在熱鬧的網上圍棋對弈平臺都會死掉(因為對手可以輕易用手機作弊),人類圍棋將回歸現場競賽,圍棋培訓講師將更重視普及教育,因為中高級的提高訓練完全可以用機器代練。

不過,如果說「攻克圍棋」是像計算機可以窮舉西洋跳棋的所有變化那樣,讓電腦成為圍棋「上帝」,這個應該還不大可能。現在AI大部分的招數,還在人類高手可以理解的範疇內。AI也有一些可疑的「弱點」,比如官子水平到底如何等等。

以後AI和AI之間的競賽,應該會不斷促進AI提高(但這種沒有太多商業利益的事情,有沒有持續投入是個問題)。人類應該望塵莫及,但可以不斷從AI中學習新的思想。

不止下棋

「AlphaGo給大家最大啟發,不是贏棋,而是如何構建一個智商超過300的機器」,HTC負責研發及醫療的總裁、原Google中國工程院副院長張智威說。

構建的方法有兩個:一是訓練、二是數據。張智威最近在清華的一次分享(傳送門)中說,「如果能做好這件事,各位都是億萬富翁。最近兩年,我們每天都在想,哪些領域可以拿到無限的數據」。


而在AAAI Fellow、IEEE Fellow、香港科技大學楊強教授看來,DeepMind在創造AlphaGo的過程中,引入一個新的概念:利用深度學習+強化學習,來判斷現狀和預測未來。這與未來的商業模式有著明確的關聯:

通過對大數據的分析,對現實的判斷和對商業未來走向進行預估。

楊強還試圖基於AlphaGo歸納出一套人工智慧的應用流程:算法的目標是什麼?有沒有數據?數據在哪裡?問題的邊界是否清晰?什麼叫合理的走法、什麼叫犯規的走法?你的特徵在哪裡?又如何得到這些特徵?是否可以得到一個持續的反饋?

但也有人沿著另一條路前進。

圍棋也好、西洋棋也好、國際跳棋也好,所有這些都是完美信息博弈。現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。

今年初,在德州撲克的人機大戰中,人工智慧Libratus擊敗了四位頂級人類玩家。創造了這個AI的卡內基梅隆大學Sandholm教授說,能夠處理不完美信息的AI,未來可以用於商業談判、網絡安全、醫療方案制定等領域。

人工智慧發展的終極目標,是通用人工智慧(AGI)。通用人工智慧可以解決任何一個問題。想要實現AGI就得讓人工智慧學會解決不確定性問題,這也是德州撲克人機大戰的重大意義之一。

對於已屆不惑的Demis Hassabis來說,創立DeepMind的目標絕不僅限於創造AlphaGo。過去的一年裡,DeepMind還搞出了很多有意思的創新。

比方說可以模擬任意一種人類聲音的WaveNet;以及與英國國家醫療服務體系合作,使用人工智慧來改善醫療行業等。

繼續戰鬥

過去的一年裡,僅僅在圍棋界,出彩的人工智慧就不止AlphaGo一家。比方說量子位此前報導過的首個圍棋十段:騰訊絕藝(傳送門),就是一個AI。

而對於AlphaGo來說,挑戰也還沒結束。

現在的圍棋江湖裡,中日韓三強中,無疑中國軍團佔據了絕對的優勢。剛剛結束的第18屆農心杯三國圍棋擂臺賽上,中國隊僅上場兩位選手,就將日韓兩隊悉數全滅。連笑、柁嘉熹、柯潔等重量級棋手尚未登場,就已經拿下冠軍。

不在正式場合對陣世界排名第一的柯潔,對於AlphaGo來說始終不夠完美。去年AlphaGo挑戰李世乭前,各方還就誰贏誰輸打賭。

當時《連線》記者在報導中描述道:

一位名叫周峰的中國記者在觀戰室攔下了我,開心地和我這種將AlphaGo視為科技奇蹟而非圍棋殺手的人進行對話。

但是當我詢問看見李世石輸了比賽他作何感想時,他指著心口說:「我很難過。」

四月,新的人機大戰又要啟幕了。

量子位很想問問,如果柯潔這次也輸給AlphaGo,周峰還會特別難過麼?

這一次,在人工智慧和人類頂級高手之間,你覺得誰會贏呢?

「我們不關心輸贏。輸贏其實不用看的,AI想贏它就肯定能贏」,雲從CEO周曦說,「關鍵問題是AlphaGo會不會有些新的想法」。

好戲又要上演,而未來的人機大戰,勢必不止於圍棋。

插播廣告

還有個大新聞:《馬雲爸爸神秘計劃曝光,組建新團隊研發人工智慧》

詳情見量子位微信公眾號(ID:QbitAI)今日推送的二條。

今天AI還搞了哪些大新聞?
在量子位(QbitAI)公眾號會話界面回復「今天」,看我們全網搜羅的AI新鮮資訊。比心❤~

△ 掃碼強行關注『量子位』

追蹤人工智慧領域最勁內容

相關焦點

  • 柯潔迎戰谷歌AlphaGo!圍棋人機大戰直播地址
    【PConline資訊】在今天10點30分,中國棋手、當今世界圍棋第一人柯潔將會迎戰AlphaGo,這是一場備受關注的比賽。柯潔是近年來排名世界第一的圍棋選手,而AlphaGo則是當今最強的圍棋AI,可以說是超越人類的存在,在公開比賽中曾經擊敗李世石,並以「Master」的ID連勝包括柯潔在內的圍棋好手。谷歌谷歌柯潔與谷歌AlphaGo的對決吸引了全世界的關注,而早上的開幕式中包括柯潔、古力、陳耀燁、周睿羊、時越、唐韋星、羋昱廷、連笑等中國棋手到場,各路媒體記者圍拍。
  • 人機大戰兩周年紀念:阿爾法狗揭開圍棋新時代序幕
    不公開進行的對局,被冠以「圍棋人機大戰」名號的正式比賽只有兩次——2016年3月AlphaGo與李世石在韓國的五番棋大戰,以及2017年5月AlphaGo與柯潔在中國的三番棋、與周睿羊等五位世界冠軍的一對多和表演賽性質的配對賽AlphaGo+古力對AlphaGo+連笑,總共也是五盤棋。
  • 人機大戰:AlphaGo贏 世界圍棋冠軍李世石首場認輸
    3月9日下午3點30分,人機世紀大戰第一場結果公布,谷歌人工智慧系統AlphaGo挑戰世界圍棋冠軍李世石成功,李世石認輸。這次比賽採用中方的圍棋規則,黑貼3又3/4子(黑貼7目半)。每位棋手各有兩個小時布局時間,3次60秒的讀秒,每場比賽預計需要大約4-5個小時。
  • 各方熱議"圍棋人機大戰" 柯潔:AlphaGo贏不了我
    各方熱議"圍棋人機大戰" 柯潔:AlphaGo贏不了我 2016-03-09 17:13:08   中新網3月9日電 今天下午,「阿爾法圍棋」(AlphaGo)機器人與韓國棋手李世石的五番棋首戰結束,最終李世石執黑失利,讓人頗感意外。賽後網上一片熱議之聲,而中國圍棋新一代代表人物柯潔就在個人微博中放出豪言:AlphaGo贏不了自己。
  • 圍棋人機大戰第四局:AlphaGo連續失誤 李世石扳回一局
    3月13日中午12點,迎來「人機大戰」第四場,此前韓國九段棋手李世石連敗三場,五局系列賽提前告負。最後兩局的意義,更多是為職業棋手的尊嚴,為測試、尋找的可能薄弱點而戰。 在兩小時布局時間用完之際,李世石出現「年度妙手」考驗AlphaGo(阿爾法狗)。AlphaGo陷入長考,並下出一步看似失誤的棋。第78手讓大家看到熟悉的李世石九段回來了。
  • 圍棋人機大戰第二季柯潔VS阿爾法狗AlphaGo比賽時間地點
    柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。  此次人機終極大戰中,代表人類出戰的是目前排名世界第一的職業圍棋九段選手柯潔,而代表機器一方的則是AlphaGo的2.0版本。區別於和李世石對戰的AlphaGo1.0,這次對戰柯潔的AlphaGo2.0採用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內的所有選手,60戰而無一敗。
  • 最終一戰柯潔再負AlphaGo,此後再無圍棋人機大戰
    在這場人機大戰中,世界圍棋第一人0:3完敗於圍棋人工智慧。全程回顧上午10:30,聶衛平宣布比賽正式開始。棋聖也略顯緊張,一開始忘了拿起麥克風,宣布規則時又說成黑棋貼2¾子。耗時1分05秒,執黑的AlphaGo第一手下在棋盤的右下角。又是一個不合「禮儀」的開頭。
  • 圍棋人機大戰柯潔不敵AlphaGo
    圍棋人機大戰柯潔不敵AlphaGo 2017-09-20 11:33
  • 圍棋人機大戰直播地址:李世石 VS AlphaGo第一局 李世石情況不妙
    圍棋人機大戰直播地址:李世石 VS AlphaGo第一局 李世石情況不妙  倦夢還 • 2016-03-09 13:31:
  • 人機大戰團賽收官 圍棋高手聯隊被阿爾法狗打敗(圖)
    人機大戰團賽收官,26號中午開始,棋手團由周睿羊領銜,陳耀燁、時越、羋昱廷、唐韋星五人組成豪華天團挑戰alphago。可惜由於五人分工不明確,決策機制不健全,在開局就出現了失誤。人機智能真的已經無敵了嗎?
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • 人機大戰落下帷幕:柯潔0比3負於AlphaGo
    至此,人機大戰第二季以柯潔0:3被人工智慧AlphaGo橫掃告終。沒能創造「贏一盤」的奇蹟由於在第二盤中表現近乎「完美」,以及一度出現勝利的機會,人們對仍舊由柯潔執白的第三場比賽寄予厚望。然而面對始終發揮完美的AlphaGo,柯潔沒能完成自己「贏一盤棋」的目標,沒有創造奇蹟。
  • 圍棋人機大戰柯潔哭了 機器卻沒有笑
    新華社發  浙江在線5月28日訊(浙江在線記者 張峰)5月27日,人機大戰的最後一局在烏鎮開始,要求再次執白的柯潔沒有創造奇蹟,在行棋至209手時,柯潔將兩顆棋子擺上棋盤,向裁判表示投子認輸。至此,人機大戰第二季以柯潔0:3被人工智慧AlphaGo橫掃告終。
  • 李世石VS谷歌阿爾法圍棋人機大戰第三場完整棋譜步驟分析(圖)
    3月12日,人機大戰第三場已經結束,世界圍棋冠軍李世石遭遇三連敗,五番棋比賽中谷歌AlphaGo已贏得勝利,剩下的比賽中李世石只能寄希望「贏一局」了。  在第三場比賽中,李世石的黑棋布局初期重點在局部。圍棋九段古力認為,黑棋初期布局肯定不成功,李世石的布局是分散的,而白棋一個整體宏觀的局面已經構成。
  • AlphaGo 3:0李世石:人機圍棋戰勝負已定
    北京時間3月12日中午12點,谷歌AlphaGo與李世石之間的圍棋世紀大戰進入第三輪較量。由於第一輪及第二輪較量中,AlphaGo均戰勝李世石,所以第三輪較量至關重要。本輪李世石持黑子先行,而AlphaGo則持白子,規則依舊是貼7.5目中國規則。
  • AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...
    至此,持續近兩年的圍棋「人機大戰」可以說真正落下了帷幕,而AlphaGo也在不斷學習中,走向了自己的終極狀態——AlphaGo Zero。2016年1月27日,國際頂尖期刊《自然》封面文章報導,谷歌研究者開發的名為「阿爾法圍棋」(AlphaGo)的人工智慧機器人,在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾。
  • 「人機大戰」收官:「阿爾法圍棋」4勝李世石
    中新社首爾3月15日電 (記者 吳旭)「形勢很微妙,估計要到最後數目」、「李世石還是過於求穩」……15日下午,在首爾鍾路的「人機大戰」觀戰區,上百名來自世界各地的棋手、媒體和「圍棋迷」們聚集在一起討論棋局,分析局勢。「我嚇了一跳,走到哪裡都是和棋有關的人。」在觀戰區的中國棋手芮乃偉九段這樣形容自己的感受,「感到現場熱氣騰騰的。」
  • 新版Alphago棋風更穩健
    柯潔與Alphago的人機大戰第一場結束,Alphago執白戰勝了柯潔,勝四分之一子。柯潔經過一天的苦戰在失利已成定局的情況下,依舊堅持下完比賽;經過改進的Alphago則依靠穩健的棋風拿下了對手。柯潔身為現圍棋世界冠軍,此次也是有備而來,並宣稱用所有的熱情與Alphago進行了對決。Deepmind創始人哈薩比斯賽前曾表示:」本次比賽的宗旨是探索新的圍棋打法。alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰,而是人類使用電腦作為工具探索新的東西,就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。
  • 柯潔對決AlphaGo "人機大戰2.0"看點在勝負之外
    原標題:「人機大戰」2.0看點在勝負之外   「人機大戰」2.0之所以引發關注,一是人工智慧有望幫助人們進一步理解複雜又古老的圍棋;二是人與人工智慧如何密切配合,並通過合作體現出更高的實力,將是未來人工智慧發展真正的大趨勢   13個月前,韓國世界冠軍李世石與
  • 圍棋人機大戰第二局:柯潔中盤失誤認輸
    今天,備受關注的「圍棋人機大戰」展開第二局圍棋對決。中國棋手柯潔與AlphaGo繼續交鋒,比賽從今天上午10:30開始,一直持續到1時許,最終比賽以柯潔中盤認輸而結束。此局比賽中,柯潔執白子,AlphaGo執黑子。