別了,人類對手!中國圍棋人工智慧要「逼出」阿爾法狗

2020-12-05 澎湃新聞

馬博從未下過一盤完整的圍棋,但他的「作品」很會下棋。

最近,在一場世界級的圍棋大賽中,「絕藝」以7∶0戰勝「星陣」獲得冠軍,倆選手都不是人。絕藝來自馬博所在的騰訊AI團隊,星陣的前身是清華大學開發的「神算子」。

參加本屆世界人工智慧圍棋大賽前,絕藝曾對陣柯潔豪取13連勝,還以11連勝的戰績奪得第10屆UEC杯計算機圍棋大賽冠軍,成為這項承載「攻克圍棋」使命的AI賽事裡最後一個冠軍。它的名字來自杜牧詩句「絕藝如君天下少,閒人似我世間無」。

比起UEC杯,人工智慧圍棋大賽參賽門檻更高:參賽程序需要獲得過世界人工智慧圍棋比賽(最近3年)前8名的成績,或棋力在野狐圍棋平臺九段及以上。大賽吸引了包括日韓兩國國家圍棋隊指定訓練AI在內的眾多高手,一度被外界認為是一場「眾神之戰」。

世界人工智慧圍棋大賽,「絕藝」大戰「星陣」。

人類世界的圍棋高手只是觀眾

2016年3月以來,在騰訊程式設計師馬博的工作計算機裡,絕藝幾乎24小時都在跟自己下棋,每天對弈成千上萬盤。

這樣的對局數,是人類棋手一生幾萬盤棋難以企及的。而在19×19的方格世界中,存在著10171種有效對局盤,數量超過宇宙原子的總和。

兩年前,李世石以1∶4敗給阿爾法狗,後者的訓練數據是3000萬盤棋。人類不再心存「贏」的幻想。此後阿爾法狗又連勝中日韓高手60盤,其技藝「讓人類棋手感到絕望」。

兩周前,眾多圍棋國手來到他們熟悉的中國棋院對弈場,只當觀眾。馬博和絕藝研發團隊第一次走進中國圍棋最高殿堂:「棋聖」聶衛平、「八冠王」古力、「天才少年」柯潔都曾在此留下名局。

AI棋手沒有環肥燕瘦或迥異個性,它們不像聶衛平那樣嗜煙如命,在煙霧繚繞中陷入棋局的沉思。也不會有柯潔的年少輕狂,對陣前輩李世石前放話「勝算95%」。它們是一行行代碼和後臺的計算資源,人類棋手要緊跟棋盤局勢都顯得十分吃力。

「比賽現場觀眾都是一些職業棋手。」馬博對記者回憶,他將筆記本電腦接入比賽的對弈系統,點擊屏幕上的「開始」後,就「與我無關」了,人類棋手則緊盯著對弈臺後面的電子棋盤。雖然人類前輩在幾千年前就已經開始黑白「搏殺」,並且一直是勝負的主角,但此刻的棋盤上還是有太多人類從未見過的「殺招」。

「我們和AI的思考層級不同,在計算量上存在著差距。」作為決賽解說嘉賓的古力表示,他曾和絕藝有過數次交手,但對手成長之快,他始料未及。3年前,風頭正盛的日本圍棋AI「DeepZenGo」開發者加藤英樹曾表示,人工智慧攻克圍棋至少需要10年。

世界人工智慧圍棋大賽。

我們是人類,人類會犯錯誤

兩年前的絕藝還只是業餘五段的水平,如今古力已用「不可思議」來解說昔日對手的戰術了。

就在4個月前,古力在個人微博上曬出「絕藝正式成為中國國家圍棋隊訓練專用AI」畫面,並配文「國家隊的訓練方式跟上了時代步伐」,而此前的中國國家隊並沒有專用AI。

在賽場上,馬博偶爾也會聽聽解說嘉賓聊起的圍棋段子,或是走下對弈臺喝喝茶,和羅洗河聊聊天——後者是絕藝的圍棋顧問,也是開發團隊中唯一能下完一盤圍棋的人。

這位曾在2006年1月終結「李昌鎬時代」的傳奇棋士,也是截至目前和絕藝對弈最多次的人類。他需要通過與之對弈發現漏洞,將它打造成「圍棋上帝」。

比起棋盤走勢,馬博和他的對手更關心各自電腦屏幕上閃現出來的一行行勝率計算結果,那是AI通過算法分析落子位置得出的獲勝概率。屏幕上勝率持續上升,意味著此前的算法分析沒有出現失誤,布局意圖正逐步實現。但隨著對手落下一顆棋子,局面的勝率就會被算法重新統計。

絕藝使用的算法框架並非馬博團隊的首創。「人工智慧領域有很多公開的算法框架,按照這些框架很快就能做出產品。但如果要達到更高的勝率,就要在算法細節和計算能力上努力了。」 雖然馬博為絕藝寫下了第一行代碼,但其核心算法框架來自於Deep Mind團隊。

2016年1月28日,谷歌旗下的Deep Mind團隊在《自然》雜誌發表論文,介紹了阿爾法狗程序的技術細節,還附帶它以5∶0橫掃三屆歐洲圍棋冠軍樊麾二段的喜訊。

樊麾並沒有像1997年西洋棋世界冠軍卡斯帕羅夫那樣,在被IBM研發的象棋AI「深藍」擊敗以後,指責這款電腦程式作弊,並要求重新比賽。

他也並沒有像這位俄羅斯棋王一樣,有過3次擊敗「棋桌對面新型智慧」的戰績,並坦言「自己還有幾年的安穩日子」。面對比西洋棋10120種變化更為複雜的圍棋,樊麾的劣勢要更加明顯。

「人類是會犯錯誤的,因為我們是人類。」阿爾法狗在樊麾眼裡像一面沒有任何情緒波動的牆,穩穩地堵住了他調動的一切經驗和智力攻勢,也壓住了一名頂尖棋手求勝的欲望。如果沒有事先告訴他阿爾法狗是程序的話,樊麾甚至會認為對方是一個棋路清奇的人類棋手。

一年後的烏鎮棋局,阿爾法狗又以3∶0的戰績強勢逼哭了棋盤對面的柯潔,這位圍棋史上最年輕的五冠王第一次在賽場上失控落淚。在離開對弈臺的20分鐘裡,他覺得自己就像一個「無助的孩子」,對過程和結局都感到絕望。

「對手非常完美,沒有任何缺陷和失誤,而且也沒有任何心態上的波動。」柯潔賽後曾表示。阿爾法狗也在此戰後成為中國第43位中國圍棋九段獲得者,它的42位九段前輩都是人類。

阿爾法狗戰勝柯潔。

人工智慧下圍棋不需要人類對手了

「沒有情緒」或許是人們對阿爾法狗最為感性的理解了。

實際上,阿爾法狗有著兩個強大的決策網絡:Policy Network(策略網絡)和Value Network(價值網絡)。前者主要判斷在當前局面下,下一步棋該怎麼走。

作出這樣的判斷,不僅需要提前輸入人類已探索出的大量棋譜,還要讓其能夠通過大量的自我對局結果來學習評價每一步棋的優劣。後者則相當於人類棋手的「大局觀」,阿爾法狗在自我對局中會逐漸學習評價整體局面的走勢。

第一個網絡在從人類棋手已有的走法中篩選出若干種可能的同時,也會通過蒙特卡洛樹搜索來展開這些走法並給出優劣判斷。蒙特卡洛樹搜索正是圍棋AI算法的核心之一。在對弈時,它會隨機選擇一種落子路徑並向下展開,如果這種落子路徑能夠獲勝,就會被賦予一定的權重,並在下次隨機選擇路徑時被優先選中。

第二個網絡則會利用整體局面的判斷刪除那些無法得到高勝率的落子路徑,同時也能根據下一步棋將導致的新局面的優劣,給出落子建議。最終的落子決定則是由兩個網絡被平均加權後作出的。

這種既有局部判斷又作全盤分析的思考方式已經接近人類棋手的思維。雖然棋手選擇的落子位置並非由局部和全盤的思考加權平均決定,但DeepMind在論文中卻得出了這樣的結論:兩個大腦取平均的結果比依賴兩者各自得出的結果要好很多。

2017年10月,在宣布阿爾法狗退役後的5個月後,DeepMind又在《自然》雜誌發表最新論文。他們最新的「狗」在3天時間內積累了490萬盤圍棋賽的訓練數據,並以100∶0完勝曾經打敗過李世石、柯潔等人的——過去的那個自己。

此時的阿爾法狗已經完全不再需要人類棋手的定式了,所有的訓練都是通過自我博弈增強學習來完成。

馬博團隊先後借鑑了Deep Mind兩篇論文,但他們已經不再熱衷戰勝人類棋手,以證明絕藝的實力了。很多圍棋界的棋手期待絕藝能逼出阿爾法狗與之一戰,探索圍棋之道的極限。

這樣的眾望,人類曾寄託於吳清源、聶衛平、李昌鎬……當然,也給過出戰阿爾法狗之前的人類棋手。

(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)

相關焦點

  • 人工智慧圍棋大戰!中國絕藝要「逼出」阿爾法狗
    作為決賽解說嘉賓的古力表示,他曾和絕藝有過數次交手,但對手成長之快,他始料未及。3年前,風頭正盛的日本圍棋AI「DeepZenGo」開發者加藤英樹曾表示,人工智慧攻克圍棋至少需要10年。世界人工智慧圍棋大賽。我們是人類,人類會犯錯誤兩年前的絕藝還只是業餘五段的水平,如今古力已用「不可思議」來解說昔日對手的戰術了。
  • 人工智慧擊敗世界圍棋冠軍 "阿爾法狗"為什麼厲害
    人民視覺 谷歌的圍棋人工智慧程序和人類圍棋冠軍之間的比賽,堪稱人工智慧發展的一個重要裡程碑,也讓全世界的目光聚焦在人工智慧這個熱門科技領域。谷歌的人工智慧程序是怎樣贏了人類?人工智慧對人類來說到底意味著什麼,會帶來什麼?它會不會有一天在智能上也超過人類?
  • 阿爾法狗zero是否將宣告圍棋的終結
    自從2016年阿爾法狗擊敗了韓國圍棋高手李世石,繼而又在2017年擊敗了世界排名第一的柯潔,人工智慧就已經開始威脅到了圍棋的生存,以及所有人類的古老智力遊戲的生存。無論是圍棋還是象棋,現在都要面對一個根本的問題,為什麼還要下圍棋和象棋,因為最終還是要輸。
  • 人工智慧「阿爾法狗」橫掃圍棋高手
    央視網消息:過去一周,一個註冊名為「大師」的神秘網絡棋手一路擊敗數十位圍棋高手,實現了快棋戰的60場不敗。這個「大師」就是去年「人機大戰」當中擊敗韓國棋手李世石的人工智慧程序「阿爾法狗」。4號,「大師」終於透露,自己正是「阿爾法狗」的最新版本,代為落子的則是「阿爾法狗」團隊的黃士傑博士。當天與中國棋手古力的一盤棋是本次網絡公測的最後一戰。結果古力告負,「大師」實現了60場不敗。「阿爾法狗」是「深度思維」公司開發的一項人工智慧程序。
  • 圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗
    圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗 自去年李世石挑戰阿爾法狗失敗後,人類一直期待當今圍棋第一人柯潔與阿爾法狗進行一場終極較量。
  • 人工智慧毫無感情?紀錄片《阿爾法狗》解讀科技背後的人性光芒
    在谷歌電腦擊敗人類頂級圍棋選手時,人們將通過這部紀錄片了解到許多軟體內部運行的幕後秘密,以及人工智慧的意義。在「阿爾法狗」的控制室,鏡頭捕捉到了一股緊張氣氛,一支由多國編程師所組成的隊伍在那裡追蹤勝率。Deep Mind項目的科學家們監視著診斷提示,試圖分析「阿爾法狗」的思路。透過鏡頭,你能看到整個團隊的焦慮與喜悅。
  • 「阿爾法狗」戰勝了圍棋世界冠軍 人工智慧千億市場將引爆
    谷歌人工智慧軟體「阿爾法狗」中盤戰勝世界冠軍、圍棋職業棋手李世石九段。在此之前,圍棋是唯一沒有被計算機攻克的博弈遊戲項目,這次是計算機首次在分先(註:即不讓子,平手對局)的情況下戰勝人類頂尖棋手!3月9日中午,在韓國首爾四季酒店,一場別開生面的圍棋對決吸引了全球的目光。
  • 比不過阿爾法狗, 為什麼還要學圍棋?
    2017年5月27日,中國烏鎮,棋盤一端是柯潔,另一端是阿爾法狗(AlphaGo)。聚光燈下,意料之中,柯潔零比三輸掉了這場人機對弈。   可曾記得二十二年前,還是人機對戰,同樣地,人類輸。   圍棋的複雜性要遠大於西洋棋,也曾被認為是人類最後的智慧堡壘,現在卻因人工智慧的侵入變得搖搖欲墜。   剛剛過去的3月27日,人工智慧專家傑弗裡·欣頓和另外兩位「深度學習」倡導者榮獲2018年圖靈獎,這一獎項被稱為「計算機界的諾貝爾獎」。
  • 柯潔對戰阿爾法狗首場1/4子告負 稱「阿爾法狗越來越像圍棋上帝」
    在剛剛結束的柯潔對戰阿爾法狗(Alphago)比賽中,柯潔以1/4子負於對方,在雙方的三番棋大戰中暫時0-1落後。按照中國圍棋規則,1/4子已經是最小的差距。另外在賽後的採訪中,柯潔認為,Alphago已經接近圍棋上帝。
  • 柯潔首度還原對戰阿爾法狗,人工智慧將超越人類智能?
    在人工智慧極速發展的今天,機器能替代的不僅僅是傳統重複性的機械動作,而是模擬人類思考。去年,一場轟動全球的阿爾法狗圍棋挑戰賽拉開帷幕。在戰勝了韓國圍棋高手李世石後,中國圍棋少年天才柯潔,迎來了世紀人機大戰。
  • 中韓兩國圍棋天才均被「阿爾法狗」打敗,人工智慧獲勝
    今年我國烏鎮的圍棋峰會進行了一場罕見的人機大戰,參與此次人機大戰的分別是「阿爾法狗」和我國的圍棋天才柯潔。兩者經過了一番較量之後,柯潔這位圍棋天才不敵「阿爾法狗」,最終戰敗了。針對這樣的一個結局,大家紛紛在揣測,人是否真的敵不過人工智慧機。
  • 阿爾法狗圍棋戰勝柯潔後,並沒有善罷甘休,已確認進軍各大行業!
    阿爾法狗圍棋戰勝柯潔後,並沒有善罷甘休,已確認進軍各大行業!隨著人工智慧的高度發展,人工智慧已經進軍到生活的各個領域,從人們的衣食住行,再到電影、娛樂和設計領域。人工智慧正在進入我們的生活。但其實人工智慧早在1956年已經被提出,而當人們正在意識到受到人工智慧的威脅則是從阿爾法狗戰勝圍棋天才柯潔開始。一位一年獲得過3次圍棋世界冠軍的95後。那麼,阿爾法狗真的這麼厲害嗎?阿爾法狗確實非常厲害,它有「2個大腦」,一個用來下棋,一個則是用來上網分析對弈的數據。
  • 德州撲克人工智慧之父:阿爾法狗贏不贏都缺實際用處
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • 圍棋阿爾法狗和德撲冷撲大師:哪個更厲害,哪個更有用
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • 天元賽棋手布局遭網友吐槽,人工智慧讓圍棋失去精彩?
    2016年3月,阿爾法狗(AlphaGo)與李世石九段進行了圍棋人機大戰,最終阿爾法狗獲勝,成為了第一個戰勝圍棋世界冠軍的人工智慧機器人。一年後之後,擁有「深度學習」能力的阿爾法狗在完勝柯潔,人類遭遇完全「碾壓」……如今,阿爾法狗早已退出了棋壇,但人工智慧已經滲透進了圍棋世界。
  • 阿爾法狗圍棋世界登頂 柯潔與阿爾法終將一戰
    阿爾法狗圍棋世界登頂,柯潔與阿爾法終將一戰。AlphaGo在中國被戲稱為阿爾法狗,在前些年擊敗了韓國名手李世石成為世界第二大圍棋高手,並且今年6月終於與柯潔進行約戰!雖然上不明確確切的缺戰時間,但是應為最近柯潔敗局連連,在分數上已經超越柯潔成為世界第一!
  • 贏過阿爾法狗的圍棋選手,現在已退役,表示人工智慧不可戰勝的
    唯一打敗AlphaGo(AlphaGo,谷歌計算機圍棋程序)的人決定結束他的職業生涯,因為他相信人工智慧是無敵的。據韓聯社27日報導,李世石在接受採訪時表示,即使我成為世界第一,也有我無法戰勝的東西。」隨著人工智慧在圍棋遊戲中的首次亮相,我意識到即使我通過瘋狂的努力成為第一,我也不是一流的,」李世石說。
  • 「阿爾法狗」化名Master對戰人類高手 59勝1和震撼棋壇
    在匆匆的採訪中,耿進透露,由於籤訂了保密協議,他無權透露Master的身份,「要透露也是『他們』透露。」耿進口中的「他們」,顯然是Master的設計者。耿進介紹說,去年野狐網的確進駐了一些人工智慧帳號,而Master的出現引流明顯,伺服器差點承受不了。至於Master在網上的對手,有些是隨機選的,有些是網站安排的。
  • 你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!
    前段時間,阿爾法狗戰勝圍棋天才李世石的消息在網上迅速走紅,當即很多網友稱,在以後,人類再也不能在圍棋界稱霸了,但是幸運的是,阿爾法狗研發公司稱,以後阿爾法狗不會在和人類進行圍棋比賽。可是,你真的以為只有圍棋你們下不過人工智慧機器人嗎?現在就連DOTA你也玩不過它!
  • 人類已經不可戰勝人工智慧狗了!
    經過這幾天的對局,我深深的感受到圍棋的神秘,似乎Master給我們打開一道圍棋的神秘之門,不論勝負,人類與人工智慧共同探索。」  2016年12月29日,人們開始辭舊迎新。慶祝新年的方式有多種,有些人選擇對弈。中、日、韓三國的圍棋手選擇在弈城網絡平臺切磋棋藝。