百度正用谷歌AlphaGo,解決一個比圍棋更難的問題

2020-12-20 站長之家

圖片來源圖蟲:已授站長之家使用

本文來自於微信公眾號量子位(ID:QbitAI),作者:曉查,站長之家經授權轉載。

9102 年,人類依然不斷回想起圍棋技藝被AlphaGo所碾壓的恐怖。

卻也有不以為然的聲音:只會下棋的AI,再厲害也還是個運動員啊!

百度說:你們錯了,它還是一位數學家。

百度矽谷AI實驗室的同學們,就在用這個出自谷歌DeepMind的圍棋算法,解決一個比圍棋複雜得多的數學問題。

為了重新訓練這個算法,百度用了 300 張1080Ti和2080Ti顯卡。

他們解決的問題,叫做「圖著色問題」,又叫著色問題,屬於前些天讓中國奧數隊全軍覆沒的圖論。它是最著名的NP-完全問題之一。

簡單來說,就是用儘可能少的顏色,給一張圖的頂點上色,保證相鄰頂點的顏色不重複。

10 個頂點的簡單版是這樣的:

而複雜版……只要頂點足夠多,分分鐘讓人類數學家無從下手,如果有 512 個頂點,這個問題的複雜度會比圍棋高出幾百個數量級。

在這個數學問題上,運動員AlphaGo表現優秀,最高能將一張圖所用的顏色減少10%。

從四色定理談起

就算你對「圖論」、「著色問題」這些詞有點陌生,應該也聽說過「四色定理」。這是第一個由計算輔助證明的數學定理。

四色定理告訴我們,只需 4 種顏色我們就可以讓地圖上所有相鄰國家的顏色互不相同。

這其實就是一個平面上的著色問題,國家可以簡化為頂點,國與國之間的相鄰關係可以簡化為連接頂點之間的線。對於平面圖而言,顏色數k最小等於幾?

歷史上數學家已經手工證明了五色定理(k=5),但是因為運算量太大,在將顏色數量進一步減少到四種(k=4)時卻遲遲無法解決,最終在 70 年代靠計算機才完成證明。

一般來說,我們可以用貪心算法解決這個問題,其基本思路是:先嘗試用一種顏色給儘可能多的點上色,當上一步完成後,再用第二種儘可能多地給其他點上色,然後再加入第三種、第四種等等,直到把整張圖填滿。

或者是用深度優先搜索算法,先一步步給圖像著色,若遇到相鄰點顏色相同就回溯,再換一種著色方法,直到問題解決為止。

比圍棋世界更複雜

如果圖的頂點數比較少,以上兩種方法還可行,但隨著頂點數的增加,以上兩種算法的局限性就暴露了出來。

△ 用貪心算法著色和最優解的對比

貪心算法會陷入局部最優解,而深度優先搜索算法的運算量會越來越大,以至於完全不可行。

圖著色問題的複雜度隨著頂點數增加而急劇增長。當頂點數達到 512 時,其可能得狀態數就達到達到了10^790,遠超圍棋的10^460,當然更是比全宇宙的粒子數10^ 80 多得多。

即使中等大小圖的狀態數也遠超圍棋,如果頂點數量達到 1000 萬,複雜度會大得驚人,相當於在 1 後面有 4583 萬個0。

另外著色問題還有另一個複雜維度,圍棋算法可以反覆在同一張相同棋盤上進行測試,而圖即使頂點相同,因為連接各點的邊不相同,結構也不完全相同。

相關焦點

  • 百度正用谷歌AlphaGo,解決比圍棋更難的問題 | 300塊GPU在燃燒
    百度說:你們錯了,它還是一位數學家。百度矽谷AI實驗室的同學們,就在用這個出自谷歌DeepMind的圍棋算法,解決一個比圍棋複雜得多的數學問題。為了重新訓練這個算法,百度用了300張1080Ti和2080Ti顯卡。
  • AI戰勝歐洲圍棋冠軍 圍棋界怎麼說
    像桌球一般,與亞洲一線的職業高手相比,自然會有些差距,但一般業餘圍棋高手也遠非其對手。「alphago」的勝利書寫了圍棋AI第一次戰勝職業圍棋選手的記錄,正如《科學》雜誌所評價,這是圍棋AI一次巨大的飛躍。對其實力,百度圍棋吧棋友生動比喻:「nba普通球員,跑去cba,在cba當了兩年主力。」「其實可以拿羽毛球、桌球之類的來說。
  • 曝百度騰訊正開發圍棋智能軟體:可實戰
    日前,韓國烏鷺網的一篇文章透露,中國的百度和騰訊正聯手開發一款圍棋人工智慧軟體,目前已經到了實戰測試對局階段。以下是這篇文章的大致內容,在文章最後,作者不經意間提到了這個爆炸性的消息。 11月29日,日本棋院宣布創辦「世界圍棋精英賽」,邀請中國、韓國、日本的一名代表棋手和圍棋人工智慧角逐冠軍。即圍棋的世界大賽將進入新的一個局面,人類棋手和人工智慧同場競技,「世界圍棋精英賽」是首項人類和人工智慧共同參賽的圍棋世界大賽。而這款人工智慧即是日本「DeepZenGo」,在11月23日結束的日本第2屆電王戰三番棋雖然1比2不敵趙治勳九段,但面對趙治勳九段分先取得了一勝。
  • 谷歌AlphaGo背後的男人:是神童是工作狂,但更接地氣
    德米斯·哈薩比斯(Demis Hassabis)北京時間3月9日,谷歌的人工智慧AlphaGo將要對韓國圍棋冠軍李世石發起挑戰。在去年戰勝了歐洲圍棋冠軍樊麾後,人工智慧與人類最古老棋類項目之間的對弈,值得我們期待。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    此外,今年五月份被 AlphaGo Master 打敗的柯潔第一時間轉發微博表示「重新學圍棋。」(還用了一個賤賤的 doge 表情)而這個工具到底好不好用,大家可以去自行體驗。官網英文地址如下:https://alphagoteach.deepmind.com/中文地址如下:https://alphagoteach.deepmind.com/zh-hans附 David Silver 介紹 AlphaGo Master 的研發關鍵:AlphaGo Master 為何如此厲害呢?
  • 阿爾法狗教你下棋 谷歌上線AlphaGo圍棋教學工具
    【PConline 資訊】看起來AlphaGo在圍棋界真的是無敵了,如果這麼強大聰明的AI變成了圍棋老師,對於人類來說是不是又是另一種體驗呢?12月13號,谷歌旗下的DeepMind上線了這款在線AlphaGo圍棋教學工具(點擊此訪問)。
  • 谷歌阿爾法圍棋AlphaGo背景資料照片 兩個大腦介紹(圖)
    AlphaGo具備策略網絡(Policy Network)和估值網絡(Value Network)能力,前者分析局面、預測對手招式,後者負責判斷勝率,可以在2微秒內走出一步棋,而Dark Forest僅具備第一種能力,並且走棋所花費的時間也要更慢。  當然,真正讓AlphaGo成名的還是戰勝歐洲圍棋冠軍樊麾,這在當時引起了軒然大波,甚至推升了谷歌的股價,畢竟這是電腦對人腦的一次勝利。
  • 谷歌AlphaGo首局戰勝李世石
    谷歌為何要做人工智慧圍棋程序AlphaGo谷歌並不只是想做一個棋類程序,而是想做一個通用的智能計算系統。如果解決了圍棋問題,谷歌希望能把這套人工智慧算法用於災害預測、風險控制、醫療健康和機器人等複雜領域。也就是說谷歌的目的還是為了更好的服務人類,沒有任何惡意。
  • 谷歌AlphaGo比人類差了兩個智能等級
    解決AI超越人類智慧的理論基礎-標準智能模型為了解決這個問題,從2014年開始我們與科學院大數據挖掘與知識管理重點實驗室石勇教授參考馮·諾伊曼結構,維.韋克斯勒人類智力模型定義,知識管理領域DIKW模型體系。發表論文提出了包含信息知識的輸入輸出,掌握和創新能力的系統--「標準智能模型」
  • 圍棋愛好者們,3月「翻牆」去YouTube看AlphaGo挑戰李世石啊-虎嗅網
    谷歌此前並未直播AlphaGo與歐洲圍棋冠軍樊麾的比賽,當時AlphaGo取得了5:0的壓倒性勝利。谷歌的這一成果隨後發表在《自然》雜誌上。預計AlphaGo和李世石的比賽將吸引上萬,甚至上百萬人的實時收看。
  • 百度挑戰世界級難題 智能圍棋Bingo誕生
    7月底在百度內部舉行的「挑戰Bingo」人機大戰上,自然語言處理部開發的智能圍棋系統—Bingo,在9路盤的最終決戰中分別以兩個2:1擊退兩名業餘5段棋手的挑戰,最終以14戰全勝、總盤數37勝4負的絕對優勢取得勝利,並且在19路盤上以較大優勢擊敗業餘初段。「這是一個重要的進展」,百度副總裁王海峰表示,「得益於領先的人工智慧算法與專家知識的完美結合。」
  • 境外遊,百度地圖比谷歌更適合中國人
    這次「俄囧之行」就讓我深刻感受到了這個問題。一下飛機,抵達伯力諾維機場,我們竟然驚奇地發現,機場沒有一輛「趴活兒」的計程車,這座人口約120萬的俄羅斯第五大城市居然也沒辦法用叫車軟體。打開谷歌地圖,密密麻麻全是俄文,除了機場和幾條主幹道有中文顯示外,我們幾乎蒙圈。
  • Facebook 圍棋負責人田淵棟:AlphaGo 賽後感言
    大家可能一直有誤解, 計算機解決問題靠暴力,而人則靠智能。其實在面對指數級別的解題空間時,機器的暴力搜索所能覆蓋的範圍,不過是滄海一粟。我現在越來越覺得,連接主義和符號主義的合併,強直覺加上適當搜索才是解決問題較好的方案。人工智慧迄今為止的歷程,就是人類認識到這個宏大空間並且往這個方向靠攏的過程。
  • AlphaGo首現Bug 圍棋算法死穴在哪兒?
    再可怕的怪物也是有弱點的,AlphaGo為什麼會下臭棋讓大家大跌眼鏡,圍棋人工智慧第二代第三代的死穴是什麼?圍棋人工智慧第三代的死穴在哪兒?韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之後,執白棋居然扳回一局。
  • 人機大戰為何總以棋測智 圍棋比西洋棋更高深
    IBM的超級電腦「深藍」曾擊敗西洋棋世界冠軍卡斯帕羅夫,谷歌正用「阿爾法圍棋」程序挑戰圍棋頂級高手李世石,而臉書的人工智慧「黑暗森林」程序也選擇了圍棋人機對弈,作為人工智慧水平的檢測。  棋類博弈自古被視為一種關乎智力的高級挑戰。和其他智力測試相比,弈棋具有直接對抗的特點,緊張對局中,對手一手精妙棋招,更能讓人感覺到一種智力上的刺激和挑戰。
  • AlphaGo之父:下個版本會讓電腦從零開始學圍棋
    以下是文章全文:DeepMind的AlphaGo戰勝韓國傳奇棋手李世石,點燃了空前的對人工智慧問題的熱情。但是,這家谷歌子公司的AlphaGo計劃卻遠遠超出了它自身 - 甚至可以說它本身都不是重點。作為DeepMind的聯合創始人,德米斯·哈薩比斯(Demis Hassabis)在本周早些時候表示,DeepMind要做出「智慧解決方案」,對此他有一些想法。
  • AlphaGo 是如何被訓練成圍棋之神的?
    我們把下一步的落子的行動也用361維的向量來表示,記為a。這樣,設計一個圍棋人工智慧的程序,就轉換成為了,任意給定一個s狀態,尋找最好的應對策略a,讓你的程序按照這個策略走,最後獲得棋盤上最大的地盤。如果你想要設計一個特別牛逼驚世駭俗的圍棋程序,你會從哪裡開始呢?
  • 獨家|專訪田淵棟:AlphaGo之後,研究智能圍棋還有什麼意義?
    我覺得圍棋是很有意思的遊戲,AlphaGo雖然把它做出來了。但很多東西的做法和人是不一樣的。人在學圍棋的時候有很多概念,按照概念做判斷,但是機器解決他還是比較暴力的。一方面,你可以說人用概念來做推理局限了他的計算能力,體現出人本身有一個高度抽象的能力,就是用非常非常局限的計算能力,能達到那麼強的棋力。
  • AlphaGo對圍棋研究謝幕 留下輔助學棋的軟體
    這也標誌著AlphaGo對圍棋研究的謝幕。不過12月11日晚間,DeepMind公司在官網上線了AlphaGo教學工具。當今世界圍棋第一人柯潔隨後轉發此條微博,並評論道:「重新學圍棋。」AlphaGo抽身離去,圍棋卻已離不開它了。  留下無人超越的高度AlphaGo雖然離去,職業棋手卻沒有鬆口氣的感覺。
  • 滴滴章文嵩將派單問題與 AlphaGo 相比較,被懟「不懂圍棋」
    都是目前我們在不斷迭代,所以這個問題複雜度,比下圍棋複雜多了,所以這可能是跟大家想像得不一樣,滴滴是真正背後是拿很多科技的手段在解決問題……」 滴滴派單問題是極為複雜的時空調度問題,一天有幾千萬乘客在不同的時空中發出需求,也有大幾百萬司機在不同的時空出現,每一次不同的派單都會影響不同的時空裡供需分布,乘客和司機對派單響應是動態的,交通路況也不斷地變化,優化目標也挺難刻畫的,不光考慮全局的需求滿足率,還得考慮人們心目中對服務的感覺等約束,把服務確定性描述清楚就不容易,是個開放的問題。若