比佐為更強大 谷歌即將揭秘AlphaGo思路

2020-12-05 中關村在線

1AlphaGo到底什麼樣?

    在公眾視線中,AlphaGo自從下完了與李世石的五盤棋之後就消失了。但事實上沒那麼簡單,再過不久,AlphaGo及Deepmind團隊通過與世界冠軍古力、周鶴洋合作的方式,將通過發布新網站,來詳解與李世石的五盤棋及AlphaGo自己對弈的三盤精選棋譜,用可視化的方式加入了AlphaGo在對弈過程中的分析及數據。或許今天的AlphaGo,要比動漫裡面的Sai(佐為)更強大。


    AlphaGo到底長什麼樣?

前幾個月科技界的媒體已經公布了AlphaGo的機器,由幾個機架組成,在自然雜誌公布的棋力上,這種分布式計算的AlphaGo有1920個CPU核心和280個GPU。不過看第二張圖,谷歌的深度學習用的處理單元是定製的,那個螺絲顯得工藝不是那麼精緻。就是這個機器,用更好的深度學習的方法和強大的計算能力,戰勝了世界等級分第三的李世石九段。這個單元名字叫「張量處理單元」,(Tensor Processing Unit,TPU)。因此AlphaGo到底能否有個X86的版本,是未來的疑問。


谷歌AlphaGo機器的真身


谷歌定製的TPU,並非我們傳統的伺服器架構,對機器學習進行了專門的優化


古力九段的微博,感慨AlphaGo的強大

    之前公眾只是知道AlphaGo下圍棋非常厲害,能贏世界冠軍李世石就很說明問題。但是AlphaGo是如何思考的?這才是問題的關鍵。而即將放出的棋譜,則通過非常好的可視化形式,展現出來AlphaGo在對局過程中,機器認為李世石應該走的位置,並對其進行更深層次的計算。這次的研究員古力九段曾經發微博感慨過人工智慧已經精進到了如此程度!


人機大戰第五盤在人類覺得李世石稍好的時候,機器判斷自己勝率一直在上升

    有意思的是界面裡面還會有AlphaGo對輸贏的判斷,即在後臺的勝率分析,這個分析的準確性很高,因為結果也是隨著勝率的一路走高,李世石出現了投子認負(當然第四盤出了bug是個意外,現在Deepmind團隊表示更多訓練之後已經沒了這個問題)。有意思的是用戶可以結合當時的各路直播來看當時人類的分析,與機器分析進行對比。比如第五盤,右下角下完之後感覺AlphaGo送了幾個子,人類的高手普遍判斷是形勢上執黑的李世石稍好,但是機器的後臺判斷那時候AlphaGo的勝率是一直領先的,因為有一路爬回的手段。 


AlphaGo自我對弈的棋譜,15秒一步,全是中腹的戰鬥

    更為可怕的是此次Deepmind團隊放出了三個機器自我對弈的棋譜,設定的機器每一步思考只有15秒的時間,但是從公布的棋譜看,似乎非常深奧,只能期待古力與周鶴洋這兩位九段高手的理解了,因為對於AlphaGo,現在人類的棋藝已經難以企及它的高度,只能是從既有的圍棋知識去做判斷。


歡迎掃碼關注我們的公眾號生活科技新知(lifeintech),上面會有很多獨到內容喲!

2AlphaGo登陸網絡圍棋

    AlphaGo登陸網絡圍棋

    是第二次人機大戰要開始了嗎?並不是。而是谷歌的Deepmind團隊,在對弈網站gokgs上,設置了一個對弈機器人!這個機器人不是別人,正是大名鼎鼎的AlphaGo!


AlphaGo登陸網絡對弈平臺GoKGS,名字叫AlphaGoBot

   不過現在還都只是一些測試工作,並且工程師Aja黃,就是人機大戰坐在李世石對面的那位Deepmind團隊的人,在平臺裡面解釋這只是做一些測試,沒有谷歌的許可,是不可以開放這個AlphaGo機器人和KGS上的棋手對弈的,當然不止KGS,Deepmind團隊在多個圍棋對弈平臺都布置有機器人。


單機版、V20的AlphaGo到底會有多強?這需要谷歌的允許才會揭曉答案

    相比之下,這個對弈的機器人與幾個月前人機大戰的AlphaGo並不一樣,是單機版的,CPU、GPU要少得多,因此搜索的線程更少,按理說棋力應該稍差,可問題是,這個版本和當時不同,當時李世石對弈的版本是V18,而這個是V20,也就是進化了兩代,根據Deepmind團隊的說法,如果一個版本的勝率對上一個版本要達到90%,才會被標註為一個全新版本,這已經進化了兩次的V20到底有多強的棋力?相信一旦能正式上線與人對弈,全世界各路頂級職業棋手一定會排隊與之對弈。

3可能的大新聞

    可能的大新聞

    今年3月的時候,谷歌來了中國,包括CEO皮查伊,也見了中國棋院的人以及棋聖聶衛平。這在當時讓人產生聯想,甚至一度傳出來今年晚些時候在海南舉辦柯潔與AlphaGo的人機大戰!世界排名第一VS AlphaGo!


三月的時候谷歌的CEO訪華,特意與中國圍棋界見了面,圖片來自古力微博

    然而現在看這場比賽或許要泡湯,因為聶衛平這兩天接受採訪透露出來的意思是,人類棋手根本下不贏AlphaGo,綁一塊一起下也下不贏,很可能就是非正式的打了退堂鼓。當然筆者是看熱鬧不嫌事兒大,當然希望有第二次人機大戰。因為唯有如此,才能看看進化到V20或是更高版本的分布式AlphaGo到底強悍到了什麼程度,人類最強的柯潔到底能不能贏,能贏幾盤?


當年西洋棋領域的人機大戰

    其實圍棋輸了也沒什麼,中國象棋的電腦軟體甚至讓人一馬也能贏,是人和電腦學習新套路,西洋棋卡斯帕羅夫輸了兩次之後,西洋棋界已經徹底服氣,現在人根本下不過電腦。而到了圍棋這裡怎麼就不肯正式的下一盤,輸了也是人類智慧的勝利。人類普遍的共識是職業圍棋早晚輸給電腦,只是沒想到居然這麼快,這是難以承受的地方。


人機大戰AlphaGo在右下角脫先在上面還原成中國流布局,顛覆了以往局部定式的認知

    其實我反而覺得,圍棋不可能像象棋、西洋棋那樣容易的被窮舉,因此AlphaGo的算法如果越強,那麼人與之學習進步的空間也就越大,反而是推動人類圍棋進步,比如很多定式機器改了走法,再比如對形勢的判斷等等,會產生大量根本性的理念與認知上的變革。圍棋無止境,機器帶著人加速進步難道是壞事嗎?

相關焦點

  • 《棋魂》佐為為什麼會消失 佐為的消失是不是敗筆?
    川北在線核心提示:原標題:《棋魂》佐為為什麼會消失 佐為的消失是不是敗筆?佐為的消失是不是敗筆?     一切命運流轉,一切命中注定,人與人的一局又一局,只為時光的終點,——只為了領悟到神乎其技的那一刻,漫畫後續也借高永夏之口更展開了這一主題,「為了連接過去與未來?我們都是如此。」
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    【中關村在線新聞資訊】10月19日消息,今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。
  • 新版Alphago棋風更穩健
    新版Alphago採用了增強學習的策略,下棋技巧上遠勝初代依靠監督學習戰勝李世石的初代Alphago,它曾化名Master拿下所有高手,加之谷歌在人工智慧底層架構TensorFlow的提升,讓Alphago速度更快。柯潔身為現圍棋世界冠軍,此次也是有備而來,並宣稱用所有的熱情與Alphago進行了對決。
  • 棋魂:千年的等待,神之一手的追求,佐為的離去是必然嗎?
    不過卻被劇情裡的一幕幕給感染了,於是便縱身入了棋魂的坑,喜歡小光的坦率執著,喜歡小亮的刻苦堅毅,也喜歡佐為美如畫的,身姿高超的棋藝以及對待圍棋千年不變的初心。棋魂當中一幕幕感動漫迷的實在是多,可是也有許許多多人漫迷們為之心碎的畫面,比如,最後佐為的離去。那麼,難道說要想成就棋魂,必須要葬送掉佐為這個人物嗎?今天我們來好好聊一聊吧!
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    官網英文地址如下:https://alphagoteach.deepmind.com/中文地址如下:https://alphagoteach.deepmind.com/zh-hans附 David Silver 介紹 AlphaGo Master 的研發關鍵:AlphaGo Master 為何如此厲害呢?
  • 好久不見,藤原佐為!
    就在他接觸棋盤的一瞬間,竟被藏身於棋盤中的平安時代天才棋士佐為的靈魂附身。佐為將圍棋視為生命,經過了千年,佐為依舊想下圍棋,為了達到神乎其技的境界!佐為現世的第一戰,遇到了塔矢亮,準確的說是進藤光遇到了塔矢亮,而塔矢亮則品嘗到了被一個什麼都不懂的菜鳥吊打的滋味……以此為契機,兩人的命運齒輪瘋狂地轉動了起來。
  • 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類
    而我之所以將人工智慧這一行為定義為類人類的行為,是因為就其本質而言,不論人工智慧有多麼強大,它都只是物理層面的行為,而不是生物層面的行為,或者說是生命科學層面的行為。因此,所謂的取代人類、替代人類的這種擔憂也就只是停留在物理層面,在生命科學以及生物層面並不存在可比性。
  • 佐為離去無棋魂?這才是真正的棋魂!
    在我心中這是神作,有人會說棋魂爛尾了,在光不敵韓國高手後就突然結束,許多期待的對決也沒有上演,佐為最後也沒有回到光的身邊,其實不然,今天和大家聊聊棋魂不為人知的一面!,你來我往中驚心動魄,光是主角亮是影子,佐為篇後,在漫畫第15卷中佐為雖然離亮而去,但故事還在繼續,"相見你唯一的辦法,原來是下棋啊。"
  • 動漫《棋魂》,仍是無法超越的經典|圍棋|佐為|井山裕太|小畑健...
    由於小光可以看到棋盤上隱形的血漬,於是與沉睡在棋盤裡的鬼魂藤原佐為發生了命運的交集。佐為是一千年前平安時代的棋士,在一次對弈後,他因遭受對手的陷害含恨投水自盡。但由於佐為對圍棋無比摯愛甚至超越了生命,最大的願望就是有朝一日能夠參悟「神之一技」,所以死後靈魂不願散去,而是寄居在棋盤之中,等待著可以再次下棋的機會。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」相關閱讀:阿爾法狗之父:AlphaGo Zero 3天走完千年棋史 澎湃新聞記者 虞涵棋 王心馨倫敦當地時間10月18日18:00(北京時間19日01:00),谷歌旗下的DeepMind團隊公布了進化後的最強版AlphaGo ,代號AlphaGo Zero。新版本的AlphaGo究竟有多厲害?
  • 揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲
    導語:美國《紐約客》雜誌(The New Yorker)近日發表的文章揭秘谷歌旗下DeepMind最新公布的人工智慧AlphaZero。這個AI程序起源於在2016年名聲大噪的圍棋AI AlphaGo,而AlphaZero被應用於更多棋類遊戲中,取得了令人可喜的成就。
  • 比傳統超級計算機更強大 谷歌或在明年底前造出量子計算機
    9月2日消息,據《新科學家》報導稱,谷歌的研究人員或許將在明年底之前公布一款性能強大的量子計算機。這一領域的許多研究人員都表示,谷歌團隊距離項目的最終完成已經不遠。這或許將是全球最強大的量子計算設備。《麻省理工科技評論》去年訪問了谷歌的硬體實驗室,對谷歌的量子計算機項目進行了介紹。
  • AlphaGo背後:谷歌有支「機器人軍團」
    編/者/按  比機器人更可怕的,是谷歌想改變人類未來的野心  一個名叫AlphaGo(阿爾法狗)的人工智慧機器人以4:1的戰績,在與韓國棋手李世石的圍棋博弈中,完勝人類。  谷歌在做什麼  「靜默期有法可依」  在十天前,幾乎沒有人知道AlphaGo,更沒有人知道DeepMind公司。那其他被谷歌收購的公司,他們的靜默期會有多長?他們在靜默期後是「生存」還是「死亡」?是「一鳴驚人」還是「碌碌無為」?
  • 佐為棋藝遠超阿光,為什麼阿光能發現神之一手而佐為卻失敗了
    日本平安時代的棋師藤原佐為,穿越了遙遠的時光,在進藤光心中復活了,為了領悟神之一手。從此那個不愛圍棋的進藤光為了sai(佐為)走上了自己的圍棋之路。在sai與塔矢名人的對局中,小光發現了神之一手。也因為如此,sai的使命完成了,他離開了小光。那麼sai為什麼發現不了神之一手,而小光能發現呢?在夫子解答這個問題之前,先給各位科普下圍棋以及圍棋趨勢。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • 柯潔vsAlphaGo圍棋比賽日期時間
    谷歌宣布5月23日-27日在烏鎮主辦「中國烏鎮·圍棋峰會」,屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進行圍棋對弈。  根據賽程安排,本次比賽內容豐富。其中AlphaGo與世界排名第一的柯潔的三番棋對弈無疑是眾人最關注的焦點。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    在10月19日世界《自然》雜誌上線的重磅論文中,詳細介紹了谷歌DeepMind團隊最新的研究成果。阿爾法元完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己強化學習和參悟, 棋藝增長遠超阿爾法狗,百戰百勝,擊潰阿法爾狗100比0。
  • 谷歌一意孤行,逼出了強大對手!華為提前布局,鴻蒙迎來最佳時機
    所以谷歌只要限制其中一個環節,安卓手機廠商就會受到極大影響,特別是進入國際市場的手機品牌。因此,谷歌斷供華為,使華為的手機不能預裝谷歌GMS,使華為手機海外市場嚴重受損,因為國外用戶基本離不開谷歌全家桶。
  • 谷歌傳統藝能再現,Chrome App即將停止支持
    不過在瀏覽器市場高歌猛進之下,谷歌還是難免走了些彎路,例如此前曾被寄予厚望的Chrome App已經涼涼了。然而事實卻是無情的,據不完全統計,目前Chrome應用商店中的Chrome App有188620個,但其中僅有13個App的安裝量突破千萬,大約有50%的App安裝量在16次以內,更有著高達87%的App安裝次數不足1000次。目前外界有觀點認為,Chrome App沒有做起來的一個關鍵,就是谷歌錯誤的估計了形勢。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    前不久,《自然》雜誌刊登了谷歌DeepMind團隊的新成果,名為AlphaZero的人工智慧程序完全靠自我對弈學習下棋,不依賴人類圍棋經驗,僅訓練3天就戰勝了AlphaGo Lee,比分100:0,後者就是戰敗李世石的那套。經過40天訓練後,Alpha Zero又以89:11戰勝了Alpha Master,即橫掃柯潔的那套。