一劍西來天外飛仙:AlphaGo與圍棋變革(全文)_辦公列印評測試用...

2020-12-01 中關村在線

1AlphaGo的計算力與配置

    【中關村在線原創】前不久在浙江,圍棋目前ELO等級分第一、多次世界冠軍柯潔與Deepmind的人工智慧圍棋程序AlphaGo的三番棋落下了帷幕。第三盤上我們看到了柯潔的淚水。第二次人機大戰讓全人類見識到了今天的AI在卓越算法和深度神經網絡的雙重合力之下,如何徵服了人類幾千年來積累的圍棋的理解與經驗。最遺憾的是,DeepMind宣布AlphaGo收山了,世間只留下一段傳奇。


中國棋院授予AlphaGo第43個正式九段證書

AlphaGo的計算力與配置

    這次人機大戰,第二天的AI論壇爆料很多,可惜後面記者的提問都沒有問Deepmind AlphaGo的首席David Silver更多關於AlphaGo的技術細節。但就已知的來說,李世石版本的需要1300多個處理器加上280個GPU,這個版本改進了,所以只要4個TPU就可以,所以後來公布的棋譜,應該是部署了很多對AlphaGo一起下的,這樣可以幾天就收集到數以百計的狗的慢棋棋譜。


TPU2代的配置可以看出TPU:CPU大約就是2:1的比例

    AlphaGo的硬體架構大幅度的縮減但是棋力卻大幅度提升,作為科技領域的記者,我在想的問題是,拋開軟體是算法,到底需要多少計算能力就能達到Master的棋力?神經網絡拼的是「神經元」節點的數量,並非CPU有多快,一般來說就是TPU:CPU=2:1。也就是說配合一個雙處理器的至強E5 2699插滿內存,加上4個TPU二代(滿打滿算,實際用的一代)就可以實現碾壓所有人類的棋力。


能買到的最強機器學習加速卡:nVidia的TESLA P100

    再換算一下,因為我們買不到TPU,那是谷歌內部使用的。在性能測試上,TPU2的計算能力是45TFLOPS,四個就是180T,而NV剛剛公布的新DGX-1是8個Tesla P100,有170T的能力,大體上二者相當。也就是日本的DeepZenGo的配置,雙至強2699V4+4 GTX1080其實也差不多夠了,只是「地震狗」的算法比真狗差太多。


TPU在AI領域被寄予了無限的希望

    換言之,實際上的AlphaGo是一代TPU4個,因此可能只要4個Tesla P100可能就已經具備了相對應的計算力。Google自己搞TPU除了為自己的TensorFlow優化,還有避免花太多錢買GPU的意思,而定製的TPU還可以讓學習的效率更高。

2AlphaGo的棋力極限在哪裡

AlphaGo的棋力極限在哪裡

    很遺憾的是,我們沒有看到以後也極可能沒有機會看到AlphaGo下對頂尖棋手的讓子棋,只有內部測試的對歷史上版本的讓三個子,鑑於DeepMind一直一來的謙虛傳統,真覺得真相未必這樣。


DeepMind內部的測試與柯潔對戰的版本比對李世石的版本棋力要強3個子



AlphaGo Master版本對戰的棋譜第二盤震驚了整個圍棋界

    其實結合公布的50盤自戰譜,可以發現我們認為AlphaGo不行的什麼大混戰什麼打劫,都是井底之蛙。之前對人的60盤快棋裡面,基本都是50手左右人已經不行了,人太菜,連見識瘋狂對殺的機會也沒有。


人機配對賽出現了AlphaGo投降、但是古力覺得還能下的有趣一幕

    再結合古力和Master配對的傳說,古力兩三手棋,就讓勝率從75%掉到了45%,AlphaGo就是下讓子棋,哪怕讓你2-3個子,你下出了立二後拆三之類的棋,它後臺勝率就能提升一截,多下幾步你覺得「正確的應對」、「必然的一手」「本手」可能就喪失了讓三個子的大優勢拉回到同一起跑線,再然後進入它的步調,當然讓子的存在可以有特殊的應對策略。

    柯潔在後來的Blog裡面也說,以後如果Master再出來下棋,人應該恭恭敬敬的擺上兩個子,以表示對棋力的尊重。

3千年的理論就此打破?

千年的理論就此打破?

    我們從小知道3平方+4平方=5平方,這是基本的數學。平方推廣到n的時候有沒有整數解?這是費馬定理,用到的辦法叫代數數論,在數學的層次上就高的不知道哪裡去了。最近有張流行的圖片,數學的海洋,我覺得用來比喻人與Master的差距還是很合適的。


數學的深淵來比喻人和AlphaGo對圍棋理解上的差距還是很合適的

    所以當我們去欣賞它的著法的時候,有種深深的無力感。當時Master的60盤的時候,很多棋手就是下著下著就不行了,現在大家共同的理解是,在狗看來,它自己每一步都走到了全局看最優的地方,而我們還在拘泥於過去的傳統結構當中。


點星位33是圍棋初學的定式,但是AlphaGo的處理帶給我們的思考是革命性的


人工智慧AlphaGo教授告訴我們應該這麼下,局面是兩分的

     比如討論的非常多的星位點33,我覺得應該這麼看,下在星位肯定是不壞的,33點了之後取實地,哪怕只幾目,在AlphaGo的評估裡面也不算差,以後點三三的定式應該大家都按照AlphaGo的下法飛了之後頂,守角的扳了走別的地方。當然我們覺得總體來說點三三不便宜,因為人家走在外面厚,點的人裡面目不是太多。但什麼是薄什麼是厚?可能你15子的配置不如人家12個子的效率高,那就別聊薄厚了,AlphaGo早就教育我們不是面向某個方向有一些棋子就叫厚。


人機大戰第一局AlphaGo下到數字標號5的時候,人普遍認為是後手不好(圖:新浪棋牌新聞)

    所以過去我們概念裡面的俗手、先後手、無理手這些概念真的還成立嗎?柯潔的第一盤,AlphaGo的一斷是後手,但是人家一個子關係到後面很遠的發展,所以來了個「後中先」,但說實話我覺得這就是人不如AlphaGo的地方,AlphaGo眼中那就是急所應該先走的地方。棋力遠高於所有人的Master起碼不這麼認為,步步下在全盤看來價值最大的地方,那麼它的每一步就都是先手,都有道理,沒有俗手。當然那得是它下出來的,人學個皮毛下出來的應該還是臭棋,因為你這個應對沒有算到AlphaGo那麼遠,效率低。前幾天的LG杯上就出現了不少AlphaGo自我對戰的新的著法。

4什麼叫技術領先?

什麼叫技術領先?

    圍棋AI,可以分為兩種。正式比賽過的V18和Master,其它的都是仿品。


Nature的論文告訴了全世界AlphaGo實現的原理

    其它的圍棋軟體研發團隊翹首以盼的無疑是新論文。怎麼去定義科技領先?第一篇論文發表之後,棋界表示樊麾太臭,根本不是我的對手……事實教育了李世石,也讓人感受到了它的強大之後,Master的60盤應該是讓棋界徹底服了。


DeepMind的哈薩比斯表示6月將發布新論文來解釋Master為何比李世石的版本更強

    但是這期間受到公開的論文啟發,誕生的模仿AlphaGo的軟體不少,投入的資源也頗多,但是都達不到正品的棋力,並且找不到改進的辦法,這就是技術落後,單無論如何,論文已經把圍棋軟體的能力帶上了一個前所未有的高度不是嗎?前年我們還都一致的認為計算機圍棋戰勝人類還得幾年呢。


AlphaGo只是驗證AI有效性的工具,其目標遠大

   新論文很可能會告訴我們從12層深度神經網絡到40層,這28層的差異是什麼,層與層之間如何去相互影響,用什麼辦法可以提升整個軟體的效率,DeepMind說提升10倍,筆者個人覺得覺得少了,因為它的硬體配置上少了太多但是棋力更強,效率應該不止10倍。當然DeepMind那個層面考慮的是這麼做對於機器學習來說意義在於哪裡,更高效率的深度神經網絡對於整個科技界甚至謀求人類福祉的意義在哪裡,如何更好的利用而不僅僅是下圍棋。

    對於其它的圍棋AI這些來說,新論文及模仿實現一定會讓這些軟體有了大幅度的棋力,Deepmind的意思也在這裡,這些軟體提升了(而且我的論文展示的技術和理論保證你也能學用),就足夠指導現在的人類頂尖高手去提升圍棋水平了。Master收山以及不玩機器對機器的對抗也就意義在於此。

相關焦點

  • 古龍小說最好聽的武功名字,天外飛仙和小李飛刀入榜
    大家好,古龍小說中的男主角名字都很聽,而且有許多武功的名字也很優美,今天咱們來列舉一下古龍筆下最好聽的幾種武功名字,排名不分前後,歡迎各位大俠補充。1流雲飛袖∶這個武功的名字好像是一種舞蹈,但是它卻是花滿樓的武功。
  • 專注高效辦公 良田高拍儀S700AF評測(全文)_辦公列印評測試用...
    1S700AF:高清掃描瞬間搞定    【中關村在線辦公列印頻道原創】高效辦公成為商務辦公領域的共識,如何在有限的時間內高質量地完成更多的辦公作業成為商務辦公領域以及高拍儀廠商共同關注的問題。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了從亂下開始,1天達到V18(超越人類棋手水平),21天達到Master,40天碾壓Master。 less is more。 2017年起,在某些領域,AI不再需要人類知識。
  • 對陣AlphaGo 人類第一柯潔有多少勝算(全文)_辦公列印評測試用...
    1終於官宣了消息    今年元旦的時候,化名Master(Magist)的神秘高手在網絡平臺上大殺四方,對陣人類職業棋手的成績為不可思議的60勝0負,最終幕後的人肉手臂Aja Huang承認Master就是AlphaGo,並且是個新版本,對計算機圍棋的強大有了重新的認識
  • ...愛普生商用墨倉式L4168評測(全文)_愛普生 L4168_辦公列印評測...
    【中關村在線辦公列印頻道原創】對於個人辦公和中小企業來說,彩印不是一個容易的事情,彩色印表機原裝耗材價格高,改連供、自加粉又很麻煩印表機也容易出問題。愛普生全新推出的墨倉式L4168 A4全新彩色商用多功能一體機就是為個人辦公和中小企業用戶量身定製的彩印機型,拒絕負面情緒,享受快樂彩印。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    除了官網上的簡單介紹,作為 DeepMind 圍棋大使、AlphaGo 的「教練」,樊麾也在其個人微博上宣布「AlphaGo 教學工具終於上線。」他表示,教學工具共有兩萬多個變化,三十七萬多步棋組成,通過 AlphaGo 的視角,分析並建議圍棋開局的諸多下法。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)https://alphagoteach.deepmind.com
  • 千元的色彩與智能 惠普6230商噴測試(全文)_HP 6230_辦公列印評測...
    更多的閃光點隨著評測文章逐漸顯露。    自動雙面和有線網絡功能,以及為移動辦公量身打造的無線網絡、無線直連和雲列印功能都出現在惠普6230商用彩色噴墨印表機上。即使是預算有限的小企業和SOHO用戶,也可以享受到不打折扣的便捷列印和移動辦公體驗。
  • 智慧文印 惠普E77428dn彩色複合機評測(全文)_惠普複印機_辦公列印...
    普遍的情況是從省從簡,本著能用就行的原則,文印體驗、辦公效率就無從談起了。惠普進入A3複合機行業,重新調研、考量企業對文印的潛在需求,打造全新的E77422dn/E77428dn管理型彩色數碼複合機。它與傳統的文印觀念有什麼不同?能給企業文印帶來什麼新東西?來看我們試用、測試惠普E77428dn管理型彩色數碼複合機的體驗。
  • 十款彩色複印機穩定性測試結果_複印機_辦公列印評測試用...
    【中關村在線辦公列印頻道原創】經過幾十年的發展,複印機技術已經完成了從模擬到數字的轉變,一方面用戶除了對性能和品質提升的需求之外,穩定性的要求從來沒有降低過,因為一旦複印機出現問題,那麼帶來是對整個辦公效率的影響,給用戶帶來的體驗會非常不好,這也是為什麼文印廠商非常重視穩定性的一點,而影響穩定性的因素眾多,包括用戶所使用的紙張的品質
  • 存摺列印新變革 愛普生新品PLQ-50K試用評測
    下面,我們就通過評測來驗證一下,這款全新的針式印表機究竟帶來了怎樣的改變。 ●緊湊紮實 便利的工作利器初見愛普生PLQ-50K的人,都會對其小巧緊湊的機身設計印象深刻。白色的外觀設計搭配小巧的機身,能夠很好地融入辦公空間內,還可以有效節省桌面空間。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    柯潔發微博:「一個純淨、純粹自我學習的alphago是最強的……對於Alphago的自我進步來講,人類太多餘了。」Alpha Go通過數百萬次自我對弈,從零開始掌握圍棋,在短短幾天內積累人類幾千年才有的知識。
  • 天龍八部:武當應該進階七星聚首還是天外飛仙?團戰七星單挑天外
    武當的控制型進階,一個是增加群體麻痺時間的七星聚首,另外一個是增加單體麻痺時間的天外飛仙。一直以來,關於武當到底是進階七星聚首還是天外飛仙,成為了武當玩家們的爭論。其實目前主流的經脈控制選擇,武當依然是大多選擇七星聚首,因為七星聚首是百分百命中,而天外飛仙命中有一定機率。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • 傻瓜式加墨 愛普生墨倉式L6178評測(全文)_愛普生 L6178_辦公列印...
    【中關村在線辦公列印頻道原創】愛普生全新墨倉式L6178一體機採用「智能加墨」 方式,快捷省力省心,我們把它叫做「傻瓜式加墨」。墨水容量大,耐打耐用;彩打超經濟,加墨更省心,是辦公室裡更好的彩打選擇。
  • 10款彩色複印機百鍊驗真金(全文)_複印機_辦公列印評測...
    1九九八十一個日夜 嚴格測試    【中關村在線辦公列印頻道原創】經過長達3個月的測試、2個月的驗證和數據整理,最終「10款入門級A3彩色複印機橫評」終告一段落,OEBL也推出了長達數百頁的詳盡測試報告。
  • 《問道》1.49天外飛仙跨服大戰
    《問道》1.49天外飛仙跨服大戰火爆開啟在即,百萬遊戲玩家匯聚一堂,向中洲大陸唯一的霸主發起衝擊!一個新的時代即將來臨,究竟誰能勇奪「問道之王」? 日復一日的生活,讓坐鎮東海的老龍王頗感煩悶。龜丞相為了取悅龍王,將在龍宮舉行比武大賽,名曰:龍宮鬧海!《問道》1.49新版本天外飛仙火熱來襲,白熱化戰況點燃百萬激情!
  • 柯潔vsAlphaGo圍棋比賽日期時間
    相信很多棋友對於這場經常對弈很期待,下文帶來阿爾法狗vs柯潔日期介紹,一起和小編來了解下吧!  柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。而那個說著「AlphaGo贏不了我」的少年,終於站到了AI面前。
  • 存摺列印變革 愛普生PLQ-50K評測
    愛普生新品PLQ-50K評測 下面,我們就通過評測來驗證一下,這款全新的針式印表機究竟帶來了怎樣的改變。 ●緊湊紮實 便利的工作利器 初見愛普生PLQ-50K的人,都會對其小巧緊湊的機身設計印象深刻。白色的外觀設計搭配小巧的機身,能夠很好地融入辦公空間內,還可以有效節省桌面空間。
  • 全能先鋒 震旦AD400MNF雷射一體機評測_震旦 AD400MNF_辦公列印...
    震旦AD400MNF黑白雷射一體機功能全面、配置豐富、機身緊湊,標稱40ppm的列印和複印速度保證輸出效率,為中小型企業辦公提速小空間迸發大能量,震旦AD400MNF網絡型雷射一體機憑藉快速的紙質和電子文件輸出能力、直觀快捷的操作,給職場人士帶來全新的辦公列印體驗。