在公眾視線中,AlphaGo自從下完了與李世石的五盤棋之後就消失了。但事實上沒那麼簡單,再過不久,AlphaGo及Deepmind團隊通過與世界冠軍古力、周鶴洋合作的方式,將通過發布新網站,來詳解與李世石的五盤棋及AlphaGo自己對弈的三盤精選棋譜,用可視化的方式加入了AlphaGo在對弈過程中的分析及數據。或許今天的AlphaGo,要比動漫裡面的Sai(佐為)更強大。
AlphaGo到底長什麼樣?
前幾個月科技界的媒體已經公布了AlphaGo的機器,由幾個機架組成,在自然雜誌公布的棋力上,這種分布式計算的AlphaGo有1920個CPU核心和280個GPU。不過看第二張圖,谷歌的深度學習用的處理單元是定製的,那個螺絲顯得工藝不是那麼精緻。就是這個機器,用更好的深度學習的方法和強大的計算能力,戰勝了世界等級分第三的李世石九段。這個單元名字叫「張量處理單元」,(Tensor Processing Unit,TPU)。因此AlphaGo到底能否有個X86的版本,是未來的疑問。
谷歌AlphaGo機器的真身
谷歌定製的TPU,並非我們傳統的伺服器架構,對機器學習進行了專門的優化
古力九段的微博,感慨AlphaGo的強大
之前公眾只是知道AlphaGo下圍棋非常厲害,能贏世界冠軍李世石就很說明問題。但是AlphaGo是如何思考的?這才是問題的關鍵。而即將放出的棋譜,則通過非常好的可視化形式,展現出來AlphaGo在對局過程中,機器認為李世石應該走的位置,並對其進行更深層次的計算。這次的研究員古力九段曾經發微博感慨過人工智慧已經精進到了如此程度!
人機大戰第五盤在人類覺得李世石稍好的時候,機器判斷自己勝率一直在上升
有意思的是界面裡面還會有AlphaGo對輸贏的判斷,即在後臺的勝率分析,這個分析的準確性很高,因為結果也是隨著勝率的一路走高,李世石出現了投子認負(當然第四盤出了bug是個意外,現在Deepmind團隊表示更多訓練之後已經沒了這個問題)。有意思的是用戶可以結合當時的各路直播來看當時人類的分析,與機器分析進行對比。比如第五盤,右下角下完之後感覺AlphaGo送了幾個子,人類的高手普遍判斷是形勢上執黑的李世石稍好,但是機器的後臺判斷那時候AlphaGo的勝率是一直領先的,因為有一路爬回的手段。
AlphaGo自我對弈的棋譜,15秒一步,全是中腹的戰鬥
更為可怕的是此次Deepmind團隊放出了三個機器自我對弈的棋譜,設定的機器每一步思考只有15秒的時間,但是從公布的棋譜看,似乎非常深奧,只能期待古力與周鶴洋這兩位九段高手的理解了,因為對於AlphaGo,現在人類的棋藝已經難以企及它的高度,只能是從既有的圍棋知識去做判斷。
歡迎掃碼關注我們的公眾號生活科技新知(lifeintech),上面會有很多獨到內容喲!
AlphaGo登陸網絡圍棋
是第二次人機大戰要開始了嗎?並不是。而是谷歌的Deepmind團隊,在對弈網站gokgs上,設置了一個對弈機器人!這個機器人不是別人,正是大名鼎鼎的AlphaGo!
AlphaGo登陸網絡對弈平臺GoKGS,名字叫AlphaGoBot
不過現在還都只是一些測試工作,並且工程師Aja黃,就是人機大戰坐在李世石對面的那位Deepmind團隊的人,在平臺裡面解釋這只是做一些測試,沒有谷歌的許可,是不可以開放這個AlphaGo機器人和KGS上的棋手對弈的,當然不止KGS,Deepmind團隊在多個圍棋對弈平臺都布置有機器人。
單機版、V20的AlphaGo到底會有多強?這需要谷歌的允許才會揭曉答案
相比之下,這個對弈的機器人與幾個月前人機大戰的AlphaGo並不一樣,是單機版的,CPU、GPU要少得多,因此搜索的線程更少,按理說棋力應該稍差,可問題是,這個版本和當時不同,當時李世石對弈的版本是V18,而這個是V20,也就是進化了兩代,根據Deepmind團隊的說法,如果一個版本的勝率對上一個版本要達到90%,才會被標註為一個全新版本,這已經進化了兩次的V20到底有多強的棋力?相信一旦能正式上線與人對弈,全世界各路頂級職業棋手一定會排隊與之對弈。
可能的大新聞
今年3月的時候,谷歌來了中國,包括CEO皮查伊,也見了中國棋院的人以及棋聖聶衛平。這在當時讓人產生聯想,甚至一度傳出來今年晚些時候在海南舉辦柯潔與AlphaGo的人機大戰!世界排名第一VS AlphaGo!
三月的時候谷歌的CEO訪華,特意與中國圍棋界見了面,圖片來自古力微博
然而現在看這場比賽或許要泡湯,因為聶衛平這兩天接受採訪透露出來的意思是,人類棋手根本下不贏AlphaGo,綁一塊一起下也下不贏,很可能就是非正式的打了退堂鼓。當然筆者是看熱鬧不嫌事兒大,當然希望有第二次人機大戰。因為唯有如此,才能看看進化到V20或是更高版本的分布式AlphaGo到底強悍到了什麼程度,人類最強的柯潔到底能不能贏,能贏幾盤?
當年西洋棋領域的人機大戰
其實圍棋輸了也沒什麼,中國象棋的電腦軟體甚至讓人一馬也能贏,是人和電腦學習新套路,西洋棋卡斯帕羅夫輸了兩次之後,西洋棋界已經徹底服氣,現在人根本下不過電腦。而到了圍棋這裡怎麼就不肯正式的下一盤,輸了也是人類智慧的勝利。人類普遍的共識是職業圍棋早晚輸給電腦,只是沒想到居然這麼快,這是難以承受的地方。
人機大戰AlphaGo在右下角脫先在上面還原成中國流布局,顛覆了以往局部定式的認知
其實我反而覺得,圍棋不可能像象棋、西洋棋那樣容易的被窮舉,因此AlphaGo的算法如果越強,那麼人與之學習進步的空間也就越大,反而是推動人類圍棋進步,比如很多定式機器改了走法,再比如對形勢的判斷等等,會產生大量根本性的理念與認知上的變革。圍棋無止境,機器帶著人加速進步難道是壞事嗎?