轉自:新智元
測試棋現場
新浪體育訊 3月6日,北京望京SOHO極客幫創投會議室,若干年後,這可能會是個值得紀念的日子,因為這個下午,圍棋程序「異構神機」第一次與圍棋職業高手進行了測試對局,竟然擊敗了職業棋手,雖然很快職業棋手找到了應對的辦法,但圍棋程序能夠威脅職業棋手這一點已經被證實。
開發者吳韌博士表示,圍棋人工智慧中國人也有能力做出來,而且更有意義,通過它我們可以提高棋手的競技水平,完善自己的圍棋技術,這才是人類發展人工智慧的真正目的。
吳韌博士是著名計算機博弈專家,在深度學習領域有著深入研究。「異構神機」是他基於人工智慧深度學習技術設計出的圍棋人工智慧程序,目前雖然只是剛剛起步,但從原理上已經思考清楚,技術上暫時並沒有什麼瓶頸,所欠缺的只是大量的圍棋高手對局數據來繼續「深度學習」和其餘幾個輔助系統的增加和優化。 今天進行測試的版本是以「深度學習」技術為內核的最初級版本,添加了一點蒙特卡洛算法作為驗算輔助,運行這個程序的只是一臺蘋果筆記本電腦。新浪網的記者有幸親眼見證了這一幕。
第一盤測試棋竟勝職業棋手
第一盤測試棋,上場的職業棋手竟然敗北。其實這盤棋職業棋手的形勢一直都非常不錯,但中盤階段,職業棋手起了屠龍的心思。殊不知這個只憑「感覺」下棋的圍棋程序,在做活騰挪時,竟然下得格外地精準。最終職業棋手屠龍失敗,中盤告負。不過測試的職業棋手很快調整了心態,從布局某處重新對局,果斷髮力,電腦很快就陷入了敗勢。後來,測試棋手又與程序下了讓二子局,心態穩定下來的職業棋手再度取勝。
這位參加測試的職業棋手坦言,第一盤測試棋時心理極其不適應,看著棋盤上的招法,想到對方電腦的身份,甚至有種恐怖的感覺。電腦的落子時間固定為10秒一步,無論多麼複雜的局面它都以相同的速度走棋,這也讓測試棋手非常不適應。不過後面的測試棋,人類漸漸找到了對付電腦的訣竅,電腦在某些細節的處理,還有大局的把握上,還是有一定的問題。吳韌博士在測試棋的時候,通過調整電腦的思考時間,對比招法區別,甚至現場修改程序代碼。
測試棋下完,大家都鬆了口氣。吳韌博士確信了自己的技術方向沒有問題,來觀看測試的人們則確信電腦圍棋已經能夠威脅到職業棋手了。開始採訪的時候,吳博士並不是很健談,沒有下測試棋時那麼活躍。這可能是所有科學家的特點,他們更習慣用一摞摞數據和原理圖來表達觀點。吳博士表示,雖然他對自己的異構神機有著絕對的信心,但是目前這個階段,並不想太說什麼。
人工智慧專家吳韌博士
圍棋人工智慧中國不應落後
深度學習乍一看很神奇,電腦竟然能自己「學習」,並成為超越人類的「專家」,普通人的第一感當然是不覺明歷。但對人工智慧領域的專家們來說,這項技術並不神秘。谷歌關於阿爾法圍棋的學術論文就發表在《自然》雜誌上,不久前日本宣布打造加入深度學習技術的圍棋程序「deepzengo」,並要趕超谷歌的阿爾法圍棋。顯然,日本人已經「看懂」了。
日本宣布進軍圍棋人工智慧
然而作為圍棋的發源地中國,在這件事上之前卻一直處在一個「看熱鬧」的尷尬狀態。這也是吳韌博士下決心來做圍棋人工智慧的重要原因之一。與谷歌不同,谷歌開發圍棋程序是要證明自己在人工智慧領域的技術領先地位,跟李世石下完棋,可能後面在圍棋上就沒有下文了。「異構神機」的目的則是幫助人類棋手提升圍棋水平,而不是打敗人類去證明什麼。
當今科技界,人工智慧是必然的發展方向。吳韌博士此前曾利用深度學習技術研發出了圖像識別能力世界第一流的人工智慧,今天測試棋的結果證明,在圍棋上他有著同樣的潛力。
人工智慧是人類智能的補充
基於深度學習寫出的圍棋程序,會有自己的「風格」。「異構神機」的學習樣本大都來自KGS對弈網站,因此形成了酷愛是實地的棋風。如果給程序足夠的武宮正樹的棋譜,它所走出的招法也將是「宇宙流」。如果深度學習的圍棋程序成熟了,是能夠給人類提供各種風格的選點的。
圍棋相比其他棋類,最深奧的地方就是沒有結論……尤其是在布局和大局上。圍棋程序暫時也無法告訴你每一手的最終得分,但它有可能告訴你李昌鎬會這麼下,古力會這樣選擇,等等。這也是「異構神機」項目與聶衛平圍棋道場合作的基點,可以預見的是,圍棋人工智慧很快就是能夠成為人類棋手的良好輔助了。
自我訓練是煙霧彈運算能力才是殺手鐧
谷歌圍棋的研發人員曾透露阿爾法可以通過自我對局不斷提高,吳博士認為這可能是谷歌放出來的煙霧彈。程序自我對局提高水平的方法其實很早以前在國際跳棋的程序裡就曾使用過,在頂尖水平階段,能夠帶來提升並不明顯。圍棋程序通過深度學習,已經能夠形成接近職業棋手的棋感,通過自我對局,提升不會太大。
吳韌博士對谷歌圍棋和李世石一戰並未作出預測,在他看來,預測一個「實驗」是一件很奇怪的事情。不過吳韌博士特別提到了,與李世石對局時,谷歌將使用多大於對陣歐洲冠軍時的數據處理器,這可能才是谷歌真正的「殺手鐧」和信心所在。
人類被自己的心理打敗
說起人機大戰,深藍與卡斯帕羅夫的一戰,吳韌博士是現場的見證人之一。「卡斯帕羅夫輸給的是自己的心理。」吳博士回憶起當時戲劇性的一幕:「第二盤的時候,電腦在一個局面長考了20分鐘,走出了一步讓卡斯帕羅夫非常意外的頑強防守的好棋。卡斯帕羅夫開始懷疑深藍是不是人在後面下。心思就不在棋上了,最後被電腦反攻。其實那盤棋到最後卡斯帕羅夫是能夠長將和棋的,但他沒看出來。本來這事就過去了,但晚上有個教練告訴卡斯帕羅夫可以和棋的時候,他的心理徹底崩潰了。」
心理是人類棋手與電腦對抗時最大的不穩定因素,無論是李世石還是柯潔,都要小心。忘記對方電腦的身份,是最好的應對辦法。