電腦程式「阿爾法圍棋」與韓國名將李世石的五番棋較量即將展開,對於這場「人機大戰」,倫敦帝國理工學院人工智慧學者馬克·戴森羅特認為,即便「阿爾法圍棋」在這次比賽中無法擊敗李世石,計算機的勝利也只是遲早的問題。
在接受新華社記者專訪時,戴森羅特說,如果「阿爾法圍棋」擊敗了最頂尖的圍棋選手,就意味著終於有一款電腦程式在下圍棋水平上達到讓人驚嘆的地步。我們可以對比「阿爾法圍棋與深藍」,後者在上世紀90年代擊敗了西洋棋頂尖選手卡斯帕羅夫,這種電腦程式在完成某一項特別任務時,能夠做得遠遠好於人類。
「即便阿爾法圍棋在今年三月的比賽中無法擊敗頂尖的人類圍棋選手,那也只是時間問題。」他說。
戴森羅特認為,為了能夠達到職業圍棋選手的水平,「阿爾法圍棋」結合了「深度學習」和「蒙特卡洛樹搜索」方法。「蒙特卡洛樹搜索」是一種啟發式的搜索策略,能夠基於對搜索空間的隨機抽樣來擴大搜索樹,從而分析圍棋這類遊戲中每一步棋應該怎麼走才能夠創造最好機會。「蒙特卡洛樹搜索」在此前一些圍棋智能程序中也有採用,它們在相對較小的棋盤中能夠很好地發揮作用,但在正規的全尺寸棋盤上,這種方法就無法使用,因為涉及的搜索樹實在太大了。
但「阿爾法圍棋」關鍵是它採用了很聰明的策略,利用深度學習的方法降低搜索樹的複雜性。因此「深度學習」和「蒙特卡洛樹搜索」就成為它的兩個關鍵因素,這兩項技術單獨來說都有成功的實際應用——「深度學習」已被應用在包括圖像識別、文本翻譯、音頻、文本處理、臉部識別、強化學習以及機器人等領域。「蒙特卡洛樹搜索」則經常被用於可進行不同遊戲對抗的人工智慧程序中,比如像圍棋、西洋棋、《卡坦島拓荒者》這樣的桌面遊戲、電子遊戲或者撲克等。
戴森羅特認為,對人工智慧研究者來說,人機對抗這類比賽很有趣,因為它們是人工智慧邁向人類般思考的裡程碑。過去很長一段時間裡西洋棋是衡量人工智慧是否能達到人類般思考水平的標杆,「深藍」在90年代攻克了這一目標後,我們再次把這一標準提高了;隨後IBM的WATSON在《危險邊緣》電視智力競賽節目中擊敗了最好的人類對手,這成了另一個裡程碑;圍棋是最新的裡程碑——因為比起西洋棋,圍棋更複雜,此前的預計是到2025年前在這方面都很難突破。
不過他也警告說,我們在詮釋這類人機對抗的比賽結果時需要特別謹慎,因為至今人工智慧領域實現的所有裡程碑都還沒帶來一個真正意義上的智能系統——即我們認為具有近似人類智力和思考方式的系統。
他說:「電腦程式仍然沒有達到人類所展示的智力水平。一些人類習以為常的學習能力目前對人工智慧系統來說還很困難。比如人們能夠把解決某一個問題的知識用於另一個新問題的破解過程;從有限的經驗中就能學習一定技能(相比而言,『阿爾法圍棋』需要玩數千萬次圍棋才能逐步學會,並且還要再與自己下棋數百萬次才能達到目前的水平);在抽象層面進行推理的能力;與其他人合作的能力等等。」 (完)