原標題:下圍棋是阿爾法厲害打星際它贏不了人
《最強大腦》的「人機大戰」中,中國「腦王」王峰惜敗機器人「小度」。
本周五晚,中國電視史上首場「人機大戰」,在江蘇衛視《最強大腦》第四季舞臺上正式打響。最終,中國「腦王」王峰2:3惜敗於人工智慧機器人「小度」。
而就在幾天前,用連勝60局的戰績肆虐了世界棋壇近一周後,Alpha Go(阿爾法狗)脫下「Master」的馬甲,宣布暫時閉關。
人工智慧的話題在新年裡又成了熱搜。
就像美劇《西部世界》第一季的結尾,機器人被自我意識喚醒,崛起反抗人類。很多網友也擔心,機器人再這麼聰明下去,人怎麼和它在友誼的小船上相處?
記者專訪了浙江大學人工智慧研究所所長、教授吳飛和浙江大學求是高等研究院系統神經與認知科學研究所的副教授奚望,他們從各自的角度,解答了網友的兩大疑問:第一,在下棋這件事上,人到底能不能戰勝機器;第二,機器人最後會不會取代人。
可枚舉的對弈
機器一定勝人
在神秘的Master身份尚未揭秘的時候,有看熱鬧不嫌事兒大的群眾思忖著:「哎,要是Master不是Alpha Go該多好,我想看兩隻狗的人間大戰!」
如果真的有這麼「兩隻狗」,有的一拼嗎?
比如,日本也有一個非常牛的圍棋AI叫「Deep Zen Go」,它和Alpha Go一樣,也學了人類的16萬份經典棋譜。但是它在和人類對弈的時候,時有敗局。
和Alpha Go相比,它應該是輸在不夠勤奮。
Alpha Go實在是太勤奮了,一開始,僅僅有16萬局人類棋譜數據的它自覺不足,它沒有二話,埋頭學習。它每天都在進步,不停地自己跟自己下棋。這一過程叫強化學習。它學出了一個自己的「神經網絡」,神經網絡裡面的許多參數刻畫了「狗」對圍棋複雜模式的一種獨到理解,也就是其得出了自己的考試套路。
吳飛解釋說,事實上,Alpha Go通過視覺感知來進行學習下棋。也就是說,根據圖像的變化,它判斷兩件事情——「當前這一子怎麼落,這是策略網絡;整體布局怎樣推進,這是價值網絡。」
「所以,可枚舉式的對弈,機器一定會勝人。」吳飛斷言。
「狗」尤其擅長布全局。懂棋的人會發現,這60盤棋局過程中,有的時候Alpha Go有點像《天龍八部》裡的虛竹一樣,會下匪夷所思的怪棋。但下完了發現,完全不影響它贏棋。
吳飛說,這恰好是人類很難做到的,因為要有太大量的計算,人算不到那麼遠。
人工智慧取代人類
尚且遙遠
2016年10月,谷歌宣布Alpha Go未來有可能會挑戰星際爭霸遊戲。
吳飛認為,Alpha Go的能力要完成這個挑戰,還很遙遠。
資深星際玩家Joe也持一樣的觀點。他告訴記者,星際和圍棋對弈的最大不同,是對手在暗處。「對抗中,雙方同時出招,這個過程中,你不知道大量的關鍵信息——對手的作戰能力、武器情況,也不知道自己被反偵查的程度。」
在這樣信息不完備的情況下,AI(智慧機器人)目前並不像人一樣,具備推理的能力。
吳飛說,Alpha Go是AI領域的突破,但是它並不能導致AI實現終極目標——實現類人智能,「AI目前受的訓練,都依賴於有標註的海量數據。」
吳飛解釋,「也就是說,供它學習的16萬份人類對弈的棋譜,已經告訴它誰勝誰負,如果不標註,或者摻雜『噪音數據』,會大大地幹擾它的學習能力。」比如,世界上有30萬種菌菇,Alpha Go經過標註學習,能夠知道每一種菌菇的名字,但是若給它看一朵30萬以外的菌菇,它可能連這是一朵菇都說不出來,它會不知道這是什麼,「AI不會舉一反三。」
在信息不完整的情況下進行有效推理,人類有諸多優勢。
不過目前,人工智慧和神經科學兩個學科研究是相互融合和促進的。
浙江大學求是高等研究院系統神經與認知科學研究所副教授奚望告訴記者,現在也有根據人腦的神經連接特點設計的類腦晶片,可以實現當前計算機的各種功能,還有神經科學的研究,就是直接用人腦的信號來控制機器,也就是腦機接口,這些都是計算機跟神經交叉研究的熱點領域。