圍棋世界冠軍李世石與谷歌人工智慧程序AlphaGo首戰打響!此次人機對戰將於北京時間3月9日-15日在首爾四季酒店舉行,具體日程為:3月9日進行首場比賽,此後的3月10日、3月12日、3月13日、3月15日裡,每日進行一場比賽。Youtube對本次賽事進行全程直播,國內棋迷也可通過B站、網易等渠道觀看。
繼1997年IBM超級計算機「深藍」擊敗西洋棋世界冠軍卡斯帕羅夫以後,人工智慧又向人類博弈遊戲的最後堡壘圍棋發起了挑戰。事實上,就在不久前,谷歌已在《自然》上刊登論文,宣布旗下DeepMind開發的人工智慧程序AlphaGo,在十九路圍棋分先5比0擊敗了歐洲圍棋冠軍、旅法職業棋手樊麾二段。有媒體評論,若此次AlphaGo戰勝李世石,哪怕只勝一盤,也將成為計算機發展史上的「登月事件」。
比賽還沒開始,全民就已經熱情高漲。截至開戰前1小時,B站已有8,000人守在直播間眼巴巴地等待比賽開始。中午12:00,比賽正式開始,YouTube視頻播放量在直播開始(YouTube直播11:30開始)20分鐘內就接近3萬 。虎嗅全程關注比賽(賽況直播綜合自Youtube、新浪、網易)。
李世石開局不利
棋賽正式開始,李世石執黑子,谷歌AlphaGo執白子。
開戰一小時,雙方在右上角陷入激戰。第7手時,李世石走了一步出人意料的棋,這一步在職業棋手中比較罕見的。曹大元說,如果是職業高手之間對陣下這一步,是要被批評的。曹大元表示谷歌人工智慧比上次戰勝歐洲圍棋冠軍樊麾時更強,而且從目前情況來看,白棋下得更好一些。
新浪直播嘉賓、中國棋院九段棋手俞斌認為李世石表現得比較急躁,不太有利。Youtube解說員、九段棋手麥克雷蒙也認為黑棋目前比較危險,並評價AlphaGo表現驚豔。同在解說現場的搜狗CEO王小川則表示,在足夠複雜的局面下,機器的極限高於人。
77手,李世石首次離席。一般對手會等對手回來才落子,但電腦沒有這樣的「覺悟」,馬上就落子了= =。
AlphaGo出現失常
開賽1小時40分鐘左右,AlphaGo出現失誤,但隨即在86手時使出了兇險招數。Youtube解說、韓國金成龍九段評價:成為職業棋手27年來,第一次看到白86斷這手棋!然而李世石看到斷這步棋後,搖了搖頭。
古力九段此時分析,黑棋左下已經構成很具規模的地盤,右上邊目數也比較大。而白棋如果不逃出左下局面被包圍的兩子,盤面將明顯落後。而實戰是李世石夾死了AlphaGo左下的兩顆白棋,白棋選擇在右邊打入。目前右邊白棋大龍雖長,但眼位明顯比較缺乏。
棋局進行到現在,形勢判斷各方認為李世石優勢。網易直播解說員、中國棋院九段棋手曹大元表示:白棋現在有點失常。
重大失誤後,李世石面露沮喪
開賽2小時30分鐘,各方一度預測李世石穩勝。俞斌甚至說,接下去的看點就是機器會不會主動認輸。
但隨後AlphaGo似乎一直在製造變數,一通攪局後,黑棋已不具明顯優勢。將近3個小時,白棋50目左右,黑棋不算右下是55目,右下還未定型。不久,李世石右下出現失誤,有評論員大呼不好,說李世石要輸。
現場有人問金成龍李世石右下失誤是否會影響勝負,金成龍說你不要套我的話,講棋的只會說這棋好難好難啊,這種對弈需要大心臟,可是AlphaGo沒有心臟,我也是人,得去下洗手間了。
比賽進行到3小時30分鐘,俞斌宣布:這棋基本可以宣判了,如果是我們比賽研究室,在這個階段,可以收子了。 李喆補充說:如果電腦不犯特別低級的失誤,李世石基本輸了。李世石似乎面露沮喪。
15:35左右,李世石宣布認輸。
李世石曾信心動搖
對於這場世紀大戰,李世石此前曾表示自己有信心獲勝。「我聽說谷歌DeepMind的人工智慧技術很強,而且還在提升,但我還是有信心的,我覺得至少這次可以贏。」但僅僅過了半個多月,李世石卻對美聯社表示:「但是如果人工智慧繼續發展,再過一兩年,結果就很難說了。」
而就在昨天,對弈「雙方」在首爾舉行了賽前最後一場記者見面會。李世石在記者會上表示,他認為到目前為止還是人類比人工智慧強,「不過聽到人工智慧具有了類似人類的直覺判斷能力,我倒感到有些緊張, 恐怕我以5比0戰勝它有點兒夠嗆,因為人類下棋時會有失誤。」
針對AlphaGo戰勝樊麾一事,李世石認為,「阿爾法圍棋此前與樊麾的對局應算業餘中的頂級水平,並非職業水平。」他表示:「之所以接受機器的挑戰,是因為聽到歐洲冠軍被擊敗感到震驚。如果我失敗,可能會對圍棋的流行造成影響,但人工智慧擊敗人類是不可避免的事情。」
「阿爾法狗」有多厲害?
「深藍」打敗西洋棋世界冠軍,已經給人工智慧界帶來了一次休克性的震撼。然而比起西洋棋,圍棋要複雜得多,對比一下便知:西洋棋的第一步有28種下法,圍棋有361種;西洋棋一局大約是40個回合,而圍棋可長達150個回合。在「深藍」時代,大多數西洋棋電腦依賴的依然是窮舉法,即計算並評估所有可能的下法,然後從中選擇對自己最有利一種,「深藍」當時的運算能力是每秒計算2億種下法。
但在圍棋中,這種方法根本行不通。據科技媒體Ars Techtica報導,以當今計算機的運算能力,用窮舉法來計算圍棋下法幾乎是不可能的事。另據《衛報》分析,即使窮舉法下圍棋可以實現,計算機每走一步都要耗費大量時間進行計算,這樣下去根本連普通選手都下不過。這種困境,甚至使得一位知名圍棋軟體開發者在2014年放出話來:機器要戰勝人類選手,恐怕要再等10多年。
AlphaGo已經以事實證明要不了那麼久。與傳統解決方案不同,AlphaGo人工智慧程序結合了深度神經網絡機器學習方法和樹搜索算法。簡單來說,就是先讓AlphaGo觀察人類下圍棋,然後通過將不同決策進行比較來提升技能,這一過程被叫做強化學習。經上百萬次重複後,AlphaGo就可以進行對戰了。
谷歌DeepMind CEO Hassabis表示,用強化學習技術「教」機器下圍棋,就如同教小孩子一樣,不是讓程式設計師添一段代碼就完事,而是要給程序看足夠多的案例,讓機器自己「領悟」到正確的下法。
從一定程度上說,AlphaGo是在以預測的方式模擬人類的直覺,試圖以人類的思維去學習圍棋。目前,AlphaGo模仿人類的直覺判斷程度約為80%,但李世石表示由於它的運算速度要優於自己,所以要格外小心。
這種強化學習技術的應用,其實早已不局限於圍棋。DeepMind曾用相同的技術教會計算機玩雅達利的經典遊戲。另有消息稱,DeepMind最近宣布與英國國民健康服務中心合作,首個項目是為醫生護士開發一款可以監測到病人是否出現急性腎衰竭的App。
接下來的比賽究竟勝負如何?虎嗅將持續關注。
*文章為作者獨立觀點,不代表虎嗅網立場