3月9日,首爾四季酒店成為人類AI歷史上的一個裡程碑。
在一場關乎競技、算法、AI發展乃至哲學的圍棋「人機大戰」中,代表人類出戰的韓國著名九段棋手李世石首戰不敵AlphaGo,人類智慧先丟一陣。
對弈現場。
谷歌工程師:李世石獲勝可能為0
無論是奧運會還是世界盃決賽,或許都無法像李世石對弈AlphaGo一樣引起體育界和科技界最廣泛的關注。這場圍棋人機大戰的熱度甚至早已超越了昔日IBM電腦「深藍」與卡斯帕羅夫1997年的那場對決。
賽前,大多數圍棋界人士都看好李世石能夠拿下比賽,他們的擔心只是在於在短短數月中,AlphaGo的自我學習能力可以達到多麼恐怖的層次。
創新工場CEO、曾經研發過棋類對弈軟體的李開復也透露,按照李世石與AlphaGo的Elo(圍棋等級分),可以算出去年年底的AlphaGo打敗李世石的概率相當低。
「如果對弈一盤,AlphaGo尚有11%的獲勝的可能性,而整個比賽五盤勝出三盤或更多,AlphaGo就只有1.1%的可能性了。」當然,李開復也強調這個預測是根據幾個月前的AlphaGo的表現做出的,「但是無法猜測它如今的進步能力。」
在賽前發布會上,谷歌執行董事長艾瑞克·施密特卻主要在講演科技對人類生活的促進,對於比賽只是官方表態式地說道:「輸贏都是人類的勝利。」
不過,正在韓國觀戰的中國圍棋隊總教練俞斌透露,他們得到的谷歌內部消息並沒有外界普遍的樂觀,「谷歌工程師估算,李世石勝出的可能性為0。」
而據韓國news1表示,韓國網友此次支持李世石的比例僅剛剛過半,是因為大部分人不懂圍棋,而棋迷們大部分都看好李世石的。
李世石入場。
贏一盤就是人工智慧的勝利?
Alpha Go的強大在於模擬人類大腦的神經元結構,如何結合深度學習與強化學習兩套神經網絡,簡單來說,一方面它迅速汲取10萬圍棋高手的棋局,充分利用人類棋手的即有經驗;
另一方面是「左右互搏」。每天跟自己(不同的分身)下上幾十萬盤,在不斷的試錯中自我完善、自我進化,並累積3000萬棋位(position)的資料庫……而左右互搏,自我冥想對弈恰恰也是李世石賽前備戰的方法。
儘管這場比賽是5盤3勝,下滿5盤,然而在人工智慧領域的科學家看來,AlphaGo並不需要拿下整場比賽,甚至在5盤中拿下1盤其實就取得了勝利。
英國《衛報》稱,帝國理工學院認知機器人學教授穆雷·沙那罕認為在AlphaGo戰勝樊麾後,已經說明了「AI在發展中達到了一個重要的裡程碑」,而只要戰勝李世石這位頂尖棋手一盤,就證明「人工智慧已經取得了驚人的成就,它可以在短時間裡不斷學習,變得更加強大。」
職業棋手李喆則表示:「從這盤棋的表現來看,不一定李世石會以5比0戰勝谷歌AlphaGo。」
對於人工智慧而言,沒有情感是優勢也是劣勢,因為圍棋更多地需要依靠棋手的「直覺」。
在談及很多經典勝負手時,職業棋手的答案通常是:「感覺這樣是對的。」而這其中不但包含著局域的思考,還有大局的感知,而人工智慧僅僅靠暴力窮舉無法徵服圍棋。
深度學習初創公司Skymind的創始人克裡斯·尼克爾森也認為,鑑於AlphaGo的學習能力,贏下一盤也意味著AI徵服圍棋的進程大大縮短了。
即便在哲學家眼中,AlphaGo也只需要一盤勝利。超人類主義哲學家尼克·博斯特羅姆在接受《衛報》採訪時表示:「這將使過去幾年機器學習領域的成果變得戲劇化。」
他在自己的著作《超級智能:道路、危險和戰略》寫道:如果通用人工智慧成為現實,那麼將是一個帶來無與倫比後果的事件。
比賽現場。
最強AI也只是人類思維的一部分
與「人機大戰」一樣火爆的話題是,AlphaGo贏下比賽能否證明人工智慧已經超越人類?
復旦大學哲學學院教授、人工智慧哲學專家徐英瑾在接受採訪時指出,即便李世石輸掉比賽,這並不意味著人工智慧已比人類聰明。
徐英瑾舉了個例子,AlphaGo是訓練了2000萬局棋後,才能戰勝職業圍棋選手,而一個人在成長為職業九段高手前,訓練的棋局數量遠小於2000萬。
「儘管擁有了深度學習能力,但它勝過人類的主要原因仍和以前的電腦程式一樣:運算速度快、不受生物屬性限制。」
而從與李世石的第一盤比賽來看,AlphaGo就像李世石說的那樣,「過分拘泥於局部價值,欠缺整體的完善感。」也就是說,尚欠大局觀,這也與它自我學習的方式有關。
曼徹斯特大學的計算機科學教授凱文·柯倫在接受《果殼》採訪時也表示:「人類能夠辨認並區分現實世界中的事物、明確地理解對話內容,並且基本能在現實生活中長期維持運作而不『出錯』。但最優秀的AI也只能在理想的應用情境中實現以上功能的一部分。」
來源:東方早報(記者 朱軼)
3月9日起,韓國圍棋手,擁有14個世界冠軍頭銜的李世石,將與谷歌的人工智慧系統AlphaGo舉行五場人機大戰,人工智到底最終能否超越人類,引發關注。
這是一場怎樣的世紀大戰?
過去圍棋被認為是世界上最複雜的棋盤遊戲,也是唯一一種人腦能戰勝電腦的棋類。
1月28日谷歌披露DeepMind人工智慧研究團隊研究的人工智慧系統AlphaGo挑戰了歐洲圍棋冠軍樊麾。在番棋賽中,AlphaGo以5:0擊敗了樊麾。這是軟體首次在全尺寸棋盤對職業棋手的比賽中取得這樣的成績。
在公布這一消息後後,DeepMind團隊已向全球最優秀的圍棋選手之一,韓國的李世石發出挑戰。這場即將舉辦的AlphaGo與李世石的比賽將會成為人工智慧與人類博弈史上的重要一役。
本次比賽的詳細賽程和規則:
1.比賽賽程:此次對戰分為5場,分別是:3月9日、3月10日、3月12日、3月13日和3月15日。
2.比賽盤局:五盤對局,取得三局或三局以上者為勝。若比賽出現3-0或3-1已經分出勝負後,也將下滿5局。
3.比賽規則:本次比賽採用中國規則,黑貼3又3/4子(黑貼7目半)。每位棋手各有兩個小時布局時間,3次60秒的讀秒,每場比賽預計需要大約4-5個小時。
4.比賽時間:在韓國首爾四季酒店開戰,開始時間為韓國當地時間下午1點(北京中午時間12點),比賽不設中間休息。
5.賽後獎勵:谷歌設置了11億韓元(約合100萬美元)的基礎獎金,李世石還可獲得15萬美元出場費;此外每勝一局還有2萬美元勝局獎金。如果五盤全勝,勝局獎金為10萬美元。如果李世石五戰全勝獲得優勝,最多可以獲得125萬美元。若「AlphaGo」獲勝,獎金將全部捐獻給聯合國兒童基金和STEM教育及圍棋相關公益團體。
交戰雙方是什麼來頭?
AlphaGo:
一款圍棋人工智慧程序,由位於倫敦的谷歌旗下DeepMind公司的戴維•西爾弗、艾佳•黃和戴密斯•哈薩比斯與他們的團隊開發。
作為一種人工智慧系統,AlphaGo擁有兩個大腦,落子選擇器(Move Picker)和棋局評估器(Position Evaluator)。這也基於兩個深度神經網絡,policy network與value network。二者極大地降低了需要考慮的搜索空間的複雜度,前者降低搜索的廣度,後者降低搜索的深度,很像人腦在下圍棋時憑直覺快速鎖定策略的思維。
「集合了3000萬種職業棋手的下法,數百萬次深度學習與自我對戰,十分接近帶著直覺和第六感的人類大腦,能以57%的概率預測與其對陣人類的水平。」
AlphaGo有自己學習和進化的能力。研發者表示,「人類在長時間的比賽中會因疲勞而犯錯,但電腦程式不會,人類可能一年只能下一千盤棋,而AlphaGo一天就能下一百萬盤。」
李世石:
1983年3月2日生於韓國全羅南道,1995年入段,1998年二段,1999年三段,2003年因獲LG杯冠軍直接升為六段,2003年4月獲得韓國最大棋戰KT杯亞軍,升為七段,2003年7月獲第16屆富士通杯冠軍後直接升為九段。
2006、2007、2008韓國圍棋大獎——最優秀棋手大獎(MVP)。目前這一次,谷歌挑中他作為對手,因為李世石擁有14個世界冠軍頭銜,聽起來更有說服力。
李世石的棋風屬於典型的力戰型棋風,善于敏銳地抓住對手的弱處主動出擊,以強大的力量擊垮對手,他的攻擊可以用「穩,準,狠」來形容,經常能在劣勢下完成逆轉。
這場大戰對人類的意義何在?
圍棋大師吳清源曾用一句話來抒發心情,「200歲後我要在宇宙下棋。」圍棋大師留下的一句感慨令人不禁思索:浩瀚宇宙中人類未來將走向何方?
第一個打敗人類的計算機西洋棋程序「深藍」之父——許峰雄對當年研究過程的講述,最大的感受就是:其實並不是計算機打敗了人類,而是人類打敗了人類。人工智慧對於現代乃至未來科技的發展有著極大的意義,我們不應該感到恐懼。
3月8日,在谷歌新聞發布會上,谷歌董事長施密特在開場做了簡單的發言:「這場比賽,我也不知道谷歌會不會贏,但我知道人類會變的更加聰明,技術會讓一切都成為可能。」
而李世石也表達了自己的自信,他在發布會上說:「我依舊是很有自信的,但不免有些緊張。我與谷歌機器人的世紀人機大戰將是人工智慧史上一個重要事件,能參與進來我感到非常榮幸。」
但同時他也提到「如果人類輸給機器人,對圍棋界會有不好的影響,但這個時代人工智慧發展的趨勢無法阻止,相信將會有一天人工智慧會取得勝利。即使這樣,圍棋也不會變成一項沒有意義的運動。」
早在20世紀60年代就已經出現了若干博弈程序,人類不斷製造著一種可以打敗自己的機器,從最初機器只在計算方面超越人類,現在開始在很多視覺、感覺方面越做越好,甚至像AlphaGo已經擁有自己學習和進化的能力。
李開復在接受騰訊科技的採訪中表示,在技術的選擇上,要致力於能把世界變得更美好的技術,而不能僅僅局限於先進或很酷。在工作的選擇上,要選擇能拯救生命的工作,而不是破壞生命的工作。
對於這場人機世紀大戰,人們關注的原因可能不只是因為結果,更是因為未來。此次大戰對人類將會有更多的啟迪,很多事情也將開啟新的篇章。
來源:瞭望