獨家專訪「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑 : )

2020-11-28 DeepTech深科技

早在上世紀 60 年代,就已經有人開始對圍棋的電腦程式進行研究。當時還在威斯康辛大學麥迪遜分校讀計算機博士的Albert Zobrist引入了影響函數(influential function),為棋盤的每個空位計算數值,從而劃分黑白領域並為每個子的影響力打分。

圖丨w:白子影響函數;b:黑子影響函數;m:相互影響函數

1972 年,密西根大學的Walter Reitman 和 Bruce Wilcox開始把人工智慧研究應用於圍棋。

從上世紀 80 年代末起,中國科學家也在相關領域做過一些工作,其中影響力最大的是陳志行和他的圍棋程序「手談」。從 1994 年到 1997 年,「手談」在兩個重要的國際計算機圍棋比賽應氏杯和 FOST 杯中共獲得了六個冠軍。

進入 21 世紀後,機器學習技術和蒙特卡羅樹搜索等方法開始被大量引入圍棋程序中,也讓圍棋人工智慧出現了飛躍。

2004 年,法國的B Bouzy 和 B Helmstetter發表論文,在評估某個行棋位置的時候,他們讓自己的蒙特卡羅圍棋程序隨機選取一些點,並以此為基礎完成一定數量的棋局,從而計算某個點引發的棋局最終結果的平均分數。

圖丨蒙特卡羅樹搜索

在此基礎上,法國計算機科學家 Rémi Coulom 開發出了圍棋程序 Crazy Stone。2008 年,Crazy Stone 在被讓 8 子的情況下戰勝了職業棋手青葉燻四段——這是計算機首次在讓 9 子之內戰勝職業棋手。

在那時,Rémi Coulom 也曾經指導了一名臺灣師範大學的博士生,他叫做黃士傑。他從小學習圍棋,屬於圍棋業餘六段選手,還曾在臺灣師大讀書期間創辦過圍棋社,並獲得大專杯圍棋賽冠軍。

圖丨黃士傑的博士論文

在讀碩士期間,黃士傑就將圍棋定為他的研究課題。為了寫程序,黃士傑有時在實驗室一待就是十幾個小時。他甚至還為了延續自己的研發成果而推遲兩年畢業,最終,功夫不負苦心人,他設計的程序不僅獲得了 19 路電腦圍棋金牌,更是擊敗了當時最強的圍棋程序 Zen。

在當時,這名計算機專業博士提出了一些新的蒙特卡羅樹搜索的啟發式算法,包括應用了模擬平衡算法(Simulation Balancing)和時間控制方法,極大地提升了程序的棋力。黃士傑用自己妻子的英文名 ERICA 給程序命名。

不過,這些程序都沒有達到職業水準。性能最好的 Crazy Stone 和 Zen 也只達到了業餘 5 段的水平。在那個時候,圍棋界一般認為,計算機戰勝職業圍棋選手的那天還遠遠沒有到來。

圖丨圍棋程序Crazy Stone

2012 年,在加拿大阿爾伯塔大學做了一年博士後研究員後,黃士傑加入了英國的人工智慧創業公司 DeepMind。當時 DeepMind 創建剛剛兩年,創始人是Demis Hassabis,Shane Legg 和 Mustafa Suleyman,早期投資人包括 Elon Musk、Peter Thiel 的 Founders Fund、以及李嘉誠的 Horizons Ventures。

2014 年 1 月,谷歌以 5 億美元的價格收購 DeepMind,那時的 DeepMind 尚未發布任何一個產品,只有一篇還沒有發表的論文。當時,黃士傑名列公司內兩位首席工程師之一。

DeepMind 早期希望通過機器學習和系統神經生物學理解智能。2014 年 10 月,公司發布了一款原型產品,可以讓計算機模擬人類大腦的短期記憶功能。

圖丨Demis Hassabis、David Silver和黃士傑

2014 年,DeepMind 組建了 AlphaGo 項目,用來檢測使用了深度學習的神經網絡能否應用於圍棋。公司的科學家通過增強學習讓 AlphaGo 自己下了數千盤棋,矯正模型。

隨後,AlphaGo 又與 Crazy Stone、Zen 等圍棋程序下了 495 盤棋,只輸了 1 盤。為了增加難度,AlphaGo 又與 Crazy Stone,Zen 和 Pachi 下了讓四子棋,勝率分別為 77%、86%和99%。

2015 年 10 月,AlphaGo 隨後以 5:0 的比分完勝歐洲冠軍樊麾二段,這是電腦程式第一次在正式比賽中戰勝人類職業選手。

圖丨AlphaGo完勝樊麾二段

2016 年 3 月,AlphaGo 在普遍不被看好的情況下以 4:1 的比分戰勝了 18 次世界冠軍李世石九段。這標誌著計算機已經足以戰勝頂尖的人類圍棋選手,象徵意義可以媲美 19 年前「深藍」戰勝西洋棋大師卡斯帕羅夫。賽後,韓國棋院授予 AlphaGo 名譽九段證書,《科學》雜誌將之評為 2016 年十大突破之一。

在 2016 年 2 月,DeepMind 在《自然》雜誌上發表了一篇文章,介紹了自己的研究方法。他們在論文中表示,研究團隊使用監督學習的方法研究人類專家的棋局,同時也使用增強學習的技術讓 AlphaGo 自己和自己下棋。

5 月 23 日,中國·烏鎮圍棋峰會的人機圍棋大戰打響。最終,AlphaGo 三勝柯潔,也毫無懸念地戰勝了 5 位世界冠軍組成的聯隊。賽後,AlphaGo 獲得了中國棋院頒發的九段證書。至此,在圍棋領域,人機對戰的勝負不再有懸念。

實際上,為了這一天的到來,人工智慧圍棋學界實際上已經努力了將近半個世紀。

但毫無疑問的是,回看整個圍棋人工智慧發展史中,黃士傑的出現以及他之後的貢獻是最重要的轉折點之一。不僅是圍棋人工智慧技術的重要奠基者、AlphaGo 的幕後推手,他都直接參與「腦」的研發設計,甚至還作為「手」替 AlphaGo 在對弈中執子。

不論是在剛剛結束的烏鎮人機大戰中,還是去年在韓國首爾對陣李世石,我們都會留意到黃士傑非常「淡定」的坐著,儘量不去做落子之外的任何多餘動作。

李世石曾回憶道,黃士傑擔心他受影響,對弈期間面不改色,整個過程中就喝了一口水,甚至連一次洗手間都沒去過。黃士傑作為業餘六段的棋手,或許是在代替AlphaGo向對手表達應有尊重。

近日,DT君有幸對這位通常十分低調的人工智慧學者進行一次獨家專訪。這次的問答沒有太多談及技術,但有不少細節十分值得閱讀。

圖 | 黃士傑博士

問:能具體描述一下身為「AlphaGo之手」是一種什麼樣的感受?

黃士傑:AlphaGo 是 DeepMind 團隊努力不懈的成果,我有一種很強的責任感,絕對不能犯錯,因此對局時我始終努力保持冷靜。能跟頂尖棋手們面對面下棋我也感到無比的榮幸。

問:您個人更希望機器贏還是人類棋手贏?柯潔和李世石都曾坐在您的對面下圍棋,兩人給你的不同感受是?

黃士傑:作為 AlphaGo 團隊的一員,我當然是站在 AlphaGo 這一邊。不過李世石九段靠著「神之一手」贏下了第四局,我衷心為他感到高興,因為在比賽過程中,我感覺到他承受著極大的壓力。柯潔九段跟我都說中文,我們在對局前後都有簡短的交流,因此跟他對局我感到比較親切。

圖 | AlphaGo對戰李世石(上圖) & AlphaGo對戰柯潔(下圖)都由黃士傑博士執子

問:當初為什麼同意加入AlphaGo項目?是什麼吸引了您?

黃士傑:我熱愛圍棋,我在博士班期間所開發的圍棋程序 Erica 甚至是以我太太的英文名字所命名的。其實,Demis Hassabis(DeepMind創始人)與David Silver(AlphaGo項目負責人)在項目開始的時候,動機比我更強烈,我們三個人也就成為了 AlphaGo 的創始團隊。

問:在研發AlphaGo的過程中印象最深刻的一件事情是?

黃士傑:研發 AlphaGo 讓我印象最深刻的始終是 AlphaGo 不停止的進步,我們團隊是在把科學的力量發揮的淋漓盡致。也因此我也清楚的認識到圍棋的深奧,圍棋遠遠的難於我原本所想像的。

(圖片由谷歌官方提供)

問:在不久前的烏鎮圍棋峰會團體賽中,有一個小插曲,當時棋手周睿羊起身應該是去洗手間,而為AlphaGo執棋的您露出了「迷之微笑」,請問當時您在想什麼?

黃士傑:團體賽的氣氛是比較輕鬆的,我也可以清楚的聽到五位棋手在討論什麼。周睿羊九段所提出的下法似乎常常被其他四位棋手反駁,我覺得十分有趣,所以周九段起身時,我們互看了一眼,很有默契的互相微笑了一下。

問:對於很多人來說,AlphaGo宣布不再參加比賽是非常遺憾的,您怎麼看待?

黃士傑:我覺得 AlphaGo 在圍棋項目的歷史性任務已經完成了。AlphaGo 不但幫助了圍棋界在圍棋技術上的突破,也促進了計算機圍棋界與 AI 領域的進步。

未來,其他的圍棋程序可以站在我們所公布的 AlphaGo 論文基礎上繼續研發,普及圍棋並探索圍棋的真理。所以我並不覺得遺憾。

(圖片由谷歌官方提供)

問:一個充滿腦洞的說法是,您已經是AlphaGo本人了,那麼,您如何證明自己是黃博士而不是AlphaGo呢?

黃士傑:比賽中我不是微笑了嗎? AlphaGo 是沒有感情的,我會笑就證明我不是 AlphaGo(迷之微笑)。

圖 | 黃士傑博士(右)與浙江省圍棋協會秘書長盧俊和(左)

問:據說,AlphaGo的研發團隊中僅有您一人會下圍棋,這樣的人員配置其實挺有意思的,DeepMind為何如此設置?

黃士傑:事實上,Demis Hassabis(DeepMind創始人)與David Silver(AlphaGo項目負責人)都會下圍棋,棋力大約都是業餘初段。Demis 與David 在1997年深藍(Deep Blue)打敗西洋棋王之後,就夢想著一起研發出超級圍棋 AI,DeepMind 被 Google 收購之後,我們三個人對計算機圍棋與圍棋的熱情,促使了 AlphaGo 項目的誕生。

我雖然在團隊中的棋力是最強的,但是研發人員的棋力並不是研發 AlphaGo 的必要條件,這也證明了 AlphaGo 的技術具備了很強的通用性,即使是圍棋初學者也可以根據我們的論文打造出自己的 AlphaGo。

相關焦點

  • 別了,AlphaGo之魂——黃士傑
    大時代的一批傳奇人物謝幕,他是寂寞的,自己培養的AI取代了他,如果一定要有一個人為AlphaGo的研究劃上句點,黃士傑當之無愧。從AlphaGo第一次出現在公眾視野時,黃士傑便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風範。他冷靜、他沉著,他是AlphaGo的「人肉臂」。
  • AlphaGo人肉臂黃士傑:Zero版阿法狗未達極限
    「我沒有想過一個名詞能獲得所有人的認同,從政治人物、科學家、企業家、到學生甚至是小孩,都覺得這件事明天會發生,這場完美風暴的引爆點是 AlphaGo,黃士傑可能自己都沒想過,他那隻幫機器下棋的手,改變這個世界:讓大家相信或者憂慮機器會超越人類」,Google 臺灣董事總經理簡立峰說。
  • 谷歌DeepMind首度放出紀錄電影《AlphaGo》預告片
    圖丨紀錄片《AlphaGo》的海報在今年早些時候, DT君曾對為 AlphaGo 執子、有「AlphaGo 之手」之稱的黃士傑博士進行過專訪,他在專訪中曾表示:「研發 AlphaGo 讓我印象最深刻的始終是 AlphaGo 不停止的進步,我們團隊是在把科學的力量發揮的淋漓盡致。也因此,我也清楚的認識到圍棋的深奧,圍棋遠遠的難於我原本所想像。」
  • AlphaGo Zero幕後開發心路歷程大公開!DeepMind資深研究員黃士傑最新演講解密
    【導讀】11月10日,黃士傑應臺灣人工智慧年會之邀來臺演講,演講主題是「AlphaGo——深度學習與強化學習的勝利」,也是他首次公開演講。 「我沒有想過一個名詞能獲得所有人的認同,從政治人物、科學家、企業家、到學生甚至是小孩,都覺得這件事明天會發生,這場完美風暴的引爆點是AlphaGo,黃士傑可能自己都沒想過,他那隻幫機器下棋的手,改變這個世界:讓大家相信或者憂慮機器會超越人類」,Google臺灣董事總經理簡立峰說。
  • 阿爾法狗「人肉臂」黃士傑:結束圍棋項目,轉戰下個領域
    到了2011年6月,黃士傑的博士畢業論文答辯前夕,他就已經獲邀到加拿大阿爾伯塔大學攻讀博士後,並擔任電腦圍棋程序的研究員。當時,他的博士論文題目為《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。2010年,黃士傑開發的圍棋程序Erica,在當年的圍棋比賽中擊敗了日本著名「選手」Zen,獲得當年的冠軍。當時黃士傑在準備的博士論文也與圍棋程序相關,題為《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。隨著AlphaGo團隊的不斷壯大,越來越多計算機方面、深度學習領域的人才加入其中,團隊也不再只有3個人組成。
  • 黃士傑博士:我的使命完成 阿爾法狗項目結束
    他的博士論文題目是:《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。   2011年6月,黃士傑博士答辯通過,7月1日,黃士傑飛赴加拿大。   此時,他後來會遇到的席爾瓦(David Silver),早於一年前從阿爾伯塔大學離開,前往倫敦大學學院。在倫敦,席爾瓦會遇到哈薩比斯。   到阿爾伯塔大學後,黃士傑繼續研究蒙特卡洛樹搜索。
  • 「人肉臂」黃士傑離開,AlphaGo死了?
    AlphaGo之死?今年5月,AlphaGo在烏鎮戰勝世界圍棋第一人柯潔,代AlphaGo落子的「人肉臂」就是黃士傑博士雖然DeepMind官方並沒有宣布這是否意味著AlphaGo項目正式結束,但是早在今年5月戰勝世界圍棋第一人柯潔後,DeepMind
  • Master就是AlphaGo升級版!60連勝背後看專家怎麼評說
    本文帶來新智元智庫專家白碩、鄧侃的獨家解讀。同時,國內圍棋AI 的一名開發者也透露了他的看法:Master的水平略有些讓人失望。新智元還採訪了中國圍棋隊總教練俞斌,他在文中談了自己的看法和理解。這一次,機器可能不再借用人類經驗,而是憑藉自我對弈和學習戰勝了人類,讓人類認識到另一個「真理」的存在。從某種程度上來說,這是一個新的「紀元」的開啟。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)https://alphagoteach.deepmind.com
  • 阿爾法圍棋ALPHAGO 紀錄片
    在反覆試錯、討論、改進之後,AlphaGo終於更新到了第18代,並即將迎接屬於它的世紀之戰。代替AlphaGo執子的是——黃士傑(深思公司首席程式設計師)他有些緊張,這是他第一次坐在世界級圍棋手面前,他能感受到李世石這偉大圍棋手的精神與禮節,他想這也是李世石第一次面對一個陌生的對手——它不是人類,沒有情感。它很冷漠,但它很鎮定。
  • 解讀:AlphaGo 是如何被訓練成圍棋之神?
    虛竹在天龍八部裡自填一子,無意中以「自殺」破解「珍籠」棋局,逍遙子方才親傳掌門之位。難道以後「阿爾法狗」要出任逍遙派掌門了?1933年,東渡日本19歲的吳清源迎戰當時的日本棋壇霸主、已經60歲的本因坊秀哉,開局三招即是日本人從未見過的三三、星、天元布陣,快速進擊逼得對方連連暫停「打卦」和弟子商量應對之策。
  • 業界| 微軟宣布投資人工智慧孵化器Element AI,機器之心獨家對話...
    機器之心原創機器之心編譯參與:蔣思源、李澤南、ChainnZ在機器學習領軍人物 Yoshua Bengio 的 Element AI 成立僅僅一個多月後,微軟旗下的風投公司 Microsoft Ventures 今天宣布了向 Element AI 投資的新動向。
  • 柯潔首戰憾負機器!新版Alphago棋風更穩健
    alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰,而是人類使用電腦作為工具探索新的東西,就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏,最終還是人類贏。祝柯潔好運。」來源:網易科技
  • 獨家| 專訪田淵棟:AlphaGo之後,研究智能圍棋還有什麼意義?
    沒有什麼是永垂不朽的,沒有什麼會一直昌盛,所以我寧願做點真正有意義的事情,來致敬這個風起雲湧的人工智慧時代。人在學圍棋的時候有很多概念,按照概念做判斷,但是機器解決他還是比較暴力的。一方面,你可以說人用概念來做推理局限了他的計算能力,體現出人本身有一個高度抽象的能力,就是用非常非常局限的計算能力,能達到那麼強的棋力。而AlphaGo就是用非常多的計算能力去彌補這些不足,所以恰恰是互補的,我相信還是有意義的。
  • 獨家|專訪田淵棟:AlphaGo之後,研究智能圍棋還有什麼意義?
    職業棋手是很厲害的,人腦的神經傳導是毫秒級的,這點時間機器可以幹很多事情,但人就是用這麼慢的處理速度達到了這麼強的水平。2. 絕藝和AlphaGo有差距麼,差距是多少,是什麼造成了這種差距?這個我稍微看了一下,我覺得絕藝肯定是比Zen要強挺多,200手不到就讓Zen認輸了。
  • 「服務窗口,微笑是一把神奇的鑰匙」
    日前,我在滁州市2019年度「文明行業·文明窗口·服務之星·微笑大使」評選中榮獲「服務之星」稱號。這既是對我階段工作的肯定,也是對我進一步提高服務質量的鞭策。常年在一線工作的我,深刻體會到微笑服務就像是一把神奇的鑰匙,能夠打開心靈的「幽宮」,微笑的光芒能夠照耀身邊的一切,給身邊人增添溫暖。微笑,並不僅僅僅是一種表情的展示,更重要的是與客戶作感情上的溝通和交流。
  • 獨家專訪Owl City:泰勒·斯威夫特是我的偶像
    由創作才子亞當·揚(Adam Young)組建的單人樂隊貓頭鷹之城(Owl City)宣布,今年將於8月20日在上海風尚音樂新地標The Mixing Room& Muse舉行演唱會。
  • 網友:沒有感情的吃瓜「機器」!
    網友:沒有感情的吃瓜「機器」!水豚是世界上最大的齧齒動物,作為一種食草性動物,它們常常啃食植物或者吃水果,那水豚的吃瓜速度有多快?就像是沒有感情的吃瓜機器一樣,作為一種半水棲的動物,它們可以在陸地上生存,也可以在水中遊走,常年棲息於植物繁茂的沼澤地裡,性格溫和安靜。
  • 獨家專訪諾貝爾化學獎得主斯託達特:這會是震撼化學界的全新領域
    當天,斯託達特接受了世界頂尖科學家論壇(WLF)的獨家視頻專訪。他在採訪中預言:分子納米拓撲學將是震撼化學界的全新領域。所以,我會叫這個未被開墾過的新領域——分子納米拓撲學。因為未來對我而言也充滿著未知,我並沒有比其他人知道的更多。」
  • 《蒙娜麗莎》微笑之謎?放大30倍,終於解開微笑之謎
    《蒙娜麗莎》微笑之謎?放大30倍,終於解開微笑之謎在歷史上出現過很多名畫,但是其中《蒙娜麗莎》這幅畫是一幅很神奇的話,因為你在哪個角度看她,她都微笑著,這正是這幅畫的一個神奇之處。最近《蒙娜麗莎》被科學家們放大了30倍,然而也終於揭開了微笑之謎!《蒙娜麗莎》是義大利文藝復興時期畫家李奧納多·達·文西創作的油畫,現在收藏在法國羅浮宮博物館。