阿爾法狗「人肉臂」黃士傑:結束圍棋項目,轉戰下個領域

2020-12-03 澎湃新聞

5月份的烏鎮人機大戰上,當今世界圍棋第一人柯潔在賽後曾這樣評價坐在他對面的對手:「黃博士來擺棋,可能更讓我有和AI對戰的感覺。我也特別佩服黃博士,大家看直播也能看到我很愛動,總喜歡活動身體,而黃博士總是一動不動,不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時,我覺得黃博士就是AlphaGo。」

柯潔(前左)、黃士傑(前右)在烏鎮圍棋峰會現場。有一個細節值得一提,從直播鏡頭裡看,當時柯潔旁邊的桌子上,除了一個水杯,還有兩盤水果和零食。而黃士傑這邊的桌子上,只有一個白色水杯。三場比賽都是如此的擺設。

柯潔這裡說的黃博士,正是AlphaGo的「人肉臂」黃士傑(Aja Huang),他是DeepMind的高級研究員,AlphaGo團隊的領導成員之一。北京時間12月11日晚間,DeepMind公司在自己官網上線了AlphaGo教學工具,旨在幫助公眾用新的、啟發性的方式下圍棋。至此,AlphaGo也兌現了烏鎮人機大戰上許下的諾言:與全世界圍棋愛好者共同分享AlphaGo的數據。

伴隨著教學工具的上線,黃士傑也第一時間在自己的Facebook帳號上分享了感慨:AlphaGo教學工具已經發布,這也是我AlphaGo研究之旅的美好句點。我已經轉到DeepMind的其他專案,也將在深度學習與強化學習的AI研究上持續探索和精進。

黃士傑在自己的Facebook帳號上的留言

從2012年11月加入DeepMind,到AlphaGo項目的最初立項,再到陸續戰勝樊麾、李世石,此後又進化成Master,戰勝柯潔;再到今年10月份進化為AlphaGo Zero,最後發展為三類棋「通吃」,黃士傑一直是AlphaGo最核心的參與者。

回看黃士傑在DeepMind的這5年,或許能讓我們知道更多關於AlphaGo背後的故事。

Aja,我們準備啟動一個圍棋項目

2001年,黃士傑考入臺灣師範大學,開始自己的研究生學習,他的碩士畢業論文題目是《電腦圍棋打劫的策略》。到2004年,此時已經畢業一年,在學校當了一年的研究助理後的黃士傑,再次考入臺灣師範大學資訊工程研究所念博士。到了2011年6月,黃士傑的博士畢業論文答辯前夕,他就已經獲邀到加拿大阿爾伯塔大學攻讀博士後,並擔任電腦圍棋程序的研究員。當時,他的博士論文題目為《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。

在整個時間線上,需要插一句的是, 2010年,戴密斯·哈薩比斯(Demis Hassabis)和大衛·席爾瓦(Dave Sliver)在倫敦成立了DeepMind。而當2011年,黃士傑到加拿大念博士後,並擔任研究員時,大衛·席爾瓦於前一年離開阿爾伯塔大學。

到了2012年,戴密斯·哈薩比斯、大衛·席爾瓦和黃士傑才在倫敦相遇,而那時AlphaGo項目可能連想法都還沒有形成。直到2014年1月,谷歌宣布用4億英鎊收購DeepMind,事情才有了質的突破。

據黃士傑回憶,有一天,席爾瓦走到他面前說:「Aja,我們準備啟動一個圍棋項目。最開始只有你和我」。當時團隊只有三個人:哈薩比斯、席爾瓦、黃士傑。哈薩比斯是整個公司的老闆,席爾瓦是黃士傑的經理。從三個人的職位來看,黃士傑需要幹的活可能是最多的。

黃士傑落子瞬間

給AlphaGo團隊當圍棋培訓師

除了專業受到DeepMind團隊青睞外,黃士傑對圍棋的熱愛也是團隊看中的因素之一。黃士傑從小熱愛圍棋,在臺師大讀書時就曾經創辦了學校的圍棋社,是個業餘六段圍棋選手。除了愛下圍棋外,他還對電腦棋類程序競賽非常感興趣。他曾自己開發過一款圍棋程序,名為AjaGo。2010年,黃士傑開發的圍棋程序Erica,在當年的圍棋比賽中擊敗了日本著名「選手」Zen,獲得當年的冠軍。當時黃士傑在準備的博士論文也與圍棋程序相關,題為《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》。

隨著AlphaGo團隊的不斷壯大,越來越多計算機方面、深度學習領域的人才加入其中,團隊也不再只有3個人組成。但有個問題是,新加入團隊的工程師,可能之前並不了解圍棋規則,這就需要有人來為其普及知識。因此,黃士傑為新加入的同事辦了一個訓練班,普及基本的圍棋規則。

有了新力量的加入,AlphaGo項目的推進突飛猛進。2016年1月27日,《自然》雜誌以封面論文的形式,介紹了DeepMind團隊開發的AlphaGo,以及它擊敗了歐洲冠軍樊麾的消息。實際上,自那時起,黃士傑就已經成為了AlphaGo的人肉臂。在與樊麾比賽前,他還曾告訴過樊麾,AlphaGo非常厲害,但那時,樊麾沒有聽進去,也大意了。或許不只是樊麾大意了,即便《自然》已公布AlphaGo的成功,那時候,仍沒有人能夠相信人工智慧程序能戰勝人類職業棋手。直到同年3月份,它以4:1的成績打敗韓國棋手李世石,才真正意義上贏得了世界的刮目相看。

黃士傑

他是AlphaGo,但他又和AlphaGo不同

2016年3月9日至15日,AlphaGo和李世石在韓國大戰五個回合。最終AlphaGo以4:1取得勝利。當時坐在李世石對面,代替AlphaGo落子的還是黃士傑。這一次,他真正走入人們的視野,出現在電視轉播前面。

按照當時的比賽規則,每一次對弈,最長可能耗時近6個小時。據電視直播記錄,在與李世石的對弈過程中,黃士傑只喝過一次水,甚至一次洗手間都沒有去過。

「黃士傑是此次人機對弈中最辛苦受累的人,他擔心我會受到影響,對弈期間,他一直面無表情,甚至連一次洗手間都沒去過。」這是李世石賽後給予的評價,與柯潔的評價如出一轍。

黃士傑在比賽中的表現,讓人驚嘆,也是自那時起他有了AlphaGo人肉臂的稱號。作為AlphaGo的執棋手,要下好棋並不容易。戰勝了李世石後,AlphaGo以Master的名義在野狐圍棋平臺上以60:0的成績橫掃中日韓頂尖高手。在最後一盤棋結束後,Master現出真身:我是AlphaGo的黃士傑。

儘管成績傲人,但黃士傑曾在Facebook上透露,在Master對戰人類棋手取得60:0大勝過程,自己卻有過2個失誤。這是人代機器執子的過程中的人為失誤。而在一些圍棋網站的棋譜解析中,這兩步棋被認為是別出心裁的、有"非人類式"大局觀的著手。

到了今年5月,人機大戰移步中國烏鎮,坐在柯潔對面的仍是黃士傑。有一個細節值得一提,從直播鏡頭裡看,當時柯潔旁邊的桌子上,除了一個水杯,還有兩盤水果和零食。而黃士傑這邊的桌子上,只有一個白色水杯。三場比賽都是如此的擺設。

相比比賽過程中,柯潔情緒的波動,黃士傑一直面無表情,冷酷地有點像冰冷的機器。即便有記者想上去採訪,當時也被「他們不讓我接受採訪」拒絕了。

結束與柯潔的對戰後,5月28日,黃士傑少見地在朋友圈發了一條狀態:「天下沒有不散的筵席,我轉往其他專案的時刻已到」。或許從那時候起,黃士傑就一直在為與AlphaGo的道別做準備了。

有時候,結束意味著新徵程的開始,黃士傑在Facebook上說,這是自己到倫敦的第5年,他感謝家人的陪伴,但更多地,他開始期待前路,也希望自己的前路能一步步踏實的走下去。

相關焦點

  • 黃士傑博士:我的使命完成 阿爾法狗項目結束
    【PConline資訊】12月13日 凌晨,AlphaGo曾經的「代言人/人肉臂」、谷歌DeepMind科學家黃士傑(Aja Huang)博士今天凌晨在Facebook上發帖宣布,他本人將正式從AlphaGo團隊離開,轉到DeepMind其他項目的研究中去。
  • 「人肉臂」黃士傑離開,AlphaGo死了?
    12月13日凌晨消息,AlphaGo曾經的「代言人/人肉臂」、谷歌DeepMind科學家黃士傑(Aja Huang)博士今天凌晨在Facebook上發帖宣布,他本人將正式從AlphaGo團隊離開,轉到DeepMind其他項目的研究中去
  • 別了,AlphaGo之魂——黃士傑
    大時代的一批傳奇人物謝幕,他是寂寞的,自己培養的AI取代了他,如果一定要有一個人為AlphaGo的研究劃上句點,黃士傑當之無愧。從AlphaGo第一次出現在公眾視野時,黃士傑便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風範。他冷靜、他沉著,他是AlphaGo的「人肉臂」。
  • AlphaGo人肉臂黃士傑:Zero版阿法狗未達極限
    人工智慧,是簡立峰口中的完美風暴,AlphaGo 則是這一波 AI 風潮的最佳代言人,那麼,黃士傑呢?相信 DeepTech 的讀者們已經對這個名字並不陌生,他是 DeepMind 資深研究員,是與人類頂尖棋手對弈時代 AlphaGo 執棋的「人肉臂」,更重要的是,他還是開發這個神秘大腦的關鍵人物之一。
  • 人工智慧「阿爾法狗」橫掃圍棋高手
    央視網消息:過去一周,一個註冊名為「大師」的神秘網絡棋手一路擊敗數十位圍棋高手,實現了快棋戰的60場不敗。這個「大師」就是去年「人機大戰」當中擊敗韓國棋手李世石的人工智慧程序「阿爾法狗」。4號,「大師」終於透露,自己正是「阿爾法狗」的最新版本,代為落子的則是「阿爾法狗」團隊的黃士傑博士。當天與中國棋手古力的一盤棋是本次網絡公測的最後一戰。結果古力告負,「大師」實現了60場不敗。「阿爾法狗」是「深度思維」公司開發的一項人工智慧程序。
  • 解讀:AlphaGo 是如何被訓練成圍棋之神?
    圍棋棋盤是19x19路,所以一共是361個交叉點,每個交叉點有三種狀態,可以用1表示黑子,-1表示白字,0表示無子,考慮到每個位置還可能有落子的時間、這個位置的氣等其他信息,我們可以用一個361 * n維的向量來表示一個棋盤的狀態。我們把一個棋盤狀態向量記為s。當狀態s下,我們暫時不考慮無法落子的地方,可供下一步落子的空間也是361個。
  • 為什麼「阿爾法狗」誕生在倫敦?
    」時隔9個月後再次亮相,掃蕩了圍棋的江湖。從小在北倫敦長大的韓老師說:「華人最擅長的是下圍棋。」同學們都以為韓老師在表揚自己,因為大家都知道他喜歡圍棋,還在學校成立了圍棋俱樂部,業餘時間教學生下圍棋。但他接下來的話讓學生們大吃一驚:「我有一個一塊長大的朋友,我們從小一起下圍棋,後來我們一起到劍橋上大學,他學了計算機,我學了數學,然後我就給你們當了數學老師,他後來就成立了一個公司,發明了一個下圍棋的程序,名字你們肯定都聽說了,叫『阿爾法狗』」。韓老師這個同學的名字叫德米什·哈薩比斯,別看名字很複雜,其實他母親是來自新加坡的華人,父親是個希臘人。
  • 「阿爾法狗」圍棋對戰勝55局?誰是這場營銷的贏家?
    延續1個多小時的圍棋對戰,在神秘帳號Master的一句「謝謝聶老師」中結束,今天下午,中國「棋聖」聶衛平也未能在對戰中阻止Master連勝的腳步。 與的聶老的這一戰後,Master單挑世界知名的棋手,拿下了全勝紀錄(55勝1平,平局是對方選手斷線,系統判定為和棋),並且還在繼續挑戰,儼然一副「孤獨求敗」的模樣。
  • 比不過阿爾法狗, 為什麼還要學圍棋?
    2017年5月27日,中國烏鎮,棋盤一端是柯潔,另一端是阿爾法狗(AlphaGo)。聚光燈下,意料之中,柯潔零比三輸掉了這場人機對弈。   可曾記得二十二年前,還是人機對戰,同樣地,人類輸。而曾經橫掃圍棋界備受矚目的阿爾法狗就得益於「深度學習」,這讓當年的人機對弈再次被提起並被熱烈討論。阿爾法狗就像一個推手,把圍棋推向了人們的關注的焦點,推向了新的歷史舞臺,圍棋競技的技法、世界理解圍棋的角度,都在這之後慢慢發生了改變。
  • 獨家專訪「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑 : )
    在那時,Rémi Coulom 也曾經指導了一名臺灣師範大學的博士生,他叫做黃士傑。他從小學習圍棋,屬於圍棋業餘六段選手,還曾在臺灣師大讀書期間創辦過圍棋社,並獲得大專杯圍棋賽冠軍。圖丨黃士傑的博士論文在讀碩士期間,黃士傑就將圍棋定為他的研究課題。為了寫程序,黃士傑有時在實驗室一待就是十幾個小時。
  • 「阿爾法狗」戰勝圍棋世界冠軍,還將治療老年痴呆症!
    自從2016年「阿爾法狗」橫空出世,對陣世界圍棋冠軍李世石以及其他知名圍棋大師之後,人們對人工智慧有了新的認知。但在「世紀之戰」過後,「阿爾法狗」似乎淡出了人們的視線,銷聲匿跡了一段時間。轉戰新領域此次「阿爾法狗」團隊不再研究能夠戰勝人類的智慧機器人,反而決定和人類「聯手」,解決目前科學領域最棘手的問題之一:預測蛋白質。為什麼要研究蛋白質?其實當前許多重大疾病都和蛋白質有關係。此前,科學家發現了一種蛋白質是乳腺癌生長和擴散的關鍵驅動因素。
  • 如果2個阿爾法狗程序對下圍棋,結果會如何?
    這是個很有意思的問題,但其實已經發生過了。 這是個很有意思的問題,但其實已經發生過了。10月19日凌晨某國際期刊指出,谷歌新智能「阿爾法元」:在僅僅知道圍棋規則的情況下,從0開始自學,不看人類棋譜,僅僅3天時間,通過自己和自己下棋的方式,進行了490萬盤博弈。
  • 圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗
    柯潔將挑戰阿爾法狗「單挑」加「群毆」的賽制去年3月份,代表人類的韓國圍棋高手李世石在五番棋大戰中以1:4負於機器人阿爾法狗,這是一次劃時代的對弈,說明人工智慧在圍棋領域已經超越人類。去年歲末和今年年初,阿爾法狗升級版Master在網上又連勝職業高手60盤,包括贏了柯潔三盤。
  • 阿爾法狗之後的圍棋世界
    忍不住,還要念叨一下圍棋。從阿法狗(IT之家註:同阿爾法狗,下文不進行標註。)戰勝柯潔到現在,已經有一段時間了,現在圍棋AI戰勝人類已經不是公眾新聞,但就圍棋業內而言,還是有很多故事和變化在發生。
  • 柯潔對戰阿爾法狗完敗也不用怕 阿法狗只是一條"狗"而已
    柯潔對戰阿爾法狗完敗也不用怕 阿法狗只是一條"狗"而已  柯潔必然完敗,阿爾法狗才是圍棋界的"上帝"  首先來看看阿爾法狗的歷史:  阿爾法圍棋(AlphaGo)是一款圍棋人工智慧程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈薩比斯
  • 你以為人類只有圍棋下不過阿爾法狗嗎?DOTA也玩不過它!
    前段時間,阿爾法狗戰勝圍棋天才李世石的消息在網上迅速走紅,當即很多網友稱,在以後,人類再也不能在圍棋界稱霸了,但是幸運的是,阿爾法狗研發公司稱,以後阿爾法狗不會在和人類進行圍棋比賽。可是,你真的以為只有圍棋你們下不過人工智慧機器人嗎?現在就連DOTA你也玩不過它!
  • 「血洗」圍棋界,獲60連勝,完勝柯潔、聶衛平等一...
    這幾日,自稱「 Master」的九段圍棋高手攪得整個圍棋界「血雨腥風」,不僅引來諸多圍觀者觀戰,更是讓很多職業高手如 柯潔 、 樸延桓 排隊苦等與其對戰。1月2日,Master轉戰「野狐」圍棋網,之後傳來的消息是包括中國90後世界冠軍柁嘉熹九段、日本大滿貫傳奇井山裕太九段、前爛柯杯冠軍孟泰齡九段、韓國世界冠軍金志錫九段等一眾高手被Master擊敗。
  • 阿爾法狗又逆天,谷歌推教人類下圍棋工具!
    今天下午13時,「尋找圍棋小先鋒」的活動,在上海世博園萬國體育館舉行。聶衛平道場創始人、圍棋九段聶衛平先生、谷歌CEO桑達爾·皮查伊先生和谷歌大中華區總裁石博盟先生參加了此次發布會。如此規格的嘉賓陣容,足以見得谷歌方面和聶衛平對此次圍棋青少年大賽極高的重視程度。