別了,AlphaGo之魂——黃士傑

2020-11-28 新智元

新智元報導

12月寒冬的最冷一天，這條深夜的臨別感言引爆了朋友圈，熱鬧喧囂的討論更映襯出一個時代終結的孤寂悲涼，黃士傑，一位精通圍棋的AI工程師，他一手造就的AlphaGo，已經登峰造極，而他離去的身影，也或許窺見了人類的未來。大時代的一批傳奇人物謝幕，他是寂寞的，自己培養的AI取代了他，如果一定要有一個人為AlphaGo的研究劃上句點，黃士傑當之無愧。從AlphaGo第一次出現在公眾視野時，黃士傑便是AlphaGo的最佳代言人。他抬手、落子，行機器之智能，走出一代大師風範。他冷靜、他沉著，他是AlphaGo的「人肉臂」。時代的前進腳步從不停歇，人工智慧的盛世爆發正在來臨，「人肉臂」黃士傑轉崗，對AlphaGo深情的告別，都是在 AI圍棋的裡程碑上落下絢爛的一筆。

針對未來發展方面，黃士傑表示，DeepMind 有興趣的領域除了圍棋之外，還有『醫療』跟『機器人』，希望能夠讓世界變得更美好，至於他自己個人的下一步，當然就是選一個有興趣的領域去投入。現場有媒體再次詢問下一個目標是不是挑戰《星海爭霸》、《英雄聯盟》這個模擬策略遊戲領域，黃士傑並沒有把話說死，表示：「內部還在討論」。

11月27日，黃士傑在Facebook轉發了一則關於DeepMind將與一些頂尖的研究機構共同投入診斷乳腺癌的AI研究消息。DeepMind將利用最新的機器學習技術，希望能夠快速、準確地檢測出癌症的跡象，幫助醫生儘早發現癌症，以便更早的有效治療，此舉或許能捕風捉影體會到黃士傑之後的動態走向。

黃士傑，他就是AlphaGo本身

黃士傑出生於臺灣，1997考入臺灣國立交通大學就讀大學本科，專業為計算機與信息科學。2001年到2003年，在國立臺灣師範大學就讀計算機科學和信息工程碩士。2004年到2011年在國立臺灣師範大學完成了博士學業，博士論文就是「應用於電腦圍棋之蒙地卡羅樹搜索法的新啟發式演算法」。

黃士傑專精於人工智慧領域，碩博士論文都在臺師大資工所教授林順喜指導下完成，據其導師林順喜回憶，黃士傑是個很努力的學生，對圍棋也非常有興趣，是臺師大圍棋社創社社長，就讀時就有圍棋業餘6段的資格。

林順喜透露，黃士傑的博士本來5年就可念完，但為了延續研發成果，多念了2年，博士班7年級時，他所開發的圍棋程式「Erica」擊敗了當時國際公認的最強程式「Zen」，並在日本舉辦的國際電腦奧林匹亞中拿下19路電腦圍棋金牌。

黃士傑博士畢業後在加拿大艾伯塔大學做了一年研究員，隨後於2012年加入DeepMind，擔任高級研究員。2014年1月26日，谷歌以5億美元收購了這家日後將會大放異彩的公司。自此，黃士傑在谷歌DeepMind任研究科學家。同年2月，AlphaGo項目正式啟動，團隊只有3個人：哈薩比斯、席爾瓦、黃士傑。

項目啟動伊始，團隊就決定將沿著深度學習和強化學習的方向探索。無疑，這條道路將無比艱難。然而，他們還是上路了。

2014年6月，AlphaGo通過卷積神經網絡學習了很多人類棋譜，能在3毫秒內做出堪比人類的下棋直覺。黃士傑將它命名為「策略網絡」，並在GPU上進行持續的訓練優化。

一年之後，AlphaGo閱讀棋局的能力提升了很多，可以檢索多種局面變化，並且找到最佳的應對方式，可以算出後續40-60步棋。

自此，有越來越多的深度學習專家加入了這個一開始只有三人的團隊。8月，AlphaGo將掌握稱霸圍棋世界最關鍵的能力：形勢判斷。AlphaGo通過自我對弈，訓練出價值網絡，進而可以判斷每一手棋背後代表的勝率。這就形成了形勢判斷的能力。據黃士傑回憶，他當時已經感覺到AlphaGo的強大。10月，樊麾大戰AlphaGo，當時代替AlphaGo落子的正是黃士傑。樊麾輸了。但這一消息當時並未被公布。

2016年1月27日，Nature雜誌介紹了DeepMind團隊的AlphaGo，以及樊麾輸了的消息。黃士傑與席爾瓦是這篇論文的第一作者。

又過了2個月，AlphaGo擊敗了李世乭。這次，依舊是黃士傑代替AlphaGo落子。這也是黃士傑第一次出現在觀眾的眼前。

這年年底，一個叫Master的棋手大開殺戒，連續斬殺各路圍棋高手。取得59場連勝之後，Master公布了自己的真實身份：「我是AlphaGo的黃博士」。黃士傑，又是黃士傑。

2017年5月23日，柯潔對面坐的，仍然是黃士傑。在對戰結束後，柯潔說，「黃博士來擺棋，可能更讓我有和AI對戰的感覺。我也特別佩服黃博士，大家看直播也能看到我很愛動，總喜歡活動身體，而黃博士總是一動不動，不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時，我覺得黃博士就是AlphaGo。」

AlphaGo一路廝殺，黃士傑始終在側，甚至可以說，他就是AlphaGo本身。

AlphaGo 小傳

姓名：AlphaGo（Fan，Lee，Master，Zero）

別名：阿老師，阿爾法狗

生日：2014年

出生地：英國倫敦

1、擊敗樊麾

2015年10月，AlphaGo擊敗樊麾，成為第一個無需讓子即可在19路棋盤上擊敗圍棋職業棋手的電腦圍棋程序，寫下了歷史，相關成果在2016年1月發表於Nature

2、擊敗李世石

2016年3月，AlphaGo在一場五番棋比賽中4:1擊敗尖端職業棋手李世石，成為第一個不藉助讓子而擊敗圍棋職業九段棋手的電腦圍棋程序，再創歷史。五局賽後韓國棋院授予AlphaGo有史以來第一位名譽職業九段

3、排名短暫超越柯潔

2016年7月18日，AlphaGo在Go Ratings網站的排名升至世界第一。但幾天之後被柯潔反超。

4、Alpha Go化名「Master」 60連勝

2016年的倒數第三天，一個用戶名為「Master」的圍棋用戶，連續在圍棋平臺大開殺戒，「斬殺」包括柯潔、樸廷桓、井山裕太、陳耀燁、申真諝、常昊、古力等各路圍棋高手，最終以以60連勝告終。柯潔連輸三場，期間還因為急性腸胃炎住院……

在第59場時候，「Master」自報家門：「我是AlphaGo的黃博士」。

5、AlphaGo大敗柯潔，柯潔落淚哽咽

2017年5月27日，烏鎮圍棋峰會，柯潔總比分 0：3 敗於AlphaGo。比賽中，柯潔在局面不利時長時間離開，回來後又淚灑現場。賽後柯潔一度哽咽稱：它太完美我很痛苦，看不到任何勝利的希望。

6、AlphaGo Zero橫空出世自學21天虐Master

2017年10月，DeepMind最新版AlphaGo論文介紹了迄今最強最新的版本AlphaGo Zero：使用純強化學習，將價值網絡和策略網絡整合為一個架構，3天訓練後就以100比0擊敗了上一版本的AlphaGo。

7、AlphaGo教學工具正式上線，柯潔：重新學習圍棋

2017年12月11日，AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露：「AlphaGo教學工具共有兩萬多個變化，三十七萬多步棋組成，通過AlphaGo的視角，分析並建議圍棋開局的諸多下法。隨後，當今世界圍棋第一人柯潔隨後轉發此條微博，並評論到：「重新學習圍棋。」

AlphaGo已經退休，但技術永存。

謹以此文，致敬AlphaGo，以及研發AlphaGo的人。

相關焦點

獨家專訪「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑 : )

在那時，Rémi Coulom 也曾經指導了一名臺灣師範大學的博士生，他叫做黃士傑。他從小學習圍棋，屬於圍棋業餘六段選手，還曾在臺灣師大讀書期間創辦過圍棋社，並獲得大專杯圍棋賽冠軍。圖丨黃士傑的博士論文在讀碩士期間，黃士傑就將圍棋定為他的研究課題。為了寫程序，黃士傑有時在實驗室一待就是十幾個小時。
AlphaGo 圍棋教學工具已發布

在Deepmind所謂的「教學工具」發布之前，小編曾在腦海出現萬千猜想……但今天揭底才知道，原來只是一個平平淡淡的網頁……（建議複製到電腦上打開，因為據有的棋友反映手機打不開，小編這裡實測手機能打開，只是讀取了較長時間）https://alphagoteach.deepmind.com
「人肉臂」黃士傑離開,AlphaGo死了?

12月13日凌晨消息，AlphaGo曾經的「代言人/人肉臂」、谷歌DeepMind科學家黃士傑（Aja Huang）博士今天凌晨在Facebook上發帖宣布，他本人將正式從AlphaGo團隊離開，轉到DeepMind其他項目的研究中去
AlphaGo人肉臂黃士傑:Zero版阿法狗未達極限

圖丨黃士傑出席 11 月 10 日的臺灣人工智慧年會11 月 10 日，黃士傑應臺灣人工智慧年會之邀來臺演講，演講主題是「AlphaGo—— 深度學習與強化學習的勝利」，也是他首次公開演講。如果我讓 AlphaGo 有所阻礙的話，那我確實應該被拿掉，AlphaGo 99％的知識經我之手，它到達這一步其實是我從事計算機圍棋研究的非常好的收尾，我已經非常滿足了。開發 Erica，獲邀加入 DeepMindAlphaGo 怎麼開始的？
黃士傑博士:我的使命完成阿爾法狗項目結束

同年7月，臺北成功高中的黃士傑參加聯考。當年國文試題第15題，B選項是：現代電腦的優點多得「罄竹難書」令人不得不嘆服。　　黃士傑最終考入臺灣交通大學，四年後獲得計算機與信息科學學士。2001年，黃士傑考入臺灣師範大學攻讀研究生學位。　　2003年，黃士傑碩士畢業。畢業論文：《電腦圍棋打劫的策略》。
AlphaGo Zero幕後開發心路歷程大公開!DeepMind資深研究員黃士傑最新演講解密

【導讀】11月10日，黃士傑應臺灣人工智慧年會之邀來臺演講，演講主題是「AlphaGo——深度學習與強化學習的勝利」，也是他首次公開演講。人工智慧，是簡立峰口中的完美風暴，AlphaGo則是這一波AI風潮的最佳代言人，那麼，黃士傑呢？
阿爾法狗「人肉臂」黃士傑:結束圍棋項目,轉戰下個領域

柯潔（前左）、黃士傑（前右）在烏鎮圍棋峰會現場。有一個細節值得一提，從直播鏡頭裡看，當時柯潔旁邊的桌子上，除了一個水杯，還有兩盤水果和零食。而黃士傑這邊的桌子上，只有一個白色水杯。三場比賽都是如此的擺設。
解讀:AlphaGo 是如何被訓練成圍棋之神?

虛竹在天龍八部裡自填一子，無意中以「自殺」破解「珍籠」棋局，逍遙子方才親傳掌門之位。難道以後「阿爾法狗」要出任逍遙派掌門了？1933年，東渡日本19歲的吳清源迎戰當時的日本棋壇霸主、已經60歲的本因坊秀哉，開局三招即是日本人從未見過的三三、星、天元布陣，快速進擊逼得對方連連暫停「打卦」和弟子商量應對之策。
劍與遠徵囚時之界死魂之引打法技巧囚時之界死魂之引陣容推薦

劍與遠徵囚時之界死魂之引怎麼打？死魂之引是囚時之界第三階段的boss，很多玩家都不知道這個傢伙有什麼技能，該如何應對。下面就是囚時之界死魂之引打法技巧和陣容搭配攻略了，大家一起來看看吧！　　劍與遠徵囚時之界死魂之引怎麼打技能介紹　　1、湮滅　　召喚閃電打擊最虛弱的2名敵人。
《黑暗之魂》圖文攻略黑暗之魂黑森林庭院第二部分刷魂攻略

《黑暗之魂》圖文攻略黑暗之魂黑森林庭院第二部分刷魂攻略。《黑暗之魂》作為一款硬核遊戲，難度門檻非常高想要通關並不容易，加上畫面升級的重製版上線大量新人湧入，在受苦過程中出現卡關情況的玩家肯定不在少數，下面為大家帶來「權限戰士」分享的《黑暗之魂》新手詳盡圖文攻略，助大家順利通關。註：《黑暗之魂》原版與重製版對比，除畫面與流暢度外內容基本一致。
別慌張放心玩《對馬之魂》不會像《血源》那樣難

從《對馬之魂》的演示預告在E3放出之後，許多玩家就對其中頗為硬核的動作系統產生了諸多疑問，而其中最大的困惑還是集中於遊戲的困難度。而近日遊戲開發團隊Sucker Punch的創意總監Nate Fox在一場閉門會議上透露了關於本作的許多問題。
《黑暗之魂3》《仁王》與《血源》區別對比黑暗之魂3和仁王哪個好玩

導讀《黑暗之魂3》、《仁王》與《血源》三款遊戲十分相似，但也有各自的特點，究竟哪款遊戲更好玩，大家難免會拿來比較
「魂系列」起源,宮崎英高與他的《惡魔之魂》(上)

在前些天的PS5發布會上，《惡魔之魂：重製版》的出現可以說是除了PS5真機曝光之外的發布會高潮。比起這款遊戲，或許玩家對於《黑暗之魂》系列要了解的更多一點。如果問起這類遊戲的起源究竟在何處，或許許多玩家會將矛頭指向第一款「魂類遊戲」《惡魔之魂》。但實際上，即便到了今天，魂類遊戲的起源一直都不是某款遊戲，而是這一系列遊戲的製作人，宮崎英高如果問起宮崎英高是什麼人，不少玩家都會將「惡意」二字和他聯繫起來。這位看到玩家在他設計的遊戲裡死到崩潰之後會露出微笑的男人，也正是一切「魂類遊戲」的開端。
《惡魔之魂》吸魂法術怎麼學吸魂法術學習方法分享

導讀《惡魔之魂》中的吸魂法術是非常厲害的，很多玩家都不太清楚吸魂法術的學習方法是什麼，今天小編就給大家帶來玩家
谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

谷歌團隊發布AlphaGo Zero：柯潔稱人類太多餘了（圖片來自於推特）在這款軟體發出之後，柯潔也對這款軟體發表了自己的看法，他認為：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說，主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
《黑暗之魂3》新手指引:不要懼怕死亡享受這個過程

如果你在期盼著《黑暗之魂3》的降臨，那麼這個等待終於要結束了。玩這個遊戲的時候，你的心情會從想要摔手柄，逐漸適應和開始享受這個過程。《黑暗之魂3》是系列中最容易上手的一作，僅次於《血源詛咒》。遊戲的戰鬥節奏更強一些，你還有很多的道具可以來輔助你的冒險。同樣比起前幾作，本作的流程也採用了更加線性地方式。
抖M之魂熊熊燃燒《黑暗之魂3》steam打折促銷

《黑暗之魂3》首個DLC昨天被索尼的臨時工曝光，這款名為「阿里安德爾的灰燼（Ashes of Ariandel）」的DLC將於今晚或最遲明天公布，而Steam平臺為迎接首款DLC的到來，也開啟了打折促銷活動，遺憾的是，打折的只有本體，跟季票沒什麼關係。
柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

【文/觀察者網周遠方】昨夜，「半狗」柯潔贏了一隻41連勝的「小狗」，輾轉難眠…… 他在今天（18日）凌晨0時23分發微博感嘆：一個AI滿地走的時代...除了alphago以外，這個暱稱為「符合預期」的AI尤其強，實力應該已經遠超當時與李世石對弈的alphago了吧？...
新版Alphago棋風更穩健

alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰，而是人類使用電腦作為工具探索新的東西，就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏，最終還是人類贏。祝柯潔好運。」來源：網易科技
Master 自曝真實身份,他與 AlphaGo 的關係居然是……

黃博士，如果沒有意外的話其真名應該為黃士傑，這也是早在去年初人機大戰中代替 AlphaGo 落子的「人肉臂」。在公開身份後的現在，新的戰鬥已經開始了。

別了,AlphaGo之魂——黃士傑

相關焦點

獨家專訪「AlphaGo之手」黃士傑:機器是沒有感情的,而我會微笑 : )

AlphaGo 圍棋教學工具已發布

「人肉臂」黃士傑離開,AlphaGo死了?

AlphaGo人肉臂黃士傑:Zero版阿法狗未達極限

黃士傑博士:我的使命完成 阿爾法狗項目結束

AlphaGo Zero幕後開發心路歷程大公開!DeepMind資深研究員黃士傑最新演講解密

阿爾法狗「人肉臂」黃士傑:結束圍棋項目,轉戰下個領域

解讀:AlphaGo 是如何被訓練成圍棋之神?

劍與遠徵囚時之界死魂之引打法技巧 囚時之界死魂之引陣容推薦

《黑暗之魂》圖文攻略 黑暗之魂黑森林庭院第二部分刷魂攻略

別慌張放心玩 《對馬之魂》不會像《血源》那樣難

《黑暗之魂3》《仁王》與《血源》區別對比 黑暗之魂3和仁王哪個好玩

「魂系列」起源,宮崎英高與他的《惡魔之魂》(上)

《惡魔之魂》吸魂法術怎麼學 吸魂法術學習方法分享

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

《黑暗之魂3》新手指引:不要懼怕死亡 享受這個過程

抖M之魂熊熊燃燒 《黑暗之魂3》steam打折促銷

柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

新版Alphago棋風更穩健

Master 自曝真實身份,他與 AlphaGo 的關係居然是……

黃士傑博士:我的使命完成阿爾法狗項目結束

劍與遠徵囚時之界死魂之引打法技巧囚時之界死魂之引陣容推薦

《黑暗之魂》圖文攻略黑暗之魂黑森林庭院第二部分刷魂攻略

別慌張放心玩《對馬之魂》不會像《血源》那樣難

《黑暗之魂3》《仁王》與《血源》區別對比黑暗之魂3和仁王哪個好玩

《惡魔之魂》吸魂法術怎麼學吸魂法術學習方法分享

《黑暗之魂3》新手指引:不要懼怕死亡享受這個過程

抖M之魂熊熊燃燒《黑暗之魂3》steam打折促銷