讓柯潔痛哭的AlphaGo,耗資3500萬美元,耗電量相當於12760個大腦

2020-12-16 新智元

【新智元導讀】還記得當年柯潔和AlphaGo對戰失利後的失聲痛哭嗎？AlphaGo背後的模型訓練要燃燒多少經費你知道嗎？本文來告訴你答案。

當年，19歲的世界圍棋第一人柯潔九段在和AlphaGo的圍棋終極人機大戰以0:3完敗，這也是人類頂尖高手與這臺機器之間的最後一次較量，AlphaGo從此將退隱江湖。

比賽至中局之時，柯潔再次被AlphaGo的手法驚到了。他先是取下眼鏡捂住自己的臉，繼而在桌子上趴了幾秒鐘，起身搖頭，再次趴下，然後才用手把頭撐起，雙手抹了抹眼睛，又重新戴上眼鏡。

韓國高手李世石也面對過AlphaGo，曾在三連敗的情況下扳回一局，連輸兩場的柯潔自然也希望能在最後一句中挽回顏面，很可惜這次柯潔全面落於下風。

2017年，機器學習領域最令人興奮的事件之一，莫過於 AlphaGo 戰勝李世石成為世界上最好的圍棋選手了。

同年10月份，DeepMind 發表了一篇論文，描述了一個名為 AlphaGo Zero 的新版本。僅僅經過36個小時的訓練，AlphaGo Zero已經比擊敗李世石的阿爾法狗更擅長圍棋了。

不僅如此，AlphaGo Zero 學會下圍棋，卻是在沒有任何先驗的遊戲知識的情況下(換句話說，就是白板)。

而相比之下，之前發布的 AlphaGo 則是在人類圍棋比賽資料庫的幫助下進行訓練的。

這一成就確實非同尋常，因為它表明，我們可以開發一個系統，教會自己從一張白紙上做一些不瑣碎的任務，並最終在完成任務方面比人類做得更好。

它同時也表明了，現在整個世界的可能性是觸手可及的，只要想像計算機可以教自己做任何人類可以做的事情。

但是取得這樣的進步卻並不便宜。

正如人類掌握圍棋需要多年的訓練一樣，計算機掌握圍棋也需要大量的資源，復現 AlphaGo Zero 的論文中報導的實驗需要花費3500萬美元的算力。

AlphaGo Zero 學習下圍棋的方法是通過一種被稱為「self-play」的過程，模擬圍棋對它自己的比賽。該論文報告了以下幾點:

1.在72個小時裡，共進行了490萬場比賽

2. 在自我遊戲過程中，每個動作大約佔用0.4秒的時間

3.在一臺機器上執行自我遊戲，該機器包含4個 TPU

不過，這裡有一個數字沒有被公布出來，就是在三天的過程中使用的進行自我遊戲的機器的數量。按照平均每場圍棋211步的估計值，得到了最終的1595臺自動對戰機器的結果，或者說6380個 TPU。

按照每個TPU每小時6.50美元的報價(截至2018年3月) ，僅僅進行復現就要花費2,986,822美元。

而這只是他們論文中的兩個實驗中的一個小實驗:

「隨後，我們使用一個更大的神經網絡，將我們的強化學習管道應用於 AlphaGo Zero 的第二個實例，並且持續時間更長。訓練再次從完全隨機的行為開始，持續了大約40天」

「在訓練過程中，產生了2900萬場自我比賽」

在為期40天的這項實驗中，使用的神經網絡的層數(大小相同)是為期3天的實驗中使用的網絡的兩倍，因此，假設實驗沒有其他任何改變，一個動作所需的計算機思考時間大約是之前的兩倍。

考慮到這一點，可以大概求出最終花費了35,354,222美元的TPU來復現這個為期40天的實驗。

就 DeepMind 運行這項實驗的實際成本而言，還有其它因素需要考慮，比如研究人員的薪水等。但是對於谷歌以外的人來說，這個數字對於重複這個實驗的成本是一個很好的估計。

另一種看待 AlphaGo Zero 實驗成本的方式是想像需要多少人的大腦來提供同樣數量的能量。

圖：當機器接管後，他們將更有效地使用我們的大腦

一個TPU消耗大約40瓦，人腦大約是20瓦。所以，這個實驗的耗電量相當於12760個人的大腦連續運轉。

這種耗電量和金錢的消耗並不是說AlphaGo Zero不是一個驚人的成就，它向世界展示了建立系統來自學完成複雜任務是可能的，只是開發這種通用技術還沒有提供給大眾而已。

也就是說，許多具有現實價值的問題並不需要超人一般的表現。也許，通過應用領域知識和 AlphaGo Zero 提供的技術，未來這些問題可以用比創建 AlphaGo Zero 便宜得多的成本得到解決。

相關焦點

柯潔選修圍棋課上熱搜網友吐槽:圍棋老師可咋教?

今天（2月18日），圍棋世界冠軍柯潔在微博發文，「還有沒睡的朋友嘛！一想到明天有早課，有點睡不著。」在和網友的互動中，疑似證實自己在清華選修了圍棋課程。我們一起看看吧！
波司登本月將在倫敦南莫爾頓街開旗艦店裝修耗資5500萬美元

旗艦店的開發總計耗資3500萬英鎊(合5500萬美元)。若收尾工作順利完成，旗艦店將在7月26日開張。　　資料顯示，目前波司登有超過1萬個零售網點，主要集中在中國大陸地區。在截止2012年3月的一年內，其淨利潤增長17.2%，至2.25億美元;收入增長19%，達13億美元。
谷歌AlphaGo之父盤中盛讚柯潔:表現非常完美

北京時間5月25日，柯潔九段對陣圍棋人工智慧AlphaGo三番棋第二局展開較量，儘管首局輸掉後外界一片悲觀，認為柯潔之後對決毫無勝算，但今天柯潔表現出色，甚至贏得哈薩比斯的點讚。哈薩比斯一直關注今天的對決，比賽開始前他就曬出一張現場圖片，預告這場大戰即將拉開大幕。
AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?

谷歌AlphaGo在3:0完勝李世石後，又在2017年7月迎戰柯潔。這場世紀人機大戰被寄予厚望，結果柯潔遭遇三連敗，淚灑現場。AlphaGo一戰成名，也為人工智慧做了最好的宣傳。從此，人工智慧成為婦孺皆知的熱點話題。
柯潔:李世石僥倖贏了AlphaGo AI能幫人類少走彎路

網易體育7月10日報導：北京時間7月10日，圍棋世界冠軍柯潔接受採訪時再次談到了人工智慧，在柯潔看來，AI曲線上升的速度遠超人類，人類棋手雖然無法超越AI，但可以通過人工智慧來幫助自己無限縮短走彎路時間。
曝灰熊隊3年3500萬美元續約狄龍-布魯克斯

北京時間2月6日，據記者Woj報導稱，灰熊隊已經跟球隊後衛狄龍-布魯克斯就一份3年3500萬美元的續約合同達成協議。布魯克斯是2017年的45號秀，本賽季他已經成長為球隊穩定的分衛。據悉，布魯克斯新合同的年薪分別為1140萬美元、1220萬美元和1140萬美元。二輪秀拿到千萬級別的年薪，布魯克斯的逆襲相當勵志。原文信息源來自Woj推特
基因測序新銳10X Genomics融資3500萬美元

近日，10X Genomics公司宣布完成了3500萬美元的D輪融資，10X Genomics公司是基因測序行業的領導者，為全球各地的科研機構提供準確完整的基因測序服務。本輪融資由Meritech Capital領投，富達(Fidelity)、富國銀行(Wells Fargo)、Paladin Capital 以及軟銀(SoftBank)跟投。
2838天,柯潔的微博往事

就在柯潔進入這個社交世界的15個月前，新浪微博官方宣布，註冊用戶已經突破1億大關。彼時，那個龐大的虛擬世界裡沒幾個人認識柯潔，即便當時只有15歲的柯潔已經在圍棋圈子裡頗受關注。2012年6月，一位名叫「上古龍王」的網友在「百度知道」留下一個問題：弈城圍棋網的「潛伏」是誰？
AlphaGo擊敗柯潔一周年後,聶衛平說:我從來沒有失落感

幾乎整整一年之前，AlphaGo在烏鎮沒有給人類任何機會，在三番棋中零封當時世界排名第一的人類旗手柯潔，徹底在圍棋這項古老運動中戰勝了人類。隨後，研發出這一人工智慧程序的DeepMind公司創始人Demis Hassabis就宣布，AlphaGo將永久退出競技舞臺，不再進行比賽。
柯潔女朋友是誰,美女黑嘉嘉與柯潔結婚了嗎

柯潔被稱為世界圍棋第一人，年紀輕輕的他就包攬多個世界冠軍。網友們也對柯潔的私生活表示十分感興趣，那麼柯潔女朋友是誰呢？這兩年柯潔的緋聞女友就有於之瑩、崔精、黑嘉嘉等人，我們來看看到底誰是柯潔的正牌女友。
搜狗(SOGO.US)2019年Q4淨利潤3500萬美元同比增長33%

2019年第四季度，搜狗實現總收入3.01億美元，同比增長1%，以人民幣計，則同比增長3%。歸屬於公司淨利潤為3500萬美元，同比增長33%，基本和稀釋後的每股收益為0.09美元。非國際會計準則下，歸屬於公司淨利潤為3900萬美元，同比增長44%。搜索和搜索相關收入為2.746億美元，同比下降1%。
柯潔被曝大學選修課是圍棋,遭網友吐槽有才無德,柯潔回應別罵了

在圍棋界，柯潔是大家都知道的圍棋天才，也多次獲得國際大獎。不過，柯潔除了下棋外，還喜歡發表一些評論。比如此次疫情爆發後，柯潔就多次發表評論。對一些人吐槽明星捐款少者，認為不要「道德綁架」等。最近，柯潔凌晨時分發文稱還有沒睡的朋友，一想到明天有早課，有點睡不著。可見，柯潔也要上課。柯潔被清華大學錄取後，也就成為了清華大學的一名大學生。自然也會和大家一樣，需要上課了。不過，沒有想到不僅有很多網友沒有睡，還有網友吐槽其選修課竟然選的是圍棋，讓老師怎麼上課，更是批其是惡人，有才無德等等。
智能門禁廠商ButterflyMX成功籌集3500萬美元

智能門禁製造商 ButterflyMX 今天宣布在成長型股權融資中成功籌集了 3500 萬美元，從而讓總融資金額超過 5800 萬美元。預計到 2027 年，非接觸式入口技術將會帶來 220 億美元的市場。儘管在新冠疫情期間接觸感染並不多見，但也推動了這項技術的快速發展。CBRE 最近對 203 家公司進行的調查發現，大約一半的公司正在考慮安裝非接觸式技術，作為他們重返辦公室計劃的一部分。
2838天,柯潔的微博往事:好友的墜樓,擊垮了「狂妄」的他

不到一周時間，他的微博粉絲從1.8萬增長到42萬。那些圍棋圈外的網友開始發問，「柯潔大棋渣」是誰？「看來圍棋盲還是不少啊，在這裡我簡單介紹一下自己：我叫做柯潔，1997年出生。但如果不是在這個科技和網絡迅速發展的時代，不滿23歲的柯潔可能無法在圍棋以外的世界產生如此大的影響力，甚至是製造出如此多的爭議話題。微博就像一副放大鏡，柯潔「真性情」中的每一個稜角都被無限放大。柯潔喜歡自嘲，也習慣用略帶刻薄的言辭去評論時事——然而，他在社交網絡上擁有超過540萬粉絲，這些激烈的言論就成了引火燒身的導火線。
耗資100億美元美國韋伯太空望遠鏡完成關鍵測試:2021年發射

提到太空望遠鏡，很多人能想到哈勃，它確實是之前最強大的太空望遠鏡，不過它的時代結束了，明年美國要發射詹姆斯·韋伯望遠鏡，這將是人類最野心勃勃的太空探測計劃，耗資將近100億美元。
單從圍棋水平來說,柯潔和李世石到底誰更勝一籌?

圍棋最早起源於中國，是琴棋書畫四藝中的一種，圍棋最先起源於中國，隋唐時期傳入日本，後來傳到歐美，最後遍布於全國全世界，圍棋能夠發散人的思維，促進人的大腦發育。在當今社會中，很多小學生也加入了圍棋培訓的行列，可見圍棋。
2019年蒙古國人均GDP超4200美元,相當於哪年的中國人均水平呢?

數據顯示，截止到2019年年底，其人口只在320萬到330萬之間，GDP卻達到了138.5億美元。即，2019年蒙古國人均GDP已超過了4200美元，在全球屬於中等收入國家，並且超過了同期的印度、越南、菲律賓、印度尼西亞等國。以印度為例，其在2019年完成的GDP約為2.85萬億美元，在全球排第五名。
開思完成3500萬美元C3輪融資,老股東源碼資本領投

【獵雲網北京】12月15日報導獵雲網近日獲悉，中國汽車後市場企業「開思」宣布完成3500萬美元C3輪融資，由老股東源碼資本領投，紅杉資本中國基金、大灣區共同家園、順為資本跟投。不到半年時間，開思先後獲得C2輪及C3輪共8500萬美元融資。其中，C2輪融資由大灣區共同家園投資有限公司領投；紅杉資本中國基金、老股東源碼資本為C1輪聯合領投方。此前，開思還曾獲得復星銳正、蔚來創投基金、灃源資本、上合資本、華業天成和長江商學院創創壹號等機構的多輪融資。
北美外賣平臺飯糰完成B輪3500萬美元融資

1月8日，北美知名外賣平臺飯糰完成B輪3500萬美元融資，由蘭馨亞洲領投，A輪領投方元璟資本，種子輪領投方凱爾特亞洲、及大眾點評聯合創始人李璟等跟投。泰合資本擔任本輪獨家財務顧問。本次融資後，飯糰已成為加拿大地區融資額最高的外賣平臺，預計累計融資額超過5000萬美元。這也是一年內飯糰第二次獲得中國和北美的知名投資機構注資。
人的大腦相當於多大的「內存」?

人的大腦相當於多大內存？拿人腦與內存相比，那真是太低估大腦了。內存是計算機系統中重要的組成部分，它可用來存儲數據，實現計算機的運算過程，存儲什麼數據呢？是存儲CPU的運算數據的，並且CPU可以隨時調用這些數據。

讓柯潔痛哭的AlphaGo,耗資3500萬美元,耗電量相當於12760個大腦

相關焦點

柯潔選修圍棋課上熱搜 網友吐槽:圍棋老師可咋教?

波司登本月將在倫敦南莫爾頓街開旗艦店 裝修耗資5500萬美元

谷歌AlphaGo之父盤中盛讚柯潔:表現非常完美

AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?

柯潔:李世石僥倖贏了AlphaGo AI能幫人類少走彎路

曝灰熊隊3年3500萬美元續約狄龍-布魯克斯

基因測序新銳10X Genomics融資3500萬美元

2838天,柯潔的微博往事

AlphaGo擊敗柯潔一周年後,聶衛平說:我從來沒有失落感

柯潔女朋友是誰,美女黑嘉嘉與柯潔結婚了嗎

搜狗(SOGO.US)2019年Q4淨利潤3500萬美元 同比增長33%

柯潔被曝大學選修課是圍棋,遭網友吐槽有才無德,柯潔回應別罵了

智能門禁廠商ButterflyMX成功籌集3500萬美元

2838天,柯潔的微博往事:好友的墜樓,擊垮了「狂妄」的他

耗資100億美元 美國韋伯太空望遠鏡完成關鍵測試:2021年發射

單從圍棋水平來說,柯潔和李世石到底誰更勝一籌?

2019年蒙古國人均GDP超4200美元,相當於哪年的中國人均水平呢?

開思完成3500萬美元C3輪融資,老股東源碼資本領投

北美外賣平臺飯糰完成B輪3500萬美元融資

人的大腦相當於多大的「內存」?

柯潔選修圍棋課上熱搜網友吐槽:圍棋老師可咋教?

波司登本月將在倫敦南莫爾頓街開旗艦店裝修耗資5500萬美元

搜狗(SOGO.US)2019年Q4淨利潤3500萬美元同比增長33%

耗資100億美元美國韋伯太空望遠鏡完成關鍵測試:2021年發射